五月激情开心网,五月天激情社区,国产a级域名,婷婷激情综合,深爱五月激情网,第四色网址

數(shù)據(jù)挖掘論文優(yōu)選九篇

時(shí)間:2022-07-23 05:41:04

引言:易發(fā)表網(wǎng)憑借豐富的文秘實(shí)踐,為您精心挑選了九篇數(shù)據(jù)挖掘論文范例。如需獲取更多原創(chuàng)內(nèi)容,可隨時(shí)聯(lián)系我們的客服老師。

數(shù)據(jù)挖掘論文

第1篇

[關(guān)鍵詞]數(shù)據(jù)挖掘數(shù)據(jù)挖掘方法

隨著信息技術(shù)迅速發(fā)展,數(shù)據(jù)庫的規(guī)模不斷擴(kuò)大,產(chǎn)生了大量的數(shù)據(jù)。但大量的數(shù)據(jù)往往無法辨別隱藏在其中的能對(duì)決策提供支持的信息,而傳統(tǒng)的查詢、報(bào)表工具無法滿足挖掘這些信息的需求。因此,需要一種新的數(shù)據(jù)分析技術(shù)處理大量數(shù)據(jù),并從中抽取有價(jià)值的潛在知識(shí),數(shù)據(jù)挖掘(DataMining)技術(shù)由此應(yīng)運(yùn)而生。

一、數(shù)據(jù)挖掘的定義

數(shù)據(jù)挖掘是指從數(shù)據(jù)集合中自動(dòng)抽取隱藏在數(shù)據(jù)中的那些有用信息的非平凡過程,這些信息的表現(xiàn)形式為:規(guī)則、概念、規(guī)律及模式等。它可幫助決策者分析歷史數(shù)據(jù)及當(dāng)前數(shù)據(jù),并從中發(fā)現(xiàn)隱藏的關(guān)系和模式,進(jìn)而預(yù)測(cè)未來可能發(fā)生的行為。數(shù)據(jù)挖掘的過程也叫知識(shí)發(fā)現(xiàn)的過程。

二、數(shù)據(jù)挖掘的方法

1.統(tǒng)計(jì)方法。傳統(tǒng)的統(tǒng)計(jì)學(xué)為數(shù)據(jù)挖掘提供了許多判別和回歸分析方法,常用的有貝葉斯推理、回歸分析、方差分析等技術(shù)。貝葉斯推理是在知道新的信息后修正數(shù)據(jù)集概率分布的基本工具,處理數(shù)據(jù)挖掘中的分類問題,回歸分析用來找到一個(gè)輸入變量和輸出變量關(guān)系的最佳模型,在回歸分析中有用來描述一個(gè)變量的變化趨勢(shì)和別的變量值的關(guān)系的線性回歸,還有用來為某些事件發(fā)生的概率建模為預(yù)測(cè)變量集的對(duì)數(shù)回歸、統(tǒng)計(jì)方法中的方差分析一般用于分析估計(jì)回歸直線的性能和自變量對(duì)最終回歸的影響,是許多挖掘應(yīng)用中有力的工具之一。

2.關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則是一種簡單,實(shí)用的分析規(guī)則,它描述了一個(gè)事物中某些屬性同時(shí)出現(xiàn)的規(guī)律和模式,是數(shù)據(jù)挖掘中最成熟的主要技術(shù)之一。關(guān)聯(lián)規(guī)則在數(shù)據(jù)挖掘領(lǐng)域應(yīng)用很廣泛適合于在大型數(shù)據(jù)集中發(fā)現(xiàn)數(shù)據(jù)之間的有意義關(guān)系,原因之一是它不受只選擇一個(gè)因變量的限制。大多數(shù)關(guān)聯(lián)規(guī)則挖掘算法能夠無遺漏發(fā)現(xiàn)隱藏在所挖掘數(shù)據(jù)中的所有關(guān)聯(lián)關(guān)系,但是,并不是所有通過關(guān)聯(lián)得到的屬性之間的關(guān)系都有實(shí)際應(yīng)用價(jià)值,要對(duì)這些規(guī)則要進(jìn)行有效的評(píng)價(jià),篩選有意義的關(guān)聯(lián)規(guī)則。

3.聚類分析。聚類分析是根據(jù)所選樣本間關(guān)聯(lián)的標(biāo)準(zhǔn)將其劃分成幾個(gè)組,同組內(nèi)的樣本具有較高的相似度,不同組的則相異,常用的技術(shù)有分裂算法,凝聚算法,劃分聚類和增量聚類。聚類方法適合于探討樣本間的內(nèi)部關(guān)系,從而對(duì)樣本結(jié)構(gòu)做出合理的評(píng)價(jià),此外,聚類分析還用于對(duì)孤立點(diǎn)的檢測(cè)。并非由聚類分析算法得到的類對(duì)決策都有效,在運(yùn)用某一個(gè)算法之前,一般要先對(duì)數(shù)據(jù)的聚類趨勢(shì)進(jìn)行檢驗(yàn)。

4.決策樹方法。決策樹學(xué)習(xí)是一種通過逼近離散值目標(biāo)函數(shù)的方法,通過把實(shí)例從根結(jié)點(diǎn)排列到某個(gè)葉子結(jié)點(diǎn)來分類實(shí)例,葉子結(jié)點(diǎn)即為實(shí)例所屬的分類。樹上的每個(gè)結(jié)點(diǎn)說明了對(duì)實(shí)例的某個(gè)屬性的測(cè)試,該結(jié)點(diǎn)的每一個(gè)后繼分支對(duì)應(yīng)于該屬性的一個(gè)可能值,分類實(shí)例的方法是從這棵樹的根結(jié)點(diǎn)開始,測(cè)試這個(gè)結(jié)點(diǎn)指定的屬性,然后按照給定實(shí)例的該屬性值對(duì)應(yīng)的樹枝向下移動(dòng)。決策樹方法是要應(yīng)用于數(shù)據(jù)挖掘的分類方面。

5.神經(jīng)網(wǎng)絡(luò)。神經(jīng)網(wǎng)絡(luò)建立在自學(xué)習(xí)的數(shù)學(xué)模型基礎(chǔ)之上,能夠?qū)Υ罅繌?fù)雜的數(shù)據(jù)進(jìn)行分析,并可以完成對(duì)人腦或其他計(jì)算機(jī)來說極為復(fù)雜的模式抽取及趨勢(shì)分析,神經(jīng)網(wǎng)絡(luò)既可以表現(xiàn)為有指導(dǎo)的學(xué)習(xí)也可以是無指導(dǎo)聚類,無論哪種,輸入到神經(jīng)網(wǎng)絡(luò)中的值都是數(shù)值型的。人工神經(jīng)元網(wǎng)絡(luò)模擬人腦神經(jīng)元結(jié)構(gòu),建立三大類多種神經(jīng)元網(wǎng)絡(luò),具有非線形映射特性、信息的分布存儲(chǔ)、并行處理和全局集體的作用、高度的自學(xué)習(xí)、自組織和自適應(yīng)能力的種種優(yōu)點(diǎn)。

6.遺傳算法。遺傳算法是一種受生物進(jìn)化啟發(fā)的學(xué)習(xí)方法,通過變異和重組當(dāng)前己知的最好假設(shè)來生成后續(xù)的假設(shè)。每一步,通過使用目前適應(yīng)性最高的假設(shè)的后代替代群體的某個(gè)部分,來更新當(dāng)前群體的一組假設(shè),來實(shí)現(xiàn)各個(gè)個(gè)體的適應(yīng)性的提高。遺傳算法由三個(gè)基本過程組成:繁殖(選擇)是從一個(gè)舊種群(父代)選出生命力強(qiáng)的個(gè)體,產(chǎn)生新種群(后代)的過程;交叉〔重組)選擇兩個(gè)不同個(gè)體〔染色體)的部分(基因)進(jìn)行交換,形成新個(gè)體的過程;變異(突變)是對(duì)某些個(gè)體的某些基因進(jìn)行變異的過程。在數(shù)據(jù)挖掘中,可以被用作評(píng)估其他算法的適合度。

7.粗糙集。粗糙集能夠在缺少關(guān)于數(shù)據(jù)先驗(yàn)知識(shí)的情況下,只以考察數(shù)據(jù)的分類能力為基礎(chǔ),解決模糊或不確定數(shù)據(jù)的分析和處理問題。粗糙集用于從數(shù)據(jù)庫中發(fā)現(xiàn)分類規(guī)則的基本思想是將數(shù)據(jù)庫中的屬性分為條件屬性和結(jié)論屬性,對(duì)數(shù)據(jù)庫中的元組根據(jù)各個(gè)屬性不同的屬性值分成相應(yīng)的子集,然后對(duì)條件屬性劃分的子集與結(jié)論屬性劃分的子集之間上下近似關(guān)系生成判定規(guī)則。所有相似對(duì)象的集合稱為初等集合,形成知識(shí)的基本成分。任何初等集合的并集稱為精確集,否則,一個(gè)集合就是粗糙的(不精確的)。每個(gè)粗糙集都具有邊界元素,也就是那些既不能確定為集合元素,也不能確定為集合補(bǔ)集元素的元素。粗糙集理論可以應(yīng)用于數(shù)據(jù)挖掘中的分類、發(fā)現(xiàn)不準(zhǔn)確數(shù)據(jù)或噪聲數(shù)據(jù)內(nèi)在的結(jié)構(gòu)聯(lián)系。

8.支持向量機(jī)。支持向量機(jī)(SVM)是在統(tǒng)計(jì)學(xué)習(xí)理論的基礎(chǔ)上發(fā)展出來的一種新的機(jī)器學(xué)習(xí)方法。它基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則上的,盡量提高學(xué)習(xí)機(jī)的泛化能力,具有良好的推廣性能和較好的分類精確性,能有效的解決過學(xué)習(xí)問題,現(xiàn)已成為訓(xùn)練多層感知器、RBF神經(jīng)網(wǎng)絡(luò)和多項(xiàng)式神經(jīng)元網(wǎng)絡(luò)的替代性方法。另外,支持向量機(jī)算法是一個(gè)凸優(yōu)化問題,局部最優(yōu)解一定是全局最優(yōu)解,這些特點(diǎn)都是包括神經(jīng)元網(wǎng)絡(luò)在內(nèi)的其他算法所不能及的。支持向量機(jī)可以應(yīng)用于數(shù)據(jù)挖掘的分類、回歸、對(duì)未知事物的探索等方面。

事實(shí)上,任何一種挖掘工具往往是根據(jù)具體問題來選擇合適挖掘方法,很難說哪種方法好,那種方法劣,而是視具體問題而定。

三、結(jié)束語

目前,數(shù)據(jù)挖掘技術(shù)雖然得到了一定程度的應(yīng)用,并取得了顯著成效,但仍存在著許多尚未解決的問題。隨著人們對(duì)數(shù)據(jù)挖掘技術(shù)的深人研究,數(shù)據(jù)挖掘技術(shù)必將在更加廣泛的領(lǐng)域得到應(yīng)用,并取得更加顯著的效果。

第2篇

系統(tǒng)采用C/S+B/S結(jié)構(gòu),主要由前端數(shù)據(jù)采集設(shè)備(位移及載荷傳感器)、站點(diǎn)客戶端、數(shù)據(jù)庫及Web服務(wù)器等組成。各部分采取分布式協(xié)同處理運(yùn)行方式,站點(diǎn)客戶端利用前端采集的數(shù)據(jù)獨(dú)立分析計(jì)算,分析完成后上傳至數(shù)據(jù)庫服務(wù)器,并通過網(wǎng)頁服務(wù)器對(duì)外。

2系統(tǒng)數(shù)據(jù)

2.1系統(tǒng)數(shù)據(jù)結(jié)構(gòu)系統(tǒng)采用MicrosoftSQLServer,創(chuàng)建了WPGUI與WPCHQ數(shù)據(jù)庫來管理3萬余口油井?dāng)?shù)據(jù)采集、處理及存儲(chǔ)等,建設(shè)數(shù)據(jù)表65張(見主要數(shù)據(jù)表的關(guān)系圖2),主要包括生產(chǎn)井的完井?dāng)?shù)據(jù)、靜態(tài)數(shù)據(jù)、動(dòng)態(tài)數(shù)據(jù)、采集數(shù)據(jù)、原油物性數(shù)據(jù)、機(jī)桿管泵等技術(shù)數(shù)據(jù),同時(shí)系統(tǒng)保存了油井近兩年功圖電參數(shù)據(jù)(每天每口井到少100張),以及根據(jù)這些數(shù)據(jù)分析計(jì)算出來的結(jié)果和匯總生成的數(shù)據(jù)。

3數(shù)據(jù)挖掘應(yīng)用

數(shù)據(jù)挖掘是從大量數(shù)據(jù)集中發(fā)現(xiàn)可行信息的過程,是統(tǒng)計(jì)分析技術(shù)、數(shù)據(jù)庫技術(shù)及人工智能技術(shù)的綜合。面對(duì)油井工況實(shí)時(shí)分析及功圖計(jì)產(chǎn)系統(tǒng)大量的油井生產(chǎn)完備數(shù)據(jù),長慶油田充分利用數(shù)據(jù)挖掘技術(shù),對(duì)數(shù)據(jù)進(jìn)一步清理、集成、轉(zhuǎn)換、挖掘應(yīng)用,深化功圖系統(tǒng)數(shù)據(jù)分析,先后開展了動(dòng)液面計(jì)算,系統(tǒng)效率在線實(shí)時(shí)監(jiān)測(cè)、區(qū)塊動(dòng)態(tài)分析研究等,并應(yīng)用于油田現(xiàn)場(chǎng),取得了較好的效果,既節(jié)約了生產(chǎn)成本,又方便了現(xiàn)場(chǎng)管理應(yīng)用,進(jìn)一步提升系統(tǒng)在長慶油田數(shù)字化前端的核心地位。

3.1區(qū)塊動(dòng)態(tài)分析

油井生產(chǎn)中,每天都會(huì)獲得大量的實(shí)時(shí)生產(chǎn)數(shù)據(jù),目前系統(tǒng)主要對(duì)單井完成工況分析及產(chǎn)液量計(jì)算,如何通過分析和處理這些數(shù)據(jù),及時(shí)全面了解油田區(qū)塊產(chǎn)油量、壓力、含水等變化規(guī)律是數(shù)據(jù)挖掘應(yīng)用又一問題。長慶油田開展了基于油井工況診斷及功圖計(jì)產(chǎn)系統(tǒng)的區(qū)塊動(dòng)態(tài)分析,從空間和歷史角度,對(duì)油井分類、分級(jí)、分層次進(jìn)行統(tǒng)計(jì)分析,挖掘生產(chǎn)數(shù)據(jù)里有用的信息,提煉區(qū)塊共性問題,并按照設(shè)計(jì)的模板(區(qū)塊指標(biāo)統(tǒng)計(jì)圖表、供液能力分析、產(chǎn)量分析、故障井分析等)每月30日自動(dòng)生成全面及時(shí)的區(qū)塊油井生產(chǎn)動(dòng)態(tài)分析,從而指導(dǎo)區(qū)塊生產(chǎn)管理,實(shí)現(xiàn)油田的精細(xì)管理,為油田開發(fā)決策提供依據(jù)。

4結(jié)束語

隨著長慶油田數(shù)字化建設(shè)的不斷深入,各種生產(chǎn)、研究、管理等數(shù)據(jù)庫不斷增加,如何深化數(shù)據(jù)應(yīng)用,準(zhǔn)確迅速從數(shù)據(jù)庫是提取有用信息,已成為是數(shù)字油田生產(chǎn)管理的迫切需求。在基于油井工況實(shí)時(shí)分析及功圖計(jì)產(chǎn)系統(tǒng)數(shù)據(jù)挖掘應(yīng)用中我們積累了不少經(jīng)驗(yàn),拓展了系統(tǒng)功能,提升系統(tǒng)在長慶油田數(shù)字化前端的核心地位。在今后應(yīng)用中,油田數(shù)據(jù)挖掘應(yīng)用注意幾個(gè)問題:

(1)數(shù)據(jù)是數(shù)字油田的血液,為了保證數(shù)據(jù)挖掘效率,在數(shù)據(jù)庫建設(shè)中要規(guī)范數(shù)據(jù)存儲(chǔ)格式,保證數(shù)據(jù)源及數(shù)據(jù)類型的統(tǒng)一,同時(shí)加強(qiáng)數(shù)據(jù)審核,注重?cái)?shù)據(jù)入庫的質(zhì)量;

(2)數(shù)據(jù)挖掘中盡可能使用可視化工具,一幅圖勝過千句話,數(shù)據(jù)挖掘可視化主要包括數(shù)據(jù)可視化、挖掘結(jié)果可視化、挖掘過程可視化等;

第3篇

目前現(xiàn)有的針對(duì)煙草營銷策略的研究,多采用數(shù)據(jù)挖掘的思想,基于數(shù)據(jù)挖掘的營銷策略是對(duì)終端客戶進(jìn)行分類,根據(jù)用戶的銷量和誠信記錄把用戶分為多個(gè)等級(jí),但這種分級(jí)策略只能反應(yīng)用戶的銷量信息,把這個(gè)分類作為營銷策略依據(jù)太單薄,只能起一定的輔助作用。更深入地研究是根據(jù)客戶的資料和歷史訂單數(shù)據(jù)對(duì)現(xiàn)有商戶進(jìn)行聚類,獲取到自主的商戶分類,但盲目的聚類會(huì)導(dǎo)致商戶的分類沒有實(shí)際意義,或獲取的結(jié)果是無助于營銷目的的。

2技術(shù)關(guān)鍵

本系統(tǒng)采用基于營銷目的的商戶聚類,技術(shù)關(guān)鍵包括三部分內(nèi)容:數(shù)據(jù)預(yù)處理中的特征選擇、基于限制目標(biāo)的商戶精確聚類和基于聚類結(jié)果的多層關(guān)聯(lián)規(guī)則算法的研究。

2.1特征選擇

假定獲取的數(shù)據(jù)的維數(shù)為n,通常情況下n是很大的一個(gè)數(shù),為簡化模型,也為了防止模型陷入過擬合(維數(shù)災(zāi)難),需要進(jìn)行降維處理,即僅把對(duì)項(xiàng)目改造判定起關(guān)鍵作用的因素挑選出來。本系統(tǒng)采用PCA算法來進(jìn)行降維處理,過程如下:

1)計(jì)算標(biāo)準(zhǔn)化后的矩陣Z的樣本的協(xié)方差矩陣Cov;

2)計(jì)算協(xié)方差矩陣Cov的本征向量e1,e2,…,en的本征值。本征值按大到小排序;

3)投影數(shù)據(jù)

到本征矢張成的空間之中,利用貢獻(xiàn)分析取前m個(gè)向量Y1,Y2,…,Ym。

2.2基于營銷目標(biāo)限制的商戶精確聚類算法

現(xiàn)有聚類算法一般沒有約束條件,只根據(jù)相似度來進(jìn)行聚類,為了能夠體現(xiàn)約束條件,需要在聚類相似度或者樣本距離之間把限制條件增加進(jìn)去,這樣在樣本聚類的時(shí)候即可使得具有相同營銷特性的樣本或者客戶被劃分到同一個(gè)類中。煙草終端商戶的大部分屬性是分類屬性,例如:地區(qū)、類別等,此外還有數(shù)字型屬性、日期型屬性,由于存在不同類型的屬性,常規(guī)的聚類算法無法使用,為此,采用把數(shù)字屬性和日期屬性劃分區(qū)間的思路,這樣可以轉(zhuǎn)化成分類屬性的方式來進(jìn)行聚類。進(jìn)而可建立如下商戶模型:分類對(duì)象X∈Ω,X=[A1=x1]∧[A2=x2]∧…∧[Am=xm],其中xj∈DOM(Aj),1≤j≤m,為簡便起見,將對(duì)象X∈Ω用向量(x1,x2,…,xm)表達(dá),如果屬性Aj的值不存在,則Aj=ε。令Χ={X1,X2,…,Xn}為n個(gè)分類對(duì)象的集合,用集合方式表達(dá)分類對(duì)象,則Xi={xi,1,xi,2,…,xi,m},如果屬性Aj的值不存在,則集合中不出現(xiàn)xi,j,容易得到|Xi|≤m。如果存在Xi,j=Xk,j,1≤j≤m,則Xi=Xk。為方便聚類,利用聚類匯總來壓縮原始數(shù)據(jù),從而達(dá)到提高算法效率的目的。一個(gè)類C可以由如下三元組(n,I,S)來表示。其中n為類C中的對(duì)象數(shù)量,I={i1,i2,…,iu}是C內(nèi)所有屬性值的集合,S={s1,s2,…,su},其中sj為ij在類C中的數(shù)量,ij∈I,1≤j≤u。集合S按升序排列,即s1≤s2≤…≤su,這同時(shí)也暗示集合I的元素按其在C中的數(shù)量按升序排列。三元組(n,I,S)被稱作類C的聚類匯總CS,CS的三個(gè)成員分別記作CS.n、CS.I和CS.S;對(duì)于CS.I的任一元素ij∈CS.I,則記作CS.I.ij,對(duì)于sj∈CS.S,則記作CS.S.sj,其中1≤j≤u。

2.3基于煙草營銷的多層關(guān)聯(lián)規(guī)則的研究

針對(duì)本項(xiàng)目,對(duì)關(guān)聯(lián)規(guī)則定義進(jìn)行擴(kuò)展,對(duì)形如:XY的關(guān)聯(lián)規(guī)則,不再限定X和Y為一個(gè)項(xiàng)目集,而把X和Y定義為條件的合取范式,每個(gè)條件Ai=True/False為布爾表達(dá)式。此時(shí)的Ai為一個(gè)項(xiàng)目集,它的含義與原來的X和Y的含義相同,如果把結(jié)果中的條件布爾表達(dá)式寫成Cj=True/False,則關(guān)聯(lián)規(guī)則有如下形式:(A1=True/False)∧(A2=True/False)∧…∧(An=True/False)(C1=True/False)∧(C2=True/False)∧…∧(Cm=True/False)關(guān)聯(lián)規(guī)則的開采問題可以分解成以下兩個(gè)子問題:

①從數(shù)據(jù)集合或交易集合D中發(fā)現(xiàn)所有的頻繁項(xiàng)目集。

②從頻繁項(xiàng)目集中生成所有置信度不小于用戶定義的最小置信度minconf的關(guān)聯(lián)規(guī)則。即對(duì)任一個(gè)頻繁項(xiàng)目集F和F的所有非空真子集S,SF,如果sup(F)/sup(F-S)≥minconf,則(F-S)S就是一條有效的關(guān)聯(lián)規(guī)則。按上述方法發(fā)現(xiàn)所有類似的規(guī)則。這兩個(gè)步驟中第2步要相對(duì)容易,因此項(xiàng)目的研究將更關(guān)注第1步,由于最大頻繁項(xiàng)目集已經(jīng)隱含了所有頻繁項(xiàng)目集,所以可以把發(fā)現(xiàn)頻繁項(xiàng)目集的問題轉(zhuǎn)化為發(fā)現(xiàn)最大頻繁項(xiàng)目集的問題。針對(duì)煙草營銷的客戶,進(jìn)行關(guān)聯(lián)規(guī)則挖掘時(shí),是在上一步的基礎(chǔ)上,即針對(duì)每一個(gè)商戶群進(jìn)行規(guī)則挖掘。在獲取到最大頻繁項(xiàng)目集后,順序生成頻繁項(xiàng)目集,然后獲取到可用的關(guān)聯(lián)規(guī)則。此時(shí)獲取的關(guān)聯(lián)規(guī)則是底層關(guān)聯(lián)規(guī)則,然后再采用概念樹的方法對(duì)獲取的底層關(guān)聯(lián)規(guī)則進(jìn)行匯總。概念樹由煙草領(lǐng)域?qū)<腋鶕?jù)屬性的領(lǐng)域知識(shí)提供,按特定屬性的概念層次從一般到具體排序。樹的根結(jié)點(diǎn)是用any表示最一般的概念,葉結(jié)點(diǎn)是最具體的概念即屬性的具體值。

第4篇

近年來,我國的部隊(duì)管理體系已經(jīng)逐漸向著自動(dòng)化方向發(fā)展,部隊(duì)中各個(gè)部門都建立了一定的管理體系,也逐漸脫離了人工管理模式,實(shí)現(xiàn)信息現(xiàn)代化模式,很大程度提高了部隊(duì)工作的效率,但是由于外界因素與經(jīng)濟(jì)發(fā)展的多樣化以及人們的思維模式也在不斷改變,從而出現(xiàn)了一些新問題,使得部隊(duì)管理體系存在著一定問題:第一、關(guān)聯(lián)性小、系統(tǒng)比較獨(dú)立。現(xiàn)階段,部隊(duì)采購食品系統(tǒng)的作用以及目的比較簡單,思維面也比較窄,也就是說按照清單進(jìn)行食品采購時(shí),不能充分考慮到采購人員的健康、效率等問題,不能達(dá)到最優(yōu)化采購方式,因此就變得比較獨(dú)立;第二,數(shù)據(jù)功能簡單,可靠性不高。現(xiàn)階段,部隊(duì)食品采購數(shù)據(jù)只是對(duì)采購的種類與過程進(jìn)行簡單記錄,時(shí)間一久,就會(huì)被損壞或者丟失;第三,數(shù)據(jù)分散不集中。現(xiàn)階段與部隊(duì)人員健康、起居飲食、訓(xùn)練相關(guān)的數(shù)據(jù)分散在不同系統(tǒng)中,使得數(shù)據(jù)變得不一致、不完整,僅僅只能進(jìn)行簡單查詢、匯總、統(tǒng)計(jì)等工作,不能對(duì)數(shù)據(jù)進(jìn)行多角度分析、關(guān)聯(lián)等,不能為采購食品提供很好的政策支持。針對(duì)部隊(duì)采購存在的問題,可以利用數(shù)據(jù)倉庫以及數(shù)據(jù)挖掘技術(shù)建立多為數(shù)據(jù)庫,利用數(shù)據(jù)挖掘進(jìn)技術(shù)對(duì)食品采購數(shù)據(jù)進(jìn)行挖掘。依據(jù)現(xiàn)階段部隊(duì)的實(shí)際發(fā)展情況,建立一套新數(shù)據(jù)庫的成本代價(jià)比較高,因此,選用了目前社會(huì)上通用方法,對(duì)已經(jīng)存在的數(shù)據(jù)進(jìn)行一定改革與拓展,合理優(yōu)化系統(tǒng)數(shù)據(jù),成為新的數(shù)據(jù)庫。并且選取對(duì)數(shù)據(jù)挖掘影響比較大的系統(tǒng)性分析,包括訓(xùn)練系統(tǒng),食品采購系統(tǒng)、人員管理系統(tǒng)以及醫(yī)療衛(wèi)生系統(tǒng)。針對(duì)食品采購采購系統(tǒng)建立數(shù)據(jù)模型。

二、在部隊(duì)食品采購系統(tǒng)中的應(yīng)用以及其價(jià)值評(píng)價(jià)

在部隊(duì)食品采購系統(tǒng)實(shí)際應(yīng)用工程中,其實(shí)可以運(yùn)用MicrosoftSQLServerAnalysisServices來對(duì)數(shù)據(jù)進(jìn)行分析,并且在數(shù)據(jù)挖掘過程中對(duì)多維數(shù)據(jù)進(jìn)行描述與查找起到一定作用。因?yàn)槎嗑S數(shù)據(jù)比較復(fù)雜,增長的也比較快,因此,進(jìn)行手動(dòng)查找是很困難的,數(shù)據(jù)挖掘技術(shù)提供的計(jì)算模式可以很好的對(duì)數(shù)據(jù)進(jìn)行分析與查找。在建設(shè)部隊(duì)食品采購倉庫數(shù)據(jù)的時(shí)候,數(shù)據(jù)內(nèi)容主要包括了人員的健康、兵員的飲食以及訓(xùn)練等,進(jìn)行數(shù)據(jù)挖掘主要包括以下內(nèi)容:第一,把每個(gè)主題信息數(shù)據(jù)進(jìn)行收集、匯總、分析等,對(duì)人員情況、健康、飲食、訓(xùn)練等進(jìn)行合理分析;第二,多維分析數(shù)據(jù)信息。根據(jù)部隊(duì)的實(shí)際情況,利用數(shù)據(jù)挖掘技術(shù)對(duì)部隊(duì)人員健康、飲食、訓(xùn)練等數(shù)據(jù)信息進(jìn)行多維分析,其中包含上鉆、切片、下鉆等;第三,挖掘健康與飲食之間的內(nèi)在關(guān)系。根據(jù)數(shù)據(jù)庫中許多面向主題的歷史數(shù)據(jù),采用數(shù)據(jù)挖掘技術(shù)進(jìn)行分析與演算得到部隊(duì)人員的訓(xùn)練和健康情況與部隊(duì)飲食之間內(nèi)在關(guān)系,以便于為部隊(duì)食品采購提供合理的、有效的保障,從而提高部隊(duì)整體人員的健康水平、身體素質(zhì)以及訓(xùn)練質(zhì)量,對(duì)提高我國部隊(duì)?wèi)?zhàn)斗力有著深遠(yuǎn)的意義。

三、結(jié)束語

第5篇

[關(guān)鍵詞]數(shù)據(jù)挖掘客戶關(guān)系管理應(yīng)用步驟

根據(jù)波特的影響企業(yè)的利益相關(guān)者理論,企業(yè)有五個(gè)利益相關(guān)者,分別是客戶、競(jìng)爭(zhēng)對(duì)手、供應(yīng)商、分銷商和政府等其他利益相關(guān)者。其中,最重要的利益相關(guān)者就是客戶。現(xiàn)代企業(yè)的競(jìng)爭(zhēng)優(yōu)勢(shì)不僅體現(xiàn)在產(chǎn)品上,還體現(xiàn)在市場(chǎng)上,誰能獲得更大的市場(chǎng)份額,誰就能在競(jìng)爭(zhēng)中占據(jù)優(yōu)勢(shì)和主動(dòng)。而對(duì)市場(chǎng)份額的爭(zhēng)奪實(shí)質(zhì)上是對(duì)客戶的爭(zhēng)奪,因此,企業(yè)必須完成從“產(chǎn)品”導(dǎo)向向“客戶”導(dǎo)向的轉(zhuǎn)變,對(duì)企業(yè)與客戶發(fā)生的各種關(guān)系進(jìn)行管理。進(jìn)行有效的客戶關(guān)系管理,就要通過有效的途徑,從儲(chǔ)存大量客戶信息的數(shù)據(jù)倉庫中經(jīng)過深層分析,獲得有利于商業(yè)運(yùn)作,提高企業(yè)市場(chǎng)競(jìng)爭(zhēng)力的有效信息。而實(shí)現(xiàn)這些有效性的關(guān)鍵技術(shù)支持就是數(shù)據(jù)挖掘,即從海量數(shù)據(jù)中挖掘出更有價(jià)值的潛在信息。正是有了數(shù)據(jù)挖掘技術(shù)的支持,才使得客戶關(guān)系管理的理念和目標(biāo)得以實(shí)現(xiàn),滿足現(xiàn)代電子商務(wù)時(shí)代的需求和挑戰(zhàn)。

一、客戶關(guān)系管理(CRM)

CRM是一種旨在改善企業(yè)與客戶之間關(guān)系的新型管理方法。它是企業(yè)通過富有意義的交流和溝通,理解并影響客戶行為,最終實(shí)現(xiàn)提高客戶獲取、客戶保留、客戶忠誠和客戶創(chuàng)利的目的。它包括的主要內(nèi)容有客戶識(shí)別、客戶關(guān)系的建立、客戶保持、客戶流失控制和客戶挽留。通過客戶關(guān)系管理能夠提高企業(yè)銷售收入,改善企業(yè)的服務(wù),提高客戶滿意度,同時(shí)能提高員工的生產(chǎn)能力。

二、數(shù)據(jù)挖掘(DM)

數(shù)據(jù)挖掘(DataMining,簡稱DM),簡單的講就是從大量數(shù)據(jù)中挖掘或抽取出知識(shí)。數(shù)據(jù)挖掘概念的定義描述有若干版本。一個(gè)通用的定義是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中提取人們感興趣的知識(shí),這些知識(shí)是隱諱的、事先未知的、潛在有用的信息。

常用的數(shù)據(jù)挖掘方法有:(1)關(guān)聯(lián)分析。即從給定的數(shù)據(jù)集中發(fā)現(xiàn)頻繁出現(xiàn)的項(xiàng)集模式知識(shí)。例如,某商場(chǎng)通過關(guān)聯(lián)分析,可以找出若干個(gè)客戶在本商場(chǎng)購買商品時(shí),哪些商品被購置率較高,進(jìn)而可以發(fā)現(xiàn)數(shù)據(jù)庫中不同商品的聯(lián)系,進(jìn)而反映客戶的購買習(xí)慣。(2)序列模式分析。它與關(guān)聯(lián)分析相似,其目的也是為了控制挖掘出的數(shù)據(jù)間的聯(lián)系。但序列模式分析的側(cè)重點(diǎn)在于分析數(shù)據(jù)間的前后(因果)關(guān)系。例如,可以通過分析客戶在購買A商品后,必定(或大部分情況下)隨著購買B商品,來發(fā)現(xiàn)客戶潛在的購買模式。(3)分類分析。是找出一組能夠描述數(shù)據(jù)集合典型特征的模型,以便能夠分類識(shí)別未知數(shù)據(jù)的歸屬或類別。例如,銀行可以根據(jù)客戶的債務(wù)水平、收入水平和工作情況,可對(duì)給定用戶進(jìn)行信用風(fēng)險(xiǎn)分析。(4)聚類分析。是從給定的數(shù)據(jù)集中搜索數(shù)據(jù)對(duì)象之間所存在的有價(jià)值聯(lián)系。在商業(yè)上,聚類可以通過顧客數(shù)據(jù)將顧客信息分組,并對(duì)顧客的購買模式進(jìn)行描述,找出他們的特征,制定針對(duì)性的營銷方案。(5)孤立點(diǎn)分析。孤立點(diǎn)是數(shù)據(jù)庫中與數(shù)據(jù)的一般模式不一致的數(shù)據(jù)對(duì)象,它可能是收集數(shù)據(jù)的設(shè)備出現(xiàn)故障、人為輸入時(shí)的輸入錯(cuò)誤等。孤立點(diǎn)分析就是專門挖掘這些特殊信息的方法。例如,銀行可以利用孤立點(diǎn)分析發(fā)現(xiàn)信用卡詐騙,電信部門可以利用孤立點(diǎn)分析發(fā)現(xiàn)電話盜用等。

三、數(shù)據(jù)挖掘在客戶關(guān)系管理中的應(yīng)用

1.進(jìn)行客戶分類

客戶分類是將大量的客戶分成不同的類別,在每一類別里的客戶具有相似的屬性,而不同類別里的客戶的屬性不同。數(shù)據(jù)挖掘可以幫助企業(yè)進(jìn)行客戶分類,針對(duì)不同類別的客戶,提供個(gè)性化的服務(wù)來提高客戶的滿意度,提高現(xiàn)有客戶的價(jià)值。細(xì)致而可行的客戶分類對(duì)企業(yè)的經(jīng)營策略有很大益處。例如,保險(xiǎn)公司在長期的保險(xiǎn)服務(wù)中,積累了很多的數(shù)據(jù)信息,包括對(duì)客戶的服務(wù)歷史、對(duì)客戶的銷售歷史和收入,以及客戶的人口統(tǒng)計(jì)學(xué)資料和生活方式等。保險(xiǎn)公司必須將這些眾多的信息資源綜合起來,以便在數(shù)據(jù)庫里建立起一個(gè)完整的客戶背景。在客戶背景信息中,大批客戶可能在保險(xiǎn)種類、保險(xiǎn)年份和保險(xiǎn)金額上具有極高的相似性,因而形成了具有共性的客戶群體。經(jīng)過數(shù)據(jù)挖掘的聚類分析,可以發(fā)現(xiàn)他們的共性,掌握他們的保險(xiǎn)理念,提供有針對(duì)性的服務(wù),提高保險(xiǎn)公司的綜合服務(wù)水平,并可以降低業(yè)務(wù)服務(wù)成本,取得更高的收益。

2.進(jìn)行客戶識(shí)別和保留

(1)在CRM中,首先應(yīng)識(shí)別潛在客戶,然后將他們轉(zhuǎn)化為客戶

這時(shí)可以采用DM中的分類方法。首先是通過對(duì)數(shù)據(jù)庫中各數(shù)據(jù)進(jìn)行分析,從而建立一個(gè)描述已知數(shù)據(jù)集類別或概念的模型,然后對(duì)每一個(gè)測(cè)試樣本,用其已知的類別與學(xué)習(xí)所獲模型的預(yù)測(cè)類別做比較,如果一個(gè)學(xué)習(xí)所獲模型的準(zhǔn)確率經(jīng)測(cè)試被認(rèn)可,就可以用這個(gè)模型對(duì)未來對(duì)象進(jìn)行分類。例如,圖書發(fā)行公司利用顧客郵件地址數(shù)據(jù)庫,給潛在顧客發(fā)送用于促銷的新書宣傳冊(cè)。該數(shù)據(jù)庫內(nèi)容有客戶情況的描述,包括年齡、收入、職業(yè)、閱讀偏好、訂購習(xí)慣、購書資金、計(jì)劃等屬性的描述,顧客被分類為“是”或“否”會(huì)成為購買書籍的顧客。當(dāng)新顧客的信息被輸入到數(shù)據(jù)庫中時(shí),就對(duì)該新顧客的購買傾向進(jìn)行分類,以決定是否給該顧客發(fā)送相應(yīng)書籍的宣傳手冊(cè)。

(2)在客戶保留中的應(yīng)用

客戶識(shí)別是獲取新客戶的過程,而客戶保留則是留住老顧客、防止客戶流失的過程。對(duì)企業(yè)來說,獲取一個(gè)新顧客的成本要比保留一個(gè)老顧客的成本高。在保留客戶的過程中,非常重要的一個(gè)工作就是要找出顧客流失的原因。例如,某專科學(xué)校的招生人數(shù)在逐漸減少,那么就要找出減少的原因,經(jīng)過廣泛的搜集信息,發(fā)現(xiàn)原因在于本學(xué)校對(duì)技能培訓(xùn)不夠重視,學(xué)生只能學(xué)到書本知識(shí),沒有實(shí)際的技能,在就業(yè)市場(chǎng)上找工作很難。針對(duì)這種情況,學(xué)校應(yīng)果斷的抽取資金,購買先進(jìn)的、有針對(duì)性的實(shí)驗(yàn)實(shí)訓(xùn)設(shè)備,同時(shí)修改教學(xué)計(jì)劃,加大實(shí)驗(yàn)實(shí)訓(xùn)課時(shí)和考核力度,培訓(xùn)相關(guān)專業(yè)的教師。

(3)對(duì)客戶忠誠度進(jìn)行分析

客戶的忠誠意味著客戶不斷地購買公司的產(chǎn)品或服務(wù)。數(shù)據(jù)挖掘在客戶忠誠度分析中主要是對(duì)客戶持久性、牢固性和穩(wěn)定性進(jìn)行分析。比如大型超市通過會(huì)員的消費(fèi)信息,如最近一次消費(fèi)、消費(fèi)頻率、消費(fèi)金額三個(gè)指標(biāo)對(duì)數(shù)據(jù)進(jìn)行分析,可以預(yù)測(cè)出顧客忠誠度的變化,據(jù)此對(duì)價(jià)格、商品的種類以及銷售策略加以調(diào)整和更新,以便留住老顧客,吸引新顧客。

(4)對(duì)客戶盈利能力分析和預(yù)測(cè)

對(duì)于一個(gè)企業(yè)而言,如果不知道客戶的價(jià)值,就很難做出合適的市場(chǎng)策略。不同的客戶對(duì)于企業(yè)而言,其價(jià)值是不同的。研究表明,一個(gè)企業(yè)的80%的利潤是由只占客戶總數(shù)的20%的客戶創(chuàng)造的,這部分客戶就是有價(jià)值的優(yōu)質(zhì)客戶。為了弄清誰才是有價(jià)值的客戶,就需要按照客戶的創(chuàng)利能力來劃分客戶,進(jìn)而改進(jìn)客戶關(guān)系管理。數(shù)據(jù)挖掘技術(shù)可以用來分析和預(yù)測(cè)不同市場(chǎng)活動(dòng)情況下客戶盈利能力的變化,幫助企業(yè)制定合適的市場(chǎng)策略。商業(yè)銀行一般會(huì)利用數(shù)據(jù)挖掘技術(shù)對(duì)客戶的資料進(jìn)行分析,找出對(duì)提高企業(yè)盈利能力最重要的客戶,進(jìn)而進(jìn)行針對(duì)性的服務(wù)和營銷。

(5)交叉銷售和增量銷售

交叉銷售是促使客戶購買尚未使用的產(chǎn)品和服務(wù)的營銷手段,目的是可以拓寬企業(yè)和客戶間的關(guān)系。增量銷售是促使客戶將現(xiàn)有產(chǎn)品和服務(wù)升級(jí)的銷售活動(dòng),目的在于增強(qiáng)企業(yè)和客戶的關(guān)系。這兩種銷售都是建立在雙贏的基礎(chǔ)上的,客戶因得到更多更好符合其需求的服務(wù)而獲益,公司也因銷售增長而獲益。數(shù)據(jù)挖掘可以采用關(guān)聯(lián)性模型或預(yù)測(cè)性模型來預(yù)測(cè)什么時(shí)間會(huì)發(fā)生什么事件,判斷哪些客戶對(duì)交叉銷售和增量銷售很有意向,以達(dá)到交叉銷售和增量銷售的目的。例如,保險(xiǎn)公司的交叉營銷策略:保險(xiǎn)公司對(duì)已經(jīng)購買某險(xiǎn)種的客戶推薦其它保險(xiǎn)產(chǎn)品和服務(wù)。這種策略成功的關(guān)鍵是要確保推銷的保險(xiǎn)險(xiǎn)種是用戶所感興趣的,否則會(huì)造成用戶的反感。

四、客戶關(guān)系管理應(yīng)用數(shù)據(jù)挖掘的步驟

1.需求分析

只有確定需求,才有分析和預(yù)測(cè)的目標(biāo),然后才能提取數(shù)據(jù)、選擇方法,因此,需求分析是數(shù)據(jù)挖掘的基礎(chǔ)條件。數(shù)據(jù)挖掘的實(shí)施過程也是圍繞著這個(gè)目標(biāo)進(jìn)行的。在確定用戶的需求后,應(yīng)該明確所要解決的問題屬于哪種應(yīng)用類型,是屬于關(guān)聯(lián)分析、分類、聚類及預(yù)測(cè),還是其他應(yīng)用。應(yīng)對(duì)現(xiàn)有資源如已有的歷史數(shù)據(jù)進(jìn)行評(píng)估,確定是否能夠通過數(shù)據(jù)挖掘技術(shù)來解決用戶的需求,然后將進(jìn)一步確定數(shù)據(jù)挖掘的目標(biāo)和制定數(shù)據(jù)挖掘的計(jì)劃。

2.建立數(shù)據(jù)庫

這是數(shù)據(jù)挖掘中非常重要也非常復(fù)雜的一步。首先,要進(jìn)行數(shù)據(jù)收集和集成,其次,要對(duì)數(shù)據(jù)進(jìn)行描述和整合。數(shù)據(jù)主要有四個(gè)方面的來源:客戶信息、客戶行為、生產(chǎn)系統(tǒng)和其他相關(guān)數(shù)據(jù)。這些數(shù)據(jù)通過抽取、轉(zhuǎn)換和裝載,形成數(shù)據(jù)倉庫,并通過OLAP和報(bào)表,將客戶的整體行為結(jié)果分析等數(shù)據(jù)傳遞給數(shù)據(jù)庫用戶。

3.選擇合適的數(shù)據(jù)挖掘工具

如果從上一步的分析中發(fā)現(xiàn),所要解決的問題能用數(shù)據(jù)挖掘比較好地完成,那么需要做的第三步就是選擇合適的數(shù)據(jù)挖掘技術(shù)與方法。將所要解決的問題轉(zhuǎn)化成一系列數(shù)據(jù)挖掘的任務(wù)。數(shù)據(jù)挖掘主要有五種任務(wù):分類,估值預(yù)測(cè),關(guān)聯(lián)規(guī)則,聚集,描述。前三種屬于直接的數(shù)據(jù)挖掘。在直接數(shù)據(jù)挖掘中,目標(biāo)是應(yīng)用可得到的數(shù)據(jù)建立模型,用其它可得到的數(shù)據(jù)來描述感興趣的變量。后兩種屬于間接數(shù)據(jù)挖掘。在間接數(shù)據(jù)挖掘中,沒有單一的目標(biāo)變量,目標(biāo)是在所有變量中發(fā)現(xiàn)某些聯(lián)系。

4.建立模型

建立模型是選擇合適的方法和算法對(duì)數(shù)據(jù)進(jìn)行分析,得到一個(gè)數(shù)據(jù)挖掘模型的過程。一個(gè)好的模型沒必要與已有數(shù)據(jù)完全相符,但模型對(duì)未來的數(shù)據(jù)應(yīng)有較好的預(yù)測(cè)。需要仔細(xì)考察不同的模型以判斷哪個(gè)模型對(duì)所需解決的問題最有用。如決策樹模型、聚類模型都是分類模型,它們將一個(gè)事件或?qū)ο髿w類。回歸是通過具有已知值的變量來預(yù)測(cè)其它變量的值。時(shí)間序列是用變量過去的值來預(yù)測(cè)未來的值。這一步是數(shù)據(jù)挖掘的核心環(huán)節(jié)。建立模型是一個(gè)反復(fù)進(jìn)行的過程,它需要不斷地改進(jìn)或更換算法以尋找對(duì)目標(biāo)分析作用最明顯的模型,最后得到一個(gè)最合理、最適用的模型。

5.模型評(píng)估

為了驗(yàn)證模型的有效性、可信性和可用性,從而選擇最優(yōu)的模型,需要對(duì)模型進(jìn)行評(píng)估。我們可以將數(shù)據(jù)中的一部分用于模型評(píng)估,來測(cè)試模型的準(zhǔn)確性,模型是否容易被理解模型的運(yùn)行速度、輸入結(jié)果的速度、實(shí)現(xiàn)代價(jià)、復(fù)雜度等。模型的建立和檢驗(yàn)是一個(gè)反復(fù)的過程,通過這個(gè)階段階段的工作,能使數(shù)據(jù)以用戶能理解的方式出現(xiàn),直至找到最優(yōu)或較優(yōu)的模型。

6.部署和應(yīng)用

將數(shù)據(jù)挖掘的知識(shí)歸檔和報(bào)告給需要的群體,根據(jù)數(shù)據(jù)挖掘發(fā)現(xiàn)的知識(shí)采取必要的行動(dòng),以及消除與先前知識(shí)可能存在的沖突,并將挖掘的知識(shí)應(yīng)用于應(yīng)用系統(tǒng)。在模型的應(yīng)用過程中,也需要不斷地對(duì)模型進(jìn)行評(píng)估和檢驗(yàn),并做出適當(dāng)?shù)恼{(diào)整,以使模型適應(yīng)不斷變化的環(huán)境。

參考文獻(xiàn):

[1]羅納德.S.史威福特.客戶關(guān)系管理[M].楊東龍譯.北京:中國經(jīng)濟(jì)出版社,2002

[2]馬剛:客戶關(guān)系管理[M]大連:東北財(cái)經(jīng)大學(xué)出版社,2008

[3]朱美珍:以數(shù)據(jù)挖掘提升客戶關(guān)系管理[J].高科技產(chǎn)業(yè)技術(shù)與創(chuàng)新管理,2006,(27)

[4]顧桂芳何世友:數(shù)據(jù)挖掘在客戶關(guān)系管理中的應(yīng)用研究[J].企業(yè)管理,2007,(7)

第6篇

對(duì)于一個(gè)多種網(wǎng)絡(luò)形式并存的復(fù)雜網(wǎng)絡(luò),假設(shè)復(fù)雜網(wǎng)絡(luò)作為一個(gè)網(wǎng)絡(luò)社區(qū),在復(fù)雜網(wǎng)絡(luò)中存在的網(wǎng)絡(luò)類型數(shù)即社區(qū)數(shù)。我們用一個(gè)無向遍歷圖GV,E來表示整個(gè)網(wǎng)絡(luò)社區(qū),如果網(wǎng)絡(luò)中有兩個(gè)節(jié)點(diǎn)有兩條不重合的網(wǎng)絡(luò)路徑,則說明這兩個(gè)節(jié)點(diǎn)處于一個(gè)網(wǎng)絡(luò)環(huán)路當(dāng)中,網(wǎng)絡(luò)中的數(shù)據(jù)流需要經(jīng)過網(wǎng)絡(luò)環(huán)路到達(dá)特定的節(jié)點(diǎn)。當(dāng)在某個(gè)時(shí)間段里需要傳送的數(shù)據(jù)流個(gè)數(shù)大于網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)時(shí),則說明該網(wǎng)絡(luò)的數(shù)據(jù)流密度較大,為了能夠準(zhǔn)確地在復(fù)雜網(wǎng)絡(luò)中挖掘出所需的數(shù)據(jù)流,則需要根據(jù)數(shù)據(jù)流密度來劃分整個(gè)網(wǎng)絡(luò)社區(qū),尋找數(shù)據(jù)流處于哪個(gè)社區(qū),再確定數(shù)據(jù)流所在社區(qū)的環(huán)路。在這里我們通過設(shè)計(jì)算法確定網(wǎng)絡(luò)數(shù)據(jù)流密度,來對(duì)復(fù)雜網(wǎng)絡(luò)進(jìn)行社區(qū)劃分,再對(duì)社區(qū)進(jìn)行無向環(huán)路遍歷,并通過遍歷得到該社區(qū)網(wǎng)絡(luò)的所環(huán)路,確定所需查詢的數(shù)據(jù)流位于哪個(gè)環(huán)路。以下為復(fù)雜網(wǎng)絡(luò)中需要用到的符號(hào)說明。

2增量子空間數(shù)據(jù)挖掘算法

為了能夠有效地在復(fù)雜網(wǎng)絡(luò)中挖掘出目的數(shù)據(jù)流,使用了復(fù)雜網(wǎng)絡(luò)數(shù)據(jù)流密度的分析方法在對(duì)復(fù)雜網(wǎng)絡(luò)進(jìn)行社區(qū)劃分后,通過對(duì)社區(qū)網(wǎng)絡(luò)進(jìn)行無向環(huán)路遍歷并得到社區(qū)網(wǎng)絡(luò)的所有環(huán)路。接下來挖掘算法先后挖掘出目的數(shù)據(jù)流所屬的社區(qū)以及環(huán)路,最終確定目的數(shù)據(jù)流的具置。

2.1基于社區(qū)網(wǎng)絡(luò)遍歷的數(shù)據(jù)流挖掘

當(dāng)數(shù)據(jù)流i與社區(qū)k的相關(guān)度最大時(shí),說明數(shù)據(jù)流i位于社區(qū)k的可能性就最大。但是當(dāng)多個(gè)數(shù)據(jù)流的大小區(qū)別不大時(shí),以數(shù)據(jù)流的大小作為指標(biāo)來定義相關(guān)度會(huì)導(dǎo)致挖掘精度較低。這里我們也引入數(shù)據(jù)流的特征集和數(shù)據(jù)流中的分組隊(duì)列長度來計(jì)算相關(guān)度。

2.2基于多增量空間的數(shù)據(jù)流挖掘

在采用基于社區(qū)網(wǎng)絡(luò)遍歷的數(shù)據(jù)流挖掘方法得到數(shù)據(jù)流的所屬社區(qū)后,我們接著采用基于多增量空間的數(shù)據(jù)流挖掘方法來挖掘出數(shù)據(jù)流的所屬環(huán)路。先將社區(qū)網(wǎng)絡(luò)的環(huán)路進(jìn)行多增量空間擴(kuò)展,即先得到

目標(biāo)數(shù)據(jù)流所經(jīng)過的環(huán)路,再得到數(shù)據(jù)流所經(jīng)過的節(jié)點(diǎn)與時(shí)間的相關(guān)系數(shù),這樣就可以在時(shí)空上確定目的數(shù)據(jù)流位于環(huán)路的哪個(gè)節(jié)點(diǎn)中。

3實(shí)驗(yàn)結(jié)果

為了驗(yàn)證本文提出的基于復(fù)雜網(wǎng)絡(luò)數(shù)據(jù)流密度的增量子空間數(shù)據(jù)挖掘算法的效果,我們通過matlab7.0軟件進(jìn)行算法仿真,其中仿真的復(fù)雜網(wǎng)絡(luò)由多種網(wǎng)絡(luò)形式組成,網(wǎng)絡(luò)節(jié)點(diǎn)有200個(gè),數(shù)據(jù)流大小為500bytes,節(jié)點(diǎn)的接收能耗為10nJ/bit,發(fā)射能耗為50nJ/bit,進(jìn)行信號(hào)處理和功率放大的能耗為10nJ/bit。其他節(jié)點(diǎn)干擾而產(chǎn)生的能量消耗為5nJ/bit。在對(duì)本文算法進(jìn)行分析的過程中,我們采用了對(duì)比分析的方法,Lopez-Yanez等人提出一種基于時(shí)間序列數(shù)據(jù)挖掘的新的關(guān)聯(lián)模型,該模型是基于伽瑪分類,是一種監(jiān)督模式識(shí)別模型,目的是為了挖掘已知模式中的時(shí)間序列,以預(yù)測(cè)未知的值。由Negrevergne等人提出的一種PARAMINER算法:一個(gè)通用的模式挖掘算法的多核架構(gòu)。多核架構(gòu)采用的是一種新的數(shù)據(jù)集縮減技術(shù)(稱之為EL-還原),在算法中通過結(jié)合新的技術(shù)用于處理多核心架構(gòu)的并行執(zhí)行數(shù)據(jù)集。為了驗(yàn)證本文算法的挖掘有效性,我們分別在增多節(jié)點(diǎn)數(shù)量和社區(qū)網(wǎng)絡(luò)數(shù)的情況下獲取算法的數(shù)據(jù)挖掘精度。實(shí)驗(yàn)采用的精度為NMI[16],實(shí)驗(yàn)結(jié)果如圖3和圖4所示。在不同節(jié)點(diǎn)數(shù)量下基于復(fù)雜網(wǎng)絡(luò)數(shù)據(jù)流密度的增量子空間數(shù)據(jù)挖掘算法的挖掘精度更高,挖掘精度高于85%,而文獻(xiàn)[14]的挖掘精度在77%以上,挖掘精度在76%以上。因?yàn)椤⑻岢龅年P(guān)聯(lián)模型、提出的多核架構(gòu)沒有準(zhǔn)確把握數(shù)據(jù)流在不同時(shí)間段里與環(huán)路位置的相關(guān)情況。而本文算法采用社區(qū)網(wǎng)絡(luò)遍歷和多增量空間的方法可以有效地確定這種相關(guān)性。圖4為不同社區(qū)數(shù)下的算法挖掘精度,從圖中可以看出,當(dāng)社區(qū)網(wǎng)絡(luò)的種類增多時(shí),會(huì)對(duì)算法的挖掘精度造成影響,本文算法的挖掘精度在社區(qū)數(shù)為10時(shí)是95.7%,當(dāng)社區(qū)數(shù)增加到50時(shí)為87.5%。而基于時(shí)間序列數(shù)據(jù)挖掘方法的挖掘精度在社區(qū)數(shù)為10時(shí)是88.6%,在社區(qū)數(shù)為50時(shí)是77.4%,而PARAMINER算法在社區(qū)數(shù)為10時(shí)是86.7%,社區(qū)數(shù)為50時(shí)是78.2%。因此從數(shù)據(jù)分析來看,本文算法的數(shù)據(jù)挖掘精度在社區(qū)數(shù)增多時(shí)仍能保持在較高水平。

4結(jié)論

第7篇

物聯(lián)網(wǎng)數(shù)據(jù)挖掘處理功能需要在Hadoop平臺(tái)和Map/Reduce模式基礎(chǔ)上進(jìn)行,對(duì)此需要?jiǎng)澐?個(gè)不同層面的操作流程。

1.1Hadoop平臺(tái)的具體操作流程

(1)對(duì)物聯(lián)網(wǎng)中的RFID數(shù)據(jù)進(jìn)行過濾、轉(zhuǎn)換、合并的處理,并在分布式系統(tǒng)HDFS中保存PML文件形式的數(shù)據(jù)。同時(shí),可采取副本策略來處理PML文件,在同一機(jī)構(gòu)的不同節(jié)點(diǎn)或不同機(jī)構(gòu)的某一節(jié)點(diǎn)上保存PML文件中的2-3個(gè)副本,進(jìn)而可實(shí)現(xiàn)對(duì)存儲(chǔ)、處理、節(jié)點(diǎn)失效問題的有效解決。

(2)在執(zhí)行任務(wù)過程中,創(chuàng)建和管理控制是Master(主控程序)的主要工作,當(dāng)Worker處于空閑狀態(tài)時(shí)會(huì)接收到有關(guān)的分配任務(wù),需與Map/Reduce互相合作實(shí)現(xiàn)操作處理,處理的最終結(jié)果由Master來歸并,同時(shí)將反饋結(jié)果傳送給用戶。

1.2Map/Reduce的具體操作流程

(1)根據(jù)參數(shù)在Map/Reduce思想指導(dǎo)下對(duì)輸入文件進(jìn)行分割處理,使其細(xì)化為M塊(16-64M大小范圍)。

(2)Master、Worker、Map操作(M個(gè))、Reduce操作(R個(gè))是構(gòu)成執(zhí)行程序的主要部分,其中Map/Reduce的處理任務(wù)會(huì)由Master伴隨物聯(lián)網(wǎng)的快速發(fā)展和廣泛應(yīng)用,人們可以有效利用物聯(lián)網(wǎng)來實(shí)現(xiàn)信息交換和通信的目的,不過物聯(lián)網(wǎng)海量數(shù)據(jù)的日益增多大大降低了物聯(lián)網(wǎng)服務(wù)的質(zhì)量。在此,對(duì)基于Apriori算法進(jìn)行物聯(lián)網(wǎng)數(shù)據(jù)挖掘研究。摘要將其分配給空閑的Worker。

(3)在處理Map任務(wù)時(shí),Worker會(huì)讀取處理中的數(shù)據(jù),并向Map函數(shù)傳送<key,value>,而后產(chǎn)生中間結(jié)果在內(nèi)存中緩存且定時(shí)向本地硬盤傳送。此外,依據(jù)分區(qū)函數(shù)將中間結(jié)果分割為R塊區(qū),利用Master將本地硬盤接收到的數(shù)據(jù)位置信息傳送給Reduce函數(shù)。

(4)ReduceWorker根據(jù)Master所傳送的文件信息采用遠(yuǎn)程讀取方式來操作,以在本地文件中找到對(duì)應(yīng)的文件,對(duì)文件的中間key進(jìn)行有序排列,并利用遠(yuǎn)程發(fā)送信息給具體執(zhí)行的Reduce。

(5)ReduceWorker依據(jù)key排序后的中間數(shù)據(jù)向Reduce函數(shù)傳送與key對(duì)應(yīng)的中間結(jié)果集,而最后的結(jié)果需采取最終輸出文件來進(jìn)行編寫。

(6)當(dāng)Map、Reduce的任務(wù)全部完成之后,MapReduce將回歸到用戶程序的調(diào)用點(diǎn)處,同時(shí)以Master對(duì)用戶程序進(jìn)行激活。

2基于Apriori算法的物聯(lián)網(wǎng)數(shù)據(jù)挖掘

2.1Apriori數(shù)據(jù)挖掘原理和操作流程

Apriori是提升物聯(lián)網(wǎng)數(shù)據(jù)挖掘功能的一種最有效算法,其原理是在K項(xiàng)集中以逐層搜索迭代的方式來探索。具體的操作流程包括:

(1)掃描數(shù)據(jù)集以生成頻繁1-項(xiàng)集L1。

(2)通過L1來探索頻繁項(xiàng)集L2,采用不斷迭代的方式來持續(xù)探索,直至頻繁項(xiàng)集是空集。

2.2K次循環(huán)搜索后的數(shù)據(jù)挖掘流程

當(dāng)已完成了K次循環(huán)搜索時(shí),還需要進(jìn)行2個(gè)數(shù)據(jù)挖掘的操作流程:(1)在LK-1生成CK(候選集)之后,開展JOIN操作。(2)支持度統(tǒng)計(jì)和剪枝的操作依據(jù)Apriori性質(zhì)來進(jìn)行,而后使得CK生成LK(頻繁集)。為提高物聯(lián)網(wǎng)數(shù)據(jù)挖掘的效率,節(jié)省系統(tǒng)的時(shí)間和內(nèi)存消耗,在Apriori算法基礎(chǔ)上還需要借鑒和移植云計(jì)算平臺(tái)的分布式并行計(jì)算性質(zhì)。如此以實(shí)現(xiàn)Hadoop架構(gòu)的建立,在掃描數(shù)據(jù)庫查找頻繁項(xiàng)集中得到的并聯(lián)規(guī)則需要存儲(chǔ)在Hadoop架構(gòu)中。同時(shí),為取得各個(gè)計(jì)算節(jié)點(diǎn)上的局部頻繁項(xiàng)集,各個(gè)DataNode節(jié)點(diǎn)需要經(jīng)歷并行操作的掃描處理,并使用Master來統(tǒng)計(jì)和確定實(shí)際全局的支持度、頻繁項(xiàng)集。

2.3Apriori算法Map/Reduce化的處理流程

上述提及基于Apriori算法的物聯(lián)網(wǎng)數(shù)據(jù)挖掘需借助于Map/Reduce模式,其數(shù)據(jù)挖掘功能的實(shí)現(xiàn)還應(yīng)Map/Reduce化Apriori算法。主要的處理流程包括:

(1)用戶提出挖掘服務(wù)的請(qǐng)求,且由用戶來設(shè)置Apriori所需的數(shù)據(jù),如最小支持度、置信度。

(2)當(dāng)Master接收到請(qǐng)求后,通過NameNode來進(jìn)行PML文件的申請(qǐng),而后逐步完成訪問空閑節(jié)點(diǎn)列表、向空閑的DataNode分配任務(wù)、調(diào)度和并行處理各個(gè)DataNode需要的存儲(chǔ)節(jié)點(diǎn)算法。

(3)運(yùn)用Map函數(shù)來處理每個(gè)DataNode的<key,value>對(duì)映射、新鍵值對(duì),以CnK(用1表示每一個(gè)CnK的支持度)來表示所產(chǎn)生的一個(gè)局部候選頻繁K項(xiàng)集。

(4)通過Reduce函數(shù)來實(shí)現(xiàn)調(diào)用計(jì)算,對(duì)每個(gè)DataNode節(jié)點(diǎn)上相同候選項(xiàng)集的支持度進(jìn)行累加,以產(chǎn)生一個(gè)實(shí)際的支持度,將其與最小支持度(用戶申請(qǐng)時(shí)所設(shè)置)進(jìn)行比較,進(jìn)而用LnK表示所生成的局部頻繁K項(xiàng)集的集合。

(5)對(duì)所有的處理結(jié)果進(jìn)行合并,從而實(shí)現(xiàn)全局頻繁K項(xiàng)集LK的生成。

3結(jié)論

第8篇

網(wǎng)上銀行促銷渠道分析系統(tǒng)采用C/S架構(gòu)或者B/S架構(gòu),充分考慮系統(tǒng)易用性和投入產(chǎn)出。從維護(hù)網(wǎng)上銀行的C/S架構(gòu)和B/S架構(gòu)角度來分析,使用網(wǎng)上銀行促銷渠道分析系統(tǒng)的多是管理人員,并且在未來的發(fā)展過程中,系統(tǒng)用戶數(shù)量也不會(huì)大幅度上漲,綜合網(wǎng)上銀行系統(tǒng)的維護(hù)成本和開發(fā)成本,盡量選擇C/S架構(gòu)。從使用者和系統(tǒng)數(shù)據(jù)傳輸?shù)慕嵌葋矸治觯挥秀y行工作人員才能使用這個(gè)系統(tǒng),而C/S架構(gòu)具有良好的靈活性。綜上所述,網(wǎng)上銀行促銷渠道分析系統(tǒng)可以使用C/S架構(gòu)來部署軟件模塊。由于網(wǎng)上銀行系統(tǒng)包含大量的客戶信息數(shù)據(jù),因此網(wǎng)上銀行系統(tǒng)必須具有更高的安全性和保密性,相關(guān)操作人員必須強(qiáng)化風(fēng)險(xiǎn)防范意識(shí),規(guī)范網(wǎng)上銀行系統(tǒng)操作,嚴(yán)格控制系統(tǒng)的數(shù)據(jù)傳輸。網(wǎng)上銀行系統(tǒng)必須具有良好的擴(kuò)展性,為數(shù)據(jù)表和數(shù)據(jù)查詢算法留出充足的軟硬件資源。同時(shí),網(wǎng)上銀行渠道分析系統(tǒng)要支持工作人員擴(kuò)展數(shù)據(jù)查詢、數(shù)據(jù)字典和數(shù)據(jù)表之前的交叉查詢,將用戶的查詢記錄保存在本地網(wǎng)絡(luò)服務(wù)器上,盡量避免重復(fù)查詢,提高網(wǎng)上銀行渠道分析系統(tǒng)的查詢速度。

2數(shù)據(jù)挖掘技術(shù)在網(wǎng)上銀行促銷活動(dòng)中的運(yùn)用

隨著商業(yè)銀行的快速發(fā)展,網(wǎng)上銀行受到人們的廣泛關(guān)注。網(wǎng)上銀行系統(tǒng)以計(jì)算機(jī)網(wǎng)絡(luò)為交易平臺(tái),各種新型的促銷策略,使網(wǎng)上銀行業(yè)務(wù)得到迅速拓展。但是,和四大行相比,一些商業(yè)銀行的網(wǎng)上銀行業(yè)務(wù)仍然存在很大的差距。同時(shí),近年來,網(wǎng)上銀行市場(chǎng)競(jìng)爭(zhēng)日益激烈,某些網(wǎng)上銀行業(yè)務(wù)在應(yīng)用過程中出現(xiàn)了促銷成本不斷增加,而促銷效果不理想的狀況,數(shù)據(jù)挖掘技術(shù)在網(wǎng)上銀行促銷活動(dòng)中的運(yùn)用,要積極解決這些問題。

2.1提高營銷質(zhì)量當(dāng)前,很多銀行都逐漸加大了網(wǎng)上銀行促銷力度,但是促銷活動(dòng)的效果卻不明顯,單純的依靠贈(zèng)送禮品或者各種優(yōu)惠措施,在很大程度上會(huì)提升促銷成本,并且難以真正地吸引客戶。在網(wǎng)上銀行促銷活動(dòng)中應(yīng)用數(shù)據(jù)挖掘技術(shù),分析不同促銷活動(dòng)的特點(diǎn),根據(jù)網(wǎng)上銀行系統(tǒng)自身的特點(diǎn)和優(yōu)化,對(duì)不同客戶進(jìn)行組合促銷,將不同的網(wǎng)上銀行業(yè)務(wù)或者產(chǎn)品聯(lián)系起來,有針對(duì)性地對(duì)有意向的客戶進(jìn)行促銷,合理安排網(wǎng)上銀行促銷活動(dòng)內(nèi)容和時(shí)間,盡量在電子商務(wù)交易高峰時(shí)段之前,實(shí)現(xiàn)網(wǎng)上銀行促銷活動(dòng)的目標(biāo)。

2.2優(yōu)化客戶結(jié)構(gòu)一些商業(yè)銀行不了解客戶的真實(shí)需求,在發(fā)展?jié)撛诳蛻魰r(shí),缺乏針對(duì)性,網(wǎng)上銀行促銷活動(dòng)的交易需求較弱。因此要應(yīng)用數(shù)據(jù)挖掘技術(shù)挖掘一些隱含的信息,明確哪些客戶對(duì)網(wǎng)上銀行的哪些產(chǎn)品或者業(yè)務(wù)有需求,挖掘潛在的、有實(shí)力的客戶,將這些客戶作為網(wǎng)上銀行促銷活動(dòng)的重點(diǎn)客戶。

2.3優(yōu)化促銷活動(dòng)流程在網(wǎng)上銀行促銷活動(dòng)中運(yùn)用數(shù)據(jù)挖掘技術(shù),采用運(yùn)用關(guān)聯(lián)分析,挖掘傳統(tǒng)銀行渠道重點(diǎn)產(chǎn)品和網(wǎng)上銀行系統(tǒng)重點(diǎn)產(chǎn)品的業(yè)務(wù)數(shù)據(jù),挖掘非網(wǎng)絡(luò)銀行系統(tǒng)和網(wǎng)絡(luò)銀行系統(tǒng)業(yè)務(wù)以及網(wǎng)絡(luò)銀行系統(tǒng)不同業(yè)務(wù)或者產(chǎn)品之間的關(guān)聯(lián)關(guān)系,通過數(shù)據(jù)挖掘技術(shù)尋找符合網(wǎng)上銀行系統(tǒng)運(yùn)營條件的關(guān)聯(lián)關(guān)系,探索網(wǎng)上銀行系統(tǒng)不同產(chǎn)品和業(yè)務(wù)之間的依存性或者相似性[2],由此將網(wǎng)上銀行系統(tǒng)的某一項(xiàng)業(yè)務(wù)或者產(chǎn)品作為重點(diǎn)促銷產(chǎn)品來拉動(dòng)其他業(yè)務(wù)和產(chǎn)品的銷售,并且可以將一些業(yè)務(wù)或者產(chǎn)品組合起來進(jìn)行有針對(duì)性的促銷,提高網(wǎng)上銀行促銷活動(dòng)效果。另外,挖掘優(yōu)質(zhì)、有潛力客戶特征,優(yōu)質(zhì)客戶可以銀行提供大量的業(yè)務(wù)收入和交易量,因此可以通過數(shù)據(jù)挖掘技術(shù)的聚類方法分析銀行系統(tǒng)的客戶構(gòu)成,挖掘優(yōu)質(zhì)客戶的共同特征,為網(wǎng)上銀行促銷活動(dòng)提供重要的依據(jù)。

3結(jié)束語

第9篇

在上述系統(tǒng)設(shè)計(jì)的基礎(chǔ)之上,我們提出了網(wǎng)店客戶購買數(shù)據(jù)挖掘系統(tǒng)的模型,該模型由三個(gè)層次組成,其邏輯架構(gòu)如圖一所示。

2、系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

2.1系統(tǒng)開發(fā)與運(yùn)行環(huán)境硬件環(huán)境:CPUIntelI3380M/RAM2G/硬盤320G軟件配置:操作系統(tǒng):Windows7SP1開發(fā)工具:2005/VisualC#數(shù)據(jù)庫管理系統(tǒng):MSSQLServer2008輔助軟件:SPSSClementine11.1;SQLServer2008AnalysisServices(SSAS)

2.2主要技術(shù)與系統(tǒng)實(shí)現(xiàn)通過對(duì)上述對(duì)客戶購買數(shù)據(jù)挖掘系統(tǒng)模型的分析可知,該系統(tǒng)主要由用戶接口模塊、數(shù)據(jù)清洗模塊、數(shù)據(jù)格式轉(zhuǎn)換模塊、數(shù)據(jù)庫生成模塊和數(shù)據(jù)挖掘引擎模塊等組成。1)用戶接口模塊本系統(tǒng)最終目的還是為為客戶的決策提供支持,因此友好的界面設(shè)計(jì)是用戶與系統(tǒng)交互的基礎(chǔ)。簡潔而易于理解的界面有利于提高用戶對(duì)系統(tǒng)的使用效率。2)數(shù)據(jù)預(yù)處理模塊客戶訪問數(shù)據(jù)進(jìn)入數(shù)據(jù)預(yù)處理模塊進(jìn)行清洗,去除無關(guān)的信息,剝離出對(duì)數(shù)據(jù)挖掘有價(jià)值的數(shù)據(jù)。數(shù)據(jù)預(yù)處理模塊對(duì)原始訪問數(shù)據(jù)進(jìn)行分析,將用戶購買數(shù)據(jù)記錄逐條的分割成十個(gè)字段,分別為:u_id(訪問者編號(hào)),u_date(到訪日期),u_time(到訪時(shí)間),u_orderid(訂單編號(hào)),u_product(客戶購買的商品),u_bowser(使用的瀏覽器類型),page(首次到訪頁面),place(客戶所在地區(qū)),payment(支付方式),logistic(物流方式),同時(shí)刪除訪問數(shù)據(jù)中與以上字段不相干的數(shù)據(jù)。然后將經(jīng)過預(yù)處理的數(shù)據(jù)存入中間文件。3)XML轉(zhuǎn)換模塊該模塊程序使用.NET的相關(guān)的方法編寫,主要功能將預(yù)處理過的客戶購買數(shù)據(jù)轉(zhuǎn)換成標(biāo)準(zhǔn)化XML格式的數(shù)據(jù)文件進(jìn)行存儲(chǔ)。該程序的主要實(shí)現(xiàn)原理是對(duì)經(jīng)過預(yù)處理的中間文件中的數(shù)據(jù)記錄逐個(gè)分割并存入數(shù)組,然后將數(shù)組的內(nèi)容按照XML的格式寫入文件,完成轉(zhuǎn)換。4)數(shù)據(jù)庫導(dǎo)入模塊利用.NET的相關(guān)方法并結(jié)合數(shù)據(jù)庫管理工具建立支持?jǐn)?shù)據(jù)挖掘的客戶購買數(shù)據(jù)庫,編寫相關(guān)程序?qū)⒁呀?jīng)轉(zhuǎn)換成XML格式的客戶訪問數(shù)據(jù)逐條的導(dǎo)入到數(shù)據(jù)庫并形成日志數(shù)據(jù)表方便進(jìn)行后續(xù)的數(shù)據(jù)挖掘。5)數(shù)據(jù)挖掘引擎模塊數(shù)據(jù)挖掘引擎是實(shí)現(xiàn)客戶購買數(shù)據(jù)挖掘系統(tǒng)的實(shí)現(xiàn)關(guān)鍵。優(yōu)秀的數(shù)據(jù)挖掘算法不僅可以使數(shù)據(jù)挖掘的結(jié)果更加準(zhǔn)確,也可以提高數(shù)據(jù)挖掘的效率。本系統(tǒng)主要用到的算法是該模塊利用數(shù)據(jù)挖掘算法對(duì)數(shù)據(jù)進(jìn)行挖掘,主要包括算法的優(yōu)化、日志數(shù)據(jù)表的刪除操作以及挖掘結(jié)果集的保存與刪除操作等。這里主要用到的算法是K-Means算法。主要是利用該算法發(fā)現(xiàn)最相似的客戶聚類,通過對(duì)聚類的分析來得出網(wǎng)店眾多的顧客一般的購買行為模式,從而可以適當(dāng)?shù)卣{(diào)整網(wǎng)站營銷的策略中的來提高網(wǎng)絡(luò)營銷的效果,進(jìn)而增加銷售量。

3、小結(jié)

相關(guān)文章
相關(guān)期刊
主站蜘蛛池模板: 久久福利网 | 国产在线视频欧美亚综合 | 一级毛片免费视频 | 婷婷草| 国产激情一区二区三区 | 晚上看的www视频高清免费动漫 | 日韩小视频在线观看 | 一级毛片在线观看免费 | 九九视频只有精品六 | 久久精品视频观看 | 国产成人精品视频播放 | 欧美一区亚洲二区 | 丁香五香天堂网 | 国产一级高清视频 | 精品久久久久久国产免费了 | 久久久久久极精品久久久 | 你懂的国产视频 | 黄色工厂在线观看 | 男女精品视频 | 色婷五月综激情亚洲综合 | 欧美怡春院一区二区三区 | 婷婷激情四月 | 五月婷婷基地 | 亚洲国产午夜精品乱码 | 国产精品成人一区二区 | 国产精品久久久久久 | 亚洲综合激情九月婷婷 | 久久免费观看国产99精品 | 成人亚洲国产综合精品91 | 日本精品久久久免费高清 | 免费永久观看美女视频网站网址 | 精品视频一区二区三区 | 99精品国产福利在线观看 | 欧美性活生活视频 | 国产精品福利午夜在线观看 | 五月天婷婷激情视频 | 深田咏美中文字幕 | 激情五月婷婷在线 | 国产看片网站 | 国产精品无码久久久久 | 国产午夜视频在线观看 |