時間:2022-07-23 10:06:02
序論:在您撰寫電子商務中數(shù)據挖掘技術的運用時,參考他人的優(yōu)秀作品可以開闊視野,小編為您整理的1篇范文,希望這些建議能夠激發(fā)您的創(chuàng)作熱情,引導您走向新的創(chuàng)作高度。
1數(shù)據挖掘過程
在電子商務進行應用的數(shù)據挖掘技術的實現(xiàn)過程大致要劃分為三個不同的階段:第一部分對需要挖掘的數(shù)據信息的準備階段,第二部分對數(shù)據信息的挖掘階段,第三部分的主要任務是對數(shù)據挖掘的結果進行解釋與評價.
1.1數(shù)據信息的準備準備部分又可以分成數(shù)據的選取、數(shù)據信息的預處理.對數(shù)據進行選取的主要目的就是對操作對象進行確定,即是對目標數(shù)據進行確定,所謂的目標數(shù)據是在經過對用戶的需要進行細致分析之后,對最有可能得到有利用價值的信息的那些從數(shù)據庫中抽取出來的數(shù)據.獲取到這些數(shù)據以后需要進行預處理,主要包含數(shù)據的去噪、計算缺值數(shù)據的推導、數(shù)據類型的轉換,數(shù)據類型轉換舉個例子來說比如把連續(xù)型數(shù)據轉化成離散數(shù)據,以方便進行符號的歸納.
1.2挖掘過程數(shù)據信息的挖掘階段是在上一步的基礎之上,即在目標數(shù)據已經確定,并且已經完成了初始化的基礎之上,需要確定數(shù)據挖掘的目的與挖掘的類型.在對挖掘任務的目標確定之后,要根據數(shù)據挖掘的知識類型選取合適的數(shù)據挖掘方法,最終完成數(shù)據挖掘具體操作即采用特定的數(shù)據挖掘方法從數(shù)據倉庫中抽取所需的挖掘目標.
1.3挖掘結果的解釋和評價數(shù)據挖掘的結果的解釋和評價是在完成數(shù)據挖掘階段之后對發(fā)現(xiàn)的知識,進行評估,對于冗余或者無關的知識要進行刪除;對于獲得的知識不符合用戶的要求的要進行重新的挖掘.與此同時,因為數(shù)據挖掘需要面臨用戶,所以,在得到目標知識以后還需要對所挖掘的知識附加相關解釋,來用一種便于用戶理解的方式供用戶使用.綜上所述,整個數(shù)據信息的挖掘在實際情況下是一個不斷地循環(huán)與反復的過程,所以要對所挖掘出來的知識不斷求精和深化,最終要獲得用戶所需要的結果.
2電子商務中數(shù)據挖掘的特點
由于電子商務自身的某些獨特的特點,同其他的應用于普通商業(yè)領域中的數(shù)據挖掘相比,應用于電子商務的數(shù)據挖掘具有如下幾個特點:(1)應用于電子商務的數(shù)據挖掘的最終目的主要表現(xiàn)在企業(yè)與客戶之間的關系管理方面,電子商務利用因特網的技術能夠使企業(yè)和客戶之間的關系處理變得更加方便.所以,其主要的功能是怎樣使企業(yè)采用這些頻繁的交流信息,快速的掌握客戶的趨向、改善與客戶交流情況或者獲取交流方向等;(2)電子商務本身就是一個信息化程度比較高的系統(tǒng),其自身累積的數(shù)據信息會存放在電子商務數(shù)據庫內,用戶可以比較便捷地得到這些信息,所以對于電子商務的數(shù)據挖掘的數(shù)據信息的準備階段的相關工作就變得相對容易;(3)電子商務領域的數(shù)據挖掘的主要目標一般是使電子商務系統(tǒng)得到有效的改進.例如為客戶提供個性化頁面、把用戶比較感興趣的信息展現(xiàn)在網站首頁或得到哪一些商品比較受到客戶的歡迎等.
3電子商務中的數(shù)據挖掘運用
首先要講的是關聯(lián)規(guī)則在電子商務中的運用,利用比較通俗的語言來講,從一個事件的發(fā)生與否方面進行解釋,所謂的關聯(lián)規(guī)則法在大量的事件發(fā)生或者不發(fā)生的條件下,對這些事件中的任意兩個或者多個事件提取出來,通過一定的統(tǒng)計分析算法,最終確定兩個或者多個事件的發(fā)生與否是否存在著某種關系,而這種可能存在的管理,我們稱之為關聯(lián)規(guī)則.列舉一個有趣的故事,就是在一個超市里面,店家把小孩的尿布同啤酒放到了一起,來供購買者進行購買,結果是二者的銷量都提升了一倍,其實這就是因為二者之間有著某種潛在聯(lián)系,店家通過數(shù)據挖掘的方法發(fā)現(xiàn)的這個規(guī)則,并對這一關聯(lián)規(guī)則進行了實際的運用,從中得到了益處.同樣在電子商務中通過數(shù)據挖掘得到關聯(lián)規(guī)則,有著類似的意義.其次在電子商務中數(shù)據挖掘聚類分析方法的應用.在大量數(shù)據倉庫中,數(shù)據與數(shù)據之間,往往會有某些性質的類型相似,同樣也會有某些性質或者特點相異,我們把這些性質或者特點稱為觀察指標,聚類分析就是對于某一個特點指標而言,把指標相差不多的數(shù)據劃分為同一個類型,若相差較大則要劃分為不同的類型、這種操作的主要意義就是將具有某種特定的相似特性的客戶或者數(shù)據分成一個類.在電子商務活動中,這一方法的應用主要集中在市場細分的工作之中.分類分析系統(tǒng)的建立以生物的遺傳算法為基礎,屬于其中的自學習的一種,它一般會包含三個子系統(tǒng),第一個是以串規(guī)則為基礎的并行生成子系統(tǒng)、第二個是規(guī)則評價子系統(tǒng).第三個是遺傳算法子系統(tǒng).分類分析可以說是電子商務中運用到數(shù)據挖掘最多的一種挖掘方式.主要原因就是在于其能夠形成一種預測模型能夠對一些營銷方式或者其他的一些商業(yè)措施做出正確的預測.
4數(shù)據挖掘在電子商務中的應用
更高效的利用企業(yè)現(xiàn)有資源以及開發(fā)新資源是當代企業(yè)發(fā)展的關鍵.電子商務通過采用數(shù)據挖掘的技術,能夠更加及時和正確的獲得企業(yè)當前所有資源的具體使用情況,而且通過數(shù)據挖掘的技術可以分析以往的各種企業(yè)數(shù)據,比如說企業(yè)財務數(shù)據、企業(yè)庫存數(shù)據或者企業(yè)交易數(shù)據,能夠較為及時的發(fā)現(xiàn)企業(yè)資源過度消耗的主要問題所在,或者能夠得到各種商務活動的投入與產出的比例,來為企業(yè)領導進行經營決策提供有力的根據[6].另外在企業(yè)的經營過程中,人們不斷推崇“以客戶為中心”的經營理念,在這一趨勢下,如何正確快速的分析和了解客戶的需求已成為企業(yè)提高自身市場競爭力的一大課題.通過把數(shù)據挖掘應用到電子商務之中,能夠使企業(yè)最準確的分析客戶資源并最有效的利用企業(yè)客戶資源,通過對已有客戶行為進行相關性分析,可以形成潛在客戶資源的預測模型.除此之外在企業(yè)經營過程中,利用數(shù)據挖掘可以解決另外一個嚴重影響了商業(yè)正常秩序的重要問題.即當前時區(qū)商務活動中的地下的信用狀況問題,這一問題的嚴重程度已經引起了人們的廣泛關注.在電子商務經營過程中,因為網上詐騙公司或者企業(yè)財務的現(xiàn)象屢見不鮮,信用危機已經成為影響其快速正常發(fā)展的一個重要因素.而通過在電子商務中采用數(shù)據挖掘技術實現(xiàn)對企業(yè)經營活動的跟蹤,在此基礎上實現(xiàn)企業(yè)的資產評估、利潤收益分析以及發(fā)展?jié)摿︻A測分析等,為電子商務在經營過程中提供了完善的安全保障體系,同時利用數(shù)據挖掘實現(xiàn)企業(yè)網上全程監(jiān)控.另外通過實現(xiàn)基于數(shù)據挖掘的信用評估模型,可以在很大程度上進行防范或者化解信用風險,從而提高企業(yè)的信用度以及應對風險能力.
5結束語
電子商務是而今信息化時代進步的產物,在未來的幾年內電子商務必將會成為商業(yè)中存在的主要運營模式.隨著時間的積累,各種電子商務都會得到巨大的數(shù)據信息資源,這也是數(shù)據挖掘在電子商務中應用的基本條件.從另外一方面而言,隨著數(shù)據挖掘在電子商務方面中的不斷深入研究與發(fā)展,已經能夠向電子商務系統(tǒng)提供必不可少的技術支持,促進了電子商務的發(fā)展與普及。
作者:張莉單位:合肥工業(yè)大學淮北職業(yè)技術學院
[摘要]電子商務的廣泛應用使企業(yè)產生了大量的業(yè)務數(shù)據,按企業(yè)既定業(yè)務目標對這些數(shù)據進行數(shù)據挖掘可以幫助企業(yè)分析出完成任務所需的關鍵因素。文章介紹了數(shù)據挖掘技術,以實例分析了數(shù)據挖掘在電子商務中的應用,并介紹了在電子商務中如何應用數(shù)據挖掘技術。
[關鍵詞]電子商務;數(shù)據挖掘;路徑分析
隨著Internet的普及,電子商務的興起,人們的商務理念正在改變,電子商務的廣泛應用使企業(yè)產生了大量的業(yè)務數(shù)據,如何更快、更好地利用各種有效的數(shù)據更好地開展電子商務,這是目前電子商務急需解決的問題。
一、數(shù)據挖掘技術
20世紀90年代以來,隨著信息技術和數(shù)據庫技術的迅猛發(fā)展,人們可以非常方便地獲取和存儲大量的數(shù)據。面對大規(guī)模的海量的數(shù)據,傳統(tǒng)的數(shù)據分析工具(如管理信息系統(tǒng))只能進行一些表層的處理(如查詢、統(tǒng)計等),而不能獲得數(shù)據之間的內在關系和隱含的信息。為了擺脫“數(shù)據豐富,知識貧乏”的困境,人們迫切需要一種能夠智能地自動地把數(shù)據轉換成有用信息和知識的技術和工具,這種對強有力數(shù)據分析工具的迫切需求使得數(shù)據挖掘技術應運而生。人們認識到數(shù)據庫中存儲的數(shù)據量急劇增大,在大量的數(shù)據背后隱藏著許多重要的信息,如果能把這些信息從數(shù)據庫中抽取出來,將為公司創(chuàng)造很多潛在的利潤。這種從海量數(shù)據庫中挖掘信息的技術,就稱之為數(shù)據挖掘。數(shù)據挖掘一般有以下四類主要任務:
(一)數(shù)據總結
數(shù)據挖掘能夠將數(shù)據庫中的有關數(shù)據從較低的個體層次抽象總結到較高的總體層次上,從而實現(xiàn)對原始基本數(shù)據的總體把握。
(二)分類
分析數(shù)據的各種屬性,并找出數(shù)據的屬性模型,確定哪些數(shù)據屬于哪些組。這樣我們就可以利用該模型來分析已有數(shù)據,并預測新數(shù)據將屬于哪一個組。
(三)關聯(lián)分析
數(shù)據庫中的數(shù)據一般都存在著關聯(lián)關系,也就是說,兩個或多個變量的取值之間存在某種規(guī)律性。通過挖掘數(shù)據派生關聯(lián)規(guī)則,可以了解客戶的行為。
(四)聚類
聚類分析是按照某種相近程度度量方法,將用戶數(shù)據分成一系列有意義的子集合。每一個集合中的數(shù)據性質相近,不同集合之間的數(shù)據性質相差較大。
數(shù)據挖掘的特點和性質對于企業(yè)而言,有助于發(fā)現(xiàn)其企業(yè)業(yè)務發(fā)展的趨勢,揭示已知的事實,預測未知的結果,并幫助企業(yè)分析出完成任務所需的關鍵因素,以達到增加收入,降低成本,使企業(yè)處于更有利的競爭位置的目的。
二、數(shù)據挖掘在電子商務中的作用
數(shù)據挖掘技術源于商業(yè)的直接需求,因此它在各種商業(yè)領域都存在廣泛的使用價值。電子商務是商業(yè)領域的一種新興商務模式,是指利用電子信息技術開展一切商務活動。當電子商務在企業(yè)中得到應用時,企業(yè)信息系統(tǒng)將產生大量數(shù)據,這些海量數(shù)據使數(shù)據挖掘有了豐富的數(shù)據基礎,同時高性能計算機和高傳輸速率網絡的使用也給數(shù)據挖掘技術提供了堅實的保障。因此數(shù)據挖掘技術在電子商務活動中有了更大的用武之地。下面介紹數(shù)據挖掘在以下電子商務幾個方面的作用:
(一)客戶細分
隨著“以客戶為中心”的經營理念的不斷深入人心,分析客戶、了解客戶并引導客戶的需求已成為企業(yè)經營的重要課題。通過對電子商務系統(tǒng)收集的交易數(shù)據進行分析,可以按各種客戶指標(如自然屬性、收入貢獻、交易額、價值度等)對客戶分類,然后確定不同類型客戶的行為模式,以便采取相應的營銷措施,促使企業(yè)利潤的最大化。
(二)客戶獲得
利用數(shù)據挖掘可以有效地獲得客戶。比如通過數(shù)據挖掘可以發(fā)現(xiàn)購買某種商品的消費者是男性還是女性,學歷、收入如何,有什么愛好,是什么職業(yè)等等。甚至可以發(fā)現(xiàn)不同的人在購買該種商品的相關商品后多長時間有可能購買該種商品,以及什么樣的人會購買什么型號的該種商品等等。也許很多因素表面上看起來和購買該種商品不存在任何聯(lián)系,但數(shù)據挖掘的結果卻證明它們之間有聯(lián)系。在采用了數(shù)據挖掘后,針對目標客戶發(fā)送的廣告的有效性和回應率將得到大幅度的提高,推銷的成本將大大降低。
(三)客戶保持
數(shù)據挖掘可以把你大量的客戶分成不同的類,在每個類里的客戶擁有相似的屬性,而不同類里的客戶的屬性也不同。你完全可以做到給不同類的客戶提供完全不同的服務來提高客戶的滿意度。數(shù)據挖掘還可以發(fā)現(xiàn)具有哪些特征的客戶有可能流失,這樣挽留客戶的措施將具有針對性,挽留客戶的費用將下降。
(四)交叉銷售
交叉銷售可以使企業(yè)比較容易地得到關于客戶的豐富的信息,而這些大量的數(shù)據對于數(shù)據挖掘的準確性來說是有很大幫助的。在企業(yè)所掌握的客戶信息,尤其是以前購買行為的信息中,可能正包含著這個客戶決定他下一個購買行為的關鍵,甚至決定因素。這個時候數(shù)據挖掘的作用就會體現(xiàn)出來,它可以幫助企業(yè)尋找到這些影響他購買行為的因素。
(五)個性服務
當客戶在電子商務網站注冊時,客戶將會看到帶有客戶姓名的歡迎詞。根據客戶的訂單紀錄,系統(tǒng)可以向客戶顯示那些可能引起客戶特殊興趣的新商品。當客戶注意到一件特殊的商品時,系統(tǒng)會建議一些在購買中可以增加的其他商品。普通的產品目錄手冊常常簡單地按類型對商品進行分組,以簡化客戶挑選商品的步驟。然而對于在線商店,商品分組可能是完全不同的,它常常以針對客戶的商品補充條目為基礎。不僅考慮客戶看到的條目,而且還考慮客戶購物籃中的商品。使用數(shù)據挖掘技術可以使推薦更加個性化。
(六)資源優(yōu)化
節(jié)約成本是企業(yè)盈利的關鍵。通過分析歷史的財務數(shù)據、庫存數(shù)據和交易數(shù)據,可以發(fā)現(xiàn)企業(yè)資源消耗的關鍵點和主要活動的投入產出比例,從而為企業(yè)資源優(yōu)化配置提供決策依據,例如降低庫存、提高庫存周轉率、提高資金使用率等。
(七)異常事件的確定
在許多商業(yè)領域中,異常事件具有顯著的商業(yè)價值,如客戶流失、銀行的信用卡欺詐、電信中移動話費拖欠等。通過數(shù)據挖掘中的奇異點分析可以迅速準確地甄別這些異常事件。
由此可見數(shù)據挖掘在電子商務中有著重要的作用。在生活中采用數(shù)據挖掘的成功的例子很多。例如總部位于美國阿肯色州的WalMart零售商的“尿布與啤酒”的故事。WalMart擁有世界上最大的數(shù)據倉庫系統(tǒng),它利用數(shù)據挖掘工具對數(shù)據倉庫中的原始交易數(shù)據進行分析,得到了一個意外發(fā)現(xiàn):跟尿布一起購買最多的商品竟然是啤酒。如果不是借助于數(shù)據倉庫和數(shù)據挖掘,商家決不可能發(fā)現(xiàn)這個隱藏在背后的事實:在美國,一些年輕的父親下班后經常要到超市去買嬰兒尿布,而他們中有30%~40%的人同時也為自己買一些啤酒。有了這個發(fā)現(xiàn)后,超市調整了貨架的擺放,把尿布和啤酒放在一起,明顯增加了銷售額。
三、電子商務中如何應用數(shù)據挖掘技術
數(shù)據挖掘在電子商務中有廣泛的應用。那么在電子商務中是如何應用數(shù)據挖掘技術的?
首先,從挖掘過程說,對在線訪問客戶數(shù)據的挖掘主要有兩部分:一部分是客戶訪問信息的挖掘,另一部分是客戶登記信息的挖掘。面對大量的訪問日志,首先要做的就是對數(shù)據進行清洗,即預處理,把無關的數(shù)據,不重要的數(shù)據等處理掉;接著對數(shù)據進行事務識別,通過對事務進行劃分后,就可以根據具體的分析需求選擇模式發(fā)現(xiàn)的技術,如路徑分析、興趣關聯(lián)規(guī)則、聚類等。通過模式分析,找到有用的信息,再通過聯(lián)機分析(OLAP)的驗證,結合客戶登記信息,找出有價值的市場信息,或發(fā)現(xiàn)潛在的市場。
其次,挖掘方法主要有以下幾種:
1.路徑分析
路徑分析是一種找尋頻繁訪問路徑的方法,它通過對Web服務器的日志文件中客戶訪問站點的訪問次數(shù)分析,挖掘出頻繁訪問路徑。例如:一客戶從某一站點訪問到某一感興趣的頁面后就會經常訪問該頁面,通過路徑分析確定頻繁訪問路徑,可以了解客戶對哪些頁面感興趣,(下轉第78頁)(上接第80頁)從而更好地改進設計,為客戶服務。
2.興趣關聯(lián)規(guī)則
當客戶訪問某一網頁時,一般會通過興趣詞條找出相關的興趣網頁通過鏈接繼續(xù)訪問,這種關聯(lián)產生的數(shù)據如果能夠按照某種策略進行挖掘分析,統(tǒng)計出客戶訪問某些頁面及興趣關聯(lián)頁面的比率,就可以很好地組織站點,實施有效的市場策略。
3.聚類分析
聚類分析是電子商務中很重要的一個方面,通過分組聚類出具有相似瀏覽行為的客戶,并分析客戶的共同特征,更好地幫助電子商務的用戶了解自己的客戶,向客戶提供更合適的服務。如通過對眾多的瀏覽“camera”網頁的客戶分析,發(fā)現(xiàn)在該網頁上經常花一段時間瀏覽的客戶,再通過對這部分客戶的登記資料分析,知道這些客戶是潛在要買相機的客戶群體。就可以調整“camera”網頁的內容和風格,以適應客戶的需要。
通過以上幾種數(shù)據分析的方法可以有效地對電子商務中的信息進行分析,從而更有效地開展電子商務。
目前,數(shù)據挖掘技術正以前所未有的速度發(fā)展,并且擴大著用戶群體,在未來越來越激烈的市場競爭中,擁有數(shù)據挖掘技術必將比別人獲得更快速的反應,贏得更多的商業(yè)機會。現(xiàn)在世界上的主要數(shù)據庫廠商紛紛開始把數(shù)據挖掘功能集成到自己的產品中,加快數(shù)據挖掘技術的發(fā)展。我國在這一領域正處在研究開發(fā)階段,加快研究數(shù)據挖掘技術,并把它應用于電子商務中,應用到更多行業(yè)中,勢必會有更好的商業(yè)機會和更光明的前景。
摘要:本文從浙江電子商務發(fā)展概況出發(fā),介紹了數(shù)據挖掘技術,分析了數(shù)據挖掘技術在浙江電子商務中應用的可行性。
關鍵詞:數(shù)據挖掘;浙江;電子商務
當前,電子商務正在全國范圍內迅猛發(fā)展,隨著國務院《關于積極推進“互聯(lián)網+”行動的指導意見》、《關于大力發(fā)展電子商務加快培育經濟新動力的意見》等一系列的政策落地,“農村電商、跨境電商、行業(yè)電商”等多種電商模式迎來了重要發(fā)展機遇。浙江的電子商務起步早、發(fā)展快、創(chuàng)新性強,在全國電商市場里名列前茅,已經成為浙江經濟發(fā)展重要的增長極,產生了巨大的經濟效應和社會效應。
1浙江電子商務發(fā)展概況
1.1電商服務發(fā)達
2015年浙江省實現(xiàn)網絡零售額7610.62億元,同比增長49.9%,總量居全國第二位,超額完成“十二五”規(guī)劃目標。網絡零售額與社會消費品零售總額比值達38%,遠遠高于全國約15%的水平。各類電子商務市場主體蓬勃發(fā)展,擁有各類活躍網店100多萬家,天貓網店近2.5萬家,跨境電商經營主體近4萬個,電商服務企業(yè)3000家左右,其中規(guī)模以上電子商務服務企業(yè)約1000家;建有電商產業(yè)基地204個;電子商務帶動直接就業(yè)超過200萬人。
1.2線上線下高度融合
浙江是制造業(yè)大省,也是電子商務大省。成熟的市場環(huán)境,促成線上線下的高度融合。以金華為例,線下有“義烏小商品市場”、“永康五金市場”等國內乃至國際一流的行業(yè)市場,依托這些實體市場的突出優(yōu)勢,著力打造“義烏購”、“尚五金”等線上平臺,構建線上線下高度融合的市場環(huán)境。
2數(shù)據挖掘技術初探
2.1數(shù)據挖掘簡介
數(shù)據挖掘技術起源于20世紀80年代,它是從數(shù)據庫海量數(shù)據中提取使用者所感興趣的知識、數(shù)據和規(guī)律,進行深入的分析,提取隱含在其中的、潛在有用的信息,為使用者提供決策支持。從電子商務的角度來看,它的主要作用是從電子商務活動中抽取大量數(shù)據,進行轉讓、分析和模式化處理,從中獲得能幫助電子商務企業(yè)決策的關鍵信息,即從電子商務大量業(yè)務數(shù)據中尋找隱含的商機或者新的商業(yè)模式。
2.2數(shù)據挖掘在電子商務領域的應用
在電商商務活動的過程中,電商企業(yè)積累了大量的銷售記錄、瀏覽記錄、消費和服務記錄等數(shù)據,隨著電子商務不斷發(fā)展,相關數(shù)據不斷的膨脹擴大,在堆積如山的數(shù)據中包含著許多待提取的有用知識,這些有用知識進行挖掘是非常有意義的。數(shù)據挖掘有助于電商企業(yè)識別客戶購買行為,發(fā)現(xiàn)客戶的購買模式及趨勢,便于電商企業(yè)改進銷售模式、提高服務質量,提高客戶的用戶體驗。并且,可以根據海量數(shù)據分析,提高貨品銷售比率,優(yōu)化物流和分銷策略,進一步降低成本。1)分析客戶的購買行為和習慣。例如“男性客戶購買尿不濕的同時會購買啤酒”,“該女性客戶對化妝品和護膚品的品牌偏好”,“某客戶偏好折扣商品”,這些信息雖然看起來微不足道,卻非常有用,電商企業(yè)可以根據客戶購買行為和習慣向客戶推送他們偏好的信息。2)分析電商企業(yè)的商品構成。將各類商品按盈利水平和銷售情況進行分類,挖掘同類商品的共同特征,提取有用信息。幫助企業(yè)決策市場定位、商品定價等問題。3)數(shù)據挖掘還可以幫助企業(yè)進行銷售商品預測、商品價格分析等,在浙江線上線下高度融合的市場環(huán)境下,電商企業(yè)可以挖掘商品價格、銷售和物流信息的關聯(lián),合理安排線上線下商品銷售模式,提高企業(yè)運營效率,降低銷售成本。
3結束語
浙江電子商務的快速發(fā)展,各類電商企業(yè)在這片土地上生根發(fā)芽,數(shù)量不斷增多,市場競爭日趨激烈。有效的利用數(shù)據挖掘工具,挖掘隱含在海量數(shù)據中的有用信息,能夠使企業(yè)做出正常的市場決策,保持有力的競爭優(yōu)勢,贏得消費者的青睞。隨著信息技術的不斷發(fā)展,數(shù)據挖掘的不斷深入,電子商務數(shù)據挖掘的研究和應用必將取得長遠的發(fā)展。
作者:陳麗燕 何士產 洪改艷 單位:上海財經大學浙江學院
1數(shù)據挖掘的概念及其過程
1.1數(shù)據挖掘
數(shù)據挖掘,即在數(shù)據庫中的信息發(fā)現(xiàn),是指在大量的、不完整的、模糊的、有噪音的和隨機的數(shù)據中,提取出潛在的、不為人知的、同時又是非常有用的知識和信息的過程。數(shù)據挖掘是一項應用技術廣泛的交叉學科,它聚集了眾多不同領域的知識,例如人工智能、可視化、數(shù)據庫、數(shù)理統(tǒng)計等。從始至終數(shù)據挖掘技術都是面向應用領域,不僅是對于特定數(shù)據庫的簡單檢索查詢,還包括對數(shù)據的不同層面、不同角度的統(tǒng)計、分析、推理和綜合,以此得到問題的求解,以及發(fā)現(xiàn)事件之間的聯(lián)系,還有對未發(fā)生活動的預測。另外數(shù)據挖掘技術在存在大量數(shù)據積累的電子商務行業(yè)有著廣泛的應用,是現(xiàn)代商務企業(yè)發(fā)展的不二選擇。
1.2數(shù)據挖掘的過程
1.2.1數(shù)據預處理
在實際情況中,企業(yè)獲得的數(shù)據具有不完整性、模糊性和冗余性,所以數(shù)據挖掘技術針對的不是已得到的數(shù)據,而是潛在的數(shù)據信息,并通過預處理技術獲得簡潔、準確的數(shù)據。預處理的工作分為三步,數(shù)據合并、數(shù)據選擇和數(shù)據清洗。先將多個數(shù)據庫和文件中的數(shù)據進行合并,然后選擇適合分析的數(shù)據信息集合,最后剔除無關記錄,并將各個文件轉換成方便數(shù)據挖掘的格式。
1.2.2模式發(fā)現(xiàn)
這個階段就是利用挖掘計算技術挖掘出有用的、潛在的、新穎的、可以理解的知識和信息。像關聯(lián)分析、聚類分析、路徑選擇、序列分析等都可以用于Web的挖掘技術。
1.2.3模式分析
這個階段是將模式發(fā)現(xiàn)中沒有用的模式和規(guī)則過濾掉。通過技術分析,得到有效的結論。常用關聯(lián)規(guī)則、序列等手段。
2數(shù)據挖掘技術的方法
2.1關聯(lián)分析
所謂的關聯(lián)分析,就是利用數(shù)據間相互關聯(lián)的規(guī)則進行數(shù)據挖掘,為的是挖掘數(shù)據間潛在的聯(lián)系規(guī)則。比如,在進行關聯(lián)分析時,能發(fā)現(xiàn)類似哪些產品更受客戶的歡迎、為什么、產品優(yōu)勢有哪些、有多少客戶會再次購買等問題。
2.2序列模式分析
這個過程和第一個關聯(lián)分析有些類似,但主要任務是發(fā)現(xiàn)數(shù)據間的前后順序聯(lián)系,比如在這段時間里,企業(yè)先銷售出x產品,隨后銷售y產品,然后是z產品,所以就形成x-y-z的銷售序列,出現(xiàn)頻率較高,進而對其進行分析。序列模式分析工作方向是:在指定的交易數(shù)據庫中,找出按照時間排布的交易集,發(fā)現(xiàn)其中的高頻序列,從而進行下一個步驟。
2.3分類分析
假設有一個數(shù)據庫和一組互相區(qū)別的標記,利用特殊標記數(shù)據庫中的每一個數(shù)據,這樣的數(shù)據庫被叫做訓練集或者實例數(shù)據庫。分類分析就是利用分析標記數(shù)據庫中的每一個數(shù)據,對每個類別建立分析模型或做出精準的描述或者挖掘出分析模型,然后利用分類模式對數(shù)據庫中的數(shù)據進行分類分析。
2.4聚類分析
聚類分析所根據的分類規(guī)則主要取決于聚類分析工具。不同的聚類方法,對于同樣的記錄集合會有不同的劃分結果。聚類分析針對的未分類的記錄,而且所有記錄適合分成幾類,事先也不知情,然后依據一定的分類規(guī)則,分析記錄數(shù)據,確定每一個數(shù)據所對應的類別。
3數(shù)據挖掘技術在電子商務中的應用
3.1優(yōu)化企業(yè)資源
企業(yè)盈利的關鍵是節(jié)約成本,利用數(shù)據挖掘技術可以找到企業(yè)消耗資源的關鍵點和各種活動的投入與產出比例,進而為企業(yè)提供科學合理的調整方案,例如資源循環(huán)利用、降低庫存等方法。通過數(shù)據挖掘技術,企業(yè)可以預先知道市場上的商業(yè)信息,使企業(yè)把握市場動態(tài),創(chuàng)造更多的盈利。
3.2管理客戶資料
俗話說知己知彼,百戰(zhàn)不殆。對于企業(yè)來說,了解客戶是至關重要的,比如客戶是男是女、愛好是什么、職業(yè)是什么等,從而根據不同客戶需求,改善網絡結構,推出個性化網頁,吸引更多的客戶對本企業(yè)的關注。例如對電子商務網站的網站流量進行分析。人們在點擊或者是訪問某一個網站的同時,就將個人對網站內容的反饋信息反映了出來,用戶點擊了哪一個鏈接,在哪個網頁中停留的時間最長,采用了哪個搜索的項目或者是總共使用的瀏覽時間等信息都會被保存在網站中,將這些信息保存下來,進行數(shù)據分析,能夠有效的確定用戶的訪問特點以及產品特征,從而提高電子商務信息提供的精確性。
3.3評估商業(yè)信譽
一個企業(yè)若是沒有良好的商業(yè)信譽做基礎,一切都是空口說白話。所以建立有效的商業(yè)評估制度就成了重中之重。利用數(shù)據挖掘技術對企業(yè)營銷進行追蹤,開展資產評估、發(fā)展?jié)摿︻A測以及利潤收益分析,建立完善的安全系統(tǒng),對企業(yè)商譽安全進行保障,可以有效的預防和解決信用風險,提高企業(yè)信譽度。例如,商品售賣出去,要進行科學有效的跟蹤,了解客戶用后體驗,對客戶使用產品情況進行追蹤式分析,開展科學合理的資產評估,不斷發(fā)展?jié)撛谟脩趔w驗,通過客戶的反饋信息進行綜合性分析,提高客戶滿意度,提高商家的信用。
3.4確定異常事件
在商業(yè)領域中,確定異常事件具有十分重要的商業(yè)價值。在企業(yè)經營時間里,經常會有異常事件發(fā)生,例如話費拖欠、客戶流失、信用卡欺詐等,通過數(shù)據挖掘技術中的異常點分析可以十分準確快速地發(fā)現(xiàn)異常點,使企業(yè)及時修整系統(tǒng),減少不必要損失。例如,當客戶將商品加入購物車后,對沒有付款的原因進行科學合理的分析,從而確定要催付的客戶群體。這種催付的行為在一定程度上可能會打擾到客戶,所以需要準確的分析其真正的原因。例如客戶沒有付款的主要原因為:遺忘、沖動消費不想買了、貨比三家,發(fā)現(xiàn)更好地商品、支付發(fā)生故障等。這個時候就需要商家對號入座,確定是否要進行客戶催付。這就需要數(shù)據挖掘技術發(fā)揮自身的優(yōu)勢,進行數(shù)據分析,提出相應的解決方案。在催付時間的選擇上,根據數(shù)據挖掘技術的分析通常情況下理論上在第三天進行催付是最為合理的,因為在第二天有不少會自發(fā)付款的客戶。同時還需要考慮到女性消費者沖動購物的習慣,過了這個沖動期就不容易再購買。所以實際上要在客戶下單的第二天進行催付最為合理。在擬定催付內容的時候需要科學分析客戶一天各個時間段的情緒變化,減少客戶對商家的排斥與厭煩的心理。
4結語
隨著網絡技術的不斷發(fā)展,電子商務已經成為現(xiàn)如今經濟發(fā)展的主要方式。數(shù)據挖掘技術是電子商務發(fā)展的重要手段。利用數(shù)據挖掘可以幫助企業(yè)從大量的繁雜的數(shù)據中發(fā)現(xiàn)潛在的規(guī)律,找到有效的信息,以此指導企業(yè)調整經營策略,提高企業(yè)聲譽,獲得更有利的競爭能力。
作者:邢玉鳳 單位:云南經濟管理學院