時(shí)間:2023-06-25 16:04:21
序論:在您撰寫數(shù)據(jù)分析方向時(shí),參考他人的優(yōu)秀作品可以開闊視野,小編為您整理的7篇范文,希望這些建議能夠激發(fā)您的創(chuàng)作熱情,引導(dǎo)您走向新的創(chuàng)作高度。
1.流量來源
從圖中數(shù)據(jù)顯示,該網(wǎng)站主要流量來源于外部鏈接,表明各種推廣營銷手段還是有一定效果的,而直接訪問帶來的流量卻不太理想,說明該其用戶忠誠度較低,需要繼續(xù)加強(qiáng)。而搜索引擎流量的話其主要靠內(nèi)容,而從該站數(shù)據(jù)看來,其內(nèi)容還是比較欠缺,需要加強(qiáng)優(yōu)化。。
2. 網(wǎng)站訪問時(shí)段
從上圖觀察發(fā)現(xiàn),我們可以分析出用戶在上午9點(diǎn)-11點(diǎn),下午14點(diǎn)-17點(diǎn),這兩個(gè)時(shí)段較為活躍,那么便可根據(jù)此進(jìn)行推廣,因?yàn)樵L客越是活躍,進(jìn)行推廣便更嘔效果。同樣的,在做競價(jià)推廣時(shí),也可以此作為參考。
3. 搜索引擎分析
有統(tǒng)計(jì)數(shù)據(jù)可以發(fā)現(xiàn),各個(gè)搜索引擎過來的流量有多少,而從該網(wǎng)站數(shù)據(jù)上看,該網(wǎng)站的主要訪客來源于百度,竟然如此,該站就更加需要加強(qiáng)百度優(yōu)化,更多的去迎合百度。
4.搜索詞
通過對搜索詞的查看,我們可以查看用戶主要通過哪些詞來到該網(wǎng)站,從而可根據(jù)此來對長尾關(guān)鍵詞進(jìn)行挖掘。同時(shí)我們可以發(fā)現(xiàn)用戶是通過一些我們根本想不到的詞來訪問網(wǎng)站,通過這些詞我也可作為研究用戶搜索習(xí)慣的重要參考因素。
5.訪問時(shí)長及跳出率
通過對訪客的頁面停留時(shí)間長短及跳出率,我們可以分析出用戶的需求點(diǎn),從而分析出哪些最終頁,哪些是過度頁。如此此我們就可以根據(jù)此來對頁面進(jìn)行優(yōu)化,以及分析哪些欄目更應(yīng)放在首頁等。
6.瀏覽器訪問比例
這個(gè)數(shù)據(jù)通常告訴我們應(yīng)如何去設(shè)計(jì)網(wǎng)頁,從圖中可以看出瀏覽器中360與ie用戶量比例較大。因此在我們對該網(wǎng)站頁面進(jìn)行設(shè)計(jì)或改版時(shí),需要重點(diǎn)滿足IE與360用戶的需求,同時(shí)要保證網(wǎng)頁在IE與360下的兼容性。
關(guān)鍵詞:大數(shù)據(jù) 統(tǒng)計(jì)專業(yè) 核心
中圖分類號:G632 文獻(xiàn)標(biāo)識碼:A 文章編號:1674-2117(2014)10-0008-02
1 大數(shù)據(jù)的統(tǒng)計(jì)涵義
通常來說,凡是數(shù)據(jù)量超過一定大小,導(dǎo)致常規(guī)軟件無法在一個(gè)可接受的時(shí)間范圍內(nèi)完成對其進(jìn)行抓取、管理和處理工作的數(shù)據(jù)即可稱為大數(shù)據(jù)。業(yè)界通常用4個(gè)V(即Volume、Variety、Value、Velocity)來概括大數(shù)據(jù)的特征:數(shù)據(jù)體量巨大、數(shù)據(jù)類型繁多、價(jià)值密度低、處理速度快。
大數(shù)據(jù)潮流讓我們獲得了海量的數(shù)據(jù),數(shù)據(jù)已經(jīng)成為相關(guān)行業(yè)創(chuàng)造價(jià)值的重要資源。因此,許多IT企業(yè)和互聯(lián)網(wǎng)企業(yè)都已將業(yè)務(wù)范圍延伸至大數(shù)據(jù)產(chǎn)業(yè),探索大數(shù)據(jù)驅(qū)動(dòng)的業(yè)務(wù)模式。2012年,美國政府投資2億美元啟動(dòng)的“大數(shù)據(jù)研究和發(fā)展計(jì)劃”,更是將大數(shù)據(jù)的研究上升到國家戰(zhàn)略層面。然而,大數(shù)據(jù)的真正意義不在于數(shù)據(jù)量的巨大,而在于對數(shù)據(jù)信息進(jìn)行專業(yè)化的處理,核心是對數(shù)據(jù)進(jìn)行分析。面對大數(shù)據(jù),越來越多的領(lǐng)域都開始運(yùn)用數(shù)學(xué)特別是統(tǒng)計(jì)學(xué)的工具,挖掘大數(shù)據(jù)中真正蘊(yùn)藏的價(jià)值。正如西內(nèi)啟在《看穿一切數(shù)字的統(tǒng)計(jì)學(xué)》書中所指出的,“從數(shù)據(jù)中得出有意義的結(jié)果,關(guān)鍵在于控制和減少誤差,得出因果關(guān)系,單純收集數(shù)據(jù)并加以全部量化分析在很多情況下會(huì)得出謬誤結(jié)果,”而科學(xué)的統(tǒng)計(jì)學(xué)方法是得出因果關(guān)系的最佳方法。
從統(tǒng)計(jì)學(xué)角度看,一方面,大數(shù)據(jù)具有類型繁多、結(jié)構(gòu)復(fù)雜、體量巨大等特點(diǎn),海量數(shù)據(jù)以分布式方式進(jìn)行存儲(chǔ),特別是圖片、音頻、視頻等非結(jié)構(gòu)化數(shù)據(jù)的廣泛存在,傳統(tǒng)的統(tǒng)計(jì)方法和統(tǒng)計(jì)分析工具已無法滿足大數(shù)據(jù)分析的需要,亟需統(tǒng)計(jì)方法的革新。另一方面,數(shù)據(jù)分析結(jié)果需要用生動(dòng)、直觀、容易被接受的方式展示給讀者,可視化分析能夠直觀地呈現(xiàn)大數(shù)據(jù)的特點(diǎn),闡釋數(shù)據(jù)與數(shù)據(jù)之間的聯(lián)系。因此,統(tǒng)計(jì)學(xué)要挺立大數(shù)據(jù)潮頭,創(chuàng)新統(tǒng)計(jì)分析工具、可視化分析方法,以大數(shù)據(jù)的挖掘和應(yīng)用為核心,將傳統(tǒng)文本、圖像的統(tǒng)計(jì)、分析向數(shù)據(jù)分析轉(zhuǎn)變,以適應(yīng)大數(shù)據(jù)時(shí)代的發(fā)展及其對統(tǒng)計(jì)學(xué)帶來的挑戰(zhàn)。
2 大數(shù)據(jù)時(shí)代統(tǒng)計(jì)學(xué)教育面臨的挑戰(zhàn)與應(yīng)對
據(jù)互聯(lián)網(wǎng)數(shù)據(jù)中心(Internet Data Center)預(yù)測,中國大數(shù)據(jù)技術(shù)與服務(wù)市場將會(huì)從2011年的7760萬美元快速增長到2016年的6.16億美元,而據(jù)業(yè)界專家估算,中國大數(shù)據(jù)市場的人才需求量至少為100萬人,其中統(tǒng)計(jì)人才、技術(shù)更是捉襟見肘。傳統(tǒng)數(shù)據(jù)收集和分析技術(shù)的知識結(jié)構(gòu)已不能滿足大數(shù)據(jù)時(shí)代對“數(shù)據(jù)科學(xué)家”的要求,多家企業(yè)在面對大數(shù)據(jù)發(fā)展時(shí)遭遇人才瓶頸。大數(shù)據(jù)相關(guān)人才供給不足將會(huì)成為影響大數(shù)據(jù)市場發(fā)展的一個(gè)重要因素。
當(dāng)前,全世界范圍內(nèi)已有數(shù)百個(gè)高校開設(shè)了大數(shù)據(jù)分析專業(yè)??▋?nèi)基梅隆大學(xué)和新澤西州立大學(xué)在培養(yǎng)目標(biāo)和課程設(shè)置上項(xiàng)目設(shè)置偏重于計(jì)算機(jī)方向。課程設(shè)置偏重統(tǒng)計(jì)學(xué)與運(yùn)籌學(xué)(包括決策科學(xué))的典型學(xué)校有田納西大學(xué)和約克大學(xué)。2013年,北京航空航天大學(xué)與慧科教育合作開辦了國內(nèi)首個(gè)“大數(shù)據(jù)技術(shù)與應(yīng)用”軟件工程碩士項(xiàng)目研究生班,這是目前國內(nèi)唯一一個(gè)培養(yǎng)大數(shù)據(jù)行業(yè)專業(yè)型人才的項(xiàng)目,但其培養(yǎng)目標(biāo)、知識體系是面向計(jì)算機(jī)領(lǐng)域,而立足統(tǒng)計(jì)學(xué)基礎(chǔ)的大數(shù)據(jù)分析人才培養(yǎng)項(xiàng)目,在國內(nèi)可謂是鳳毛麟角。
知者隨事而制。高等院校統(tǒng)計(jì)學(xué)專業(yè)要通過有效利用和整合人才培養(yǎng)資源,承擔(dān)大學(xué)人才培養(yǎng)的責(zé)任,駕馭大數(shù)據(jù)的浪潮,占領(lǐng)大數(shù)據(jù)發(fā)展人才培養(yǎng)的制高點(diǎn),體現(xiàn)高等院校向社會(huì)、企業(yè)提供智力支撐,輸送企業(yè)亟需的復(fù)合型、實(shí)用性大數(shù)據(jù)分析人才的載體作用,確保產(chǎn)業(yè)科學(xué)、持續(xù)、高速的發(fā)展。一是教育資源的整合,走在前列的首都經(jīng)濟(jì)貿(mào)易大學(xué)、北京大學(xué)、中國人民大學(xué)、中國科學(xué)院大學(xué)、中央財(cái)經(jīng)大學(xué)五所應(yīng)用統(tǒng)計(jì)專業(yè)碩士培養(yǎng)單位在北京成立了“中國大數(shù)據(jù)教育協(xié)同創(chuàng)新體”,在高校之間實(shí)現(xiàn)學(xué)科融合、優(yōu)勢互補(bǔ)、強(qiáng)強(qiáng)聯(lián)合,通過共享優(yōu)質(zhì)資源平臺(tái)、共同建立課程體系、共同建設(shè)案例資源庫、聯(lián)合搭建實(shí)踐實(shí)訓(xùn)平臺(tái)等多種形式,創(chuàng)新人才培養(yǎng)體制機(jī)制。二是高等院校教育資源與業(yè)界資源的整合,通過與國有超大型企業(yè)、互聯(lián)網(wǎng)翹楚的協(xié)同培養(yǎng),立足應(yīng)用統(tǒng)計(jì)專業(yè)碩士教育,建立人才培養(yǎng)基地,進(jìn)行協(xié)同創(chuàng)新,探索構(gòu)建應(yīng)用統(tǒng)計(jì)(大數(shù)據(jù)分析)專業(yè)碩士人才協(xié)同培養(yǎng)模式。以緩解當(dāng)前大數(shù)據(jù)人才供需矛盾為目的,建立“校校協(xié)同、校企協(xié)同、院系協(xié)同”的大數(shù)據(jù)分析方向人才協(xié)同培養(yǎng)模式,最終實(shí)現(xiàn)協(xié)同培養(yǎng)“數(shù)據(jù)科學(xué)家”的目標(biāo)。[5]
3 面向大數(shù)據(jù)分析方向的應(yīng)用統(tǒng)計(jì)專業(yè)碩士培養(yǎng)模式的構(gòu)建
本研究認(rèn)為,可以將大數(shù)據(jù)分析及相關(guān)的案例教學(xué)模式融入應(yīng)用統(tǒng)計(jì)專業(yè)碩士學(xué)位研究生的培養(yǎng)過程,進(jìn)而打破統(tǒng)計(jì)學(xué)傳統(tǒng)的以闡述統(tǒng)計(jì)理論、公式推導(dǎo)、數(shù)學(xué)計(jì)算為主的教學(xué)模式。以情境浸潤為基礎(chǔ),為學(xué)生呈現(xiàn)統(tǒng)計(jì)學(xué)在大數(shù)據(jù)領(lǐng)域應(yīng)用為核心的教學(xué)模式,可以培養(yǎng)學(xué)生對大數(shù)據(jù)的挖掘、整合、分析價(jià)值的能力,以期更好、更快地適應(yīng)企業(yè)對數(shù)據(jù)分析師、數(shù)據(jù)科學(xué)家的需求。
3.1 科學(xué)構(gòu)建課程體系,突出大數(shù)據(jù)分析特點(diǎn)
大數(shù)據(jù)具有強(qiáng)烈的行業(yè)特點(diǎn),在充分借鑒國外大學(xué)成功經(jīng)驗(yàn)的基礎(chǔ)上,大數(shù)據(jù)分析專業(yè)碩士的課程設(shè)置,強(qiáng)化數(shù)據(jù)分析能力和數(shù)據(jù)挖掘能力,注重上述技術(shù)在金融等領(lǐng)域的應(yīng)用。必修課在講授統(tǒng)計(jì)基礎(chǔ)理論(描述、多元、時(shí)序、空間、可視化等)課程的基礎(chǔ)上,為增強(qiáng)學(xué)生的大規(guī)模分布式計(jì)算技能,引入主流的大數(shù)據(jù)計(jì)算平臺(tái),如Hadoop分布式平臺(tái)、MapReduce并行編程算法。與此同時(shí),為提高學(xué)生動(dòng)手能力,構(gòu)建數(shù)據(jù)模型思維,開設(shè)《大數(shù)據(jù)分析案例》等多門課程。選修課方面,考慮到學(xué)生二次開發(fā)的需要,設(shè)置大數(shù)據(jù)開發(fā)基礎(chǔ)課程,如C++、Java等。為突出應(yīng)用統(tǒng)計(jì)專業(yè)碩士側(cè)重應(yīng)用的特點(diǎn),開設(shè)面向數(shù)據(jù)的編程語言,如R、SAS、Python等課程。這些課程模塊的設(shè)置并非體現(xiàn)某一學(xué)科知識的縱深發(fā)展,而是將相關(guān)學(xué)科的知識融合,有利于突出大數(shù)據(jù)分析的特點(diǎn)。
3.2 創(chuàng)新教學(xué)培養(yǎng)模式,注重培用結(jié)合
以“編組”方式開展教學(xué)活動(dòng)。授課教師和學(xué)生均采用團(tuán)隊(duì)編組模式,多名教師協(xié)同工作,共同完成一門課程的授課任務(wù)。打破原有學(xué)科思維、教材的束縛。采用導(dǎo)師指導(dǎo)與集體培養(yǎng)相結(jié)合的方式。教師不可照搬舊有的教學(xué)大綱、課程內(nèi)容,要學(xué)習(xí)和熟悉大數(shù)據(jù)相關(guān)知識體系與技術(shù)新進(jìn)展,充分結(jié)合大數(shù)據(jù)分析需求和實(shí)際案例,使課程內(nèi)容緊貼實(shí)際需求,注重培養(yǎng)學(xué)生對模型的理解,對數(shù)據(jù)的想象力,真正實(shí)現(xiàn)學(xué)以致用、培用結(jié)合。
采取“訂制化”培養(yǎng)模式,突出培養(yǎng)與應(yīng)用相結(jié)合的特點(diǎn),力爭做到人、崗的高度匹配。“訂制化”培養(yǎng)模式打破了目前應(yīng)用統(tǒng)計(jì)專業(yè)碩士統(tǒng)一培養(yǎng)、與市場需求脫節(jié)的模式壁壘,教學(xué)實(shí)踐以市場需求為導(dǎo)向,依照企業(yè)的崗位標(biāo)準(zhǔn)、用人要求,強(qiáng)調(diào)以崗位需求制定培養(yǎng)方案,更好地滿足用人單位對大數(shù)據(jù)分析人才的需求。
3.3 開展校企協(xié)同培養(yǎng),構(gòu)建問題導(dǎo)向、項(xiàng)目牽引的實(shí)踐教學(xué)模式
根據(jù)國務(wù)院學(xué)位委員會(huì)的規(guī)定,應(yīng)用統(tǒng)計(jì)學(xué)專業(yè)碩士學(xué)位研究生教育的目的是培養(yǎng)具有良好的統(tǒng)計(jì)學(xué)背景,系統(tǒng)掌握數(shù)據(jù)采集、處理、分析和開發(fā)的知識與技能,具備熟練應(yīng)用計(jì)算機(jī)處理和分析數(shù)據(jù)的能力,能夠并適應(yīng)行業(yè)或職業(yè)實(shí)際工作需要的應(yīng)用型高層次人才。因此,要摒棄普遍存在的重理論輕實(shí)踐、重知識輕技能的教學(xué)方式。
協(xié)同創(chuàng)新培養(yǎng)在實(shí)踐教學(xué)中建立了以問題為導(dǎo)向,以項(xiàng)目為牽引的運(yùn)作機(jī)制,強(qiáng)調(diào)實(shí)踐教學(xué)內(nèi)容的呈現(xiàn)方式要面向企業(yè)需求,讓學(xué)生參與到企業(yè)的項(xiàng)目運(yùn)行過程中,引導(dǎo)學(xué)生建立業(yè)務(wù)建模能力,培養(yǎng)學(xué)生的數(shù)據(jù)資源整合能力,激發(fā)學(xué)生參與項(xiàng)目的積極性和自覺性。學(xué)生不拘泥于學(xué)校的實(shí)驗(yàn)實(shí)訓(xùn)基地和各類實(shí)驗(yàn)室,在第二學(xué)年中安排一定時(shí)間走出校門,進(jìn)入到企業(yè)的實(shí)際環(huán)境中,參與企業(yè)的項(xiàng)目組織、實(shí)施過程,在實(shí)踐過程中提升自我認(rèn)知能力,在實(shí)踐過程應(yīng)用知識和理論研究實(shí)際問題的能力,培養(yǎng)和鍛煉數(shù)據(jù)資源整合能力、溝通協(xié)調(diào)能力、IT支撐能力、業(yè)務(wù)建模能力,真正實(shí)現(xiàn)面向能力培養(yǎng)的目的。指導(dǎo)教師方面,在案例教學(xué)和實(shí)習(xí)階段引進(jìn)業(yè)務(wù)素質(zhì)高、項(xiàng)目經(jīng)驗(yàn)豐富、對大數(shù)據(jù)發(fā)展有敏銳洞察力的企業(yè)高級數(shù)據(jù)分析人員,指導(dǎo)學(xué)生在實(shí)習(xí)實(shí)踐中提出問題、建立模型、解決問題的能力。
4 結(jié)語
應(yīng)用統(tǒng)計(jì)(大數(shù)據(jù)分析)專業(yè)碩士人才協(xié)同培養(yǎng)模式,是一項(xiàng)可持續(xù)發(fā)展的應(yīng)用統(tǒng)計(jì)專業(yè)碩士人才培養(yǎng)的新模式,是專業(yè)碩士教學(xué)實(shí)踐的創(chuàng)新舉措,也是在全國率先建立起來的立足統(tǒng)計(jì)學(xué),在大數(shù)據(jù)分析人才層面建立的校校協(xié)同、校企系統(tǒng)辦學(xué)體。體現(xiàn)了面向能力培養(yǎng)、面向社會(huì)需求培養(yǎng)、面向人才價(jià)值培養(yǎng)的“三個(gè)面向”的培養(yǎng)目標(biāo),著重培養(yǎng)學(xué)生分析數(shù)據(jù)、處理數(shù)據(jù)、展示數(shù)據(jù)的能力,對于培養(yǎng)“高層次、實(shí)用性、復(fù)合型、國際化”大數(shù)據(jù)分析人才意義重大,同時(shí)也是順應(yīng)大數(shù)據(jù)技術(shù)革命的浪潮,必將對大數(shù)據(jù)等新興技術(shù)產(chǎn)業(yè)的發(fā)展注入活力。
(首都經(jīng)濟(jì)貿(mào)易大學(xué),北京 100070)
參考文獻(xiàn):
[1]劉軍.Hodoop大數(shù)據(jù)處理[M].人民郵電出版社,2013.
[2]大數(shù)據(jù)的四個(gè)典型特征[N].中國電子報(bào)、電子信息產(chǎn)業(yè)網(wǎng),2012(12).
[3]CCF大數(shù)據(jù)專家委員會(huì).2014年大數(shù)據(jù)發(fā)展趨勢預(yù)測[J].中國計(jì)算機(jī)學(xué)會(huì)通訊,2014(1):32-36.
[關(guān)鍵詞]新媒體營銷;企業(yè)轉(zhuǎn)型升級;市場營銷模式
1引言
新媒體營銷是隨著互聯(lián)網(wǎng)技術(shù)不斷發(fā)展而衍生的重要產(chǎn)物,它是以移動(dòng)平臺(tái)為載體,以信息技術(shù)為橋梁而實(shí)現(xiàn)的企業(yè)網(wǎng)絡(luò)市場競爭的過程。這種模式的出現(xiàn)意味著企業(yè)與現(xiàn)代科學(xué)技術(shù)的接軌,是企業(yè)智能化數(shù)據(jù)化發(fā)展的鮮明體現(xiàn)。企業(yè)在新媒體平臺(tái)和技術(shù)的指導(dǎo)下,能夠依靠各類先進(jìn)技術(shù),轉(zhuǎn)變自身的發(fā)展方式。其中最為突出的應(yīng)用便在于企業(yè)對數(shù)據(jù)分析的引進(jìn)。
2分析數(shù)據(jù),確立市場受眾群體
企業(yè)要想在眾多新媒體平臺(tái)營銷中脫穎而出,就必須掌握符合自身市場定位的消費(fèi)群體,要讓自身生產(chǎn)的產(chǎn)品能夠有廣泛的接受度,要取得屬于自身獨(dú)有的市場信任感和公信力。這也就意味著企業(yè)要主動(dòng)出擊,積極地吸引消費(fèi)者群體的關(guān)注和重視。如果一個(gè)企業(yè)發(fā)展自身新媒體營銷的方法,僅僅是通過水軍或者是買來的粉絲,或者是通過轉(zhuǎn)發(fā)抽獎(jiǎng)等,那么這個(gè)企業(yè)只會(huì)在短時(shí)間內(nèi)取得一定的爆發(fā)式關(guān)注,無法取得長遠(yuǎn)的市場利益,也沒有辦法真正的給消費(fèi)者留下深刻的印象,自然也不能根據(jù)消費(fèi)者的喜好和興趣制訂出針對性的市場營銷方案。這就需要企業(yè)通過數(shù)據(jù)分析的方法來明確自身的受眾群體。[1]首先,企業(yè)要用數(shù)據(jù)分析的方法,對自身已有的市場發(fā)展基礎(chǔ)進(jìn)行系統(tǒng)的分析和總結(jié),整理出自身的市場定位和發(fā)展特點(diǎn),包括品牌形象、競爭優(yōu)勢、產(chǎn)品性質(zhì)等。在此基礎(chǔ)上,大致地規(guī)劃消費(fèi)者的群體范圍,制訂相應(yīng)的宣傳方案和宣傳規(guī)劃,同時(shí)也要注意把握時(shí)間的限制,要盡可能地尋求時(shí)間和效益之間的平衡。在這一過程中,企業(yè)要按照消費(fèi)者的點(diǎn)擊喜好和頻率,來制定有針對性的宣傳模式,這樣可以更為有效地吸引消費(fèi)者的關(guān)注。其次,企業(yè)要重視用戶之間的傳播和轉(zhuǎn)發(fā),企業(yè)要在吸引一批粉絲的基礎(chǔ)上適當(dāng)?shù)剡M(jìn)行轉(zhuǎn)發(fā)和抽獎(jiǎng)活動(dòng),擴(kuò)大自身的市場影響力。最后,企業(yè)也要在這一過程中精確自身的市場定位,要?jiǎng)討B(tài)地觀察宣傳的成果和績效,要尋找大眾的認(rèn)同感。這便要求企業(yè)要借助數(shù)據(jù)分析和檢索的平臺(tái),搜索與自身宣傳相關(guān)的信息確立關(guān)鍵詞和重點(diǎn)語句,并分析大眾對于自身的評價(jià)和看法,更好地改進(jìn)營銷中存在的缺陷和不足。同時(shí)要在此基礎(chǔ)上,讓自身的宣傳內(nèi)容更加量化和準(zhǔn)確,更好地提升在用戶之間的口碑。
3分析數(shù)據(jù),確立市場營銷載體
根據(jù)上文所述,企業(yè)在新媒體營銷中所進(jìn)行的宣傳是離不開固定的平臺(tái)和載體的,移動(dòng)平臺(tái)是企業(yè)信息和展現(xiàn)自身形象的基礎(chǔ)與保障。因此,企業(yè)要十分重視自身新媒體營銷工具的選擇,要運(yùn)用數(shù)據(jù)分析的方法精準(zhǔn)地統(tǒng)籌和管理市場營銷的信息,推動(dòng)網(wǎng)絡(luò)營銷能夠適應(yīng)自身發(fā)展的特點(diǎn)和規(guī)律。同時(shí),數(shù)據(jù)分析方法還可以把企業(yè)自身經(jīng)營的特點(diǎn)與不同的新媒體平臺(tái)進(jìn)行融合,對比其結(jié)合后的實(shí)際效益和成果,同時(shí)也可以與事先的市場規(guī)劃設(shè)計(jì)相比較,在此基礎(chǔ)上選擇最為合適的企業(yè)新媒體營銷載體。[2]之所以運(yùn)用數(shù)據(jù)分析的方法來選擇企業(yè)新媒體營銷載體,是因?yàn)楝F(xiàn)階段網(wǎng)絡(luò)企業(yè)的發(fā)展形式多種多樣,不同的企業(yè)也有自身不同的市場定位和產(chǎn)品特點(diǎn),彼此之間相互獨(dú)立,但是也緊密聯(lián)系。這也就意味著,各類企業(yè)在共同運(yùn)用新媒體網(wǎng)絡(luò)平臺(tái)這一方法進(jìn)行市場營銷的同時(shí),也要根據(jù)自身的發(fā)展特點(diǎn)來選擇適合自己的宣傳載體和工具,只有這樣才可以促進(jìn)宣傳內(nèi)容的有效傳播。當(dāng)下企業(yè)利用新媒體進(jìn)行宣傳的主要形式包括紀(jì)錄片、文字和圖像等,也可以是多種表現(xiàn)形式的結(jié)合。盡管在宣傳方式上具有多樣性,但是否能真正的起到吸引用戶的作用還需要依靠用戶的主觀能動(dòng)性。這就要求企業(yè)在選擇好自身營銷載體的基礎(chǔ)上,利用后臺(tái)運(yùn)行接收數(shù)據(jù)信息的方法,分析用戶點(diǎn)擊頻率最多的板塊和內(nèi)容,總結(jié)出現(xiàn)階段自身市場發(fā)展應(yīng)當(dāng)跟隨的主流趨勢,以及分析當(dāng)下營銷平臺(tái)運(yùn)行的成果。例如當(dāng)下的微博小程序,就是企業(yè)依靠文字推送或者視頻的方式,與用戶建立線上的交流和溝通,在此基礎(chǔ)上根據(jù)用戶的點(diǎn)擊頻率來制訂出更有針對性的市場營銷方案。
4分析數(shù)據(jù),確立信息展示模式
現(xiàn)階段,有許多企業(yè)建立了自身運(yùn)營的自媒體平臺(tái),有相當(dāng)一部分是需要用戶下載相應(yīng)的軟件,并注冊賬號才可以獲得相關(guān)的信息。用戶在注冊之后,便可以通過在移動(dòng)端登錄的方法來完成后續(xù)操作。[3]但也正是因?yàn)檫@種登錄方法的存在,用戶會(huì)獲得比其他平臺(tái)更多的市場信息。這就在一定程度上激發(fā)了用戶的厭煩心理,有相當(dāng)一部分用戶會(huì)由于時(shí)間的限制,直接略過企業(yè)所的信息。同時(shí),也有一部分企業(yè)將自身的信息運(yùn)用網(wǎng)頁鏈接或者是二維碼的方式展現(xiàn)出來,用戶必須要在登錄網(wǎng)站的基礎(chǔ)上再一次點(diǎn)開網(wǎng)頁鏈接,這就會(huì)讓用戶覺得瀏覽信息是一件非常煩瑣的事情。因此,企業(yè)要重視自身信息展現(xiàn)形式的轉(zhuǎn)變,企業(yè)要盡可能地選擇簡潔明了的形式突出自身信息的重點(diǎn),要讓用戶可以看到自身營銷的優(yōu)勢和特點(diǎn)。企業(yè)可以用數(shù)據(jù)分析的方法,統(tǒng)計(jì)出用戶容易接受的信息展現(xiàn)形式,并按照類別進(jìn)行劃分。當(dāng)下,用戶容易接納的是企業(yè)圖文并茂的信息展現(xiàn)形式,可以是圖片和文字鏈接的結(jié)合,也可以是視頻和文字鏈接的結(jié)合,或者是將鏈接安置在圖片上。企業(yè)就可以根據(jù)用戶的喜好,將自身內(nèi)容展現(xiàn)的形式進(jìn)行改革和優(yōu)化,例如企業(yè)可以將市場經(jīng)營的方向和產(chǎn)品的性能,利用形象化的圖片展示出來。讓用戶可以一眼就看到自身的品牌特色,提高自身的吸引力。在這一過程中企業(yè)要意識到信息真實(shí)準(zhǔn)確表達(dá)的重要性,企業(yè)可以在原有的基礎(chǔ)上進(jìn)行適當(dāng)?shù)劁秩竞蜐櫳?,但是不能虛假信息,不能夸大其詞,不能讓用戶接受錯(cuò)誤且夸張的市場營銷數(shù)據(jù)。
5分析數(shù)據(jù),確定市場發(fā)展價(jià)值
企業(yè)運(yùn)用數(shù)據(jù)分析的重點(diǎn)不僅是要打造更為針對性的市場營銷方案,更是要在數(shù)據(jù)信息的分析過程中審視自身的市場經(jīng)營價(jià)值,分析自身的發(fā)展建設(shè)前景,評估現(xiàn)階段自身方案的質(zhì)量和效益,并以此來為未來的長遠(yuǎn)發(fā)展打下堅(jiān)定的基礎(chǔ)。因此企業(yè)要用數(shù)據(jù)分析的方法,對自身新媒體運(yùn)營平臺(tái)進(jìn)行階段性和周期性的監(jiān)督,分析現(xiàn)階段自身在市場競爭中的地位。[4]監(jiān)督的內(nèi)容主要包括平臺(tái)粉絲的瀏覽量和點(diǎn)擊率、粉絲的轉(zhuǎn)發(fā)量、粉絲總量的增減、除粉絲之外的市場其他用戶點(diǎn)擊率,以及現(xiàn)階段市場營銷的經(jīng)濟(jì)利潤和收益等。這樣就可以在很大程度上幫助企業(yè)確定自身營銷平臺(tái)選擇的正確性,分析自身市場發(fā)展定位的準(zhǔn)確性。
為了進(jìn)一步了解館藏圖書的利用情況,現(xiàn)從社科類、自科類及綜合類的角度對2008年—2012年5年數(shù)據(jù)進(jìn)行結(jié)構(gòu)劃分,其中社科類包含《中圖法(第四版)》中的A-K類,自科類包含N-X類,綜合類指Z類。綜合類每年的購置量很少,此次在表2中體現(xiàn),僅供參考,重點(diǎn)將社科與自科類圖書進(jìn)行分析。從館藏冊數(shù)方面,由表2的數(shù)據(jù)統(tǒng)計(jì)得知自科類圖書占據(jù)主導(dǎo)地位,分別占到55%,54.5%,56%,54.5%,56.2%,這與圖書館每年制定的自科社科6:4的圖書入藏比例基本相符,也表明了圖書館的館藏結(jié)構(gòu)符合學(xué)校以工為主的辦學(xué)特色。流通比例是指圖書的借閱量與總的借閱量的比例,可以從很多方面進(jìn)行劃分,時(shí)間段內(nèi)讀者對各類圖書的整體需求比例,從類別結(jié)構(gòu)劃分流通比例就可以客觀的反映出來。由表2的數(shù)據(jù)統(tǒng)計(jì)得知,2008年—2012年,社科類的流通比例每年都高于自科類,分別占到了56%,58%,60%,57%,66%。
入藏比例與流通比例的分析比對
取自科與社科的入藏比例和流通比例的差值Z,以數(shù)值0為分界點(diǎn),分為正負(fù)兩個(gè)區(qū)間,如果Z值落在同區(qū)間內(nèi),則表示館藏圖書與讀者需求在整體上保持一致,反之,若Z值落在不同的區(qū)間,則表示館藏圖書與讀者需求存在矛盾。計(jì)算公式Z=X-YX:入藏比例Y:流通比例如圖1所示,圖書館5年內(nèi)的Z值均分布于兩個(gè)不同的區(qū)間,從而說明,入藏的圖書與讀者的需求存在出入,沒有達(dá)到一致。那么,為了使圖書更好的被利用,是應(yīng)該繼續(xù)按照圖書館原有的采購比例繼續(xù)采購,還是要改變采購方向迎合讀者的需求,就要進(jìn)一步的了解利用率較高的幾大類圖書。
文獻(xiàn)的利用率衰減對文獻(xiàn)采購的影響
1圖書利用率的分類排名
通過統(tǒng)計(jì),借閱率排名前10位的有文學(xué)(I)、哲學(xué)(B)、藝術(shù)(J)、語言、文字(H)、社科總論(C)、歷史、地理(K)、經(jīng)濟(jì)(F)、工業(yè)技術(shù)(T)、政治法律(D)、數(shù)理科學(xué)和化學(xué)(O)。以2008年入藏的中文圖書作為統(tǒng)計(jì)對象,以2008年—2012年5年作為5個(gè)借閱時(shí)間段,前10位的借閱率統(tǒng)計(jì)結(jié)果如表3。表3的統(tǒng)計(jì)結(jié)果清晰表明,在每年的借閱率排名前10類中,社科類占到了80%,而自科類只占到了20%,社科類中文學(xué)(I)的借閱率更是高居榜首,文學(xué)類圖書受到讀者的歡迎,在其他各個(gè)高校中的借閱率排名亦是居高不下。社科類更是占據(jù)了借閱率排行的前6位。自科類排名中T大類遙遙領(lǐng)先,這是由于工業(yè)技術(shù)本身就涵蓋了TB、TD、TM等眾多類別,受眾面較為廣泛,但與社科類的圖書利用率進(jìn)行比較,自科類的圖書利用率還是有一定的差距。一個(gè)圖書情報(bào)機(jī)構(gòu)是為某一個(gè)或幾個(gè)專業(yè)研究、教育培訓(xùn)服務(wù),還是為一般參考咨詢或娛樂欣賞服務(wù),這是設(shè)計(jì)藏書結(jié)構(gòu)的基本出發(fā)點(diǎn)和目標(biāo)[2]。西安理工大學(xué)屬于理工院校,以工為主亦應(yīng)該在圖書館館藏結(jié)構(gòu)中得以體現(xiàn)。
2文獻(xiàn)利用率的衰減分析
文獻(xiàn)可看作是一種信息,信息有其時(shí)效性,文獻(xiàn)的價(jià)值也會(huì)隨著時(shí)間的流逝而逐漸降低(特種文獻(xiàn)除外)[3],圖書的利用率也符合這種規(guī)律逐年衰減。這一點(diǎn)可從表3的各類圖書的年利用率中清晰看到。文學(xué)(I)從91.19%降至47.70%,其它各類圖書都有不同程度的降低。如果用U來表示圖書利用率的衰減程度,那么U就應(yīng)該等于同樣的入藏圖書大類在不同時(shí)間段內(nèi)的借閱率之差。U的值越大,說明該類圖書利用率的衰減程度大,利用價(jià)值損耗大,反之,說明該類圖書的利用價(jià)值時(shí)間長,采購圖書時(shí)應(yīng)加以考慮。2008年入藏的圖書,在2008年的借閱率與2012年的借閱率之差結(jié)果如圖2所示。其中U值較小的為T類與O類,I類排在第4位。自科類的圖書利用率雖然較低,但是,隨著時(shí)間的推移,自科類的圖書利用率衰減值小,所以利用價(jià)值可持續(xù)的周期比較長,可供讀者的參考價(jià)值也較高。社科類的圖書借閱率較高,但是時(shí)效性低,而且衰減值高,圖2中顯示,J類,H類,C類,F(xiàn)類的借閱率之差相當(dāng),而且數(shù)值較高,I類圖書借閱率最高,但是屬于非專業(yè)圖書,應(yīng)控制采購比例。2008年入藏的圖書,5年之后,2012年的利用率排名前3位的分別為文學(xué)(I)47.70%、哲學(xué)(B)47.62%、工業(yè)技術(shù)(T)40.90%。T與O大類的借閱率排名分別從第8位與第10位上升為第3位與第6位。這說明自科類的圖書保值期比社科類圖書時(shí)間長,例如2008年購置的自科類《電子線路CADProtel99SE》一書,在2008年流通量為6次,2012年仍然流通量4次,而社科類《經(jīng)濟(jì)學(xué)的分析方法》一書,2008年的流通量為11次,在2012年就只流通了1次。
關(guān)鍵詞: 數(shù)據(jù)挖掘;數(shù)據(jù)倉庫;相關(guān)分析
中圖分類號:TP 311.3 文獻(xiàn)標(biāo)志碼:A 文章編號:1672-8513(2011)03-0182-03
The Application of Correlation Analysis Algorithms in the Data Invites Chien
ZHANG Hanyun,DUAN Peng
(School of Mathematics and Computer Science,Yunnan University of Nationalities,Kunming 650031,China)
Abstract: The data warehouse was constructed by using the mass data of computer science majors’ scores generated during the past three years in thirteen classes of four grades, we analyze the corresponding degree of different courses in the database using corresponding analyzing techniques, and condense the attributes in database according to corresponding factors, An example is given to illustrate the application of the proposed method. The analysis introduced in the paper has provided a scientific basis for improving the teaching quality .Then it is prepare for the Association rules mined of different courses.
Key words: data mining;data warehouse; correlation analysis
相關(guān)分析法是在分析某個(gè)問題或指標(biāo)時(shí),將與該問題或指標(biāo)相關(guān)的其他問題或指標(biāo)進(jìn)行對比,分析其相互關(guān)系或相關(guān)程度的一種分析方法,用少數(shù)幾對綜合變量來反映2組變量間的線性相關(guān)性質(zhì).目前它已經(jīng)在眾多領(lǐng)域的相關(guān)分析和預(yù)測分析中得到廣泛應(yīng)用.本文主要研究如何利用相關(guān)分析技術(shù)產(chǎn)生計(jì)算機(jī)專業(yè)課之間的相關(guān)系數(shù),發(fā)現(xiàn)專業(yè)課程之間的相關(guān)度,對數(shù)據(jù)倉庫中的數(shù)據(jù)進(jìn)行約簡[1].
1 相關(guān)分析
1.1 相關(guān)分析概述[2]
相關(guān)分析(Correlation Analysis)是研究隨機(jī)變量之間的相關(guān)關(guān)系的一種統(tǒng)計(jì)方法.相關(guān)關(guān)系是一種非確定性的關(guān)系,例如,以X和Y分別記一個(gè)人的身高和體重,或分別記每公頃施肥量與每公頃小麥產(chǎn)量,則X與Y顯然有關(guān)系,而又沒有確切到可由其中的一個(gè)去精確地決定另一個(gè)的程度,這就是相關(guān)關(guān)系.例如,教育投資與教育發(fā)展速度的關(guān)系、教師教學(xué)水平和學(xué)生的學(xué)習(xí)效果之間的關(guān)系等[3].
相關(guān)系數(shù)值為-1(完全負(fù)相關(guān)關(guān)系)~+1(完全正相關(guān)關(guān)系)之間,相關(guān)系數(shù)為0時(shí),表示不存在相關(guān)關(guān)系.例:
正相關(guān):學(xué)生的學(xué)習(xí)能力與學(xué)習(xí)成績的關(guān)系;
負(fù)相關(guān):教師的身體狀況與缺勤率的關(guān)系;
零相關(guān):教師的身高與教學(xué)能力的關(guān)系.
Pearson相關(guān)用于雙變量正態(tài)分布的資料,其相關(guān)系數(shù)稱為積矩相關(guān)系數(shù)(Coefficient of Product-Moment Correlation).進(jìn)行相關(guān)分析時(shí),我們一般會(huì)同時(shí)對2變量繪制散點(diǎn)圖,以更直觀地考察2變量之間的相互變化關(guān)系[4].
用Flag Significant Correlations 進(jìn)行顯著性檢驗(yàn),標(biāo)出有顯著性意義的相關(guān)系數(shù),用一個(gè)星號“*”標(biāo)記在α=0.05水平上有顯著性意義的相關(guān)系數(shù);用2個(gè)星號“**”標(biāo)記在α=0.01水平上有顯著性意義的相關(guān)系數(shù)[5].
1.2 相關(guān)分析的表示方法
進(jìn)行相關(guān)分析的主要方法有圖示法和計(jì)算法.圖示法是通過繪制相關(guān)散點(diǎn)圖來進(jìn)行相關(guān)分析,計(jì)算法則是根據(jù)不同類型的數(shù)據(jù),選擇不同的計(jì)算方法求出相關(guān)系數(shù)來進(jìn)行相關(guān)分析.
1.2.1 圖示法
圖示法的具體做法就是繪制相關(guān)散點(diǎn)圖.相關(guān)散點(diǎn)圖是觀察2個(gè)變量之間關(guān)系的一種非常直觀的方法.具體繪制的方法是:以橫軸表示2個(gè)變量中的1個(gè)變量(作為自變量),以縱軸表示另一個(gè)變量(作為因變量).將2個(gè)變量之間相對應(yīng)的變量值以坐標(biāo)點(diǎn)的形式逐一標(biāo)在直角坐標(biāo)系中,通過點(diǎn)的分布形狀和疏密程度來形象描述2個(gè)變量之間的相關(guān)關(guān)系.
相關(guān)散點(diǎn)圖可以通過手工繪制而得到.但如果面對的變量值比較多,手工繪制的過程既費(fèi)時(shí),又不夠精確.
1.2.2 計(jì)算法
相關(guān)系數(shù)也稱為相關(guān)量,是用來描述變量之間變化方向和密切程度的數(shù)字特征量,一般用r表示.它的數(shù)值范圍在-1到+1之間,它的正負(fù)號反映變量之間變化的方向;它的絕對值的大小反映變量之間關(guān)系的密切程度.
根據(jù)2個(gè)變量變化的密切程度,我們把相關(guān)關(guān)系分為完全相關(guān)、高度相關(guān)、中度相關(guān)、低度相關(guān)、零相關(guān)[6].
完全相關(guān):│r│=1的相關(guān);
高度相關(guān)或強(qiáng)相關(guān):0.7≤│r│<1的相關(guān);
中度相關(guān):0.4≤│r│<0.7的相關(guān);
低度相關(guān)或弱相關(guān):│r│<0.4的相關(guān).
1.3 Pearson相關(guān)
Pearson相關(guān)也稱積差相關(guān),積差相關(guān)也稱積矩相關(guān),是英國統(tǒng)計(jì)學(xué)家Rearson提出的一種計(jì)算直線相關(guān)的方法,因而又稱為Rearson相關(guān)[6-7].
積差相關(guān)系數(shù)是2列成對觀測值中各對觀測值的標(biāo)準(zhǔn)分?jǐn)?shù)乘積之和除以觀測值對數(shù)所得之商[8].
1.3.1 Pearson相關(guān)的使用條件
1) 2個(gè)變量之間是線性關(guān)系,都是連續(xù)數(shù)據(jù);
2) 2個(gè)變量的總體是正態(tài)分布,或接近正態(tài)的單峰分布;
3) 2個(gè)變量的觀測值是成對的,每對觀測值之間相互獨(dú)立.
1.3.2 Pearson相關(guān)的計(jì)算公式
r=∑ZXZYn=∑X-Y-nσXσY.
式中,[ZK(]n表示數(shù)據(jù)的對數(shù);σX,σY分別表示X和Y變量的樣本標(biāo)準(zhǔn)差;[JP],分別表示X和Y變量的樣本平均數(shù).[ZK)]
對于學(xué)生成績,其課程總體分布接近正態(tài)分布,滿足Pearson相關(guān)的使用條件.在統(tǒng)計(jì)軟件SPSS中,可以很方便地得出2變量之間的Pearson相關(guān)系數(shù).[JP]
2 用相關(guān)分析法進(jìn)行數(shù)據(jù)約簡
2.1 學(xué)生成績數(shù)據(jù)倉庫的建立
數(shù)據(jù)選擇上,主要選擇了作者所在學(xué)校計(jì)算機(jī)專業(yè)3年來產(chǎn)生的專業(yè)基礎(chǔ)課成績,收集并整理了包含高等數(shù)學(xué)、C語言、數(shù)據(jù)結(jié)構(gòu)和數(shù)據(jù)庫系統(tǒng)原理的504條學(xué)生成績數(shù)據(jù).并將具體的成績數(shù)據(jù)離散化為4個(gè)等級[9],即:
成績>=80“A”; 70=
2.2 用相關(guān)分析法進(jìn)行數(shù)據(jù)約簡
對大規(guī)模數(shù)據(jù)庫內(nèi)容進(jìn)行復(fù)雜的數(shù)據(jù)分析通常需要耗費(fèi)大量的時(shí)間,這就常常使得這樣分析變得不現(xiàn)實(shí)和不可行,尤其是需要交互式數(shù)據(jù)挖掘時(shí).數(shù)據(jù)約簡技術(shù)正是用于幫助從原有龐大數(shù)據(jù)集中獲得一個(gè)精簡的數(shù)據(jù)集合,并使這一精簡數(shù)據(jù)集保持原有數(shù)據(jù)集的完整性,這樣在精簡數(shù)據(jù)集上進(jìn)行數(shù)據(jù)挖掘,顯然效率更高,并且挖掘出來的結(jié)果與使用原有數(shù)據(jù)集所獲得結(jié)果基本相同[10].
數(shù)據(jù)約簡并不是一個(gè)新的領(lǐng)域,現(xiàn)在已經(jīng)提出了很多理論和方法,如:層次分析法,主成分分析法,隨機(jī)抽樣、免疫算法等.本研究根據(jù)實(shí)際需要,提出將相關(guān)分析方法應(yīng)用于學(xué)生成績的屬性約簡,即方便快捷又不失理論性.
在SPSS軟件中,畫出計(jì)算機(jī)專業(yè)課高等數(shù)學(xué)成績的直方圖,如圖1.
用同樣的方法,可以畫出其他計(jì)算機(jī)專業(yè)課如C語言、數(shù)據(jù)結(jié)構(gòu)等的直方圖,可以看出,我們所建立的數(shù)據(jù)倉庫中,學(xué)生計(jì)算機(jī)專業(yè)課程成績基本上符合正態(tài)分布,滿足Pearson相關(guān)的使用條件.
我們用雙變量相關(guān)分析技術(shù)來分析相關(guān)課程之間的關(guān)聯(lián)程度,并做出統(tǒng)計(jì)學(xué)推斷,以最少的數(shù)據(jù)量反映最大的信息量,進(jìn)而對數(shù)據(jù)庫的屬性進(jìn)行約簡.通過相關(guān)分析約簡相關(guān)性較弱的屬性,選擇相關(guān)性強(qiáng)的屬性而不直接利用數(shù)據(jù)庫中的所有屬性,從而減少大量冗余屬性,以提高算法的效率.
在SPSS中進(jìn)行課程間Pearson相關(guān)系數(shù)分析,得到計(jì)算機(jī)專業(yè)課程相關(guān)系數(shù)分析表如表1.
1:表中數(shù)值為4門課程進(jìn)行相關(guān)分析得到的皮爾遜相關(guān)系數(shù)(Pearson Correlation)、相伴概率(Sig.(2-tailed))、樣本個(gè)數(shù)(N).“*”標(biāo)記在α=0.05水平上有顯著性意義的相關(guān)系數(shù);用兩個(gè)星號“**”標(biāo)記在α=0.01水平上有顯著性意義的相關(guān)系數(shù);
2:相伴概率用來判斷求解線性關(guān)系的兩變量之間是否有明顯的線性關(guān)系.一般將這個(gè)Sig值與0.05相比較,如果它大于0.05,說明平均值在大于5%的幾率上是相等的,而在小于95%的幾率上不相等;如果它小于0.05,說明平均值在小于5%的幾率上是相等的,而在大于95%的幾率上不相等;如C語言與數(shù)據(jù)結(jié)構(gòu)的Sig是0,此數(shù)值說明C語言與數(shù)據(jù)結(jié)構(gòu)有顯著的線性關(guān)系(因?yàn)镾ig0.05,則說明兩變量之間沒有明顯的線性關(guān)系).
由表1可以看出,同一門課程之間的Pearson相關(guān)系數(shù)為1,是完全相關(guān)關(guān)系.高等數(shù)學(xué)與C語言之間的Pearson相關(guān)系數(shù)為0.283,C語言與數(shù)據(jù)結(jié)構(gòu)之間的Pearson相關(guān)系數(shù)為0.281,數(shù)據(jù)結(jié)構(gòu)與數(shù)據(jù)庫系統(tǒng)原理之間的Pearson相關(guān)系數(shù)為0.565,并且都有“*”標(biāo)記,由此可以推斷這4組課程之間有顯著性意義的相關(guān)性.
3 結(jié)語
用相關(guān)分析技術(shù)對數(shù)據(jù)庫進(jìn)行約簡,結(jié)果表明:線性代數(shù)、計(jì)算機(jī)導(dǎo)論及Pascal語言等多個(gè)因素相關(guān)性較弱;而C語言、數(shù)據(jù)結(jié)構(gòu)、高等數(shù)學(xué)及數(shù)據(jù)庫系統(tǒng)原理之間相關(guān)性較強(qiáng),根據(jù)數(shù)據(jù)庫約簡原則,可將線性代數(shù)、計(jì)算機(jī)導(dǎo)論及Pascal語言等多個(gè)屬性項(xiàng)從數(shù)據(jù)庫中刪除,以便提高數(shù)據(jù)挖掘效率.
參考文獻(xiàn):
[1]段西凌,甘開鵬.數(shù)據(jù)挖掘在人口普查信息系統(tǒng)中的應(yīng)用[J].云南民族大學(xué)學(xué)報(bào):自然科學(xué)版,2006,15(2):170-172.
[2]茆詩松.統(tǒng)計(jì)手冊[M].北京:科學(xué)出版社,2003.
[3]TANG Zhaohui,MACLENNAN J.數(shù)據(jù)挖掘原理與應(yīng)用[M]. 鄺祝芳,焦賢龍,高升,譯.北京:清華大學(xué)出版社,2007.
[4]王艷.數(shù)據(jù)挖掘中關(guān)聯(lián)規(guī)則的探討[J].成都信息工程學(xué)院學(xué)報(bào),2004,19(2):173.
[5]張儒良,王翰虎.論數(shù)據(jù)挖掘優(yōu)化教學(xué)管理[J].貴州民族學(xué)院學(xué)報(bào),2004:133.
[6]趙輝.數(shù)據(jù)挖掘技術(shù)在學(xué)生成績中分析中的應(yīng)用[D].大連:大連海事大學(xué),2007.
[7]王月敏.基于遺傳算法的智能組卷系統(tǒng)研究[J].云南民族大學(xué)學(xué)報(bào):自然科學(xué)版,2009,18(2):173-176.
[8]劉利鋒,吳孟達(dá). 關(guān)聯(lián)規(guī)則的快速提取算法 [J].計(jì)算機(jī)工程.2008,34(5):63-65.
[9]李萍,段富.數(shù)據(jù)挖掘中數(shù)據(jù)約簡的研究與應(yīng)用[J].微計(jì)算機(jī)應(yīng)用.2009,25(2):58-60.[ZK)]
[10][ZK(#]蔡勇,韓永國,劉自偉.數(shù)據(jù)挖掘技術(shù)在生源分析中的應(yīng)用研究[J].計(jì)算機(jī)應(yīng)用研究.2004,32(6):48-51.
收稿日期:2010-09-06.
【關(guān)鍵詞】大數(shù)據(jù)時(shí)代;運(yùn)動(dòng)訓(xùn)練科學(xué);研究方向
引 言
運(yùn)動(dòng)訓(xùn)練科學(xué)的基本理論在1960至1970年基本形成,而研究則在1990年后正式開始。運(yùn)動(dòng)訓(xùn)練科學(xué)屬于自然科學(xué)尤其是數(shù)學(xué)、化學(xué)、物理學(xué)、生物學(xué)、生理學(xué)等科學(xué)的產(chǎn)物。傳統(tǒng)的運(yùn)動(dòng)訓(xùn)練科學(xué)遵循的是小數(shù)據(jù)研究理念與模式,然而,隨著大數(shù)據(jù)的到來,小數(shù)據(jù)所展現(xiàn)出來的碎片化、分散化的特點(diǎn)不能完全的反映運(yùn)動(dòng)訓(xùn)練的模式,而大數(shù)據(jù)的分析存儲(chǔ)、收集、使用數(shù)據(jù)的能力則在運(yùn)動(dòng)訓(xùn)練科學(xué)中逐漸應(yīng)用。從訓(xùn)練人員身上的傳感器、可穿戴設(shè)備以及場內(nèi)的攝像頭,再到服務(wù)人員手中的互聯(lián)網(wǎng)以及終端設(shè)備,這其中大量的數(shù)據(jù)已經(jīng)被收集起來,進(jìn)而為以后的訓(xùn)練服務(wù)應(yīng)用。不論是受傷運(yùn)動(dòng)員的訓(xùn)練還是教練的戰(zhàn)術(shù)布置,都已經(jīng)更加完整已經(jīng)呈現(xiàn)在我們面前??梢娫诖髷?shù)據(jù)時(shí)代的到來,為運(yùn)動(dòng)訓(xùn)練科學(xué)提供了重要的幫助。也為運(yùn)動(dòng)訓(xùn)練科學(xué)領(lǐng)域注入了新的生機(jī)與活力,推動(dòng)其在科學(xué)化研究和運(yùn)動(dòng)訓(xùn)練現(xiàn)代化研究的發(fā)展,解決了在運(yùn)動(dòng)訓(xùn)練中許多遺留下來的問題,并且提供了新的研究方法思路,為運(yùn)動(dòng)訓(xùn)練科學(xué)開辟了一條新的研究道路。
一、大數(shù)據(jù)時(shí)代下運(yùn)動(dòng)訓(xùn)練科學(xué)的研究現(xiàn)狀
在大數(shù)據(jù)的背景下,不論是運(yùn)動(dòng)員的恢復(fù)、預(yù)防或傷病,運(yùn)動(dòng)競賽的過程,運(yùn)動(dòng)的訓(xùn)練的評價(jià)和效果,還是在競賽過程中的戰(zhàn)術(shù)分析與安排、運(yùn)動(dòng)員的選材、運(yùn)動(dòng)訓(xùn)練的時(shí)間等都與大數(shù)據(jù)有著緊密地聯(lián)系。因此,在大數(shù)據(jù)時(shí)代下如何從眾多的數(shù)據(jù)中尋找在運(yùn)動(dòng)訓(xùn)練中各種數(shù)據(jù)之間的聯(lián)系,發(fā)現(xiàn)隱藏在運(yùn)動(dòng)之中的秘密,從而準(zhǔn)確的為運(yùn)動(dòng)員或者在訓(xùn)練中提供有效的數(shù)據(jù),幫助運(yùn)動(dòng)員到達(dá)合理的身體狀態(tài)與競賽成績是對運(yùn)動(dòng)訓(xùn)練科學(xué)是極為必要的。如今大的數(shù)據(jù)的出現(xiàn)幫助在田徑、游泳、籃球、足球、棒球、羽毛球等運(yùn)動(dòng)提供了一定的數(shù)據(jù)支持,為競技賽場增添了一絲色彩,潛移默化的改變著運(yùn)動(dòng)訓(xùn)練科學(xué)領(lǐng)域的認(rèn)知。
高爾夫球運(yùn)動(dòng)受到了各國運(yùn)動(dòng)員的喜愛,如今運(yùn)動(dòng)員也正是依靠數(shù)據(jù)分析來幫助他們在技術(shù)方面、訓(xùn)練方面更加全面,以此提高他們的訓(xùn)練成績。例如Track Man技術(shù)是幫助運(yùn)動(dòng)員測量在每次擊球后的擊球方向、旋轉(zhuǎn)速度、角度和力度等,然后通過數(shù)據(jù)軟件等進(jìn)行分析,幫助運(yùn)動(dòng)員了解自己的數(shù)據(jù)之后,更加針對性的進(jìn)行訓(xùn)練。在上個(gè)世紀(jì)八十年代,美國男子職業(yè)籃球聯(lián)賽就通過數(shù)據(jù)來展示運(yùn)動(dòng)員在場上的得分、進(jìn)攻、掩護(hù)、擋拆、對抗數(shù)據(jù),經(jīng)過近四十年的數(shù)據(jù)積累,裁判可以根據(jù)比賽回放等來進(jìn)行更好的判斷,教練也可以利用數(shù)據(jù)對戰(zhàn)術(shù)進(jìn)行分析安排。截至目前為止,凡是聘請了數(shù)據(jù)分析師的球隊(duì)俱樂部平均勝率都打到六成以上,而其他俱樂部僅有40%的勝率。在某些運(yùn)動(dòng)中運(yùn)動(dòng)員可以通過佩戴傳感器來檢測運(yùn)動(dòng)員的心率、垂直彈跳以及加速度等,從而保障運(yùn)動(dòng)員的生命安全,并且制定相應(yīng)的訓(xùn)練,提高運(yùn)動(dòng)員的運(yùn)動(dòng)能力。
在德國,每一個(gè)足球場地四周布置傳感器,甚至在每位球員的訓(xùn)練中也都放置了傳感器來對運(yùn)動(dòng)員的運(yùn)動(dòng)變化細(xì)節(jié)進(jìn)行分析。這些數(shù)據(jù)會(huì)在很短的時(shí)間內(nèi)傳到終端平臺(tái)中,有由教練對這些運(yùn)動(dòng)員的運(yùn)動(dòng)軌跡、攻擊范圍以及運(yùn)球的速率等相關(guān)信息進(jìn)行戰(zhàn)術(shù)分析;在網(wǎng)球的訓(xùn)練中,也有許多場地安置了傳感器來捕捉網(wǎng)球的發(fā)球速率、旋轉(zhuǎn)、發(fā)球角度等來判斷球員的打法、擊球特點(diǎn)。為戰(zhàn)術(shù)的安排提供強(qiáng)有力的數(shù)據(jù)支持。而運(yùn)動(dòng)員的發(fā)球失誤率以及非受迫性失誤上升時(shí),教練則會(huì)判斷球員的體力或者心理狀態(tài)不足。除了這兩項(xiàng)運(yùn)動(dòng)外,乒乓球、羽毛球、棒球等都通過這種獨(dú)特的數(shù)據(jù)方式來幫助球隊(duì)以最小的經(jīng)濟(jì)利益獲取成功,從而提高運(yùn)動(dòng)員的比賽成績。
二、大數(shù)據(jù)背景下運(yùn)動(dòng)訓(xùn)練科學(xué)的研究方向
(一)明確運(yùn)動(dòng)科學(xué)訓(xùn)練研究對象
在大數(shù)據(jù)背景下要想確定運(yùn)動(dòng)訓(xùn)練科學(xué)的研究方向,首先要明確習(xí)研究對象。而我國近代運(yùn)動(dòng)訓(xùn)練科學(xué)是一種實(shí)體的研究,不依賴于其他事物外部復(fù)雜的實(shí)體。而在實(shí)體的研究中主要利用分解還原的研究方法,在數(shù)據(jù)的研究模式采用小數(shù)據(jù)研究。例如,在競技體育中將各項(xiàng)競技因素分開,單獨(dú)訓(xùn)練體力或者技術(shù),并且以彈跳力能力、心率肺活量、肌肉圍度等指標(biāo)來確定運(yùn)動(dòng)員的能力。然而,在運(yùn)動(dòng)訓(xùn)練科學(xué)的研究表明,實(shí)體是依附于關(guān)系的,關(guān)系甚至比實(shí)體更加重要。例如,核算與蛋白質(zhì)相互作用產(chǎn)生生命,原子之間相互作用而產(chǎn)生分子。故而,對于訓(xùn)運(yùn)動(dòng)訓(xùn)練科學(xué)來說,關(guān)系要比實(shí)體更加重要。如果我們能在運(yùn)動(dòng)訓(xùn)練科學(xué)中找到這些信息之間的聯(lián)系,就能準(zhǔn)確的分析在運(yùn)動(dòng)訓(xùn)練中的技巧與對策,從而提高運(yùn)動(dòng)員運(yùn)動(dòng)訓(xùn)練的效率。
(二)明確運(yùn)動(dòng)訓(xùn)練研究視角
我國近現(xiàn)代運(yùn)動(dòng)科學(xué)訓(xùn)練都是單向度,如研究運(yùn)動(dòng)技術(shù)或者運(yùn)動(dòng)員的生理機(jī)能等。我國運(yùn)動(dòng)訓(xùn)練科學(xué)的研究方向首先要由單向度多向度發(fā)展,促進(jìn)運(yùn)動(dòng)訓(xùn)練科學(xué)的有效進(jìn)行。
結(jié)語
綜上所述,大數(shù)據(jù)時(shí)代的到來為我國運(yùn)動(dòng)訓(xùn)練科學(xué)研究領(lǐng)域帶來了新的機(jī)遇。我們需要迎接\動(dòng)訓(xùn)練科學(xué)思維研究的變革,融入大數(shù)據(jù)的變遷,順應(yīng)時(shí)代的變化,明確運(yùn)動(dòng)科學(xué)訓(xùn)練研究的對象以及視角,提高運(yùn)動(dòng)員比賽能力和運(yùn)動(dòng)技巧,從而幫助運(yùn)動(dòng)員在比賽中取得良好的成績。
作者簡介:
白曼利(1981.3-),女,民族:漢族,籍貫:陜西咸陽,學(xué)歷:研究生,專業(yè):體育教育,研究方向:運(yùn)動(dòng)訓(xùn)練,職稱:副教授。
楊江林(1982.1-),男,民族:漢族,籍貫:云南麗江,學(xué)歷:大學(xué)本科,專業(yè):體育教育,研究方向:運(yùn)動(dòng)訓(xùn)練,職稱:副教授。
參考文獻(xiàn):
[關(guān)鍵詞]財(cái)政收入;GDP;面板數(shù)據(jù)
中圖分類號:F01 文獻(xiàn)標(biāo)識碼:A 文章編號:1006-0278(2013)02-024-01
在計(jì)量經(jīng)濟(jì)學(xué)中,我們一般應(yīng)用的最多的數(shù)據(jù)分析是截面數(shù)據(jù)回歸分析和時(shí)間序列分析,但截面數(shù)據(jù)分析和時(shí)間序列分析都有著一定的局限性。在實(shí)際經(jīng)濟(jì)研究當(dāng)中,截面數(shù)據(jù)回歸分析會(huì)遺漏掉數(shù)據(jù)的時(shí)間序列特征,例如在分析某年中國各省的GDP增長數(shù)據(jù)時(shí),單純的截面數(shù)據(jù)回歸分析無法找出各省GDP隨時(shí)間變化的特征,使得分析結(jié)果沒有深度。而如果只用時(shí)間序列分析,則會(huì)遺漏掉不同截面間的聯(lián)系與區(qū)別,例如在分析中國單個(gè)省市的GDP隨時(shí)間增長的數(shù)據(jù)時(shí),無法找出各個(gè)省市之間經(jīng)濟(jì)增長的聯(lián)系與區(qū)別,因而同樣無法滿足我們的需要。而面板數(shù)據(jù),是一種既包括了時(shí)間序列數(shù)據(jù),也包括了相關(guān)截面數(shù)據(jù)的復(fù)合數(shù)據(jù),是近年來用得較多的一種數(shù)據(jù)類型。
下面我們將基于2000-2009年中國各省GDP和財(cái)政收入的面板數(shù)據(jù)的實(shí)例來詳細(xì)闡述面板數(shù)據(jù)的分析方法。
一、GDP與財(cái)政收入關(guān)系的經(jīng)濟(jì)學(xué)模型
財(cái)政收入是保證國家有效運(yùn)轉(zhuǎn)的經(jīng)濟(jì)基礎(chǔ),在一國經(jīng)濟(jì)建設(shè)中發(fā)揮著重要作用。隨著中國經(jīng)濟(jì)發(fā)展速度的日益加快,財(cái)政收入不斷擴(kuò)大,而擴(kuò)大的財(cái)政收入又以政府支出來調(diào)節(jié)和推動(dòng)國民經(jīng)濟(jì)發(fā)展。正確認(rèn)識財(cái)政收入與經(jīng)濟(jì)增長之間的長期關(guān)系,把握財(cái)政收入與經(jīng)濟(jì)增長之間的相互影響,發(fā)揮財(cái)政收入對經(jīng)濟(jì)發(fā)展的調(diào)節(jié)和促進(jìn)功能,對于完善財(cái)稅政策,深化財(cái)稅體制改革,實(shí)現(xiàn)財(cái)政與經(jīng)濟(jì)之間的良性互動(dòng),具有重要的現(xiàn)實(shí)意義。文章就將從中國各省的面板數(shù)據(jù)出發(fā)研究,中國不同地域間財(cái)政收入和GDP之間的關(guān)系。
二、實(shí)證分析
(一)單位根檢驗(yàn)
Eviews有兩種單位根檢驗(yàn)方法,一種在相同根的假設(shè)下的檢驗(yàn),包括LLC、Breintung、Hadri。另一種則是在不同根下的假設(shè)前提下,包括IPS,ADF-Fisher和PP-Fisher5。檢驗(yàn)結(jié)果表明所有檢驗(yàn)都拒絕原假設(shè),因此序列GDP和CZSR均為一個(gè)2階單整序列。
(二)協(xié)整檢驗(yàn)
如果基于單位根檢驗(yàn)的結(jié)果發(fā)現(xiàn)變量之間是同階單整的,那么我們可以進(jìn)行協(xié)整檢驗(yàn)。協(xié)整檢驗(yàn)是考察變量間長期均衡關(guān)系的方法。所謂的協(xié)整是指若兩個(gè)或多個(gè)非平穩(wěn)的變量序列,其某個(gè)線性組合后的序列呈平穩(wěn)性。此時(shí)我們稱這些變量序列間有協(xié)整關(guān)系存在。
在最終的結(jié)果中,Pedroni方法中除了rho-Statistic、PP-Statistic項(xiàng)目外都拒絕GDP和CZSR不存在協(xié)整關(guān)系的原假設(shè),同樣Kao和Johansen檢驗(yàn)方法也都拒絕原假設(shè),因此,上述檢驗(yàn)結(jié)果表明,我國各省2000-20009年的GDP和財(cái)政收入面板數(shù)據(jù)間存在著協(xié)整關(guān)系。既然通過了協(xié)整檢驗(yàn),說明變量之間存在著長期穩(wěn)定的均衡關(guān)系,其方程回歸殘差是平穩(wěn)的,因此可以在此基礎(chǔ)上直接對進(jìn)行回歸分析,此時(shí)假設(shè)方程的回歸結(jié)果是較精確的。
三、建立模型
混合模型:如果從時(shí)間上看,不同個(gè)體之間不存在顯著性差異;從截面上看,不同截面之間也不存在顯著性差異,那么就可以直接把面板數(shù)據(jù)混合在一起用普通最小二乘法(OLS)估計(jì)參數(shù)。
我們根據(jù)混合模型的回歸結(jié)果,得到財(cái)政收入和GDP之間的回歸方程為:
CZSR=227.3123+0.103224*GDP
(26.47637)(0.002839)
R2=0.810995 F=1321.587
顯然從模型的回歸結(jié)構(gòu)來看,R2的值達(dá)到了0.81,有了比較好的回歸解釋力,同時(shí),GDP的回歸系數(shù)為0.103224,表明各省的財(cái)政收入平均占到了國民收入的10.3%左右。
變系數(shù)模型:顯然,在中國各省之間由于處在不同的地區(qū),因而擁有不同的區(qū)位優(yōu)勢,那么各省的發(fā)展水平顯然就不一樣。正是由于這種不同的地方政策、管理水平、文化差異等會(huì)導(dǎo)致經(jīng)濟(jì)變量間出現(xiàn)一些關(guān)聯(lián)性的變化,此時(shí)在進(jìn)行模型回歸的時(shí)候,我們就有必要考慮變系數(shù)模型。
在回歸結(jié)果中,R2的值達(dá)到了0.97,比混合模型擁有更好的回歸解釋力,而在變系數(shù)模型回歸結(jié)果中,GDP的回歸系數(shù)大于0.5的只有、青海、寧夏三個(gè)省份,也就是說這三個(gè)省份的財(cái)政收入占到了GDP的50%以上,他們同處于經(jīng)濟(jì)并不是很發(fā)達(dá)的西部地區(qū),由此可以看出,處在經(jīng)濟(jì)發(fā)達(dá)地區(qū)的財(cái)政收入占GDP的比重要低,而不發(fā)達(dá)地區(qū)則要高。
四、結(jié)論
通過以上的分析檢驗(yàn),我們發(fā)現(xiàn)針對于中國財(cái)政收入和GDP的面板數(shù)據(jù),我們應(yīng)建立起變系數(shù)模型,并通過模型分析,我們可以得出這樣的結(jié)論,中國各省間由于存在著地域經(jīng)濟(jì)發(fā)展水平不同、管理水平不同以及國家的相關(guān)政策等諸多不同,造成了各省之間在財(cái)政收入以及國民收入上面存在著一定的差異。而回歸結(jié)果也告訴我們,我國西部地區(qū)的財(cái)政收入占GDP的比例要明顯高于東部地區(qū),地區(qū)發(fā)展落后地區(qū)的財(cái)政收入占GDP的比例也要明顯高于東部地區(qū)。因此,這為我們改善我國落后地區(qū)的經(jīng)濟(jì)發(fā)展提供了一定的新思路,就是對一地區(qū)的稅收征收可以適當(dāng)放緩,而將GDP中以前政府占用的部分歸還于民眾和企業(yè),因?yàn)?,按照發(fā)達(dá)地區(qū)的經(jīng)驗(yàn)表明,財(cái)政收入所占比重過高,經(jīng)濟(jì)發(fā)展的活力或者就不會(huì)很高,對于進(jìn)一步刺激財(cái)政收入的增加也沒有任何幫助。因此,我們應(yīng)該適度降低財(cái)政收入占GDP的比重,從而增加經(jīng)濟(jì)活力,使西部地區(qū)以及落后地區(qū)及早的跟上東部發(fā)達(dá)地區(qū)的發(fā)展步伐,從而消除我國經(jīng)濟(jì)發(fā)展的地域不平衡。
參考文獻(xiàn):
[1]謝識予,朱洪鑫.高級計(jì)量經(jīng)濟(jì)學(xué)[M].復(fù)旦大學(xué)出版社,2005.
[2]張曉峒.Eviews使用指南(第二版)[M].南開大學(xué)出版社,2004.