一、引言
自從人類社會(huì)進(jìn)入信息時(shí)代后,數(shù)據(jù)作為信息時(shí)代獨(dú)一無(wú)二的傳遞媒介,在我們的生活中無(wú)處不在。特別是隨著互聯(lián)網(wǎng)和物聯(lián)網(wǎng)的快速發(fā)展,似乎一切都可以被數(shù)據(jù)化、被記錄。曾經(jīng)靜靜躺在各種媒介中的數(shù)據(jù),開始爆發(fā)出驚人的價(jià)值和巨大的信息量,這引起了越來(lái)越多人的關(guān)注和重視。人類已經(jīng)邁入一個(gè)深度挖掘數(shù)據(jù)內(nèi)在信息和核心價(jià)值的大數(shù)據(jù)時(shí)代。
在這場(chǎng)大數(shù)據(jù)的浪潮中,高校扮演著重要角色,既是大數(shù)據(jù)時(shí)代的參與者,也是大數(shù)據(jù)發(fā)展的推動(dòng)者。高校能夠利用自己所掌握的大量數(shù)據(jù)和信息資源,在教育和研究工作中發(fā)揮出舉足輕重的作用,這也是順應(yīng)大數(shù)據(jù)時(shí)代發(fā)展趨勢(shì)、推動(dòng)自身信息化建設(shè)和發(fā)展的一個(gè)良好契機(jī)。
美國(guó)政府為了順應(yīng)并推動(dòng)大數(shù)據(jù)這一趨勢(shì),于2012年3月宣布投資2億美元啟動(dòng)“大數(shù)據(jù)研究和發(fā)展計(jì)劃”,把大數(shù)據(jù)研究和生產(chǎn)計(jì)劃提高到國(guó)家戰(zhàn)略層面。2014年4月,美國(guó)聯(lián)邦教育部宣布從財(cái)政預(yù)算中拿出2500萬(wàn)美元用于教育數(shù)據(jù)挖掘和分析。我國(guó)也十分重視大數(shù)據(jù)在高校教育中的發(fā)展?!秶?guó)家中長(zhǎng)期教育改革和發(fā)展規(guī)劃綱要(2010-2020年)》明確提出,在加快教育信息化進(jìn)程中要“加強(qiáng)優(yōu)質(zhì)教育資源開發(fā)與應(yīng)用……促進(jìn)優(yōu)質(zhì)教育資源普及共享”。《國(guó)民經(jīng)濟(jì)和社會(huì)發(fā)展第十二個(gè)五年規(guī)劃綱要》提出,“重點(diǎn)研究……海量信息處理及知識(shí)挖掘的理論與方法……”
我國(guó)在高校研究大數(shù)據(jù)的條件更是得天獨(dú)厚。據(jù)國(guó)家統(tǒng)計(jì)局2014年2月公布的數(shù)據(jù)顯示,我國(guó)目前在校大學(xué)生達(dá)2468.1萬(wàn)人。2013年我國(guó)網(wǎng)民近30%使用過在線教育產(chǎn)品,市場(chǎng)空間巨大。未來(lái)幾年中國(guó)在線教育市場(chǎng)將保持每年30%以上的增速。預(yù)計(jì)到2017年,我國(guó)在線教育市場(chǎng)規(guī)模將會(huì)突破1600億元。
然而在大數(shù)據(jù)風(fēng)暴以迅雷不及掩耳之勢(shì)席卷全球各個(gè)行業(yè)的時(shí)候,我們卻充滿了疑惑,畢竟大數(shù)據(jù)本身尚未發(fā)展成熟,如何將它合理應(yīng)用到高校領(lǐng)域還是值得深思的。本文將從高校中的大數(shù)據(jù)來(lái)源入手,分析高校大數(shù)據(jù)具有的特征,探討大數(shù)據(jù)將對(duì)高校信息資源共享發(fā)揮的作用,深入挖掘大數(shù)據(jù)在高校信息化建設(shè)應(yīng)用中的挑戰(zhàn),以探尋合理的策略實(shí)現(xiàn)大數(shù)據(jù)時(shí)代高校間資源共享,推動(dòng)教育信息化的全面建設(shè)。
二、高校中的大數(shù)據(jù)
1.大數(shù)據(jù)是什么
(1)大數(shù)據(jù)的概念及目標(biāo)
最早提出“大數(shù)據(jù)”時(shí)代到來(lái)的是全球知名資訊公司麥肯錫。麥肯錫[1]稱:“數(shù)據(jù),已經(jīng)滲透到當(dāng)今每一個(gè)行業(yè)和業(yè)務(wù)職能領(lǐng)域,成為重要的生產(chǎn)因素。人們對(duì)于海量數(shù)據(jù)的挖掘和運(yùn)用,預(yù)示著新一波的生產(chǎn)率增長(zhǎng)和消費(fèi)者盈余浪潮的到來(lái)。”Gartner[2]于2012年對(duì)大數(shù)據(jù)做出如下定義:“大數(shù)據(jù)是大量、高速及多變的信息資產(chǎn),它需要新型的處理方式去促成更強(qiáng)的決策能力、洞察力與優(yōu)化處理。”維基百科對(duì)大數(shù)據(jù)的定義則簡(jiǎn)單明了:大數(shù)據(jù)是指利用常用軟件工具捕獲、管理和處理數(shù)據(jù)所耗時(shí)間超過可容忍時(shí)間的數(shù)據(jù)集。[3]
無(wú)論哪種定義實(shí)際都強(qiáng)調(diào)大數(shù)據(jù)的目標(biāo):①獲取知識(shí)與推測(cè)趨勢(shì);②掌握個(gè)性化特征;③通過分析辨識(shí)真相。因此,大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于通過將各種數(shù)據(jù)集合并后的分析得出大量額外的有價(jià)值信息和數(shù)據(jù)關(guān)系,幫助指導(dǎo)人們優(yōu)化自身的決策和行為方式。
(2)大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)的區(qū)別
信息的大爆炸不斷提醒著我們,未來(lái)將會(huì)因大數(shù)據(jù)技術(shù)而改變。與傳統(tǒng)數(shù)據(jù)相比,大數(shù)據(jù)之所以如此受人追捧,是因?yàn)槠渚哂刑烊粌?yōu)勢(shì)。兩者最本質(zhì)區(qū)別在于:①數(shù)據(jù)采集的來(lái)源不同。傳統(tǒng)的數(shù)據(jù)庫(kù)只是采集基本數(shù)據(jù)信息,使用數(shù)據(jù)自身含義,沒有利用數(shù)據(jù)的附加價(jià)值。而大數(shù)據(jù)來(lái)源于對(duì)傳統(tǒng)數(shù)據(jù)的提取和分析,更強(qiáng)調(diào)數(shù)據(jù)之間的關(guān)聯(lián)性,主要研究數(shù)據(jù)間的關(guān)系;②數(shù)據(jù)應(yīng)用的方向不同。傳統(tǒng)的數(shù)據(jù)庫(kù)主要對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ)和查詢,以對(duì)過去產(chǎn)生的數(shù)據(jù)進(jìn)行保存為核心。大數(shù)據(jù)對(duì)事物發(fā)展的預(yù)測(cè)為核心思想,通過對(duì)海量數(shù)據(jù)進(jìn)行分析,得到未來(lái)發(fā)展趨勢(shì)或者推斷將來(lái)的可能性。
2.高校中的大數(shù)據(jù)
(1)高校中的數(shù)據(jù)源
高校是一個(gè)每時(shí)每刻都會(huì)產(chǎn)生大量數(shù)據(jù)的地方。自從我國(guó)推行教育信息化以來(lái),這些數(shù)據(jù)大部分被記錄保存了下來(lái)。比如人事、教學(xué)、財(cái)務(wù)等部門的基本業(yè)務(wù)數(shù)據(jù),網(wǎng)絡(luò)教學(xué)課件和視頻、網(wǎng)絡(luò)遠(yuǎn)程教育教學(xué)資源的多媒體數(shù)據(jù),學(xué)生教師上論壇、微博、微信等社交網(wǎng)絡(luò)產(chǎn)生的網(wǎng)絡(luò)行為數(shù)據(jù),校園網(wǎng)內(nèi)連接無(wú)線網(wǎng)絡(luò)而感知的位置數(shù)據(jù)等。
伴隨著高校教育信息化建設(shè)程度的不斷深入和加強(qiáng),比以往更多的海量數(shù)據(jù)被積累保存,這對(duì)于高校來(lái)說(shuō),是一筆寶貴的財(cái)富。這些海量數(shù)據(jù)并不是單純的數(shù)據(jù)積累、記錄和保存,其潛在的價(jià)值將會(huì)對(duì)現(xiàn)代化高校建設(shè)產(chǎn)生積極重要的意義。例如,通過對(duì)“課堂、成績(jī)、就業(yè)”等方面數(shù)據(jù)的統(tǒng)籌分析,能夠在一定程度上對(duì)傳統(tǒng)教育領(lǐng)域的授課和學(xué)習(xí)模式的改革給予指導(dǎo)和建議,通過學(xué)生的圖書借閱歷史和選課信息綜合判斷學(xué)生的興趣愛好。在這個(gè)信息就是金錢的時(shí)代,大數(shù)據(jù)技術(shù)的應(yīng)用將會(huì)在高校教育信息化中起到越來(lái)越重要的作用。如何充分利用數(shù)據(jù)價(jià)值,使其為學(xué)校管理、教學(xué)、服務(wù)等工作提供有益幫助,將是本文重點(diǎn)研究的內(nèi)容。
(2)高校中大數(shù)據(jù)的特點(diǎn)
對(duì)于大數(shù)據(jù)關(guān)注,往往過分集中于“大”的特點(diǎn),而忽略了處理大數(shù)據(jù)所必須面對(duì)的一個(gè)難題:未經(jīng)處理的碎片數(shù)據(jù)是造成大數(shù)據(jù)價(jià)值密度低的直接原因。在高校內(nèi)部圍繞著教師或?qū)W生服務(wù)和管理產(chǎn)生的數(shù)據(jù)也具有“碎片化”的特點(diǎn)。這一點(diǎn)王左利在他的論文中也提到了。[4]同時(shí)他還總結(jié)了大數(shù)據(jù)的另一個(gè)特點(diǎn)——持續(xù)性。“持續(xù)性”體現(xiàn)了校園科研、教學(xué)和管理業(yè)務(wù)的規(guī)律。必須基于長(zhǎng)期、持續(xù)的數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,靠短期數(shù)據(jù)分析獲得的結(jié)論對(duì)指導(dǎo)教育教學(xué)改革無(wú)益。
而筆者認(rèn)為,高校的數(shù)據(jù)還體現(xiàn)了另外一個(gè)特點(diǎn)——多維度。“多維度”能夠表征校園活動(dòng)參與個(gè)體的完整狀態(tài)。如,對(duì)一位學(xué)生而言,學(xué)習(xí)成績(jī)反映學(xué)習(xí)效果;借書種類反映興趣愛好;一卡通消費(fèi)情況反映家庭狀況;上網(wǎng)軌跡反映思想動(dòng)態(tài)等。只有將多維度的數(shù)據(jù)進(jìn)行有效整合,通過建立量化分析模型,反映一個(gè)學(xué)生的生活習(xí)慣與學(xué)習(xí)進(jìn)步的相互關(guān)系,才能清晰全面地分析學(xué)生個(gè)體。
3.大數(shù)據(jù)教育與傳統(tǒng)教育相比的優(yōu)勢(shì)
通過討論大數(shù)據(jù)與傳統(tǒng)數(shù)據(jù)的不同以及高校數(shù)據(jù)源的特點(diǎn),發(fā)現(xiàn)在大數(shù)據(jù)影響下的教育與傳統(tǒng)教育相比具有諸多優(yōu)勢(shì),主要體現(xiàn)在以下三個(gè)方面:
數(shù)據(jù)采集:傳統(tǒng)教育數(shù)據(jù)的采集方式來(lái)源于調(diào)查問卷、心理測(cè)試等。采集標(biāo)準(zhǔn)和規(guī)則均已完善。而大數(shù)據(jù)的采集是過程式的,它關(guān)注著學(xué)生在校數(shù)據(jù)的整個(gè)生命周期,關(guān)注著學(xué)生在校生活的每一個(gè)微觀表現(xiàn)。
策略決策:傳統(tǒng)數(shù)據(jù)詮釋宏觀、整體的教育狀況,用于影響教育政策決策;大數(shù)據(jù)透析微觀、個(gè)體的學(xué)生在課堂上的狀況,用于調(diào)整教育行為進(jìn)而實(shí)現(xiàn)個(gè)性化教育。
評(píng)估誤差:傳統(tǒng)數(shù)據(jù)來(lái)源于階段性的、針對(duì)性的評(píng)估,其采樣過程可能有系統(tǒng)誤差;大數(shù)據(jù)采用微觀持續(xù)性記錄方式,采樣的方式誤差較小。