在下一代的革命中,無(wú)論是工業(yè)4.0(國(guó)內(nèi)叫中國(guó)制造2025)還是物聯(lián)網(wǎng)(甚至是一個(gè)全新的協(xié)議與標(biāo)準(zhǔn)),隨著數(shù)據(jù)科學(xué)與云計(jì)算能力(甚至是基于區(qū)塊鏈的分布式計(jì)算技術(shù))的發(fā)展,唯獨(dú)數(shù)據(jù)是所有系統(tǒng)的核心。
萬(wàn)物互聯(lián)、萬(wàn)物數(shù)據(jù)化之后,基于數(shù)據(jù)的個(gè)性化、智能化將是一次全新的革命,將超越100多年前開(kāi)始的自動(dòng)化生產(chǎn)線的工業(yè)3.0,給人類(lèi)社會(huì)整體的生產(chǎn)力提升帶來(lái)一次根本性的突破,實(shí)現(xiàn)從0到1的巨大變化。正是在這個(gè)意義上,這是一場(chǎng)商業(yè)模式的范式革命。商業(yè)的未來(lái)、知識(shí)的未來(lái)、文明的未來(lái),本質(zhì)上就是人的未來(lái)。而基于數(shù)據(jù)智能的智能商業(yè),就是未來(lái)的起點(diǎn)。大數(shù)據(jù)的第一要?jiǎng)?wù)就是需要有數(shù)據(jù)。
關(guān)于數(shù)據(jù)來(lái)源,普遍認(rèn)為互聯(lián)網(wǎng)及物聯(lián)網(wǎng)是產(chǎn)生并承載大數(shù)據(jù)的基地。互聯(lián)網(wǎng)公司是天生的大數(shù)據(jù)公司,在搜索、社交、媒體、交易等各自的核心業(yè)務(wù)領(lǐng)域,積累并持續(xù)產(chǎn)生海量數(shù)據(jù)。能夠上網(wǎng)的智能手機(jī)和平板電腦越來(lái)越普遍,這些移動(dòng)設(shè)備上的App都能夠追蹤和溝通無(wú)數(shù)事件,從App內(nèi)的交易數(shù)據(jù)(如搜索產(chǎn)品的記錄事件)到個(gè)人信息資料或狀態(tài)報(bào)告事件(如地點(diǎn)變更,即報(bào)告一個(gè)新的地理編碼)。非結(jié)構(gòu)數(shù)據(jù)廣泛存在于電子郵件、文檔、圖片、音頻、視頻以及通過(guò)博客、維基,尤其是社交媒體產(chǎn)生的數(shù)據(jù)流中。這些數(shù)據(jù)為使用文本分析功能進(jìn)行分析提供了豐富的數(shù)據(jù)源泉,還包括電子商務(wù)購(gòu)物數(shù)據(jù)、交易行為數(shù)據(jù)、Web服務(wù)器記錄的網(wǎng)頁(yè)點(diǎn)擊流數(shù)據(jù)日志。
物聯(lián)網(wǎng)設(shè)備每時(shí)每刻都在采集數(shù)據(jù),設(shè)備數(shù)量和數(shù)據(jù)量都在與日俱增,包括功能設(shè)備創(chuàng)建或生成的數(shù)據(jù),例如智能電表、智能溫度控制器、工廠機(jī)器和連接互聯(lián)網(wǎng)的家用電器。這些設(shè)備可以配置為與互聯(lián)網(wǎng)絡(luò)中的其他節(jié)點(diǎn)通信,還可以自動(dòng)向中央服務(wù)器傳輸數(shù)據(jù),這樣就可以對(duì)數(shù)據(jù)進(jìn)行分析。機(jī)器和傳感器數(shù)據(jù)是來(lái)自物聯(lián)網(wǎng)(IoT)所產(chǎn)生的主要例子。
這兩類(lèi)數(shù)據(jù)資源作為大數(shù)據(jù)金礦,正在不斷產(chǎn)生各類(lèi)應(yīng)用。比如,來(lái)自物聯(lián)網(wǎng)的數(shù)據(jù)可以用于構(gòu)建分析模型,實(shí)現(xiàn)連續(xù)監(jiān)測(cè)(如當(dāng)傳感器值表示有問(wèn)題時(shí)進(jìn)行識(shí)別)和預(yù)測(cè)(如警示技術(shù)人員在真正出問(wèn)題之前檢查設(shè)備)。國(guó)外出現(xiàn)了這類(lèi)數(shù)據(jù)資源應(yīng)用的不少經(jīng)典案例。還有一些企業(yè),在業(yè)務(wù)中也積累了許多數(shù)據(jù),如房地產(chǎn)交易、大宗商品價(jià)格、特定群體消費(fèi)信息等。從嚴(yán)格意義上說(shuō),這些數(shù)據(jù)資源還算不上大數(shù)據(jù),但對(duì)商業(yè)應(yīng)用而言,卻是最易獲得和比較容易加工處理的數(shù)據(jù)資源,也是當(dāng)前在國(guó)內(nèi)比較常見(jiàn)的應(yīng)用資源。
在國(guó)內(nèi)還有一類(lèi)是政府部門(mén)掌握的數(shù)據(jù)資源,普遍認(rèn)為質(zhì)量好、價(jià)值高,但開(kāi)放程度差。許多官方統(tǒng)計(jì)數(shù)據(jù)通過(guò)灰色渠道流通出來(lái),經(jīng)過(guò)加工成為各種數(shù)據(jù)產(chǎn)品。《大數(shù)據(jù)綱要》把公共數(shù)據(jù)互聯(lián)開(kāi)放共享作為努力方向,認(rèn)為大數(shù)據(jù)技術(shù)可以實(shí)現(xiàn)這個(gè)目標(biāo)。實(shí)際上,長(zhǎng)期以來(lái),政府部門(mén)間的信息數(shù)據(jù)相互封閉割裂是治理問(wèn)題而不是技術(shù)問(wèn)題。面向社會(huì)的公共數(shù)據(jù)開(kāi)放愿望雖十分美好,但恐怕一段時(shí)間內(nèi)可望而不可即。
對(duì)于某一個(gè)行業(yè)的大數(shù)據(jù)場(chǎng)景,一是要看這個(gè)應(yīng)用場(chǎng)景是否真有數(shù)據(jù)支撐,數(shù)據(jù)資源是否可持續(xù),來(lái)源渠道是否可控,數(shù)據(jù)安全和隱私保護(hù)方面是否有隱患;二是要看這個(gè)應(yīng)用場(chǎng)景的數(shù)據(jù)資源質(zhì)量如何,是“富礦”還是“貧礦”,能否保障這個(gè)應(yīng)用場(chǎng)景的實(shí)效。對(duì)于來(lái)自自身業(yè)務(wù)的數(shù)據(jù)資源,具有較好的可控性,數(shù)據(jù)質(zhì)量一般也有保證,但數(shù)據(jù)覆蓋范圍可能有限,需要借助其他資源渠道;對(duì)于從互聯(lián)網(wǎng)抓取的數(shù)據(jù),技術(shù)能力是關(guān)鍵,既要有能力獲得足夠大的量,又要有能力篩選出有用的內(nèi)容;對(duì)于從第三方獲取的數(shù)據(jù),需要特別關(guān)注數(shù)據(jù)交易的穩(wěn)定性。數(shù)據(jù)從哪里來(lái)是分析大數(shù)據(jù)應(yīng)用的起點(diǎn),如果一個(gè)應(yīng)用沒(méi)有可靠的數(shù)據(jù)來(lái)源,再好、再高超的數(shù)據(jù)分析技術(shù)都是無(wú)本之木。我們經(jīng)常看到,許多應(yīng)用并沒(méi)有可靠的數(shù)據(jù)來(lái)源,或者數(shù)據(jù)來(lái)源不具備可持續(xù)性,只是借助大數(shù)據(jù)風(fēng)口套取資金。這是很可悲的。
【凡本網(wǎng)注明來(lái)源非青島市市北區(qū)智慧城區(qū)的作品,均轉(zhuǎn)載自其它媒體,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。】
(工作日 9:00-17:30)