高德納的一份報告認為:大數據是需要新處理模式才能具有更強的決策力、洞察力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產。這一概念雖然簡潔,卻內涵豐富:第一,它認為大數據是一種信息資產;第二,這種信息資產具有海量、高增長率和多樣化的屬性;第三,它指出了大數據的應用價值和革新意義,即具有更強的決策力、洞察力和流程優(yōu)化能力。
筆者更贊同高德納的定義,把大數據看作一種戰(zhàn)略和習慣,一種新的世界觀和方法論。例如,谷歌不用分發(fā)口腔試紙和聯系醫(yī)院,就能給出和基于大量真實病例所得到的流感情況一致的結果,并且比疾控中心提前了兩周,就是因為它分析了數千億的數據,建立了強大的預測模型。從2009年10月起,“谷歌流感趨勢”網站開始提供全球每周流感疫情預測,對于數據較完備國家的預測能精確到省份,并能顯示橫跨7年的歷史數據。
另一個有代表性的例子發(fā)生在能源計量領域。美國軟件公司Opower與多家電力公司合作,在幾百萬戶家庭安裝了智能電表,這些電表每隔15分鐘就讀一次用電數據。Opower公司據此每個月向每戶家庭提供一份個性化報告,把該家庭的電費與周圍鄰居進行對比,顯示該家庭的用電情況在全美類似家庭中所處的水平,以鼓勵節(jié)約用電,預計每年為美國消費用電節(jié)省5億美元。由此可見,大數據成為政府節(jié)能減排的千里眼、萬只手,并且做到了深入每戶家庭、量身定制解決方案,這在入戶抄電表的傳統工作方式下根本是無法想象的事情。
打開數據利用的想象空間
分析師馬特·艾斯萊特將大數據定位為“之前因為技術限制而被忽略的數據”。的確,盡管從數據中發(fā)現價值的實踐由來已久,但是在大數據時代,數據的價值才真正被發(fā)掘出來,人們用數據說話、用數據決策、用數據管理、用數據創(chuàng)新的意識才真正被喚醒。
至頂網副總編趙效民提出了一個非常有意思的觀點。他認為:“大數據的出現標志著人類在數據利用方面進入了一個新的階段,它代表了一種理念(數據能源)、一種思路(從數據搜集到數據分析再到數據呈現的整體構想)和一種新工具(將結構化與非結構化數據和語義與機器化數據匯聚、統一處理、分析與呈現的工具)的集合。它賦予了人類認知數據的新能力,也進一步打開了人類在數據利用方面的想象空間?!?/p>
趙效民進一步闡述,放眼地球上的各種能源,就會發(fā)現大數據與其有太多相似之處。物質成為能源的前提在于人類對它們的認知。在遠古時期,人類因雷電引火,發(fā)現了火和木材這兩種能源。隨著人類文明的進步,人類逐漸發(fā)現了越來越多的能源,比如煤、天然氣、石油和太陽能。它們已經在地球上靜靜地存在了成萬上億年,只是在人類掌握了相應的科技與工具之后,它們才得到利用。數據也是如此,如果數據存在一個生成/采集—應用/加工—保存/管理—分析/挖掘—再保存或刪除這樣的一個周期,那么從其生成的那一刻起,它就存在應有的價值,只是在于你是否有能力發(fā)現它們。這需要新的理念、知識、技術與相應的工具。原始人即使知道地下有石油,也無法開采,對所謂的數據分析,道理也是一樣的。