避免失敗 如何像Google一樣玩轉(zhuǎn)大數(shù)據(jù)
以下為譯文:
首先看一下大數(shù)據(jù)成功典范Google,看看他們是如何玩轉(zhuǎn)大數(shù)據(jù)的:
1. 收集數(shù)據(jù),捕捉每個網(wǎng)站、電子郵件、Cookie內(nèi)容,并提取關(guān)鍵信息。
2. 為信息創(chuàng)建復(fù)合索引。不用說,廣告相關(guān)索引是必不可少的。
3. 將目錄和內(nèi)容儲存在分布式服務(wù)器中。
4. 當(dāng)用戶瀏覽網(wǎng)站以及搜索或訪問電子郵件時,Google會對這些請求做復(fù)雜的轉(zhuǎn)換處理,同時幾個索引項會隨之確定。
5. 根據(jù)索引在服務(wù)器中查詢數(shù)據(jù),返回搜索結(jié)果或者廣告。
在這里不難發(fā)現(xiàn),與Hadoop有關(guān)的只有3和5,也就是數(shù)據(jù)儲存和查詢。而這兩項也是最容易實(shí)現(xiàn)的兩項,比如Hadoop就是個具有良好擴(kuò)展性及低成本的解決方案。
那么實(shí)現(xiàn)3和5就可以像Google一樣發(fā)玩轉(zhuǎn)大數(shù)據(jù)了?很顯然不行,因?yàn)殛P(guān)鍵選項2和4并沒有實(shí)現(xiàn),而2和4就是所謂的業(yè)務(wù)分析算法。這些算法由業(yè)務(wù)專家根據(jù)數(shù)據(jù)、業(yè)務(wù)知識、市場趨勢精心打造,是許多企業(yè)商業(yè)策略制定的重要手段及核心。這才是4V理論中的“Value”。
這也是現(xiàn)下許多大數(shù)據(jù)投資失敗的原因,因?yàn)楫?dāng)下的大數(shù)據(jù)只提供了數(shù)據(jù)存儲和查詢的策略,缺乏了提高企業(yè)競爭力的業(yè)務(wù)分析解決方案,而恰恰這才是最重要的。事實(shí)上,現(xiàn)在的大數(shù)據(jù)工具都是為IT專家打造的,他們可以通過C++或者Java實(shí)現(xiàn)MapReduce功能,但是卻無法提供有價值的商業(yè)算法。
因此大數(shù)據(jù)成功的關(guān)鍵不在于Hadoop是否部署成功,而在于對業(yè)務(wù)有幫助算法的制定,而在人才嚴(yán)重缺乏的當(dāng)下,不妨從數(shù)據(jù)工具入手。降低工具使用的門檻,讓業(yè)務(wù)專家可以參與其中,才能發(fā)揮大數(shù)據(jù)真正的作用,對業(yè)務(wù)起到立竿見影的改善。
總結(jié)
工具的部署誰都可以,關(guān)鍵在于業(yè)務(wù)算法的制定,讓業(yè)務(wù)專家無縫的參與數(shù)據(jù)的分析才是成功的開端。

責(zé)任編輯:廖生玨
- 相關(guān)閱讀
- 碳交易
- 節(jié)能環(huán)保
- 電力法律
- 電力金融
- 綠色電力證書
-
碳中和戰(zhàn)略|趙英民副部長致辭全文
2020-10-19碳中和,碳排放,趙英民 -
兩部門:推廣不停電作業(yè)技術(shù) 減少停電時間和停電次數(shù)
2020-09-28獲得電力,供電可靠性,供電企業(yè) -
國家發(fā)改委、國家能源局:推廣不停電作業(yè)技術(shù) 減少停電時間和停電次數(shù)
2020-09-28獲得電力,供電可靠性,供電企業(yè)
-
碳中和戰(zhàn)略|趙英民副部長致辭全文
2020-10-19碳中和,碳排放,趙英民 -
深度報告 | 基于分類監(jiān)管與當(dāng)量協(xié)同的碳市場框架設(shè)計方案
2020-07-21碳市場,碳排放,碳交易 -
碳市場讓重慶能源轉(zhuǎn)型與經(jīng)濟(jì)發(fā)展并進(jìn)
2020-07-21碳市場,碳排放,重慶
-
兩部門:推廣不停電作業(yè)技術(shù) 減少停電時間和停電次數(shù)
2020-09-28獲得電力,供電可靠性,供電企業(yè) -
國家發(fā)改委、國家能源局:推廣不停電作業(yè)技術(shù) 減少停電時間和停電次數(shù)
2020-09-28獲得電力,供電可靠性,供電企業(yè) -
2020年二季度福建省統(tǒng)調(diào)燃煤電廠節(jié)能減排信息披露
2020-07-21火電環(huán)保,燃煤電廠,超低排放
-
四川“專線供電”身陷違法困境
2019-12-16專線供電 -
我國能源替代規(guī)范法律問題研究(上)
2019-10-31能源替代規(guī)范法律 -
區(qū)域鏈結(jié)構(gòu)對于數(shù)據(jù)中心有什么影響?這個影響是好是壞呢!