百度騰訊阿里,其大數(shù)據優(yōu)劣勢與策略分析(2)
時間:2015-07-27 22:51 來源:川北在線 責任編輯:毛青青
2月底在北京出差時,寫了一篇《搜索引擎的大數(shù)據時代》發(fā)在虎嗅。創(chuàng)造了零回復的記錄。盡管如此,仍然沒有打消我對搜索引擎在大數(shù)據時代深層次變革的思考。
搜索引擎在大數(shù)據時代面臨的挑戰(zhàn)有:更多的暗網數(shù)據;更多的WEB化但是沒有結構化的數(shù)據;更多的WEB化、結構化但是封閉的數(shù)據。
這幾個挑戰(zhàn)使得數(shù)據正在遠離傳統(tǒng)搜索引擎。不過,搜索引擎在大數(shù)據上畢竟具備技術沉淀以及優(yōu)勢。
接下來,百度會向企業(yè)提供更多的數(shù)據和數(shù)據服務。前期百度與寶潔、平安等公司合作,為其提供消費者行為分析和挖掘服務,通過數(shù)據結論指導企業(yè)推出產品,是一種
典型的基于大數(shù)據的C2B模式。與此類似的還有Netflix的《紙牌屋》美劇,該劇的男主角凱文·史派西和導演大衛(wèi)·芬奇都是通過對網絡數(shù)據挖掘之后,根據受歡迎情況選中的。
百度還會利用大數(shù)據完成移動互聯(lián)網進化。核心攻關技術便是深度學習;诖髷(shù)據的機器學習將改善多媒體搜索效果和智能搜索,如語音搜索、視覺搜索和自然語言搜索。這將催生移動互聯(lián)網的革命性產品的出現(xiàn)。
盡管百度已經出發(fā),其在大數(shù)據上可做的事情還有很多。
在數(shù)據收集方面,百度需要聚合更多高價值的交易、社交和實時數(shù)據。例如加強自己貼吧知道的社交能力、盡快讓地圖服務與O2O結合進而掌握交易數(shù)據,以及推進移動App、穿戴式設備等數(shù)據收集系統(tǒng)。
在數(shù)據處理技術上,百度成立深度學習研究院加強自己在人工智能領域的探索,在多媒體和中文自然語言處理領域已經有一些進展;云存儲、云計算的基礎設施建設也在逐步完善。但深度學習仍然是一個巨大的挑戰(zhàn),百度等探索者還有很多待解問題,如:無監(jiān)督式學習、立體圖像識別。
在數(shù)據變現(xiàn)方面,百度需將數(shù)據挖掘能力、數(shù)據內容聚合和提取等形成標準化的服務和產品,進而開拓大數(shù)據領域的企業(yè)和開發(fā)者市場。而不僅僅是頗為個性化、定制化地為大型企業(yè)提供解決。
投稿郵箱:chuanbeiol@163.com 詳情請訪問川北在線:http://sanmuled.cn/