2017 年 5 月 14 日,美國(guó)的《福布斯》報(bào)道了人工智能初創(chuàng)公司 Lattice.io 被蘋果收購(gòu)的消息,蘋果隨后官方確認(rèn)了這次收購(gòu)。此后,又有媒體爆料收購(gòu)的金額為 2 億美元,收購(gòu)在數(shù)周前已經(jīng)完成,Lattice.io的 20 名員工加入蘋果。
Lattice.io 雖然成立時(shí)間不長(zhǎng),但是創(chuàng)始人大有來(lái)頭。Mike Cafarella是密歇根大學(xué)的助理教授,也是 的數(shù)據(jù)庫(kù)系統(tǒng)領(lǐng)域的專家,曾與別人共同設(shè)計(jì)了 Hadoop 系統(tǒng)。而另一位創(chuàng)始人 Christopher Re 教授來(lái)自斯坦福大學(xué),此前曾構(gòu)建了機(jī)器學(xué)習(xí)系統(tǒng)DeepDive。Lattice公司的成立正是為了實(shí)現(xiàn) DeepDive 系統(tǒng)的商業(yè)化。
Lattice 的投資方包括谷歌風(fēng)險(xiǎn)資本(GV)和 Madrona 等機(jī)構(gòu)。
簡(jiǎn)單地來(lái)說(shuō),Lattice.io可以從大量從未被仔細(xì)研究過(guò)的暗數(shù)據(jù)(dark data)中挖掘出有價(jià)值的信息。雖然每天傳感器、互聯(lián)網(wǎng)和移動(dòng)設(shè)備等都會(huì)產(chǎn)生大量的數(shù)據(jù),但是這些數(shù)據(jù)往往雜亂無(wú)章,缺乏結(jié)構(gòu)。
≠個(gè)例子,全世界的學(xué)者都會(huì)發(fā)表成千上萬(wàn)篇論文,但這些論文中既有統(tǒng)計(jì)數(shù)據(jù),又有圖片數(shù)據(jù)、引用數(shù)據(jù)、文本數(shù)據(jù)等等內(nèi)容,非常難以實(shí)現(xiàn)結(jié)構(gòu)化。
Lattice.io 的 DeepDive 系統(tǒng)正是可以從這樣一些雜亂無(wú)章的數(shù)據(jù)中提取出結(jié)構(gòu)化的信息,儲(chǔ)存在結(jié)構(gòu)化的數(shù)據(jù)庫(kù)里。
目前,DeepDive 已經(jīng)在很多領(lǐng)域產(chǎn)生應(yīng)用,比如對(duì)抗人口販賣活動(dòng)。根據(jù)國(guó)際刑警組織的分析,人口販賣已經(jīng)成為僅次于毒品和武器走私的全球第三大非法貿(mào)易。販賣的人口主要在工廠中從事強(qiáng)迫性的苦力工作或者被迫成為性工作者,人口販子可以從相關(guān)的流程中獲得分成。作為商業(yè)流程中不可或缺的一環(huán),販賣人口的廣告也總會(huì)在網(wǎng)上露出一些痕跡。
于是,Lattice 參與了美國(guó)國(guó)防部領(lǐng)導(dǎo)的 Memex 項(xiàng)目,負(fù)責(zé)從網(wǎng)頁(yè)求職廣告數(shù)據(jù)中抽取出與人口販賣相關(guān)的結(jié)構(gòu)化數(shù)據(jù);ヂ(lián)網(wǎng)上有海量的廣告網(wǎng)頁(yè),可以理解成一個(gè)個(gè) HTML 文件,里面既有 HTML 的標(biāo)簽,也有非結(jié)構(gòu)化的文本內(nèi)容。項(xiàng)目的其他參與者從網(wǎng)上找到了 3000 萬(wàn)條和性服務(wù)有關(guān)的廣告。
雖然不同的廣告形式、內(nèi)容、風(fēng)格都不相同。不過(guò)通過(guò)DeepDive系統(tǒng),可以把這些廣告所含的信息整理成表,包括不同的列,比如:廣告的鏈接、廣告中聯(lián)系人的姓名和電話號(hào)碼、工作地點(diǎn),以及工資等。這樣,網(wǎng)絡(luò)廣告數(shù)據(jù)就變成了一張可以存儲(chǔ)在 SQL 甚至 Excel 中的表格。
因?yàn)橛辛薉eepDive,復(fù)雜的分析性工作變成了簡(jiǎn)答的數(shù)據(jù)庫(kù)查詢?nèi)蝿?wù)。
例如,人口販子經(jīng)常移動(dòng)受害者,保持對(duì)他們的控制。所以如果求職者經(jīng)常變換工作地點(diǎn),說(shuō)明他們更有可能被人控制。
此外,沒(méi)有被販賣的性工作者存在經(jīng)濟(jì)上的理性,會(huì)提出合理的價(jià)格并規(guī)避風(fēng)險(xiǎn)加大的行為。如果一個(gè)求職個(gè)體要求非市場(chǎng)化的價(jià)格或提供非正常性的服務(wù),就應(yīng)該引起執(zhí)法者的注意。
關(guān)于蘋果公司的AI布局
蘋果公司并沒(méi)有過(guò)多地透露這次收購(gòu)的具體細(xì)節(jié),只是在一則聲明中表示:“蘋果公司會(huì)不時(shí)收購(gòu)一些小型技術(shù)公司,但我們通常不討論收購(gòu)的目的和計(jì)劃!
Lattice.io 是蘋果在在過(guò)去 2 年多時(shí)間里收購(gòu)的至少第三家人工智能公司。2015 年 10 月,蘋果收購(gòu)了語(yǔ)音技術(shù)公司VocalIQ,此舉被認(rèn)為用于增強(qiáng)語(yǔ)音助手 Siri 和未來(lái)的汽車搭載交互系統(tǒng)。2016 年 8 月,蘋果又斥資 2 億美元收購(gòu)西雅圖的人工智能初創(chuàng)公司 Turi,并隨后成立了機(jī)器學(xué)習(xí)部門。
和其他硅谷的巨頭相比,長(zhǎng)期以來(lái)蘋果并不以人工智能著稱。Facebook 的人工智能負(fù)責(zé)人 Yan LeCun 曾經(jīng)公開表示,蘋果并不是人工智能研究圈子中的一員。一方面是因?yàn)樘O果的公司文化不算開放,也很少發(fā)表人工智能相關(guān)的學(xué)術(shù)論文;另一方面則是因?yàn)樘O果在挖掘用戶數(shù)據(jù)和保護(hù)用戶隱私的平衡中更偏向后者。
然而,每個(gè)季度都能賣出幾千萬(wàn)臺(tái)手機(jī)的蘋果公司顯然不能忽視用戶數(shù)據(jù)帶來(lái)的巨大紅利。早先收購(gòu)的人工智能公司往往被認(rèn)為有非常具體的產(chǎn)品整合目的,尤其是相關(guān)的語(yǔ)音分析技術(shù)可被用來(lái)增強(qiáng)Siri系統(tǒng)。
但對(duì)于 Lattice 的這次收購(gòu),無(wú)疑可能將在更大的尺度上幫助蘋果整合并分析收集到的各種數(shù)據(jù)。
毫無(wú)疑問(wèn),手機(jī)作為一個(gè)多媒體終端,獲取的數(shù)據(jù)會(huì)非常雜亂多樣,可能包括用戶的位置數(shù)據(jù)、App使用記錄、文字、圖片、視頻等等。如果能從這么多非結(jié)構(gòu)化的信息中抽取出數(shù)據(jù)整理成表格,有可能將蘋果的數(shù)據(jù)分析水平提升一個(gè)層次。
此外,DeepDive在醫(yī)療領(lǐng)域也有應(yīng)用。如果向系統(tǒng)輸入大量生物醫(yī)學(xué)領(lǐng)域的論文數(shù)據(jù),系統(tǒng)就會(huì)自動(dòng)提取論文中提及的疾病、基因、表型形狀等關(guān)鍵詞,還能從論文中挖掘出藥物和身體分子相互作用的關(guān)系。考慮到蘋果長(zhǎng)期以來(lái)在醫(yī)療領(lǐng)域的布局,DeepDive的這些功能也有可能派上用場(chǎng)。
投稿郵箱:chuanbeiol@163.com 詳情請(qǐng)?jiān)L問(wèn)川北在線:http://sanmuled.cn/