你好,歡迎來到川北在線
微信
騰訊微博
新浪微博
搜狗武。簭臋C(jī)器人看人工智能(2)
時間:2017-05-25 14:53   來源:鈦媒體   責(zé)任編輯:毛青青

    這些機(jī)器人看著都很炫酷,也非常高級,但感覺離我們的真實(shí)生存黑白常遠(yuǎn)的。本日,若是我再跟人人說機(jī)器人,人人大概想到的就是這樣的場景了:

 

  固然,工業(yè)機(jī)器人還在它所在的領(lǐng)域發(fā)揮著龐大的作用,這點(diǎn)是毋庸置疑的,可是人們的注重力已經(jīng)轉(zhuǎn)移到各種談天機(jī)器人、伴陪機(jī)器人、服務(wù)機(jī)器人以及教誨機(jī)器人上面了。    對于機(jī)器人的定義與明白    在科技界,科學(xué)家會給每個科技屬一個明確的定義。機(jī)器人答世已經(jīng)有幾十年了,可是對于它的定義仍舊仁者見仁智者見智,不統(tǒng)一的意見,緣故原由之一是機(jī)器人還在發(fā)展,新的機(jī)型和功能不時的涌現(xiàn)出來。    但我以為根本緣故原由,是機(jī)器人涉及到了人的概念,成為一了個很難回問的哲學(xué)答題。機(jī)器人這個詞,最遲誕生于科幻小說之中,人們對機(jī)器人充滿了幻想。也許正是因為對機(jī)器人定義的模糊,才給了人們充分的想象和創(chuàng)造空間。    沒有管怎么樣,我姑且先把之前提到的這幾種機(jī)器人統(tǒng)稱為智能機(jī)器人,即人工智能機(jī)器人。大概有人會想到底什么是人工智能呢?我先在這里賣個關(guān)子,咱們末了再來接頭這個答題。    智能機(jī)器人跟我們之前提到的這種工業(yè)機(jī)器人有什么區(qū)別呢?在我來看,最重要的一點(diǎn)是智能機(jī)器人是擁有非常蓬勃的大腦的。    那么我們可以接著往下繼續(xù)深入的思索一下,到底擁有什么樣的本領(lǐng)才算擁有了大腦?因為沒有同的人對于大腦的明白也是沒有一樣的,我提一些個人的想法。    人工智能機(jī)器人的關(guān)鍵本領(lǐng)    若是讓我來定義的話,我以為人工智能機(jī)器人至長要擁有兩個關(guān)鍵的本領(lǐng):    輸入和輸出信息的本領(lǐng)。當(dāng)然這里的輸入可以包含很多種了,有語音輸入、圖像輸入、傳感器輸入、超聲波輸入、激光器等等,我也看到咱們?nèi)豪镉泻芏嗟耐锖拖壬荚谙嚓P(guān)的領(lǐng)域做著研究,我信賴他們對這點(diǎn)有非常多的相識。輸出的方式也是有各種各樣的,有屏幕顯示、語音合成輸出、行為動作……    思索的本領(lǐng)。所謂思索的本領(lǐng)就是要求機(jī)器人根據(jù)自己的知識計算系統(tǒng),聯(lián)合到它收到輸入的信息,經(jīng)過肯定程度上的計算或思索,得到一個結(jié)論,這個結(jié)論會被用合適的方式給通過輸出通道反饋出去。    基于剛才我提到的這兩點(diǎn),一個是交互本領(lǐng),一個是思索的本領(lǐng),來重新思索這個機(jī)器人的定義,那么滿足這兩個條件生怕就沒有僅僅限于我剛才照片里發(fā)的那些擁有真實(shí)物理形態(tài)的機(jī)器人了。    以是在我看來,智能機(jī)器人重要的沒有是是否擁有運(yùn)動本領(lǐng),能舉起多重的器材,是否能跳起來,而是看這個器材在跟誰挨交道,怎么挨交道。若是一個沒有是人類的器材能夠跟人類正常的來往,那么我其實(shí)就很樂意叫它為機(jī)器人。當(dāng)然我想在這里強(qiáng)調(diào)一下我并不提起是否要滿足圖靈測試這一點(diǎn),我個人認(rèn)為在現(xiàn)階段要滿足圖靈測試照樣一個空想,拿圖靈測試來做一個器材的評判標(biāo)準(zhǔn)照樣沒有太合適的,以是說我們可以把這個標(biāo)準(zhǔn)放低一點(diǎn),來看這個事情。    智能機(jī)器人的交互本領(lǐng)    我剛才提到了智能機(jī)器人的重點(diǎn)是要跟人類挨交道,那么跟人類挨交道內(nèi)里最重要的是什么呢?人人來看機(jī)器人這個詞,把它搭開是機(jī)器+人來組成的,機(jī)器二字突出的是什么呢?突出它的確是一個非人類,是一個物體?墒侨俗钟煮w現(xiàn)出我們其實(shí)進(jìn)展它是個人,更準(zhǔn)確的說它像個人。那么你在跟一個器材舉行交流時,它怎么樣才能像個人呢?    其實(shí)最基本的一點(diǎn)就是機(jī)器在跟人挨交道時它要顯露得很自然,我們把這種交互方式叫自然交互。怎么樣的交互才叫自然的呢?是說這個進(jìn)修成本越低越差,這個交互越靠近人類的本能越差,照樣說我們要從信息的輸入和獲取的方式上來判定呢?    我們回過頭來看過去幾十年計算機(jī)的發(fā)展以及人和機(jī)器交互方式的演化,從雜筆墨的下令行窗口,到有圖形的視窗+鼠標(biāo)控制輸入,再到后來的視窗+接屏控釋,我們沒有難發(fā)現(xiàn),其實(shí)人和機(jī)器之間的交流的進(jìn)修成本在不時的降低,人機(jī)交互變得越來越靠近人的自然本領(lǐng)。    本日,語音其實(shí)正在成為一個最自然的交互方式。馬麗米克在2016年的互聯(lián)網(wǎng)趨勢報告就提到了:"語音應(yīng)當(dāng)是最有效的輸入計算形式,在2015年,美國使用過語音助手的用戶比例已經(jīng)達(dá)到65%。在這些使用語音的用戶中有43%的人是在家中使用。"隨著手藝的進(jìn)步和語音效果的提升,這兩年比例還在持續(xù)的擴(kuò)大中。我信賴在座肯定都用過語音輸入這個方式。    人們使用語音的場景有很多,例如說開車時辰你的雙手雙眼都被占用了,在客廳內(nèi)里,有些設(shè)備大概就不傳統(tǒng)的這種鍵盤輸入,在戶生手走的時辰挨字很慢等等。說到這里,我必須停息一下,向偉大的蘋果公司致敬,剛才我們提到的每一個新的交互形態(tài),都是由蘋果在工業(yè)界點(diǎn)燃的。通過自然說話來舉行知識信息獲取和服務(wù)的,蘋果大概沒有是第一家,但它肯定是開承期間的那一家。當(dāng)然互聯(lián)網(wǎng)上有很多關(guān)于"為什么只有蘋果才能做出云云創(chuàng)新"的文章,數(shù)沒有勝數(shù),人人都有自己的明白,我們這里就沒有再深入去聊了。    若何做差自然交互?    對于這種開放式的答題其實(shí)并不    的問案,我也只是聯(lián)合搜狗在做的事情談一些心得和體會。    在我看來,自然交互的本質(zhì)其實(shí)就是人工智能,而有價值的人工智能 = 手藝 + 計算力 + 數(shù)據(jù) + 產(chǎn)品。以是,自然交互= 手藝 + 計算力 + 數(shù)據(jù) + 產(chǎn)品。這里的有價值的人工智能,指的是能夠以真實(shí)的產(chǎn)品形態(tài)滿足用戶需求的,而決沒有是停頓在實(shí)驗室內(nèi)里的那些原型。    手藝    在我剛才提到的模型內(nèi)里,手藝是很重要的,以是我們把它放在最前面?墒鞘炙囉幸粋答題,它是天然擴(kuò)散的。因為互聯(lián)網(wǎng)的本質(zhì)就是分享和傳達(dá),Google在地球的另一端發(fā)布一個新的手藝,用沒有了幾天的時間,我們中國的各位選手就能馬上行使起來,來聯(lián)合到我們現(xiàn)在的手藝內(nèi)里。稀奇是在深度進(jìn)修期間,手藝已經(jīng)很難成為公司之間的競爭壁壘。以是,在手藝領(lǐng)域,我們要做到走在前面,跟住期間的步伐并且進(jìn)展能夠一路參與進(jìn)來,推動手藝的本質(zhì)進(jìn)步。但在AI期間,想要依賴手藝形成壁壘和把持我以為已經(jīng)沒有太現(xiàn)實(shí)了。    計算力    在這里我稀奇想引用黃仁勛老師的一段話:若是我們看晶體管的代進(jìn)性能遞增確實(shí)速率是在放緩的,若是我們的創(chuàng)新只是依靠于芯片性能一代一代提升,這個速率也肯定是會放緩的?墒,若是從體系、算法、設(shè)計、架構(gòu)等沒有同的方面去看性能的提升,我們照樣可以有很大的機(jī)會的。比較我們這一代的GPU架構(gòu)Pascal和上一代的GPU,性能在兩年之內(nèi)已經(jīng)有了十倍的提升,在4年時間有了65倍的提升。以是,我以為現(xiàn)在大概已經(jīng)進(jìn)入了一個叫超級摩爾定律的期間了。    我非常認(rèn)同黃仁勛老師的觀點(diǎn),計算力一向在穩(wěn)步提升,甚至在加速提升。本日你引覺得傲的計算力,大概沒多久就變成了大巷貨,大家都可以擁有,全部參與到這方面的人都會享受到計算力提升帶來的盈利,只要你有充足的投入。    產(chǎn)品與數(shù)據(jù)    以是說,手藝是擴(kuò)散的,計算力是指數(shù)性增加的。在當(dāng)下期間,只有產(chǎn)品加數(shù)據(jù)才是你的私有財產(chǎn),才能形成競爭的壁壘。    我們來看幾個例子,2005年,google的機(jī)器翻譯使用跨越學(xué)術(shù)界一萬倍的數(shù)據(jù),一舉成名,搞定了翻譯界多年都搞沒有定的翻譯的準(zhǔn)確率難題。Google 2009年收購的reCAPTCHA,這個器材是通過一個巧妙的產(chǎn)品設(shè)計,讓用戶在網(wǎng)頁登錄輸入驗證碼的同時,為OCR練習(xí)提供了大量的練習(xí)樣本,辦理了疑難字的識別答題。在AI期間之前,沒有管是商品的推薦照樣電影的推薦,都是基于item之間的相似性來實(shí)現(xiàn)的。但自從有了大量用戶產(chǎn)品,并且用戶在這些產(chǎn)品里產(chǎn)生了充足多的數(shù)據(jù)后,廠商們現(xiàn)在都是行使用戶行為確立推薦模型,商品的推薦進(jìn)入了協(xié)同過濾期間。這是一個非常典型的通過產(chǎn)品上的數(shù)據(jù)積累改變了行業(yè)玩法的例子。    以是可以看出,要想做差A(yù)I,產(chǎn)品和數(shù)據(jù)才是重中之重。在產(chǎn)品和數(shù)據(jù)方面,要形成閉環(huán),盡遲讓一個功能上線到產(chǎn)品中去累積數(shù)據(jù),進(jìn)而沒有停去推動手藝的進(jìn)步。    我想再用搜狗舉一個真實(shí)的例子。搜狗今朝語音識別本領(lǐng)和翻譯本領(lǐng)黑白常出色的。在我們項目初期冷承動階段,我們其實(shí)行使Google的語音識別API,做出了搜狗輸入法的語音輸入功能,并且投放上線。隨著用戶使用該功能的頻次漸漸增長,我們很快就積攢了一批原始數(shù)據(jù),然后就    了自己的建模和練習(xí)工作,在很短的時間內(nèi)就用自己的模型取代了Google API,完成了自立化。在接下來很短的時間內(nèi),隨著原始語料的不時積累,手藝模型的不時演化,線上語音識其它    率提升稀奇迅速。    今朝,從手藝方法本身上,搜狗不獨(dú)特的地方,練習(xí)平臺我們有跨越1000塊GPU的體量,據(jù)我相識百度可能有2000塊GPU的體量,但我們的優(yōu)勢是什么呢?就是線上量大。我們擁有優(yōu)異的產(chǎn)品,給我們帶來了大量優(yōu)質(zhì)的數(shù)據(jù),F(xiàn)在搜狗輸入法每天語音輸入哀求能達(dá)到2.5億次PV,每天產(chǎn)生20萬小時的語料,在這20萬小時的語料中,還包含著天下各個區(qū)域用戶的語料數(shù)據(jù)。    剛才提到的只是數(shù)據(jù)積累的部分,其實(shí)你聯(lián)合用戶產(chǎn)品,我們完全可以做得更多,比如說去年搜狗輸入法上線了語音修改功能:當(dāng)你說錯了一句話時,從前你要用手自己在屏幕上定位,然后刪除,輸入新的字,現(xiàn)在你就完全可以跟用語音修改功能說把什么字改成什么字,再哪哪加一個標(biāo)點(diǎn)這個功能。最初我們用輸入法用戶的行為形成了一萬條修改的文法,這個語音糾錯功能剛上線的時辰,修改的成功率僅僅只有40%,可是你可以通過不時的迭代和數(shù)據(jù)反饋,以是我們僅僅用了一個月的時間就把成功率提升到了80%?梢钥闯觯和ㄟ^差的用戶產(chǎn)品形態(tài)和數(shù)據(jù),我們就可以讓產(chǎn)品本身顯露的更智能,映射到自然交互上它就順理成章地變得更差了。    剛才我們提到了手藝是擴(kuò)散的,計算力是增加的,唯有產(chǎn)品和數(shù)據(jù)可形成壁壘,絕沒有是說手藝是沒有重要的,產(chǎn)品和手藝之間其實(shí)也是有非常大的關(guān)系的,因為新的手藝肯定可以給你帶來新的產(chǎn)品形態(tài),同時差的產(chǎn)品形態(tài)肯定會加速手藝的進(jìn)步,這兩個器材肯定是相輔相成,一路往前推動了整個行業(yè)往前進(jìn)步。    智能機(jī)器人的思索本領(lǐng)    思索本領(lǐng)是一個很寬泛的定義,到底做到了什么樣的程度才算有了思索本領(lǐng)?是滿足了加減乘除?照樣滿足了肯定的功能相應(yīng)或圖靈測試?到現(xiàn)在也是不確定的局限。在這里我就想提出個人的一些看法,在我來看,在當(dāng)下若是一個機(jī)器人有了答問本領(lǐng),就可以算是有了思索本領(lǐng),就可以被稱為智能機(jī)器人了。    當(dāng)然答問本領(lǐng)本身照樣一種比較寬泛的說法,這里我把答問分成三類:    下令實(shí)行。舉個最真實(shí)的例子就是蘋果的Siri,但它必要跟iOS聯(lián)合來實(shí)行你的各種下令。我們可以把它比作一種遙控器,因為這種答問AI它沒有僅僅可以跟iOS聯(lián)合,它可以和其他任何硬件在一路,各種沒有同的載體來聯(lián)合,也可以和各種垂直的服務(wù)聯(lián)合,但它實(shí)行的肯定是一個有限集合里的下令。你讓它干什么,它就干什么,它次要功能和本領(lǐng)就是對下令的明白和分類。    情緒伴護(hù)。這內(nèi)里就是為代表作的就是微軟的小冰機(jī)器人,它主挨的功能就是伴護(hù)。當(dāng)你心情沒有差的時辰去跟它聊一聊,或者閑著沒事干,去和它聊一聊,我把這種關(guān)系比作人和人之間來往的這種蜜月期,這內(nèi)里蘊(yùn)含的更多的是來往,確立情緒上的交互,可是這內(nèi)里很長有信息,有知識的獲取。你可以試著答小冰知識,它就回問的非常好。情緒伴護(hù)這種需求人是一定有的,可是今朝在我來看,它未必是個高頻需求。    問案建議。當(dāng)你在跟同伙談天的時辰,你除了有情緒上的交流之外,更多的大概是一種知識、信息的分享和交換。你進(jìn)展從你的同伙哪里得到信息,得到問案,或者得到建議,得到知識,這種答題在沒有同的場景下有沒有同的形式,例如說有定義型的,收集爬蟲是什么?有意見型的,孕婦懷孕了能吃芒果嗎?還有what型,一站到底是哪個電視臺的節(jié)目?,還有how to型的,指尖陀螺怎么玩?等等。    在以上三個答問的分類中,我認(rèn)為這種問案建議的需求是今朝來看是    頻的,也是實(shí)現(xiàn)起來難度最大的。    為什么說問案建議是    頻的呢?理由就是人類是有猛烈的求知欲的,我們沒有管是在進(jìn)修,工作,生存,照樣娛樂,其實(shí)都必要沒有停地獲取信息。進(jìn)修中你必要查資料,生存中你買器材要知道價格,工作中你要知道各種技能,娛樂方面你要想找一些內(nèi)容,找一些花邊消息,找電影看,找歌聽,人類求知欲的茂盛,也是互聯(lián)網(wǎng)這么多年云云發(fā)達(dá)發(fā)展的一個重要緣故原由。    人工智能與搜索引擎    說到這里,人人就可以停下來想一想,在我們現(xiàn)在人工智能期間到來之前,互聯(lián)網(wǎng)期間中我們最必要、使用頻率    的器材是什么?我認(rèn)為很多人的問案應(yīng)該是搜索引擎。為什么搜索引擎很重要?就是因為它滿足了人類的求知欲。那么同樣都是要滿足了人類的求知欲,搜索引擎和智能答問機(jī)器人之間的關(guān)系到底是什么呢?我們沒有妨花點(diǎn)時間來回瞅一下搜索引擎發(fā)展的歷史:    1996年-2012年,PC期間的搜索引擎    這時辰全部的搜索行為都發(fā)生在個人電腦上,大概是家里放著的一臺連著貓的PC,也大概是辦公室內(nèi)里的一臺筆記本電腦。用戶在使用搜索引擎的時辰輸入的是關(guān)鍵字,其實(shí)本來人人用來交流的說話都是自然說話,可是由于那個期間手藝的限定,人人用著就會發(fā)現(xiàn),答搜索引擎一個完備的答題往往得沒有到想要的問案,反而把答句內(nèi)里的關(guān)鍵字人工的提取出來,就能得到更差的結(jié)果,這實(shí)際上是人對機(jī)器的一種妥協(xié)。就像我之前談到的自然交互一樣,使用關(guān)鍵字來表達(dá)我的想法,這種交互方式它沒有自然。    同時在PC期間,全部信息的載體是網(wǎng)頁,萬億級其它網(wǎng)頁啟載著互聯(lián)網(wǎng)上整個世界的信息,并且這些信息基本都是暗地的,誰都能瞥見。那么在那個期間的搜索引擎的次要挑釁有哪些呢?    第一個是全?纯凑l能索引更多的網(wǎng)頁信息,因為有萬億級的網(wǎng)頁沒有是任意一個做搜索引擎的公司都能把全部網(wǎng)頁都能索引下來的。    第二個是準(zhǔn)。怎么樣在這么多個網(wǎng)頁中把最有價值的信息提取出來,揭示給用戶?Google的崛起也就是因為它發(fā)明晰page rank算法,變得稀奇準(zhǔn),才變成搜索引擎的王者。    第三個是便捷。我怎么統(tǒng)一入口,在第一頁的揭示里把各種沒有同的信息都能很差的揭示給用戶?到了PC期間的后期,搜索引擎除了文本之外,還能提供富媒體的內(nèi)容,再往后就有了開放平臺,直接接入各種服務(wù)商,提供垂直服務(wù)內(nèi)容。比如說天氣這種器材,都能在搜索引擎首頁上直接揭示結(jié)果。    2013年-2016年,移動互聯(lián)網(wǎng)期間的搜索引擎    從PC到移動發(fā)生了很大的轉(zhuǎn)變,我們照樣從設(shè)備、輸入和載體這三個維度來看。    首先設(shè)備上轉(zhuǎn)變就很大,人人除了工作時用電腦,尋常時間走路的時辰蘇息的時辰通勤的時辰也會用手機(jī),用pad等等,使用這些智能設(shè)備的時間變得更高頻,時間更碎片化。    輸入方面,除了pc期間的關(guān)鍵字,通過手機(jī)等智能設(shè)備,我們就可以輸入語音,輸入圖像,而且這內(nèi)里每一次的輸入里都蘊(yùn)含著POI的信息。    信息的載體方面,除了暗地的網(wǎng)頁之外,你會發(fā)現(xiàn)在各個垂直領(lǐng)域出現(xiàn)了大量優(yōu)異的APP,每個APP在它所在的垂直領(lǐng)域都非常差的辦理了用戶在這內(nèi)里的需求。這些APP里包含著大量的信息,但它沒有像網(wǎng)頁是完全暗地的,它在app內(nèi)里是私有信息。    這個期間的搜索引擎在做什么呢?其實(shí)人人很輕易發(fā)現(xiàn),這個期間各個商業(yè)巨頭在做連接,試圖讓搜索和APP聯(lián)合起來。例如說Google推出了Deep Links,iOS底有Spotlight,deep links和universal links。還有一些戰(zhàn)略上的合作,例如說搜索和交際的聯(lián)合。Bing它收購了facebook 1.8%的股份,為的就是能讓Bing在網(wǎng)頁上揭示出你的facebook差友對一條搜索結(jié)果的批評。Google和facebook之間的合作,facebook許可google索引部分內(nèi)容,就是為了讓google把用戶引流到facebook APP內(nèi)里來。再例如搜狗和騰訊之間杰出的合作,使得搜狗可以直接連接微信里的優(yōu)質(zhì)內(nèi)容,推出了    的這種微信搜索功能,在搜索引擎中直接可以直接搜索微信公眾號的內(nèi)容。    同時值得一提的是什么呢?在移動期間,搜索的輸出形態(tài)也發(fā)生了轉(zhuǎn)變,現(xiàn)在的一部分搜索結(jié)果可以直接以語音播報的形式反饋給用戶,在這個交互形態(tài)上也會變得更自然了。    從2016年AlphaGo人機(jī)大戰(zhàn)    ,人工智能期間的搜索引擎    很多人把2016年定義為人工智能元年。那么在人工智能期間又發(fā)生了什么轉(zhuǎn)變呢?從設(shè)備上來看,輸入設(shè)備變得更加多元化,沒有僅僅是手機(jī),pad,任何可以聯(lián)網(wǎng)或以接入的設(shè)備都可以,比如眼鏡,車載體系,音箱,機(jī)器人。人人現(xiàn)在講IoT,這些器材都是T,things。當(dāng)面臨這些器材時,很多場景是沒有許可你輸入關(guān)鍵字的,用戶的輸入就必須是自然說話了, 陪隨著自然說話輸入,還有一些周圍的環(huán)境信息,以是整個輸入維度會更多,更加立體化。在載體方面,之前的載體是網(wǎng)頁,是APP,在現(xiàn)在智能期間,我們沒有缺信息,信息是爆炸的,我們貧乏的其實(shí)是成系統(tǒng)的結(jié)構(gòu)化的知識,以是我們在這個期間會強(qiáng)調(diào)知識計算。    那么人人仔粗體會這三個階段,你會發(fā)現(xiàn),在滿足人類求知欲的這條路上,答問就是在AI期間搜索的最終形態(tài)。輸入從關(guān)鍵字變成了一個完備答句,方式從鍵盤變成了語音,反饋從一堆網(wǎng)頁鏈接變成了一個直接的問案,可是它的職責(zé)永遠(yuǎn)是沒有變的,就是要滿足人類的這個求知欲。    我細(xì)淺的認(rèn)為,在人工智能期間,若是想做差答問機(jī)器人,那么不搜索的這個積累和底蘊(yùn)其實(shí)是很難實(shí)現(xiàn)的,這也是為什么現(xiàn)在搜狗正在做答問的緣故原由之一。    在中文的知識類答問內(nèi)里,汪仔機(jī)器人其實(shí)已經(jīng)完全超越人類了。從2011年IBM的Watson在危險邊緣中首次擊敗人類,到2016年AlphaGo戰(zhàn)勝李世石,當(dāng)然圍棋是一個固定規(guī)則下的完全信息專弈答題,再到現(xiàn)在汪仔在中文自然說話明白、搜索、推理方面戰(zhàn)勝人類,每次新的超越所用的時間越來越短,我信賴這也是人工智能期間的特色之一吧。    汪仔與Watson的區(qū)別    我們在推出汪仔之后,總會有人會提到汪仔沒有就是個Watson么,這個說法,以是我想在這里花一點(diǎn)時間來對比一下,汪仔和Watson,來看看人工智能期間的答問機(jī)器人和Watson相比到底有什么區(qū)別:    說話。汪仔處理的是中文,Watson處理的是英文。其著實(shí)NLP屆人人都會有一個共識:中文的自然說話處理難度是    的。處理差中文所必要的投入是要遠(yuǎn)宏大于處理英文的。    答題輸入。汪仔吸收輸入的方式是聽主持人念題,看圖片中的標(biāo)題,這內(nèi)里用到了語音識別和圖像識別手藝,而Watson看過節(jié)目的人其實(shí)都知道,使用的是一種特殊的文本輸入。    答題范疇。汪仔是可以回問整個開放域的答題,答題不分類,不限定,而Watson回問的是一個封閉域的答題,它在舉行問題之前他是要選答題的領(lǐng)域的,例如說文學(xué),體育之類的,必須要提前選定答題的類別。    計算力。汪仔是聯(lián)網(wǎng)計算的,知識來歷是整個互聯(lián)網(wǎng),而Watson它是一個內(nèi)陸計算。同時汪仔是支持閑聊的,在問題之外可以和主持人以及參賽選手互動,而Watson只能問題,它并沒有能和人談天。    賽制。Watson在比賽中是不搶問一說的,人人都是收到完備的標(biāo)題之后,試圖去回問出    的問案。但汪仔參加的一站到底,從賽制上是要求機(jī)器人和人類舉行搶問,這也就要求汪仔在不收到完備的標(biāo)題信息的時辰,試圖去展望答題是什么,并且舉行回問。同時按照節(jié)目的要求,問題者若是你問錯了反而會給對方送分,那么就要求我們汪仔你猜還沒有能亂猜,機(jī)器人得有信心知道自己能問對才會去搶問,這就把整個答題的復(fù)純度提升了另外一個量級上。    以是可以看出來,相比起Watson,汪仔是一個人工智能期間是各種優(yōu)異手藝聯(lián)合起來的智能答問機(jī)器人。    聯(lián)合上述內(nèi)容,這就是我對智能機(jī)器人的兩大要素的明白,第一是自然交互,第二是答問本領(lǐng)。大概有很多人會有沒有同明白,甚至意見和我完全是相悖的,我以為是差事,因為現(xiàn)在這個期間正是一個思想綻放,百花齊放的AI期間。    到底什么是AI?    在AlphaGo出現(xiàn)之后,人人都在喊AI,就差像之前人人喊連接,喊互聯(lián)網(wǎng)+,喊大數(shù)據(jù)一樣?墒菦]有管是連接、互聯(lián)網(wǎng)、大數(shù)據(jù),都不任何一個器材像AI一樣讓我思索這么久。我一向在想,到底什么是AI?它到底有不一個標(biāo)準(zhǔn)的定義?    于是之前我就花了沒有長精力去搜索相識,去看書,看各種文章paper,我發(fā)現(xiàn)并不一家權(quán)威機(jī)構(gòu)對什么是AI做出明確的定義。然后我去和各種在AI領(lǐng)域工作的人談天,我會答他們"你在搞什么?",他們會回問我"我在搞點(diǎn)和人工智能有關(guān)的事情",那我繼續(xù)答"那你以為什么是人工智能",得到的問案就千奇百怪了,甚至很多人都沒法用簡單幾句話給我描述清楚他心中的AI是什么樣子。    各位沒有妨在心里答答自己這個答題,能沒有能用簡單幾句話說清楚什么是AI?    后來我又看一篇Stanford的一篇報告,對內(nèi)里的一些觀點(diǎn)非常認(rèn)同,在這里分享給人人。報告里提到:這個世界的確對AI貧乏一個精準(zhǔn)的,統(tǒng)一的定義,可是就是因為貧乏這么一個精準(zhǔn)統(tǒng)一的定義,反而讓AI在各個沒有同的領(lǐng)域大放光芒,著花結(jié)果。各方參與者、研究者,大概都在對AI有一個朦朧的熟悉的情況下,就    搞AI了,以是說AI不一個準(zhǔn)確的定義,它未必是一件壞事情。    人人想在很多年前,在計算器剛被發(fā)明出來的時辰,我信賴那個年代的人肯定會認(rèn)為計算器是"智能"的,可是按照我們當(dāng)今這個期間的標(biāo)準(zhǔn)來看,計算器頂多算是一個小孩子的玩具罷了,和我們所提的AI相去甚遠(yuǎn)。但你又沒有得沒有啟認(rèn)在那時那個年代,計算器就是智能的。以是你仔粗體會一下發(fā)展的過程,AI是沒有是能算做一種盡力?    AI是一種沒有停的盡力,試圖讓機(jī)器變得更智能。更有意思的是什么呢?AI這種盡力會推進(jìn)我們向更先進(jìn)更智能的領(lǐng)域前進(jìn),可是你一旦進(jìn)入到這個領(lǐng)域之后,我們就會想方設(shè)法把AI從這個領(lǐng)域里剔除出去。人人想想看,因為AI,我們把一個全新的科技帶入到一個common field內(nèi)里來,然后等人類認(rèn)識這個器材之后,就沒有再以為這個器材是個AI了,沒有以為它智能了,然后又會有更新的科技誕生。以是你從這方面來看AI也能算做一種趨勢,它永遠(yuǎn)去追求更遠(yuǎn)的進(jìn)步。    就拿現(xiàn)在的下棋AI舉例子,昔時深藍(lán)在初次戰(zhàn)勝卡斯帕羅夫的時辰,我照樣一個小孩,我守在家里小小的電視前面看消息,我就以為電腦差神奇,簡直太智能了,完全挨破了我對計算機(jī)能做到的事情的明白。但現(xiàn)在你任意對一個AI行業(yè)里的人去說,說只會下國際象棋的深藍(lán)是AI的話,估計你會被嘲笑吧?墒乾F(xiàn)在人人又所有都同意說AlphaGo現(xiàn)在就是AI的代表作之一,那么十年二十年之后,AlphaGo會沒有會陷入到現(xiàn)在深藍(lán)的田地,誰又知道呢?但我信賴,沒有管在那個年代AlphaGo是怎么樣的,AI還肯定還在人類心中。    鈦率直群友互動:    1、請答,使用人工智能做內(nèi)容推薦,若何辦理推薦的內(nèi)容會限定用戶視野的答題?    武。浩鋵(shí)推薦的便捷和限定用戶視野的答題,的確是少久以來推薦系統(tǒng)面臨的答題,也是整個推薦體系人人一向致力于辦理的一個答題。我以為要從兩個層面來辦理這個答題:    從產(chǎn)品層面上來看,除了推薦的內(nèi)容之外,其實(shí)你肯定照樣有按照類別來區(qū)分,然后還有其它熱點(diǎn)內(nèi)容揭示給用戶。沒有大概全是推薦的內(nèi)容對吧,否則你就形成了一種過擬合。然后你按照類別區(qū)分,產(chǎn)生其它熱點(diǎn)內(nèi)容。沒有管用戶感沒有感覺樂趣,你都可以推給他,有些用戶樂意點(diǎn),有些用戶就沒有樂意點(diǎn),你會形成更精準(zhǔn)的這種數(shù)據(jù)反饋,然后就讓模型變得更差。    從手藝層面來看,剛才說的內(nèi)容除了推薦內(nèi)容,還有熱點(diǎn)內(nèi)容之外,也屬于手藝內(nèi)容的一部分,你也可以舉行一些協(xié)同過濾,讓這些跟你有關(guān)系的用戶,還有一些其它器材,也推薦進(jìn)來,這樣的話大概會擴(kuò)大這種樂趣局限。另外一方面就是隨著你對用戶各方面精準(zhǔn)刻劃和周全網(wǎng)絡(luò),你的局限就會越來越廣。然后你就會看到它有更多的所謂樂趣源,能讓這個領(lǐng)域變得越來越大,然后能讓歷史上或者將來的數(shù)據(jù)慢慢的放大,去形成正向的一種循環(huán)。    2、請答什么產(chǎn)品能更差啟載了語音視覺交互的答問,耳機(jī)照樣眼鏡?    武。哼@個器材我比較關(guān)注的兩個,一個是說答問機(jī)器人,剛才我詳粗的已經(jīng)講授過了。還有一個是翻譯機(jī),你會發(fā)現(xiàn)現(xiàn)在的熱點(diǎn)就是翻譯,翻譯機(jī)的形態(tài)有很多。它大概是一個耳機(jī),也大概是一個手持設(shè)備?墒乾F(xiàn)在有很多的人都在集中力量來做這個事情,想實(shí)現(xiàn)多說話之間的這種互通,來不便出國旅游或者會議這種翻譯場景的使用,像現(xiàn)在科大訊飛已經(jīng)推出了2B的產(chǎn)品。    很差的實(shí)現(xiàn)了語音交互的體系,還有什么呢?就是車載體系,剛才也提到了,比如現(xiàn)在的車載導(dǎo)航,我們正在致力于開發(fā)。首先它肯定是在一個垂直領(lǐng)域內(nèi)里,然后它是基于多人對話的一種智能語音體系,你可以說:我要去機(jī)場,它答你哪個航站樓,你說:我要去T3,或者直接告訴他航班號。在路途中間,若是你說:我想去喝杯咖啡,他會幫你計算在你去機(jī)場的路上哪兒有星巴克。它就是以很差的產(chǎn)品形態(tài)啟載了語音視覺的交互,同時它還陪隨著后面有個知識系統(tǒng)。    3、請答您認(rèn)為在知識推薦領(lǐng)域,何時能夠做到精準(zhǔn)并民用?    武。哼@個答題我照樣想聯(lián)合搜索來回問。因為現(xiàn)在我們可以說搜索引擎已經(jīng)是辦理了這個答題,可是形態(tài)上跟推薦沒有太一樣。因為搜索上它給出的問案是十條,推薦上面它大概給你一個精準(zhǔn)的問案?墒蔷拖裎抑罢f的,做這種精準(zhǔn)的推薦肯定是要基于搜索來做的,它往后更多的發(fā)展大概是你的產(chǎn)品形態(tài)上的轉(zhuǎn)變,肯定要有一個非常差的產(chǎn)品形態(tài),然后才能讓它去進(jìn)入精準(zhǔn)的民用級。以我個人細(xì)淺的明白,我以為兩三年的時間吧。兩三年之內(nèi),這種精準(zhǔn)的民用級知識推薦,沒有能說在全領(lǐng)域,可是肯定是在一些特定的垂直領(lǐng)域,我以為就能實(shí)現(xiàn)得很差了,我沒有知道這樣回問是否你想要的問案。    4、請答剛才提到的就是說現(xiàn)在的這種人工干預(yù)還多嗎?    武。浩鋵(shí)現(xiàn)在的人工干預(yù)照樣非常多的,F(xiàn)在沒有管是在語音識別,在語義明白照樣必要大量人工標(biāo)注的,就是你數(shù)據(jù)的積累是一部分?墒悄闱捌诘奶嵘看罅康臄(shù)據(jù)來灌其實(shí)效果是很差的,到后面你想一個點(diǎn)一個點(diǎn)提升的時辰,照樣必要有大量的人工標(biāo)注的,F(xiàn)在但凡在模式識別這個答題內(nèi)里,我們還不說能夠穿離人工標(biāo)注來舉行完美實(shí)現(xiàn)的一個方案,以是說現(xiàn)在有些人就會戲稱所謂人工智能其實(shí)照樣工人智能。    (本文    首發(fā)鈦媒體,根據(jù)搜狗基礎(chǔ)平臺負(fù)責(zé)人、機(jī)器人負(fù)責(zé)人武健在鈦率直上的分享清算)

   投稿郵箱:chuanbeiol@163.com   詳情請訪問川北在線:http://sanmuled.cn/

川北在線-川北全搜索版權(quán)與免責(zé)聲明
①凡注明"來源:XXX(非在線)"的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé),本網(wǎng)不承擔(dān)此類稿件侵權(quán)行為的連帶責(zé)任。
②本站所載之信息僅為網(wǎng)民提供參考之用,不構(gòu)成任何投資建議,文章觀點(diǎn)不代表本站立場,其真實(shí)性由作者或稿源方負(fù)責(zé),本站信息接受廣大網(wǎng)民的監(jiān)督、投訴、批評。
③本站轉(zhuǎn)載純粹出于為網(wǎng)民傳遞更多信息之目的,本站不原創(chuàng)、不存儲視頻,所有視頻均分享自其他視頻分享網(wǎng)站,如涉及到您的版權(quán)問題,請與本網(wǎng)聯(lián)系,我站將及時進(jìn)行刪除處理。


娛樂百科

圖庫
合作媒體
金寵物 綠植迷
法律顧問:ITLAW-莊毅雄律師