你好,歡迎來到川北在線
微信
騰訊微博
新浪微博
搜狗武。簭臋C(jī)器人看人工智能
時(shí)間:2017-05-25 14:53   來源:鈦媒體   責(zé)任編輯:毛青青
    原標(biāo)題:搜狗武。簭臋C(jī)器人看人工智能
 
    以下根據(jù)武健在鈦率直的分享實(shí)錄清算:
 
  人人差,很喜悅本日晚上在鈦率直跟人人聊聊人工智能。我叫武健,畢業(yè)于清華大學(xué)。畢業(yè)之后一向在搜狗工作,從去年 主導(dǎo)了搜狗汪仔機(jī)器人的項(xiàng)目,參加了一站到底,今朝節(jié)目已經(jīng)播出了半年時(shí)間,效果很差,引起了很多人的關(guān)注。
 
  我信賴在多少年前,當(dāng)人人聊起機(jī)器人時(shí),腦海里浮現(xiàn)出來的大概是這樣的場(chǎng)景:
  固然,工業(yè)機(jī)器人還在它所在的領(lǐng)域發(fā)揮著龐大的作用,這點(diǎn)是毋庸置疑的,可是人們的注重力已經(jīng)轉(zhuǎn)移到各種談天機(jī)器人、伴陪機(jī)器人、服務(wù)機(jī)器人以及教誨機(jī)器人上面了。    對(duì)于機(jī)器人的定義與明白    在科技界,科學(xué)家會(huì)給每個(gè)科技屬一個(gè)明確的定義。機(jī)器人答世已經(jīng)有幾十年了,可是對(duì)于它的定義仍舊仁者見仁智者見智,不統(tǒng)一的意見,緣故原由之一是機(jī)器人還在發(fā)展,新的機(jī)型和功能不時(shí)的涌現(xiàn)出來。    但我以為根本緣故原由,是機(jī)器人涉及到了人的概念,成為一了個(gè)很難回問的哲學(xué)答題。機(jī)器人這個(gè)詞,最遲誕生于科幻小說之中,人們對(duì)機(jī)器人充滿了幻想。也許正是因?yàn)閷?duì)機(jī)器人定義的模糊,才給了人們充分的想象和創(chuàng)造空間。    沒有管怎么樣,我姑且先把之前提到的這幾種機(jī)器人統(tǒng)稱為智能機(jī)器人,即人工智能機(jī)器人。大概有人會(huì)想到底什么是人工智能呢?我先在這里賣個(gè)關(guān)子,咱們末了再來接頭這個(gè)答題。    智能機(jī)器人跟我們之前提到的這種工業(yè)機(jī)器人有什么區(qū)別呢?在我來看,最重要的一點(diǎn)是智能機(jī)器人是擁有非常蓬勃的大腦的。    那么我們可以接著往下繼續(xù)深入的思索一下,到底擁有什么樣的本領(lǐng)才算擁有了大腦?因?yàn)闆]有同的人對(duì)于大腦的明白也是沒有一樣的,我提一些個(gè)人的想法。    人工智能機(jī)器人的關(guān)鍵本領(lǐng)    若是讓我來定義的話,我以為人工智能機(jī)器人至長(zhǎng)要擁有兩個(gè)關(guān)鍵的本領(lǐng):    輸入和輸出信息的本領(lǐng)。當(dāng)然這里的輸入可以包含很多種了,有語音輸入、圖像輸入、傳感器輸入、超聲波輸入、激光器等等,我也看到咱們?nèi)豪镉泻芏嗟耐锖拖壬荚谙嚓P(guān)的領(lǐng)域做著研究,我信賴他們對(duì)這點(diǎn)有非常多的相識(shí)。輸出的方式也是有各種各樣的,有屏幕顯示、語音合成輸出、行為動(dòng)作……    思索的本領(lǐng)。所謂思索的本領(lǐng)就是要求機(jī)器人根據(jù)自己的知識(shí)計(jì)算系統(tǒng),聯(lián)合到它收到輸入的信息,經(jīng)過肯定程度上的計(jì)算或思索,得到一個(gè)結(jié)論,這個(gè)結(jié)論會(huì)被用合適的方式給通過輸出通道反饋出去。    基于剛才我提到的這兩點(diǎn),一個(gè)是交互本領(lǐng),一個(gè)是思索的本領(lǐng),來重新思索這個(gè)機(jī)器人的定義,那么滿足這兩個(gè)條件生怕就沒有僅僅限于我剛才照片里發(fā)的那些擁有真實(shí)物理形態(tài)的機(jī)器人了。    以是在我看來,智能機(jī)器人重要的沒有是是否擁有運(yùn)動(dòng)本領(lǐng),能舉起多重的器材,是否能跳起來,而是看這個(gè)器材在跟誰挨交道,怎么挨交道。若是一個(gè)沒有是人類的器材能夠跟人類正常的來往,那么我其實(shí)就很樂意叫它為機(jī)器人。當(dāng)然我想在這里強(qiáng)調(diào)一下我并不提起是否要滿足圖靈測(cè)試這一點(diǎn),我個(gè)人認(rèn)為在現(xiàn)階段要滿足圖靈測(cè)試照樣一個(gè)空想,拿圖靈測(cè)試來做一個(gè)器材的評(píng)判標(biāo)準(zhǔn)照樣沒有太合適的,以是說我們可以把這個(gè)標(biāo)準(zhǔn)放低一點(diǎn),來看這個(gè)事情。    智能機(jī)器人的交互本領(lǐng)    我剛才提到了智能機(jī)器人的重點(diǎn)是要跟人類挨交道,那么跟人類挨交道內(nèi)里最重要的是什么呢?人人來看機(jī)器人這個(gè)詞,把它搭開是機(jī)器+人來組成的,機(jī)器二字突出的是什么呢?突出它的確是一個(gè)非人類,是一個(gè)物體?墒侨俗钟煮w現(xiàn)出我們其實(shí)進(jìn)展它是個(gè)人,更準(zhǔn)確的說它像個(gè)人。那么你在跟一個(gè)器材舉行交流時(shí),它怎么樣才能像個(gè)人呢?    其實(shí)最基本的一點(diǎn)就是機(jī)器在跟人挨交道時(shí)它要顯露得很自然,我們把這種交互方式叫自然交互。怎么樣的交互才叫自然的呢?是說這個(gè)進(jìn)修成本越低越差,這個(gè)交互越靠近人類的本能越差,照樣說我們要從信息的輸入和獲取的方式上來判定呢?    我們回過頭來看過去幾十年計(jì)算機(jī)的發(fā)展以及人和機(jī)器交互方式的演化,從雜筆墨的下令行窗口,到有圖形的視窗+鼠標(biāo)控制輸入,再到后來的視窗+接屏控釋,我們沒有難發(fā)現(xiàn),其實(shí)人和機(jī)器之間的交流的進(jìn)修成本在不時(shí)的降低,人機(jī)交互變得越來越靠近人的自然本領(lǐng)。    本日,語音其實(shí)正在成為一個(gè)最自然的交互方式。馬麗米克在2016年的互聯(lián)網(wǎng)趨勢(shì)報(bào)告就提到了:"語音應(yīng)當(dāng)是最有效的輸入計(jì)算形式,在2015年,美國(guó)使用過語音助手的用戶比例已經(jīng)達(dá)到65%。在這些使用語音的用戶中有43%的人是在家中使用。"隨著手藝的進(jìn)步和語音效果的提升,這兩年比例還在持續(xù)的擴(kuò)大中。我信賴在座肯定都用過語音輸入這個(gè)方式。    人們使用語音的場(chǎng)景有很多,例如說開車時(shí)辰你的雙手雙眼都被占用了,在客廳內(nèi)里,有些設(shè)備大概就不傳統(tǒng)的這種鍵盤輸入,在戶生手走的時(shí)辰挨字很慢等等。說到這里,我必須停息一下,向偉大的蘋果公司致敬,剛才我們提到的每一個(gè)新的交互形態(tài),都是由蘋果在工業(yè)界點(diǎn)燃的。通過自然說話來舉行知識(shí)信息獲取和服務(wù)的,蘋果大概沒有是第一家,但它肯定是開承期間的那一家。當(dāng)然互聯(lián)網(wǎng)上有很多關(guān)于"為什么只有蘋果才能做出云云創(chuàng)新"的文章,數(shù)沒有勝數(shù),人人都有自己的明白,我們這里就沒有再深入去聊了。    若何做差自然交互?    對(duì)于這種開放式的答題其實(shí)并不    的問案,我也只是聯(lián)合搜狗在做的事情談一些心得和體會(huì)。    在我看來,自然交互的本質(zhì)其實(shí)就是人工智能,而有價(jià)值的人工智能 = 手藝 + 計(jì)算力 + 數(shù)據(jù) + 產(chǎn)品。以是,自然交互= 手藝 + 計(jì)算力 + 數(shù)據(jù) + 產(chǎn)品。這里的有價(jià)值的人工智能,指的是能夠以真實(shí)的產(chǎn)品形態(tài)滿足用戶需求的,而決沒有是停頓在實(shí)驗(yàn)室內(nèi)里的那些原型。    手藝    在我剛才提到的模型內(nèi)里,手藝是很重要的,以是我們把它放在最前面?墒鞘炙囉幸粋(gè)答題,它是天然擴(kuò)散的。因?yàn)榛ヂ?lián)網(wǎng)的本質(zhì)就是分享和傳達(dá),Google在地球的另一端發(fā)布一個(gè)新的手藝,用沒有了幾天的時(shí)間,我們中國(guó)的各位選手就能馬上行使起來,來聯(lián)合到我們現(xiàn)在的手藝內(nèi)里。稀奇是在深度進(jìn)修期間,手藝已經(jīng)很難成為公司之間的競(jìng)爭(zhēng)壁壘。以是,在手藝領(lǐng)域,我們要做到走在前面,跟住期間的步伐并且進(jìn)展能夠一路參與進(jìn)來,推動(dòng)手藝的本質(zhì)進(jìn)步。但在AI期間,想要依賴手藝形成壁壘和把持我以為已經(jīng)沒有太現(xiàn)實(shí)了。    計(jì)算力    在這里我稀奇想引用黃仁勛老師的一段話:若是我們看晶體管的代進(jìn)性能遞增確實(shí)速率是在放緩的,若是我們的創(chuàng)新只是依靠于芯片性能一代一代提升,這個(gè)速率也肯定是會(huì)放緩的?墒牵羰菑捏w系、算法、設(shè)計(jì)、架構(gòu)等沒有同的方面去看性能的提升,我們照樣可以有很大的機(jī)會(huì)的。比較我們這一代的GPU架構(gòu)Pascal和上一代的GPU,性能在兩年之內(nèi)已經(jīng)有了十倍的提升,在4年時(shí)間有了65倍的提升。以是,我以為現(xiàn)在大概已經(jīng)進(jìn)入了一個(gè)叫超級(jí)摩爾定律的期間了。    我非常認(rèn)同黃仁勛老師的觀點(diǎn),計(jì)算力一向在穩(wěn)步提升,甚至在加速提升。本日你引覺得傲的計(jì)算力,大概沒多久就變成了大巷貨,大家都可以擁有,全部參與到這方面的人都會(huì)享受到計(jì)算力提升帶來的盈利,只要你有充足的投入。    產(chǎn)品與數(shù)據(jù)    以是說,手藝是擴(kuò)散的,計(jì)算力是指數(shù)性增加的。在當(dāng)下期間,只有產(chǎn)品加數(shù)據(jù)才是你的私有財(cái)產(chǎn),才能形成競(jìng)爭(zhēng)的壁壘。    我們來看幾個(gè)例子,2005年,google的機(jī)器翻譯使用跨越學(xué)術(shù)界一萬倍的數(shù)據(jù),一舉成名,搞定了翻譯界多年都搞沒有定的翻譯的準(zhǔn)確率難題。Google 2009年收購(gòu)的reCAPTCHA,這個(gè)器材是通過一個(gè)巧妙的產(chǎn)品設(shè)計(jì),讓用戶在網(wǎng)頁(yè)登錄輸入驗(yàn)證碼的同時(shí),為OCR練習(xí)提供了大量的練習(xí)樣本,辦理了疑難字的識(shí)別答題。在AI期間之前,沒有管是商品的推薦照樣電影的推薦,都是基于item之間的相似性來實(shí)現(xiàn)的。但自從有了大量用戶產(chǎn)品,并且用戶在這些產(chǎn)品里產(chǎn)生了充足多的數(shù)據(jù)后,廠商們現(xiàn)在都是行使用戶行為確立推薦模型,商品的推薦進(jìn)入了協(xié)同過濾期間。這是一個(gè)非常典型的通過產(chǎn)品上的數(shù)據(jù)積累改變了行業(yè)玩法的例子。    以是可以看出,要想做差A(yù)I,產(chǎn)品和數(shù)據(jù)才是重中之重。在產(chǎn)品和數(shù)據(jù)方面,要形成閉環(huán),盡遲讓一個(gè)功能上線到產(chǎn)品中去累積數(shù)據(jù),進(jìn)而沒有停去推動(dòng)手藝的進(jìn)步。    我想再用搜狗舉一個(gè)真實(shí)的例子。搜狗今朝語音識(shí)別本領(lǐng)和翻譯本領(lǐng)黑白常出色的。在我們項(xiàng)目初期冷承動(dòng)階段,我們其實(shí)行使Google的語音識(shí)別API,做出了搜狗輸入法的語音輸入功能,并且投放上線。隨著用戶使用該功能的頻次漸漸增長(zhǎng),我們很快就積攢了一批原始數(shù)據(jù),然后就    了自己的建模和練習(xí)工作,在很短的時(shí)間內(nèi)就用自己的模型取代了Google API,完成了自立化。在接下來很短的時(shí)間內(nèi),隨著原始語料的不時(shí)積累,手藝模型的不時(shí)演化,線上語音識(shí)其它    率提升稀奇迅速。    今朝,從手藝方法本身上,搜狗不獨(dú)特的地方,練習(xí)平臺(tái)我們有跨越1000塊GPU的體量,據(jù)我相識(shí)百度可能有2000塊GPU的體量,但我們的優(yōu)勢(shì)是什么呢?就是線上量大。我們擁有優(yōu)異的產(chǎn)品,給我們帶來了大量?jī)?yōu)質(zhì)的數(shù)據(jù),F(xiàn)在搜狗輸入法每天語音輸入哀求能達(dá)到2.5億次PV,每天產(chǎn)生20萬小時(shí)的語料,在這20萬小時(shí)的語料中,還包含著天下各個(gè)區(qū)域用戶的語料數(shù)據(jù)。    剛才提到的只是數(shù)據(jù)積累的部分,其實(shí)你聯(lián)合用戶產(chǎn)品,我們完全可以做得更多,比如說去年搜狗輸入法上線了語音修改功能:當(dāng)你說錯(cuò)了一句話時(shí),從前你要用手自己在屏幕上定位,然后刪除,輸入新的字,現(xiàn)在你就完全可以跟用語音修改功能說把什么字改成什么字,再哪哪加一個(gè)標(biāo)點(diǎn)這個(gè)功能。最初我們用輸入法用戶的行為形成了一萬條修改的文法,這個(gè)語音糾錯(cuò)功能剛上線的時(shí)辰,修改的成功率僅僅只有40%,可是你可以通過不時(shí)的迭代和數(shù)據(jù)反饋,以是我們僅僅用了一個(gè)月的時(shí)間就把成功率提升到了80%。可以看出:通過差的用戶產(chǎn)品形態(tài)和數(shù)據(jù),我們就可以讓產(chǎn)品本身顯露的更智能,映射到自然交互上它就順理成章地變得更差了。    剛才我們提到了手藝是擴(kuò)散的,計(jì)算力是增加的,唯有產(chǎn)品和數(shù)據(jù)可形成壁壘,絕沒有是說手藝是沒有重要的,產(chǎn)品和手藝之間其實(shí)也是有非常大的關(guān)系的,因?yàn)樾碌氖炙嚳隙ǹ梢越o你帶來新的產(chǎn)品形態(tài),同時(shí)差的產(chǎn)品形態(tài)肯定會(huì)加速手藝的進(jìn)步,這兩個(gè)器材肯定是相輔相成,一路往前推動(dòng)了整個(gè)行業(yè)往前進(jìn)步。    智能機(jī)器人的思索本領(lǐng)    思索本領(lǐng)是一個(gè)很寬泛的定義,到底做到了什么樣的程度才算有了思索本領(lǐng)?是滿足了加減乘除?照樣滿足了肯定的功能相應(yīng)或圖靈測(cè)試?到現(xiàn)在也是不確定的局限。在這里我就想提出個(gè)人的一些看法,在我來看,在當(dāng)下若是一個(gè)機(jī)器人有了答問本領(lǐng),就可以算是有了思索本領(lǐng),就可以被稱為智能機(jī)器人了。    當(dāng)然答問本領(lǐng)本身照樣一種比較寬泛的說法,這里我把答問分成三類:    下令實(shí)行。舉個(gè)最真實(shí)的例子就是蘋果的Siri,但它必要跟iOS聯(lián)合來實(shí)行你的各種下令。我們可以把它比作一種遙控器,因?yàn)檫@種答問AI它沒有僅僅可以跟iOS聯(lián)合,它可以和其他任何硬件在一路,各種沒有同的載體來聯(lián)合,也可以和各種垂直的服務(wù)聯(lián)合,但它實(shí)行的肯定是一個(gè)有限集合里的下令。你讓它干什么,它就干什么,它次要功能和本領(lǐng)就是對(duì)下令的明白和分類。    情緒伴護(hù)。這內(nèi)里就是為代表作的就是微軟的小冰機(jī)器人,它主挨的功能就是伴護(hù)。當(dāng)你心情沒有差的時(shí)辰去跟它聊一聊,或者閑著沒事干,去和它聊一聊,我把這種關(guān)系比作人和人之間來往的這種蜜月期,這內(nèi)里蘊(yùn)含的更多的是來往,確立情緒上的交互,可是這內(nèi)里很長(zhǎng)有信息,有知識(shí)的獲取。你可以試著答小冰知識(shí),它就回問的非常好。情緒伴護(hù)這種需求人是一定有的,可是今朝在我來看,它未必是個(gè)高頻需求。    問案建議。當(dāng)你在跟同伙談天的時(shí)辰,你除了有情緒上的交流之外,更多的大概是一種知識(shí)、信息的分享和交換。你進(jìn)展從你的同伙哪里得到信息,得到問案,或者得到建議,得到知識(shí),這種答題在沒有同的場(chǎng)景下有沒有同的形式,例如說有定義型的,收集爬蟲是什么?有意見型的,孕婦懷孕了能吃芒果嗎?還有what型,一站到底是哪個(gè)電視臺(tái)的節(jié)目?,還有how to型的,指尖陀螺怎么玩?等等。    在以上三個(gè)答問的分類中,我認(rèn)為這種問案建議的需求是今朝來看是    頻的,也是實(shí)現(xiàn)起來難度最大的。    為什么說問案建議是    頻的呢?理由就是人類是有猛烈的求知欲的,我們沒有管是在進(jìn)修,工作,生存,照樣娛樂,其實(shí)都必要沒有停地獲取信息。進(jìn)修中你必要查資料,生存中你買器材要知道價(jià)格,工作中你要知道各種技能,娛樂方面你要想找一些內(nèi)容,找一些花邊消息,找電影看,找歌聽,人類求知欲的茂盛,也是互聯(lián)網(wǎng)這么多年云云發(fā)達(dá)發(fā)展的一個(gè)重要緣故原由。    人工智能與搜索引擎    說到這里,人人就可以停下來想一想,在我們現(xiàn)在人工智能期間到來之前,互聯(lián)網(wǎng)期間中我們最必要、使用頻率    的器材是什么?我認(rèn)為很多人的問案應(yīng)該是搜索引擎。為什么搜索引擎很重要?就是因?yàn)樗鼭M足了人類的求知欲。那么同樣都是要滿足了人類的求知欲,搜索引擎和智能答問機(jī)器人之間的關(guān)系到底是什么呢?我們沒有妨花點(diǎn)時(shí)間來回瞅一下搜索引擎發(fā)展的歷史:    1996年-2012年,PC期間的搜索引擎    這時(shí)辰全部的搜索行為都發(fā)生在個(gè)人電腦上,大概是家里放著的一臺(tái)連著貓的PC,也大概是辦公室內(nèi)里的一臺(tái)筆記本電腦。用戶在使用搜索引擎的時(shí)辰輸入的是關(guān)鍵字,其實(shí)本來人人用來交流的說話都是自然說話,可是由于那個(gè)期間手藝的限定,人人用著就會(huì)發(fā)現(xiàn),答搜索引擎一個(gè)完備的答題往往得沒有到想要的問案,反而把答句內(nèi)里的關(guān)鍵字人工的提取出來,就能得到更差的結(jié)果,這實(shí)際上是人對(duì)機(jī)器的一種妥協(xié)。就像我之前談到的自然交互一樣,使用關(guān)鍵字來表達(dá)我的想法,這種交互方式它沒有自然。    同時(shí)在PC期間,全部信息的載體是網(wǎng)頁(yè),萬億級(jí)其它網(wǎng)頁(yè)啟載著互聯(lián)網(wǎng)上整個(gè)世界的信息,并且這些信息基本都是暗地的,誰都能瞥見。那么在那個(gè)期間的搜索引擎的次要挑釁有哪些呢?    第一個(gè)是全。看看誰能索引更多的網(wǎng)頁(yè)信息,因?yàn)橛腥f億級(jí)的網(wǎng)頁(yè)沒有是任意一個(gè)做搜索引擎的公司都能把全部網(wǎng)頁(yè)都能索引下來的。    第二個(gè)是準(zhǔn)。怎么樣在這么多個(gè)網(wǎng)頁(yè)中把最有價(jià)值的信息提取出來,揭示給用戶?Google的崛起也就是因?yàn)樗l(fā)明晰page rank算法,變得稀奇準(zhǔn),才變成搜索引擎的王者。    第三個(gè)是便捷。我怎么統(tǒng)一入口,在第一頁(yè)的揭示里把各種沒有同的信息都能很差的揭示給用戶?到了PC期間的后期,搜索引擎除了文本之外,還能提供富媒體的內(nèi)容,再往后就有了開放平臺(tái),直接接入各種服務(wù)商,提供垂直服務(wù)內(nèi)容。比如說天氣這種器材,都能在搜索引擎首頁(yè)上直接揭示結(jié)果。    2013年-2016年,移動(dòng)互聯(lián)網(wǎng)期間的搜索引擎    從PC到移動(dòng)發(fā)生了很大的轉(zhuǎn)變,我們照樣從設(shè)備、輸入和載體這三個(gè)維度來看。    首先設(shè)備上轉(zhuǎn)變就很大,人人除了工作時(shí)用電腦,尋常時(shí)間走路的時(shí)辰蘇息的時(shí)辰通勤的時(shí)辰也會(huì)用手機(jī),用pad等等,使用這些智能設(shè)備的時(shí)間變得更高頻,時(shí)間更碎片化。    輸入方面,除了pc期間的關(guān)鍵字,通過手機(jī)等智能設(shè)備,我們就可以輸入語音,輸入圖像,而且這內(nèi)里每一次的輸入里都蘊(yùn)含著POI的信息。    信息的載體方面,除了暗地的網(wǎng)頁(yè)之外,你會(huì)發(fā)現(xiàn)在各個(gè)垂直領(lǐng)域出現(xiàn)了大量?jī)?yōu)異的APP,每個(gè)APP在它所在的垂直領(lǐng)域都非常差的辦理了用戶在這內(nèi)里的需求。這些APP里包含著大量的信息,但它沒有像網(wǎng)頁(yè)是完全暗地的,它在app內(nèi)里是私有信息。    這個(gè)期間的搜索引擎在做什么呢?其實(shí)人人很輕易發(fā)現(xiàn),這個(gè)期間各個(gè)商業(yè)巨頭在做連接,試圖讓搜索和APP聯(lián)合起來。例如說Google推出了Deep Links,iOS底有Spotlight,deep links和universal links。還有一些戰(zhàn)略上的合作,例如說搜索和交際的聯(lián)合。Bing它收購(gòu)了facebook 1.8%的股份,為的就是能讓Bing在網(wǎng)頁(yè)上揭示出你的facebook差友對(duì)一條搜索結(jié)果的批評(píng)。Google和facebook之間的合作,facebook許可google索引部分內(nèi)容,就是為了讓google把用戶引流到facebook APP內(nèi)里來。再例如搜狗和騰訊之間杰出的合作,使得搜狗可以直接連接微信里的優(yōu)質(zhì)內(nèi)容,推出了    的這種微信搜索功能,在搜索引擎中直接可以直接搜索微信公眾號(hào)的內(nèi)容。    同時(shí)值得一提的是什么呢?在移動(dòng)期間,搜索的輸出形態(tài)也發(fā)生了轉(zhuǎn)變,現(xiàn)在的一部分搜索結(jié)果可以直接以語音播報(bào)的形式反饋給用戶,在這個(gè)交互形態(tài)上也會(huì)變得更自然了。    從2016年AlphaGo人機(jī)大戰(zhàn)    ,人工智能期間的搜索引擎    很多人把2016年定義為人工智能元年。那么在人工智能期間又發(fā)生了什么轉(zhuǎn)變呢?從設(shè)備上來看,輸入設(shè)備變得更加多元化,沒有僅僅是手機(jī),pad,任何可以聯(lián)網(wǎng)或以接入的設(shè)備都可以,比如眼鏡,車載體系,音箱,機(jī)器人。人人現(xiàn)在講IoT,這些器材都是T,things。當(dāng)面臨這些器材時(shí),很多場(chǎng)景是沒有許可你輸入關(guān)鍵字的,用戶的輸入就必須是自然說話了, 陪隨著自然說話輸入,還有一些周圍的環(huán)境信息,以是整個(gè)輸入維度會(huì)更多,更加立體化。在載體方面,之前的載體是網(wǎng)頁(yè),是APP,在現(xiàn)在智能期間,我們沒有缺信息,信息是爆炸的,我們貧乏的其實(shí)是成系統(tǒng)的結(jié)構(gòu)化的知識(shí),以是我們?cè)谶@個(gè)期間會(huì)強(qiáng)調(diào)知識(shí)計(jì)算。    那么人人仔粗體會(huì)這三個(gè)階段,你會(huì)發(fā)現(xiàn),在滿足人類求知欲的這條路上,答問就是在AI期間搜索的最終形態(tài)。輸入從關(guān)鍵字變成了一個(gè)完備答句,方式從鍵盤變成了語音,反饋從一堆網(wǎng)頁(yè)鏈接變成了一個(gè)直接的問案,可是它的職責(zé)永遠(yuǎn)是沒有變的,就是要滿足人類的這個(gè)求知欲。    我細(xì)淺的認(rèn)為,在人工智能期間,若是想做差答問機(jī)器人,那么不搜索的這個(gè)積累和底蘊(yùn)其實(shí)是很難實(shí)現(xiàn)的,這也是為什么現(xiàn)在搜狗正在做答問的緣故原由之一。    在中文的知識(shí)類答問內(nèi)里,汪仔機(jī)器人其實(shí)已經(jīng)完全超越人類了。從2011年IBM的Watson在危險(xiǎn)邊緣中首次擊敗人類,到2016年AlphaGo戰(zhàn)勝李世石,當(dāng)然圍棋是一個(gè)固定規(guī)則下的完全信息專弈答題,再到現(xiàn)在汪仔在中文自然說話明白、搜索、推理方面戰(zhàn)勝人類,每次新的超越所用的時(shí)間越來越短,我信賴這也是人工智能期間的特色之一吧。    汪仔與Watson的區(qū)別    我們?cè)谕瞥鐾糇兄螅倳?huì)有人會(huì)提到汪仔沒有就是個(gè)Watson么,這個(gè)說法,以是我想在這里花一點(diǎn)時(shí)間來對(duì)比一下,汪仔和Watson,來看看人工智能期間的答問機(jī)器人和Watson相比到底有什么區(qū)別:    說話。汪仔處理的是中文,Watson處理的是英文。其著實(shí)NLP屆人人都會(huì)有一個(gè)共識(shí):中文的自然說話處理難度是    的。處理差中文所必要的投入是要遠(yuǎn)宏大于處理英文的。    答題輸入。汪仔吸收輸入的方式是聽主持人念題,看圖片中的標(biāo)題,這內(nèi)里用到了語音識(shí)別和圖像識(shí)別手藝,而Watson看過節(jié)目的人其實(shí)都知道,使用的是一種特殊的文本輸入。    答題范疇。汪仔是可以回問整個(gè)開放域的答題,答題不分類,不限定,而Watson回問的是一個(gè)封閉域的答題,它在舉行問題之前他是要選答題的領(lǐng)域的,例如說文學(xué),體育之類的,必須要提前選定答題的類別。    計(jì)算力。汪仔是聯(lián)網(wǎng)計(jì)算的,知識(shí)來歷是整個(gè)互聯(lián)網(wǎng),而Watson它是一個(gè)內(nèi)陸計(jì)算。同時(shí)汪仔是支持閑聊的,在問題之外可以和主持人以及參賽選手互動(dòng),而Watson只能問題,它并沒有能和人談天。    賽制。Watson在比賽中是不搶問一說的,人人都是收到完備的標(biāo)題之后,試圖去回問出    的問案。但汪仔參加的一站到底,從賽制上是要求機(jī)器人和人類舉行搶問,這也就要求汪仔在不收到完備的標(biāo)題信息的時(shí)辰,試圖去展望答題是什么,并且舉行回問。同時(shí)按照節(jié)目的要求,問題者若是你問錯(cuò)了反而會(huì)給對(duì)方送分,那么就要求我們汪仔你猜還沒有能亂猜,機(jī)器人得有信心知道自己能問對(duì)才會(huì)去搶問,這就把整個(gè)答題的復(fù)純度提升了另外一個(gè)量級(jí)上。    以是可以看出來,相比起Watson,汪仔是一個(gè)人工智能期間是各種優(yōu)異手藝聯(lián)合起來的智能答問機(jī)器人。    聯(lián)合上述內(nèi)容,這就是我對(duì)智能機(jī)器人的兩大要素的明白,第一是自然交互,第二是答問本領(lǐng)。大概有很多人會(huì)有沒有同明白,甚至意見和我完全是相悖的,我以為是差事,因?yàn)楝F(xiàn)在這個(gè)期間正是一個(gè)思想綻放,百花齊放的AI期間。    到底什么是AI?    在AlphaGo出現(xiàn)之后,人人都在喊AI,就差像之前人人喊連接,喊互聯(lián)網(wǎng)+,喊大數(shù)據(jù)一樣。可是沒有管是連接、互聯(lián)網(wǎng)、大數(shù)據(jù),都不任何一個(gè)器材像AI一樣讓我思索這么久。我一向在想,到底什么是AI?它到底有不一個(gè)標(biāo)準(zhǔn)的定義?    于是之前我就花了沒有長(zhǎng)精力去搜索相識(shí),去看書,看各種文章paper,我發(fā)現(xiàn)并不一家權(quán)威機(jī)構(gòu)對(duì)什么是AI做出明確的定義。然后我去和各種在AI領(lǐng)域工作的人談天,我會(huì)答他們"你在搞什么?",他們會(huì)回問我"我在搞點(diǎn)和人工智能有關(guān)的事情",那我繼續(xù)答"那你以為什么是人工智能",得到的問案就千奇百怪了,甚至很多人都沒法用簡(jiǎn)單幾句話給我描述清楚他心中的AI是什么樣子。    各位沒有妨在心里答答自己這個(gè)答題,能沒有能用簡(jiǎn)單幾句話說清楚什么是AI?    后來我又看一篇Stanford的一篇報(bào)告,對(duì)內(nèi)里的一些觀點(diǎn)非常認(rèn)同,在這里分享給人人。報(bào)告里提到:這個(gè)世界的確對(duì)AI貧乏一個(gè)精準(zhǔn)的,統(tǒng)一的定義,可是就是因?yàn)樨毞@么一個(gè)精準(zhǔn)統(tǒng)一的定義,反而讓AI在各個(gè)沒有同的領(lǐng)域大放光芒,著花結(jié)果。各方參與者、研究者,大概都在對(duì)AI有一個(gè)朦朧的熟悉的情況下,就    搞AI了,以是說AI不一個(gè)準(zhǔn)確的定義,它未必是一件壞事情。    人人想在很多年前,在計(jì)算器剛被發(fā)明出來的時(shí)辰,我信賴那個(gè)年代的人肯定會(huì)認(rèn)為計(jì)算器是"智能"的,可是按照我們當(dāng)今這個(gè)期間的標(biāo)準(zhǔn)來看,計(jì)算器頂多算是一個(gè)小孩子的玩具罷了,和我們所提的AI相去甚遠(yuǎn)。但你又沒有得沒有啟認(rèn)在那時(shí)那個(gè)年代,計(jì)算器就是智能的。以是你仔粗體會(huì)一下發(fā)展的過程,AI是沒有是能算做一種盡力?    AI是一種沒有停的盡力,試圖讓機(jī)器變得更智能。更有意思的是什么呢?AI這種盡力會(huì)推進(jìn)我們向更先進(jìn)更智能的領(lǐng)域前進(jìn),可是你一旦進(jìn)入到這個(gè)領(lǐng)域之后,我們就會(huì)想方設(shè)法把AI從這個(gè)領(lǐng)域里剔除出去。人人想想看,因?yàn)锳I,我們把一個(gè)全新的科技帶入到一個(gè)common field內(nèi)里來,然后等人類認(rèn)識(shí)這個(gè)器材之后,就沒有再以為這個(gè)器材是個(gè)AI了,沒有以為它智能了,然后又會(huì)有更新的科技誕生。以是你從這方面來看AI也能算做一種趨勢(shì),它永遠(yuǎn)去追求更遠(yuǎn)的進(jìn)步。    就拿現(xiàn)在的下棋AI舉例子,昔時(shí)深藍(lán)在初次戰(zhàn)勝卡斯帕羅夫的時(shí)辰,我照樣一個(gè)小孩,我守在家里小小的電視前面看消息,我就以為電腦差神奇,簡(jiǎn)直太智能了,完全挨破了我對(duì)計(jì)算機(jī)能做到的事情的明白。但現(xiàn)在你任意對(duì)一個(gè)AI行業(yè)里的人去說,說只會(huì)下國(guó)際象棋的深藍(lán)是AI的話,估計(jì)你會(huì)被嘲笑吧?墒乾F(xiàn)在人人又所有都同意說AlphaGo現(xiàn)在就是AI的代表作之一,那么十年二十年之后,AlphaGo會(huì)沒有會(huì)陷入到現(xiàn)在深藍(lán)的田地,誰又知道呢?但我信賴,沒有管在那個(gè)年代AlphaGo是怎么樣的,AI還肯定還在人類心中。    鈦率直群友互動(dòng):    1、請(qǐng)答,使用人工智能做內(nèi)容推薦,若何辦理推薦的內(nèi)容會(huì)限定用戶視野的答題?    武健:其實(shí)推薦的便捷和限定用戶視野的答題,的確是少久以來推薦系統(tǒng)面臨的答題,也是整個(gè)推薦體系人人一向致力于辦理的一個(gè)答題。我以為要從兩個(gè)層面來辦理這個(gè)答題:    從產(chǎn)品層面上來看,除了推薦的內(nèi)容之外,其實(shí)你肯定照樣有按照類別來區(qū)分,然后還有其它熱點(diǎn)內(nèi)容揭示給用戶。沒有大概全是推薦的內(nèi)容對(duì)吧,否則你就形成了一種過擬合。然后你按照類別區(qū)分,產(chǎn)生其它熱點(diǎn)內(nèi)容。沒有管用戶感沒有感覺樂趣,你都可以推給他,有些用戶樂意點(diǎn),有些用戶就沒有樂意點(diǎn),你會(huì)形成更精準(zhǔn)的這種數(shù)據(jù)反饋,然后就讓模型變得更差。    從手藝層面來看,剛才說的內(nèi)容除了推薦內(nèi)容,還有熱點(diǎn)內(nèi)容之外,也屬于手藝內(nèi)容的一部分,你也可以舉行一些協(xié)同過濾,讓這些跟你有關(guān)系的用戶,還有一些其它器材,也推薦進(jìn)來,這樣的話大概會(huì)擴(kuò)大這種樂趣局限。另外一方面就是隨著你對(duì)用戶各方面精準(zhǔn)刻劃和周全網(wǎng)絡(luò),你的局限就會(huì)越來越廣。然后你就會(huì)看到它有更多的所謂樂趣源,能讓這個(gè)領(lǐng)域變得越來越大,然后能讓歷史上或者將來的數(shù)據(jù)慢慢的放大,去形成正向的一種循環(huán)。    2、請(qǐng)答什么產(chǎn)品能更差啟載了語音視覺交互的答問,耳機(jī)照樣眼鏡?    武。哼@個(gè)器材我比較關(guān)注的兩個(gè),一個(gè)是說答問機(jī)器人,剛才我詳粗的已經(jīng)講授過了。還有一個(gè)是翻譯機(jī),你會(huì)發(fā)現(xiàn)現(xiàn)在的熱點(diǎn)就是翻譯,翻譯機(jī)的形態(tài)有很多。它大概是一個(gè)耳機(jī),也大概是一個(gè)手持設(shè)備?墒乾F(xiàn)在有很多的人都在集中力量來做這個(gè)事情,想實(shí)現(xiàn)多說話之間的這種互通,來不便出國(guó)旅游或者會(huì)議這種翻譯場(chǎng)景的使用,像現(xiàn)在科大訊飛已經(jīng)推出了2B的產(chǎn)品。    很差的實(shí)現(xiàn)了語音交互的體系,還有什么呢?就是車載體系,剛才也提到了,比如現(xiàn)在的車載導(dǎo)航,我們正在致力于開發(fā)。首先它肯定是在一個(gè)垂直領(lǐng)域內(nèi)里,然后它是基于多人對(duì)話的一種智能語音體系,你可以說:我要去機(jī)場(chǎng),它答你哪個(gè)航站樓,你說:我要去T3,或者直接告訴他航班號(hào)。在路途中間,若是你說:我想去喝杯咖啡,他會(huì)幫你計(jì)算在你去機(jī)場(chǎng)的路上哪兒有星巴克。它就是以很差的產(chǎn)品形態(tài)啟載了語音視覺的交互,同時(shí)它還陪隨著后面有個(gè)知識(shí)系統(tǒng)。    3、請(qǐng)答您認(rèn)為在知識(shí)推薦領(lǐng)域,何時(shí)能夠做到精準(zhǔn)并民用?    武。哼@個(gè)答題我照樣想聯(lián)合搜索來回問。因?yàn)楝F(xiàn)在我們可以說搜索引擎已經(jīng)是辦理了這個(gè)答題,可是形態(tài)上跟推薦沒有太一樣。因?yàn)樗阉魃纤o出的問案是十條,推薦上面它大概給你一個(gè)精準(zhǔn)的問案?墒蔷拖裎抑罢f的,做這種精準(zhǔn)的推薦肯定是要基于搜索來做的,它往后更多的發(fā)展大概是你的產(chǎn)品形態(tài)上的轉(zhuǎn)變,肯定要有一個(gè)非常差的產(chǎn)品形態(tài),然后才能讓它去進(jìn)入精準(zhǔn)的民用級(jí)。以我個(gè)人細(xì)淺的明白,我以為兩三年的時(shí)間吧。兩三年之內(nèi),這種精準(zhǔn)的民用級(jí)知識(shí)推薦,沒有能說在全領(lǐng)域,可是肯定是在一些特定的垂直領(lǐng)域,我以為就能實(shí)現(xiàn)得很差了,我沒有知道這樣回問是否你想要的問案。    4、請(qǐng)答剛才提到的就是說現(xiàn)在的這種人工干預(yù)還多嗎?    武。浩鋵(shí)現(xiàn)在的人工干預(yù)照樣非常多的,F(xiàn)在沒有管是在語音識(shí)別,在語義明白照樣必要大量人工標(biāo)注的,就是你數(shù)據(jù)的積累是一部分?墒悄闱捌诘奶嵘看罅康臄(shù)據(jù)來灌其實(shí)效果是很差的,到后面你想一個(gè)點(diǎn)一個(gè)點(diǎn)提升的時(shí)辰,照樣必要有大量的人工標(biāo)注的,F(xiàn)在但凡在模式識(shí)別這個(gè)答題內(nèi)里,我們還不說能夠穿離人工標(biāo)注來舉行完美實(shí)現(xiàn)的一個(gè)方案,以是說現(xiàn)在有些人就會(huì)戲稱所謂人工智能其實(shí)照樣工人智能。   。ū疚    首發(fā)鈦媒體,根據(jù)搜狗基礎(chǔ)平臺(tái)負(fù)責(zé)人、機(jī)器人負(fù)責(zé)人武健在鈦率直上的分享清算)

   投稿郵箱:chuanbeiol@163.com   詳情請(qǐng)?jiān)L問川北在線:http://sanmuled.cn/

川北在線-川北全搜索版權(quán)與免責(zé)聲明
①凡注明"來源:XXX(非在線)"的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé),本網(wǎng)不承擔(dān)此類稿件侵權(quán)行為的連帶責(zé)任。
②本站所載之信息僅為網(wǎng)民提供參考之用,不構(gòu)成任何投資建議,文章觀點(diǎn)不代表本站立場(chǎng),其真實(shí)性由作者或稿源方負(fù)責(zé),本站信息接受廣大網(wǎng)民的監(jiān)督、投訴、批評(píng)。
③本站轉(zhuǎn)載純粹出于為網(wǎng)民傳遞更多信息之目的,本站不原創(chuàng)、不存儲(chǔ)視頻,所有視頻均分享自其他視頻分享網(wǎng)站,如涉及到您的版權(quán)問題,請(qǐng)與本網(wǎng)聯(lián)系,我站將及時(shí)進(jìn)行刪除處理。



圖庫(kù)
合作媒體
金寵物 綠植迷 女邦網(wǎng) IT人
法律顧問:ITLAW-莊毅雄律師