你好,歡迎來到川北在線
微信
騰訊微博
新浪微博
圍棋人機大戰(zhàn)一周年:被AlphaGo改變的世界
時間:2017-03-13 12:07   來源:量子位   責任編輯:毛青青

  去年今日,三連敗的李世乭扳回一局。

  然而這一針興奮劑很快失效,隨后李世乭再折一陣,最終以1:4輸給AlphaGo。在圍棋的人機大戰(zhàn)中, 人類選手完敗給人工智能。

  人工智能一戰(zhàn)成名,李世乭留下落寞側(cè)影。為AlphaGo落子的黃士杰一年后回憶說:“當時我代表AlphaGo下棋,必須保持冷靜”。

  從那時起到現(xiàn)在,人類始終生活在一個被AlphaGo改變的世界。

  一年回望

  站在圍棋人機大戰(zhàn)一周年的節(jié)點上,該如何回顧過去、展望未來呢?量子位先把幾個問題拋給創(chuàng)新工場AI工程院副院長王詠剛。

  量子位:一年后再看AlphaGo有何改變?有什么記憶猶新的片段?

  王詠剛:AlphaGo出世一年,其實進入大家視野的是三個版本:5:0擊敗樊麾的內(nèi)測版本,4:1擊敗李世石的版本,以Master網(wǎng)名60:0快棋挑落中日韓高手的版本。三個版本演進脈絡(luò)明顯,每次迭代都有重大升級。

  最震撼的是計算機在人類傳統(tǒng)認為極其玄妙的、電腦無法掌握的“大局觀”上突飛猛進,遠遠將人類選手甩在身后。電腦計算“大局觀”的方式,和人類培養(yǎng)“大局觀”的思路,有根本的差別。人類沒可能在這方面趕上電腦。

  和樊麾對局的棋譜基本上還看不出AlphaGo的大局觀有多強,和李世石對局就下出了聶衛(wèi)平贊不絕口的五路肩沖,到了Master的60局,大局觀體現(xiàn)在兩個地方:

  1)從始至終對局勢的把握,比如第60局古力用AlphaGo的思路對付AlphaGo,把中央撐得很滿,但AlphaGo不緊不慢,總是恰到好處地保持勝勢。

  2)已經(jīng)深刻影響人類對布局的思考,大飛守角之類的變化迅速被人類棋手模仿,這和當年深藍問世后,國際象棋的布局革命是一樣的。

  量子位:過去一年,有什么具體產(chǎn)品或研究,是基于AlphaGo的么?

  王詠剛:AlphaGo用的是AI領(lǐng)域應用非常普遍的算法:深度學習、蒙特卡洛算法、增強學習等。

  從概念上可以說,機器視覺相關(guān)的深度學習技術(shù),包含環(huán)境-決策-反饋的智能系統(tǒng),里面都有AlphaGo的影子。當然,直接的代碼實現(xiàn)層面,肯定沒有復制、粘貼這樣直接借用的關(guān)系,因為AlphaGo的深度學習模型畢竟是圍繞圍棋的特征建立的。

  DeepMind去年發(fā)布的讀唇術(shù)LipNet,與英國國家醫(yī)療服務體系NHS合作推出的醫(yī)療輔助應用Streams,與眼科醫(yī)院合作幫助眼部疾病診斷等等,可以說都是與AlphaGo同源的技術(shù)。

  去年今日,三連敗的李世乭扳回一局。

  量子位:AlphaGo是否已經(jīng)攻克圍棋?未來可提升的空間還有哪些?

  王詠剛:“攻克圍棋”,如果說戰(zhàn)勝人類選手的話,AlphaGo已經(jīng)實現(xiàn)了,而且現(xiàn)在“絕藝”,DeepZen之類的程序?qū)θ祟悇俾室埠芨吡恕?/P>

  未來最多三年必將發(fā)生的是,手機上的本地APP就可以戰(zhàn)勝人類職業(yè)高手,現(xiàn)在熱鬧的網(wǎng)上圍棋對弈平臺都會死掉(因為對手可以輕易用手機作弊),人類圍棋將回歸現(xiàn)澈賽,圍棋培訓講師將更重視普及教育,因為中高級的提高訓練完全可以用機器代練。

  不過,如果說“攻克圍棋”是像計算機可以窮舉西洋跳棋的所有變化那樣,讓電腦成為圍棋“上帝”,這個應該還不大可能,F(xiàn)在AI大部分的招數(shù),還在人類高手可以理解的范疇內(nèi)。AI也有一些可疑的“弱點”,比如官子水平到底如何等等。

  以后AI和AI之間的競賽,應該會不斷促進AI提高(但這種沒有太多商業(yè)利益的事情,有沒有持續(xù)投入是個問題)。人類應該望塵莫及,但可以不斷從AI中學習新的思想。

  不止下棋

  “AlphaGo給大家最大啟發(fā),不是贏棋,而是如何構(gòu)建一個智商超過300的機器”,HTC負責研發(fā)及醫(yī)療的總裁、原Google中國工程院副院長張智威說。

  構(gòu)建的方法有兩個:一是訓練、二是數(shù)據(jù)。張智威最近在清華的一次分享(傳送門)中說,“如果能做好這件事,各位都是億萬富翁。最近兩年,我們每天都在想,哪些領(lǐng)域可以拿到無限的數(shù)據(jù)”。

  而在AAAI Fellow、IEEE Fellow、香港科技大學楊強教授看來,DeepMind在創(chuàng)造AlphaGo的過程中,引入一個新的概念:利用深度學習+強化學習,來判斷現(xiàn)狀和預測未來。這與未來的商業(yè)模式有著明確的關(guān)聯(lián):

  通過對大數(shù)據(jù)的分析,對現(xiàn)實的判斷和對商業(yè)未來走向進行預估。

  楊強還試圖基于AlphaGo歸納出一套人工智能的應用流程:算法的目標是什么?有沒有數(shù)據(jù)?數(shù)據(jù)在哪里?問題的邊界是否清晰?什么叫合理的走法、什么叫犯規(guī)的走法?你的特征在哪里?又如何得到這些特征?是否可以得到一個持續(xù)的反饋?

  但也有人沿著另一條路前進。

  圍棋也好、國際象棋也好、國際跳棋也好,所有這些都是完美信息博弈,F(xiàn)實世界中,不完美信息才是常態(tài),各種看不見的隱藏信息產(chǎn)生了大量的不確定性,而德州撲克代表的就是這種類型的博弈。

  今年初,在德州撲克的人機大戰(zhàn)中,人工智能Libratus擊敗了四位 人類玩家。創(chuàng)造了這個AI的卡內(nèi)基梅隆大學Sandholm教授說,能夠處理不完美信息的AI,未來可以用于商業(yè)談判、網(wǎng)絡(luò)安全、醫(yī)療方案制定等領(lǐng)域。

  人工智能發(fā)展的終極目標,是通用人工智能(AGI)。通用人工智能可以解決任何一個問題。想要實現(xiàn)AGI就得讓人工智能學會解決不確定性問題,這也是德州撲克人機大戰(zhàn)的重大意義之一。

  對于已屆不惑的Demis Hassabis來說,創(chuàng)立DeepMind的目標絕不僅限于創(chuàng)造AlphaGo。過去的一年里,DeepMind還搞出了很多有意思的創(chuàng)新。

  比方說可以模擬任意一種人類聲音的WaveNet;以及與英國國家醫(yī)療服務體系合作,使用人工智能來改善醫(yī)療行業(yè)等。

   投稿郵箱:chuanbeiol@163.com   詳情請訪問川北在線:http://www.sanmuled.cn/

川北在線-川北全搜索版權(quán)與免責聲明
①凡注明"來源:XXX(非在線)"的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和對其真實性負責,本網(wǎng)不承擔此類稿件侵權(quán)行為的連帶責任。
②本站所載之信息僅為網(wǎng)民提供參考之用,不構(gòu)成任何投資建議,文章觀點不代表本站立場,其真實性由作者或稿源方負責,本站信息接受廣大網(wǎng)民的監(jiān)督、投訴、批評。
③本站轉(zhuǎn)載純粹出于為網(wǎng)民傳遞更多信息之目的,本站不原創(chuàng)、不存儲視頻,所有視頻均分享自其他視頻分享網(wǎng)站,如涉及到您的版權(quán)問題,請與本網(wǎng)聯(lián)系,我站將及時進行刪除處理。



圖庫
合作媒體
金寵物 綠植迷
法律顧問:ITLAW-莊毅雄律師