喵咪视频直播破解_娇妻互换享受高潮,亚洲av综合网,黄色软件有哪些,欧洲色综合天天在线影院

面對(duì)谷歌圍棋AI 人類最后的智力驕傲崩塌了?

謝銳01-28 15:01

1月28日,圍棋圈和人工智能圈都被一條題為《面對(duì)谷歌圍棋AI,人類最后的智力驕傲崩塌了》的文章刷屏,這篇文章爆出了一條令人無比震驚的消息:Google開發(fā)的一款名為“阿爾法圍棋”(AlphaGo)的人工智能,在沒有任何讓子的情況下以5比0完勝歐洲冠軍、職業(yè)圍棋二段樊麾。

這篇文章寫道,“1997年,國際象棋AI第一次打敗頂尖的人類;2006年,人類最后一次打敗頂尖的國際象棋AI。歐美傳統(tǒng)里的頂級(jí)人類智力試金石,在電腦面前終于一敗涂地,應(yīng)了四十多年前計(jì)算機(jī)科學(xué)家的預(yù)言。至少還有東方,人們自我安慰道。圍棋AI長(zhǎng)期以來舉步維艱,頂級(jí)AI甚至不能打敗稍強(qiáng)的業(yè)余選手。這似乎也合情合理:國際象棋中,平均每回合有35種可能,一盤棋可以有80回合;相比之下,圍棋每回合有250種可能,一盤棋可以長(zhǎng)達(dá)150回合。這一巨大的數(shù)目,足以令任何蠻力窮舉者望而卻步——而人類,我們相信,可以憑借某種難以復(fù)制的算法跳過蠻力,一眼看到棋盤的本質(zhì)。”

在2015年11月北京舉行的人工智能圍棋賽中,獲得冠軍的電腦軟件在與職業(yè)七段棋手連笑的讓五子局中敗下陣來,當(dāng)時(shí)普遍的觀點(diǎn)是,人工智能在圍棋領(lǐng)域最高水平只是業(yè)余4段左右,要想達(dá)到職業(yè)高手的高度,還有漫長(zhǎng)的路要走。

但不曾想,僅僅兩個(gè)月的時(shí)間里,人工智能界就爆出這樣一條震撼性的消息來;而且,這還是2015年10月進(jìn)行的對(duì)局,谷歌公司將此消息封鎖,直至今日才公布開來。

樊麾生于80年代,在中國打上職業(yè)二段后赴法留學(xué),后來成為法國國家圍棋隊(duì)總教練,已經(jīng)連續(xù)三年贏得歐洲圍棋冠軍的稱號(hào)。在他對(duì)阿爾法圍棋5連敗的消息公開后,他坦言,雖然從幾盤棋譜上AI表現(xiàn)出的水平不是特別驚人,但在當(dāng)時(shí)的局面下正好可以擊敗他。最令他對(duì)局時(shí)感到絕望的是,不能出現(xiàn)失誤。第二局他的局面本來極好,但由于一個(gè)隨手被對(duì)方抓住,后面竟然就沒有了機(jī)會(huì)。之后他自己的心態(tài)發(fā)生了變化,而且自己棋上的弱點(diǎn)被AI完全掌握。

阿爾法圍棋有多強(qiáng),這里有一組勝負(fù)結(jié)果可以參考:研究者讓AlphaGo與其他的圍棋AI進(jìn)行較量,在總計(jì)495局中只輸了一局,勝率是99.8%。它甚至嘗試了讓四子對(duì)陣Crazy Stone、Zen和Pachi三個(gè)比較有名的先進(jìn)的圍棋AI,勝率分別是77%、86%和99%,由此可見AlphaGo有多強(qiáng)大。這次阿爾法圍棋在與人類職業(yè)高手對(duì)弈中取得5戰(zhàn)全勝的戰(zhàn)績(jī),已經(jīng)超出了之前所有人工智能在圍棋領(lǐng)域的成就。樊麾本人也說:“雖然我的水平不是特別高,但對(duì)他5比0的比分就算放在職業(yè)棋界,恐怕也沒有太多人能絕對(duì)做到。”

計(jì)算圍棋是個(gè)極其復(fù)雜的問題,比國際象棋要困難得多。圍棋最大有3^361 種局面,大致的體量是10^170,而已經(jīng)觀測(cè)到的宇宙中,原子的數(shù)量才10^80。國際象棋最大只有2^155種局面,稱為香農(nóng)數(shù),大致是10^47。面對(duì)任何棋類,一種直觀又偷懶的思路是暴力列舉所有能贏的方案,這些方案會(huì)形成一個(gè)樹形地圖。AI只要根據(jù)這個(gè)地圖下棋就能永遠(yuǎn)勝利。然而,圍棋一盤大約要下150步,每一步有250種可選的下法,所以粗略來說,要是AI用暴力列舉所有情況的方式,圍棋需要計(jì)算250^150種情況,大致是10^360。相對(duì)的,國際象棋每盤大約80步,每一步有35種可選下法,所以只要算35^80種情況,大概是10^124。無論如何,枚舉所有情況的方法不可行,所以研究者們需要用巧妙的方法來解決問題,他們選擇了模仿人類大師的下棋方式。

研究者們祭出了終極殺器——“深度學(xué)習(xí)”(Deep Learning) 。深度學(xué)習(xí)是目前人工智能領(lǐng)域中最熱門的科目,它能完成筆跡識(shí)別,面部識(shí)別,駕駛自動(dòng)汽車,自然語言處理,識(shí)別聲音,分析生物信息數(shù)據(jù)等非常復(fù)雜的任務(wù)。阿爾法圍棋的核心是兩種不同的深度神經(jīng)網(wǎng)絡(luò)。“策略網(wǎng)絡(luò)”(policy network)和 “值網(wǎng)絡(luò)”(value network)。它們的任務(wù)在于合作“挑選”出那些比較有前途的棋步,拋棄明顯的差棋,從而將計(jì)算量控制在計(jì)算機(jī)可以完成的范圍里,本質(zhì)上和人類棋手所做的一樣。

人類在下棋時(shí)有一個(gè)劣勢(shì),在長(zhǎng)時(shí)間比賽后,他們會(huì)犯錯(cuò),但機(jī)器不會(huì)。而且人類或許一年能玩1000局,但機(jī)器一天就能玩100萬局。所以AlphaGo只要經(jīng)過了足夠的訓(xùn)練,就能擊敗所有的人類選手。

在2016年3月,阿爾法圍棋將與韓國李世石九段在首爾進(jìn)行一次對(duì)抗賽,獎(jiǎng)金由Google提供的100萬美金。李世石是最近10年中獲得世界冠軍頭銜最多的棋手(14個(gè))。圍棋是最后一個(gè)人類頂尖高手能戰(zhàn)勝AI的棋類游戲。之前有人預(yù)測(cè)說,AI需要再花十幾年才能戰(zhàn)勝人類,所以這場(chǎng)比賽或許會(huì)見證歷史。

AlphaGo  /   樊麾  /   李世石  /   人工智能  /  

熱門評(píng)論

暫無評(píng)論

全部評(píng)論

暫無評(píng)論