電競體談 | AI崛起,凡人退散?言之過早了
乏善可陳的“VR年”過后,全球都將AI看作IT行業的新風口。和AI一樣,電競也依托于虛擬網絡,這兩者存在非常巨大的互融空間。電競是AI的最佳試驗場,而AI的發展也會極大改變電競行業的面貌。但僅從TI7的solo對抗而言,說AI戰勝Dendi是劃時代的勝利還為時過早。
AI有沒有那么神奇
TI7期間,久違的Dendi出現在比賽現場。不過他過來并不是參加正式比賽,而是跟AI程序打了兩場solo友誼賽,0比2慘敗。吊打Dendi的AI來自OpenAI公司,據說明年TI8它們就要組團跟人類選手打5v5比賽了。
整個2017年,AI被視為IT行業風口,包括谷歌、騰訊、百度都在發力。OpenAI亮相TI7,很大程度上是在蹭熱點,solo戰勝Dendi說明不了太多。
人工智能?還早的很呢!
OpenAI的投資人包括了埃隆·馬斯克(Elon Musk),他麾下的特斯拉被視為世界上最好的電動汽車。他說:“OpenAI首次在電競比賽中擊敗了世界上最棒的選手,這比在象棋和圍棋那種傳統桌面游戲的范疇要復雜得多。”
不過這年頭,造電動汽車的不僅有馬斯克,也有賈躍亭。他們對自己產品的褒獎,不僅要聽其言,更要觀其行。
馬斯克這句話就有點偏離事實。
首先,這只是電競solo比賽,不是正式電競比賽。而且Dendi老司機現在是世界上最棒的選手嗎?剛拿到TI7冠軍的miracle笑而不語。
其次,舞臺上Dendi確實被OpenAI打的灰頭土臉,但隨后幾天各路玩家就用野路子教AI做電腦了。前Navi選手Pajkatt仙靈火大魔棒出門,直接懟翻;有人風靈出門直接繞后勾兵,AI不知所措;還有人出門不學“死靈支配”學“影壓”,直接越塔擊殺正在專心卡兵的AI……
可見這個AI離完美還遠得很,微操無敵,大局觀堪憂,很容易被人類玩家針對。
第三,電競和象棋、圍棋,不能膚淺地說誰更復雜。
人類跟電腦是兩種模式,人類擅長擬人化抽象化,機器擅長數據化規模化。象棋、圍棋誕生于人類手下,但它的思維模式其實相當數據化。棋類游戲規則很明確,而且是回合制,所以AI比較容易取得算法上的突破。電競游戲誕生于電腦平臺,但它的思維模式卻非常擬人化,做AI算法的難度是相當高的。
簡單說,人類下棋易學難精,AI打電競也是易學難精,并不存在誰高誰下。
棋類AI與電競AI
前陣子,谷歌DeepMind開發的阿爾法狗完勝李世石和柯潔,被看做是AI的里程碑,其引發的轟動比早年深藍戰勝國際象棋第一人卡斯帕羅夫大得多。
為什么呢?
棋類AI的思路較為明確:利用電腦超高運算能力,把所有能走棋的路徑都走一遍,選擇勝率最高的路徑,這叫“樹搜索”。
和圍棋比,象棋變化相對較少。根據手頭查閱的資料,國際象棋窮舉變化數大概10的46次方,“樹搜索”比較容易成功。但圍棋窮舉變化數為10的172次方,比宇宙所有原子的總數還高幾十個數量級,也大大超越了當前計算機的窮舉能力。為此,DeepMind為阿爾法狗引入了學習和場上形勢判斷機制。它自己左右互搏,每天下幾十萬盤棋,每一盤棋都成為之后的經驗。從結果看,DeepMind的算法很完美,阿爾法狗在棋盤上的學習能力是驚人的。
從單純暴力窮舉,到深度學習,這是了不起的進步。
當然,DeepMind的學習量也靠谷歌計算機強大的性能實現的。據說阿爾法狗有超過170個GPU,粗略估計有超過800萬核并行運算。
電競游戲AI設計,并不能完全照搬棋類AI。
初一看,電競游戲計算量比不上圍棋。但圍棋的決策機制是相當簡單的,只需要選擇一個點位下子就行,而電競游戲決策機制非常復雜(走位、攻擊、正補、反補、施法、使用物品、搶神符、開霧、打roshan),且存在非常多因果邏輯不明確元素。單個決策元素而論,電競游戲的變化數遠遠少于圍棋,但所有元素疊加在一起取乘法時整體變化數驟然膨脹。從這次solo比賽也能看出來,野路子玩家斷兵時,AI不知所措。說明在AI之前左右互搏學習過程中,并未遍歷到這一情形。
最關鍵的一點,圍棋是回合制,電競游戲卻是即時制。
在圍棋比賽中,AI落子前有足夠長的時間去進行“樹搜索”。而電競比賽中,形勢瞬間萬變,AI決策時間勢必要縮短。OpenAI的細節不得而知,據我猜測,AI的決策一定是離散化的,而且決策時間間隔與人類的APM差不多。證據是OpenAI官方說法“AI 的每分鐘操作數相當于人類玩家的平均水平”。按照人類平均APM為150計算,AI的決策時間差不多為70ms,只有圍棋比賽的千分之一到萬分之一。短短70ms中要算清場上情勢,對各種可能選擇進行優劣判斷,難度太大。要想進行DeepMind那樣的樹搜索,OpenAI的性能必須在DeepMind的萬倍以上,這顯然不可能。
到這里,我們似乎可以理解官方所說的“該 BOT 通過自學從頭學習 DOTA2,但并沒有使用模仿學習或樹搜索”。
非不為也,實不能也。
從TI7的表現來看OpenAI的學習才剛剛開始,很多局面根本應付不來。這只是solo,正式5v5比賽的復雜度又上一個量級,對AI將是更大的挑戰。
據說OpenAI明年TI8會跟明星選手們打一場5v5,我建議:人類選手要想提升勝率,拼微操和團戰是不行的,野路子(增加AI決策的變數)才是王道,多換線,多開霧,多插眼,多使用隱身英雄,多使用推推等位移道具。
按圖靈的定義,如果一臺機器能與人類進行交互,而人類沒辦法分清楚它到底是機器還是人,這才是成功的AI。從這個角度看,五個AI打五個人類也不算稀奇,AI與人類的搭配才是終極考驗,不過這已經是后話了。
成熟的AI對電競來說值得期待
就開發AI而言,電競游戲是最好的試驗品,因為它兼顧數據化基礎和人性化表象。游戲里的AI即便失敗,造成的損失也比較有限。除了OpenAI,谷歌也在跟暴雪展開合作,用DeepMind開發《星際爭霸2》的AI,這將給現實中的AI研究積累非常寶貴的經驗。
盡管電競AI還處于起步階段,但未來的潛力不容小覷。數年前我們不也認為AI不可能學會圍棋的么?IT行業變化太快,永遠不要說“不可能”。
最后遐想一下,如果電競游戲里的角色有AI,游戲體驗將有革命性的提升,這或許將給游戲開發開拓新的領域。AI成熟后,AI代打必然泛濫,未來的電競游戲天梯或許也將失去意義。AI配合VR技術,未來人類會不會真的可能愛上游戲中的異性角色?不能想,太可怕了……