-
日期: 2017-01-05 | 來源: 科學人微信號 | 有0人參與評論 | 字體: 小 中 大
自1月2日起,短短的3天時間內,圍棋AI“Master”已獲60連勝,戰勝了包括柯潔、古力、聶衛平在內的幾乎所有頂尖人類棋手。“棋風怪異,招式狠辣,連戰連勝”, 在我們紛紛猜測這神秘AI來自何處時,昨日21時,Master終於給出了回應。“我就是AlphoGo”。


昨晚,DeepMind官方發布新聞稿,證實AlphaGo歸來。圖片來源:Deepmind.
2016年,DeepMind研制的人工智能程序AlphaGo戰勝圍棋世界冠軍、韓國名將李世乭。那時,人類曾贏下了壹局。不到壹年的時間,AlphaGo變得更快更強,人類卻已潰不成軍。新的AlphoGo有多厲害?Master能否戰無不勝?與AlphoGo相比,Master強在哪裡?科學人邀請多位計算機科學家進行討論,壹起來聊聊這重新歸來的AlphaGo。
天下武功
唯快不破
Master是壹個不折不扣的快棋高手。職業圍棋九段,國家圍棋隊總教練俞斌在“分答”中表示:“Master和我們的頂尖高手下的都是30秒以下的快棋,我們跟它約30秒以上的棋它是不接受的,它這次來好像就是測試快棋的實力的。”
科學人: 為什麼Master只下快棋?會有什麼可能的用意?
張崢(上海紐約大學計算機科學教授):
快慢是相對的,對狗狗系來說人的時鍾太慢。?
余凱(地平線機器人科技創始人兼CEO,前百度研究院副院長):
計算機算法的能力是用求解時間來決定的,能下快棋,說明Ai的算法能力得到了顯著提升。?
俞揚(南京大學副教授,AI專家):
下快棋是很難的,僅說機器壹方,目前的博弈算法都包含有搜索,搜得多看得遠就下得更好,國際象棋的深藍是純靠搜索。AlphaGo壹方面使用了改進的搜索算法,另壹方面引入了深度神經網絡,減少了對搜索量的需求,但是還是要搜。
搜索的弊端就是耗時,因此下得快是對算法博弈的巨大挑戰。
Master在下快棋方面拾分厲害,相較於AlphaGo在技術上肯定有改變,最直接的手段是計算加快,例如使用更新的計算設備。另壹種手段是改進算法,提高深度神經網絡的能力,進壹步減小需要的搜索量,包括:1. 目前已經有壹些性能更好的網絡結構,如ResNet;2. 強化學習的算法得到了改進,如TRPO;3. 強化學習自博弈算法得到了改進,如FSP。
繆文(富士通研發中心研究員,中科院、德國馬普學會計算神經科學博士):快棋對AI算法的影響比較小,計算10秒和計算1分鍾這兩者之間的結果絕大部分可能是壹樣是。而對於人類來說,快棋狀態下更傾向走定式棋而且更容易犯錯,定式對於AI來說是比較容易應對的,畢竟算法訓練的數據來源很多都是定式。快棋策略讓Master有更大的贏面。- 新聞來源於其它媒體,內容不代表本站立場!
-
原文鏈接
原文鏈接:
目前還沒有人發表評論, 大家都在期待您的高見