晴時多雲

限制級
您即將進入之新聞內容 需滿18歲 方可瀏覽。
根據「電腦網路內容分級處理辦法」修正條文第六條第三款規定,已於網站首頁或各該限制級網頁,依台灣網站分級推廣基金會規定作標示。 台灣網站分級推廣基金會(TICRF)網站:http://www.ticrf.org.tw

【藝術文化】電腦人腦圍棋大決戰(3-1)

2016/03/07 06:00

南韓籍的全球圍棋棋王李世石(右)和谷歌副總裁德邁斯.哈薩比斯(Demis Hassabis)共同宣布棋王對決人工智慧圍棋賽事。(法新社)南韓籍的全球圍棋棋王李世石(右)和谷歌副總裁德邁斯.哈薩比斯(Demis Hassabis)共同宣布棋王對決人工智慧圍棋賽事。(法新社)

◎王銘琬

由谷歌(Google)所打造的人工智慧圍棋系統「AlphaGo」,去年10月初以5局全勝之姿打敗歐洲圍棋冠軍樊輝,3月8日起該系統將挑戰全球棋王李世石(Lee Se-Dol),全程透過YouTube實況轉播。本報特別邀請本因坊棋王、著名棋評王銘琬,一連3天以專文介紹這場AI電腦與棋王的世紀之戰。

谷歌驚人發表

一場世紀性的電腦人腦大決戰要開始了(3/8至3/15)!1997年電腦程式「深藍」擊敗世界西洋棋冠軍卡斯帕洛夫,然而在棋類裡,電腦一直無法與人較量的是圍棋,事隔近20年,現在電腦要以圍棋來挑戰人腦了!

圍棋難以較量的原因是圍棋的變化數是10的360次方,比西洋棋10的120次方多太多。不僅變化數,圍棋的取勝方法,並非西洋棋與象棋等的擒王,而是要以全局占領的空點勝過對方,如此相對曖昧的目的,一直是電腦所不擅長的;直到最近電腦與職業棋士下圍棋還需要被讓4子,就是說電腦先下4手才開始,這是非常大的差距。

1月27日谷歌的突襲發表徹底打破了這個狀況。他們旗下的DeepMind公司所開發的程式「AlphaGo」,挑戰歐洲冠軍職業棋士樊麾二段,5局比賽取得5局全勝的成績;同時宣布與世界頂尖棋手李世石在3月舉行5局比賽,勝者獎金100萬美元。消息一出舉世譁然,谷歌股票速漲4.4%,大手筆動作馬上得到回報。

這消息讓我半信半疑,火速研究了公開的5局棋譜,結果只好承認AlphaGo的實力。樊麾二段不是弱者,有足夠的職業水準;AlphaGo下法堅實平穩,很少犯錯,使棋局大部分在優勢下進行,而且能逐漸擴大領先,發揮的棋力明顯高過對手。只看公開的這5盤棋,我的感覺是──自己要贏它也不容易。

如此高水準的表現震撼了我,5年前我對圍棋對弈軟體發生興趣,一年前自己參加軟體開發團隊Go Trend(趨勢),期待自己的圍棋經驗能對提升軟體棋力有所貢獻,但AlphaGo的棋力,遠超過我準備提升的目標。以圍棋做為研究對象的人工智慧(AI),已經進入新的階段。

圍棋程式的發展與突破

圍棋程式的開發從80年代就開始了,可是一直無法像西洋棋一樣的進步,最大的問題是,對局面無法做適切的評估;一直到約10年前出現了「蒙地卡羅法」讓評估的問題得到很大的突破。

蒙地卡羅法是從現在的局面,讓程式隨意地試下模擬到終局,這樣就可以取得一個勝或敗的數據;一般情形局面愈是有利,勝率就會愈高。用電腦龐大的計算力做足夠多次的模擬,就能用模擬結果的勝率評估局面的好壞。

得到模擬勝率這個評估值,加上原來的樹搜尋法,成為現在圍棋程式的基礎MCTS(Monte Carlo Tree Search,蒙地卡羅樹搜尋),MCTS讓電腦與人的差距從9子以上,以約5年的時間內進步到4子。但比起一開始的輝煌成果,從5年前至今沒有明顯的進步,遭遇到很大的瓶頸。

因為蒙地卡羅法是雙刃之劍,它的長處是能從全局的觀點評估局面,這個作法符合圍棋的特性,可是也成為它的弱點。圍棋有時需要對局部做正確認識後,再來評估全局,就像大型連鎖店雖需要對全體市場的評估,也須對各分店的收支掌握清楚。

「蒙地卡羅法」的弱點顯現在棋局的情形大致是:

1、複雜的死活與攻殺看不清楚;棋局手數愈少,看不清楚的程度愈大。

2、後盤需要長手數算棋的局面容易失誤。

3、在局面稍劣時,不會忍耐以等待機會。

這些問題一直沒辦法克服。有人還認為,此後要勝過人類所必須走的路,遠於至今走過來的。

☆藝文新聞不漏接,按讚追蹤粉絲頁
☆更多重要藝文新聞訊息,請上自由藝文網

不用抽 不用搶 現在用APP看新聞 保證天天中獎  點我下載APP  按我看活動辦法

網友回應