雖然才只來到英國第一天,也只下了一快一慢兩盤棋。
但戰鷹已經深刻體會到了這個圍棋項目不對勁的地方。
這種感覺別人說再多次也沒法感同身受,說了下不過其他棋手大概率都沒法理解。
唯有自己上場對弈才能夠感覺到那種奇怪之處。
七定王戰鷹的眼神里頗有些迷茫,這種迷茫甚至超過了她七定不成的那種迷茫。
這里就有一個哲學問題了,如果再過兩個月,自己完全下不過這個阿爾法圍棋程序了。
那自己還有繼續學棋,定段,努力的意義嗎?
又或者,自己已經下了的這十多年棋,它們的意義又是什么呢?
她已經隱約明白,在職業圍棋圈中,她是第一個反應過來情況已經開始不對勁了的人。
阿爾法狗將不會是一個普通的圍棋程序,它跟之前那些所有的,最高水平只有業余四五段的圍棋程序不一樣。
這些人做這個東西甚至不是最終的目的,只是一種跳板和證明。
DeepMind,谷歌大腦,他們都是真正的天才。
并且,他們現在強強聯合了。
戰鷹其實看不懂孟繁岐做出的那些成果具體是什么東西,又有什么意義。
但當這種技術來到自己的圍棋領域的時候,她感覺得到,這可能會是一個全新的時代。
一般來說,戰鷹是絕對不會悔棋的,這點職業棋手的素養她還是有的。
不過那是面對人的時候,面對機器,她一不小心下錯了地方,本能還是提出了悔棋。
說明其實心底里,她起初沒有將對方當成和人類棋手一樣的對手。
在方才的第二局里,戰鷹嘗試著下出一些比較少見的路數,但她并沒有收獲預期的效果。
她認為阿爾法狗只是在機械地模仿人類,只要局面更加罕見,這個電腦程序就更加難以應對。
然而事實并非如此。
雖然這版本的阿爾法狗缺乏強化對抗類型的訓練,但它已經可以搜索二十多步。
它對后續十數手,是會有深遠的綜合判斷的。
第二盤慢棋一路下到中盤,先輸一盤的戰鷹壓力越來越大,她看著面無表情的黃士杰,意識到了對方的另一個巨大優勢。
那就是情緒沒有波瀾,也不會被對手的棋風和戰術調整所影響。
這一局,戰鷹自認為自己是超水平發揮了,但仍舊僅僅只是半目勝。
這讓她相當沮喪。
因為她感覺得到,自己距離失敗已經不遠了。
“這個小姑娘的水平,現階段測試起來確實還不錯?!辟惡?,黃士杰,戴密斯,孟繁岐等五六個核心人員在一旁討論著。
“人類棋手的棋力會有一定程度的上下波動,她大約是業余5-6到職業1-2段的范圍,我現在對阿爾法狗的判斷,差不多在職業一段。這是個歷史性的突破。”
黃士杰分析了一番,看了剛剛兩人的對局,他感覺自己的業余6段確實稍微有點水分。
“雖然她還沒有定段成功,但這相當程度上是由于華國女子棋手名額的限制。”孟繁岐出言解釋道:“前面許多年,都是只進兩個名額,我聽說今年可能有些變化??傮w來說,戰鷹雖然沒有定段,但這也算是半個職業棋手輸給圍棋智能了,算半個歷史性時刻。”
黃士杰和戴密斯聽了之后都哈哈大笑,點頭稱是。
“我們可以提前約一下樊麾二段了,他是去年歐洲圍棋冠軍。”孟繁岐推薦道,他想要盡量加快阿爾法狗的節奏?!拔覀円粫懻摳乱话姹局?,可能一周的時間,戰鷹就很難再跟得上阿爾法狗的節奏了?!?/p>
阿爾法狗初版的能力,比孟繁岐預期要高不少。
這里主要是因為孟繁岐的輕量級網絡,節約了大量計算資源給搜索方法那邊。
前面說到,一個19x19的矩陣可以用來表示棋盤上所有的落子地點,而每個地點的取值就只有三種狀態,黑,白,無子。
可以用[-1,0,1]三個數字來指代。
但單獨只使用一個這樣的矩陣是不夠的。
還需要其他相同形狀的矩陣來表達其他常用的判斷信息,比如棋子的“氣”。
在阿爾法狗中,這里采用了48個[19x19]的矩陣輸入,這讓本身對棋了解不大夠的孟繁岐大開眼界。
“目前階段,我們就是使用海量的落子數據,不斷讓網絡逼近人類的落子位置。可以說,這一版本的阿爾法狗只是先得到了一個模仿人類模仿得非常好的模型。”
“單獨只是這個策略網絡的話,棋力大概elo評分在2000左右,還有很大的不足?!?/p>
孟繁岐微微點頭,第一流棋手的棋力大約在elo評分3600左右。
2000分確實還差得遠,戰鷹此時的初段水平大概是在2500-2600左右。
這版本的阿爾法狗主要是策略網絡+走子驗算,兩者結合之下,將分數從2000提高到了與戰鷹相若的水平。
這個所謂的策略網絡,其實和孟繁岐最初參加競賽的圖像分類十分相似,原理都差不多。
讓孟繁岐走上世界舞臺的IMAGENET千分類圖像競賽,需要網絡判斷,給定的圖像是1000個中的哪一個類別。
也就是說,網絡會返回一個長度為1000的數組,告訴你每一個對應類別的概率是多少,這1000個概率加起來就是百分之一百。
而這個策略網絡,其實也可以看做是19x19,也就是361分類問題。
每一類,意味著在對應的點上下棋的概率。
當然了,圍棋不比普通圖像分類,棋盤上哪里可以落子哪里不可以,還有一定的講究。
先不說氣還是什么其他的,至少原本有子的地方,你不可以繼續去落。
因此,也需要專門引入規則,對這些地方進行判斷,把這些落子點,排除在外。
網絡計算了輸入的棋盤現狀之后,就會返回一個[19x19]的矩陣。
這361個概率之和也同樣為百分之一百,后來常見的圍棋AI,大都會把概率最大的五個又或者是十個點標注出來。
并用顏色深淺來區分這里落子的概率。
所謂的AI一選二選,也就是圍棋智能面對當前局面,返回的棋盤矩陣當中,概率最大的兩個數字的對應位置。