冰河。
是一款關于圍棋的人工智能程序。
而這款人工智能為了應對圍棋的復雜性,結合了監督學習和強化學習的優勢。
它通過訓練形成一個策略網絡,將棋盤上的局勢作為輸入信息,并對所有可行的落子位置生成一個概率分布。
然后,訓練出一個價值網絡對自我對弈進行預測,以 -1(對手的絕對勝利)到1(冰河的絕對勝利)的標準,預測所有可行落子位置的結果。
這兩個網絡自身都十分強大,而冰河圍棋將這兩種網絡整合進基于概率的蒙特卡羅樹搜索中,實現了它真正的優勢。
在獲取棋局信息后,冰河圍棋會根據策略網絡探索哪個位置同時具備高潛在價值和高可能性,進而決定最佳落子位置。
在分配的搜索時間結束時,模擬過程中被系統最頻繁考察的位置將成為冰河圍棋的最終選擇。
在經過先期的全盤探索和過程中對最佳落子的不斷揣摩后,冰河圍棋的搜索算法就能在其計算能力之上加入近似人類的直覺判斷。
而冰河人工智能系統,主要由幾個部分組成:
一、策略網絡(Policy Network),給定當前局面,預測并采樣下一步的走棋;
首發域名m.xsbiquge。la
二、快速走子(Fast rollout),目標和策略網絡一樣,但在適當犧牲走棋質量的條件下,速度要比策略網絡快1000倍;
三、價值網絡(Value Network),給定當前局面,估計是白勝概率大還是黑勝概率大;
四、蒙特卡洛樹搜索(Monte Carlo Tree Search),把以上這四個部分連起來,形成一個完整的系統。
第一大腦:落子選擇器(move-picker)。
第二大腦:棋局評估器(position-evaluator)。
這些網絡通過反復訓練來檢查結果,再去校對調整參數,去讓下次執行更好。
這個處理器有大量的隨機性元素,所以人們是不可能精確知道網絡是如何“思考”的,但更多的訓練后能讓它進化到更好。
除了這些還有一大段,反正關于人工智能的都寫上去了,而且寫的特別詳細,就好像這個東西是夏銘研究出來的一般。
在場的所有人看到這一份詳細的資料后,都呆住了,這么多專業性的詞匯和英語單詞,他們都有些沒看懂,但是幸好有中文翻譯,這才讓大家大致了解了這個冰河的工作原理。
李達康將這份資料完完整整的看完之后,發出一聲驚嘆,忍不住的感慨道;
“老楊,你這女婿可找的太對了!真是太優秀了,博學多才啊!”
棋社社長劉東偉看到這資料之后,也忍不住驚嘆道:
“小夏的腦子里裝的是什么東西啊?他怎么能做出這個資料的?真是太不可思議了!”
楊立國看到他們這幅激動的表情,笑著說道:
“怎么樣?我女婿給我的這份資料不錯吧?”
劉東偉看完之后,笑著點點頭說道;
“這豈止是不錯啊,這真是給我來一個天大的助力啊,這小夏分析的太對了,他已經把整個冰河的運作模式告訴我們了。”
此時袁來福也走了過來笑著說道:
“夏銘老師真是太強了,你們看啊,我就說這人工智能不可能會思考吧,這不過是米國佬把它給包裝了而已,就是想摧毀我們的心里防線而已,想讓我們誤以為它真的能夠自主思考,其實它的本質還是數據處理,只不過是比傳統的ai更加迅速,更加多元化。”
現在他們終于知道這人工智能冰河不為人知的一面了!
既然已經知道了人工智能的工作原理,他們就開始思考接下來的戰略了。