人工智能(AI)領(lǐng)域再次出現(xiàn)驚人突破——據(jù)英國《自然》雜志近日發(fā)表的論文報道,一款新版的“阿法狗”(AlphaGo)計算機程序能夠從空白狀態(tài)起,在不需要任何人類棋譜輸入的條件下,自學(xué)圍棋,無師自通,自學(xué)成才。
這款新程序名叫“阿法元”(AlphaGo Zero),其以100比0的不敗戰(zhàn)績,狠狠打擊了曾書寫歷史的舊版“阿法狗”。
實力,“阿法狗”的輝煌戰(zhàn)績
人工智能“阿法狗”出自谷歌旗下深度思維(DeepMind)公司。最早在2016年1月,《自然》雜志以封面位置報道該程序在和所有其他圍棋程序的對抗中獲得了99.8%的勝率,并且以5∶0的成績打敗了歐洲圍棋冠軍。
隨后同年3月,“阿法狗”挑戰(zhàn)世界圍棋冠軍李世石,經(jīng)五局鏖戰(zhàn),人類1∶4不敵人工智能,引發(fā)巨大轟動。人們的震驚源于在圍棋19×19棋盤上,一步甚至?xí)袔装俜N走法,傳統(tǒng)的人工智能算法難以估計局面和下子。
但“阿法狗”仍在積攢實力。今年1月,一個神秘賬號Master公布自己正是“阿法狗”新版。該賬號在知名圍棋平臺上先后挑戰(zhàn)柯潔、樸廷桓和井山裕太等頂級高手,豪取勝利,隨后戰(zhàn)贏“棋圣”聶衛(wèi)平,直至60盤時自爆身份,決勝收官。
3天,“阿法元”的無師自通
此次在最新論文中,英國倫敦深度思維公司“阿法狗”項目的主要負(fù)責(zé)人戴維·西爾弗、戴密斯·哈薩比斯及其同事,報告了新版“阿法狗”軟件——“阿法元”。
“阿法元”最引人注目之處在于其無師自通的本領(lǐng)。其學(xué)習(xí)從“零”開始,單純基于與自己的對弈,不需要任何歷史棋譜的指引,也不需要任何人類經(jīng)驗的點撥。
對于這個新軟件,人類的輸入僅僅限于一張棋盤和一副棋子,沒有任何人類數(shù)據(jù)參與。“阿法元”只用到了一張神經(jīng)網(wǎng)絡(luò),這張網(wǎng)絡(luò)經(jīng)過訓(xùn)練,專門預(yù)測程序自身的棋步和棋局的贏家,讓“阿法元”在每次自我對弈中進(jìn)步。
通過3天的訓(xùn)練——包括近500萬局自我對弈——“阿法元”已能夠超越人類并打敗之前的“阿法狗”版本。戴維·西爾弗表示,“阿法元”遠(yuǎn)比“阿法狗”強大,它已不再為人類的知識所限,而能夠自行發(fā)現(xiàn)新知識。
擺脫了人類經(jīng)驗的輔助和依賴,人工智能竟然變得更強!在“阿法元”嶄露頭角后,人們揣測:難道我們?nèi)祟愡€耽誤“阿法狗”了?
震驚,AI的獨立發(fā)現(xiàn)
其實,人工智能的最大挑戰(zhàn)之一,即是研發(fā)一種能從“零”開始、以超人類的水平學(xué)習(xí)復(fù)雜概念的算法。
在去年3月那場世所矚目的比賽中,“阿法狗”軟件打敗了人類圍棋世界冠軍。當(dāng)時的這款圍棋程序,是利用價值網(wǎng)絡(luò)去計算局面,用策略網(wǎng)絡(luò)去選擇下子。
但為了贏得這場人機大戰(zhàn),科學(xué)家團隊在訓(xùn)練“阿法狗”時,同時用到了監(jiān)督式學(xué)習(xí)(基于上百萬種人類專業(yè)選手的下棋步驟)和基于自我對弈的強化學(xué)習(xí)。舊“阿法狗”訓(xùn)練過程長達(dá)幾個月,用到多臺機器和48個TPU(神經(jīng)網(wǎng)絡(luò)訓(xùn)練所需的專業(yè)芯片)。
而此次,據(jù)研究團隊介紹,新程序“阿法元”只使用了一臺機器和4個TPU。
在“阿法狗”之前,最成功的圍棋程序僅能達(dá)到人類業(yè)余選手的程度,還不能在不讓子的情況下和專業(yè)賽手一較高下,原本人們認(rèn)為,至少要10年后人工智能才有可能達(dá)到這一成就。但“阿法狗”的橫空出世改寫了預(yù)言。而在其問世不足兩年的時間里,“阿法元”再次刷新人們的認(rèn)知——隨著程序訓(xùn)練的進(jìn)行,人工智能已獨立發(fā)現(xiàn)了人類用幾千年才總結(jié)出來的圍棋規(guī)則,還建立了新的策略,可以說,人工智能已經(jīng)為這個古老的游戲,帶來全新見解。
(科技日報北京10月22日電)
凡本網(wǎng)注明“XXX(非汪清新聞網(wǎng))提供”的作品,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點和其真實性負(fù)責(zé)。
今天,在中央第一環(huán)境保護督察組向吉林省反饋督察情況后,省委書記巴音朝魯立即主持召開省委常委會議,聽取關(guān)于中央環(huán)保督察反饋問題整改工
2017-12-29 14:30
新浪科技訊 12月28日消息,由空間瞭望智庫、《國際太空》和《衛(wèi)星應(yīng)用》雜志,以及中國太空網(wǎng)聯(lián)合組織的2017年全球十大航天新聞和中國十大
2017-12-28 21:47
保潔人員先用馬桶刷子刷茶杯,隨后用同一把馬桶刷子刷馬桶。緊接著,她用浴巾擦杯子,再蘸了馬桶水擦地,最后將浴巾放在地上整理。馬桶刷刷
2017-12-28 21:12
近日,國家發(fā)改委、住建部、商務(wù)部、工信部、交通部等部委密集召開年度工作會議,貫徹落實中央經(jīng)濟工作會議精神,部署2018年的重點工作,在
2017-12-27 21:40
根據(jù)中共中央辦公廳、國務(wù)院辦公廳印發(fā)的《生態(tài)文明建設(shè)目標(biāo)評價考核辦法》和國家發(fā)展改革委、國家統(tǒng)計局、環(huán)境保護部、中央組織部印發(fā)的《
2017-12-26 16:34
21年前的12月25日,這一天是圣誕節(jié),雖然是西方的節(jié)日,但隨著夜幕降臨,歡樂的節(jié)日氣氛也隨之而來。當(dāng)晚,八點多鐘,長春市寬城區(qū)的一家藥
2017-12-15 22:18
十九大報告再次明確創(chuàng)新的地位:創(chuàng)新是引領(lǐng)發(fā)展的第一動力,是建設(shè)現(xiàn)代化經(jīng)濟體系的戰(zhàn)略支撐。2017年,我省創(chuàng)新成果豐碩,形成了跟跑、齊跑
2017-12-12 10:34
每到關(guān)鍵節(jié)點,人們總是根據(jù)一些重要信號來判斷一項工作的走勢。十九大閉幕后的首月,人們熟悉的打虎節(jié)奏和信息如約而至,中央紀(jì)委監(jiān)察部網(wǎng)
2017-12-08 12:32
長春、通化、白山、遼源入選東北地區(qū)民營經(jīng)濟發(fā)展改革示范城市,在政策環(huán)境、金融環(huán)境、創(chuàng)新環(huán)境、促進(jìn)民營經(jīng)濟轉(zhuǎn)型升級及人才隊伍建設(shè)等方
2017-12-08 12:21
11月,全國300城市土地市場供求回落,但各線城市土地成交均價環(huán)同比繼續(xù)上漲。綜合前11個月來看,年度土地出讓收入整體保持同比上漲勢態(tài)。6
2017-12-07 18:43