地平線機器人科技余凱、搜狗王小川他們如何看待人工智能與人機大戰?

創客貓 · 2016-03-16 11:02

我們講人工智能可以做很多很多事情,但是是不是可以有一個相對簡單的框架使我們能夠研究它、刻畫它?

地平線機器人科技創始人兼CEO余凱

在“全球大數據峰會 Global Big Data Conference 簡稱為 GBDC”大會上,地平線機器人科技創始人兼CEO余凱分享了關于如何利用大數據進行深度學習的演講。以下為演講中關于人工智能的部分。

我記得1956年“人工智能”這個詞被提出,到今年正好是六十年時間。在六十年的時間基本可以劃分為兩個階段:基于規則的人工智能,這個一直到八十年代末,那個典型的叫專家系統。到八十年代末開始到現在,有更多的是基于數據驅動的人工智能。這樣的話,大數據這兩個關鍵的支撐在過去的二十多年的時間去推動這個領域去往前發展。

我們講人工智能可以做很多很多事情,但是是不是可以有一個相對簡單的框架使我們能夠研究它、刻畫它?這樣一個簡單的框架我們用一個映射來描述,就是從X到Y的映射。比如說X的話,是Image,Y是Obgect,這就是簡單的圖像識別。如果X是Speech,Y是Texts,這個就是簡單的語音識別。如果X是Language,Y是ParseTree這就是自然語言的處理。如果是各種傳感器在汽車上面把路上的信息都搜集過來,實時的做決策,X就是傳感器受到的數據,Y就是控制的的決策,我們看不同人工智能的問題,基本可以用一個相對簡單的框架,從X到Y的框架來數。學習問題在這里面是怎么回事呢?就是你有一堆的訓練樣本,這堆訓練樣本告訴你,如果是這樣的輸入,它的輸入是什么?比如這樣的一個圖像,它的輸出是它的一個標注,是什么?這樣的話學習一個映射函數,這個映射函數告訴你,有了這個映射函數就會回答這樣的問題,比如給了下面這幅圖像,讓它的輸出是什么。這樣就是從學習到應用,就是從數據中學習模型,然后運用這個模型的過程。

最簡單的一個極致的模型,是也許的一個問題,就是說我們給你六個訓練樣本,六個例子,縱軸是輸出,橫軸是輸入。我們把背后蘊含的規律給找出來,這個規律可能是這樣的,這個規律好不好,有沒有更好?如果是這樣的規律,我們覺得怎么樣?可不可以做的更好?其實所有的規律都解釋了我們的樣本,但是哪個是真實的?所以這里反映到機器學習和人工智能很本質的問題,就是學習的空間的復雜度的問題。

(小貼士:余凱博士,地平線機器人技術創始人&CEO,國際著名機器學習專家,中組部國家“千人計劃”專家,中國人工智能學會副秘書長。他是前百度研究院執行院長,創建了中國企業第一家人工智能研發機構 — 百度深度學習研究院,直接向CEO李彥宏匯報。)

(來源于:數據猿)

0925daf8f39af4d.jpg

搜狗CEO王小川

在最近大熱的谷歌AlphaGo對弈李世石的人機大戰中,搜狗CEO王小川也表達了自己觀點。以下為分享全文,來源于鳳凰科技。

萬眾矚目的人機大戰已經完成兩回合,機器超出大多數人的想象獲勝了,而且是大勝,棋壇震動。另一方面,我們又聽到這樣的聲音:“一開始是李世乭占優,中盤被大逆轉”,“是李世乭幾次失誤才輸的”,“機器這一手業余五段水平,哈哈”。

這類觀點背后的一個漏洞是,這些評價都基于人類棋手百年來積累下來的共識經驗來判斷。另一種細想極恐的解釋是:機器一開始就占優而人類棋手以之前的經驗并沒意識到,待到醒悟時已經來不及了。機器這一步棋厲害到人類棋手從來沒想到過。

賽后從Google傳來的消息已經證明了后一種觀點:至始至終白棋都在占優!也就是說以機器的視角看:“人類呀,這盤棋不是啥逆轉,我一開始就吃定了你的。你以為我的昏招只是你!沒!看!懂!”

你沒看懂!我相信確實發生了這樣的事情,人不僅是沒有預料到機器的下棋能力,更是機器已經落子了我們還沒看懂為啥這么下,反而評價不高,這是多么大的差距!現在到了需要思考人和機器誰更懂棋而不只是誰更會下棋的時候了。

AlphaGo已經表現出十二段的水準,而我們還在遮羞“逆轉”、“失誤”以及“嘲笑”,這就是被吊打而不自知。

無招勝有招的宇宙流

機器和人下棋有什么區別呢?人類下圍棋是靠的“搜索”+“計算”+“棋感”。傳統意義上,計算機沒有棋感只能靠搜索,這對于圍棋的海量變化和可能性完全不適用,也是我們之前不看好機器下圍棋的終極理由。而這個棋感配合一定的計算,就變成了對局勢判斷的抽象概念,比如“厚薄”、“虛實”、風格“穩健或強硬”、策略“纏繞攻擊、棄子整形”以及每步棋的招式“跳、長、靠”等等等。這些概念的引入:當前棋局->局勢抽象判斷->走棋招式抽象選擇->局勢抽象驗證->落子,大大減少了搜索量。談論這些抽象概念,就像是武功開始比試流派和招式,成為這項智力游戲的樂趣所在。

因為深度學習,世道變了。深度學習最大的魅力就是抽象能力,通過對3000萬局人類對弈數據的學習,機器建立了一套抽象局勢和落子招式的棋感。

既然機器掌握了棋感,一個未被大家深入討論的問題是:機器會把局勢、棋形抽象成多少類呢?會把落子策略和招式抽象成多少類呢?

答案是0!

這就是機器與人在抽象時最大的不同。當我們抽象出多個概念來,每一種概念便是一種簡化,一方面忽略了全局信息,一方面也排斥了其他概念,也是在丟失信息。

打一個比方,我們都知道光的波粒二象性,光既是波又是粒子。當我們把光描述成波,就會忽略了粒子特性,如果把光描述成粒子,就會忽略波的特性。但是如果同時表達這兩個屬性,對人的理解就是很大的挑戰了。

而深度學習下的概念抽象,Value Network同時既保留了全局信息,又兼顧了局部信息,直接對應到局勢評分。Policy Network對應的走棋的抽象,兼顧了所有的招式并融會貫通,直接對應到落子的概率。

這便是小說里寫的無招勝有招,真實地在圍棋里再現。

以前我們贏機器,是因為我們有“抽象概念”而機器沒有。現在我們輸給機器,也是因為我們太有“抽象概念”,太細碎失去了整體,機器建立了大統一的抽象概念。

更多強調,這種無招勝有招,并不只是“見招拆招”,而是在時空雙重維度上的“終極大招”。之前我們有質疑機器沒有“大局觀”,在深度學習框架下,機器不僅是有大局觀,而是全局觀,包含了全部細節的全局。再有,這個全局觀不只是棋盤空間上的全局,而是每一步局勢的判斷以及落子的選擇都是指向最終贏棋的概率提升,這是時間維度的全局觀。

這種全局觀下,棋感與搜索的交織融合,每一步搜索中包含棋感、每一步棋感后都進行搜索,便打造出完全超越人理解的走棋邏輯來。

有了這種超越人的時空全局觀,機器就會走出一些人沒法解讀的匪夷所思的招式來,這些招式要么超越我們的定式,要么在招式下計算更精準,要么兩者兼有。

這便是無招勝有招的宇宙流。

Google心機婊的棋外棋

Google這次人機大戰獲得了空前的關注,一方面是這個事情本身足夠吸引眼球,號稱人類棋類智慧的最后一塊堡壘被攻破,具有足夠的象征性意義,另一方面是Google進行了深謀遠慮的市場運作。

從前幾日樊麾的口述可以看到,他在2015年11月就敗給AlphaGo,但是保密協議規定他不能對外透露。而等到2016年1月Nature雜志刊登了Google研發成功基于深度學習的圍棋機器時才公布此事,兩事情碰到一起互相佐證迅速引爆了媒體的關注。

再往深里想,為什么會找到樊麾?因為能造成最大的爭議:職業棋手以及歐洲“冠軍”的身份,看起來很有種,但是又只是二段棋手,與九段的世界冠軍形成強烈的反差和懸念,又使得這次首爾的勝利極其突然。

真夠心機!

往下有兩個繼續心機的預測:

1、有可能Google會放水讓李世乭贏1-2局,不至于人類太難看。

2、贏了李世乭之后,鳴金收兵迅速解散AlphaGo團隊宣布人工智能進軍醫療領域,為下一個戰場造勢,并且避免后起的各家基于深度學習的圍棋機器挑戰AlphaGo,Google輸不起贏了也無趣,沒必要陪著玩。

那后起的圍棋機器怎么出頭呢?沒機會挑戰Google,挑戰世界冠軍也不是大新聞了。我的一個建議是設立一個“刷副本”賽:挑戰一位世界冠軍,同時運行其他網友隨時從這個棋局的任何復盤位置進入接著下。不是覺得人有失誤么,悔棋修正了失誤繼續來。這樣會有看頭,徹底體現機器怎么碾壓人類智商。

程序狗的春天

這次關心人機大戰真是萬人空巷,也是幾家歡喜幾家愁。

最受傷的是職業棋手,段位越高傷害越大。你懂的,生命的意義受到沖擊。

最被激勵的應該是擁有人工智能理想的程序狗,會更加相信自己代表的先進生產力能改變世界。比賽前,我調研了我司好些做機器學習的工程師,他們大多表示相信機器未來會贏,但這次做不到。科技行業主流的聲音也是這樣,不相信自己手中掌握的武器有如此能耐。兩場比賽后,已經有工程師給我發微信表示要更加努力了。

這是一場人工智能的啟蒙運動,讓大眾接受和相信了機器的力量,也會促進人工智能的研發以及應用。

此外也會有對人工智能如何幫助人、取代人、傷害人的討論。這是好事,我們開始沒那么自大,開始更好地思考“我是誰”,“我要到哪里去”了。

這場比賽的意義足夠深遠,或許百年后看,是21世紀最大的歷史事件之一。

很幸運,我們參與見證了這場世紀之戰。

(小貼士:王小川:搜狗公司CEO、國內頂尖人工智能專家。1994年,王小川參加“幾何定理機器證明”課題研究組,首次在微型機下完成初等幾何命題的全部證明。1996年王小川代表中國參加第8屆國際信息學奧林匹克競賽(IOI),并獲得金牌。)


吉林快3中奖几率