近日,《科學(xué)》雜志封面刊登了一篇重磅研究:人工智能終于能像人類一樣學(xué)習(xí),并通過(guò)了圖靈測(cè)試。
這個(gè)人工智能像你一樣學(xué)習(xí)寫(xiě)字
假設(shè)你從來(lái)沒(méi)有見(jiàn)過(guò)菠蘿。有一天,有人送了你一個(gè)菠蘿。盡管你這輩子只見(jiàn)過(guò)這一個(gè)菠蘿,但你只用一眼就看出了菠蘿的特征。第二天,你去水果店,很快就能從一堆蘋(píng)果、葡萄、柚子中認(rèn)出菠蘿來(lái)。你甚至還能在紙上畫(huà)出菠蘿的簡(jiǎn)筆畫(huà)。
這種‘僅從一個(gè)例子就形成概念’的能力對(duì)人來(lái)說(shuō)很容易。然而,盡管人工智能近年來(lái)取得了長(zhǎng)足的進(jìn)步,但要讓機(jī)器做到這一點(diǎn),卻難于上青天,因?yàn)槟壳暗娜斯ぶ悄芡ǔP枰獜拇罅康臄?shù)據(jù)中進(jìn)行學(xué)習(xí),你得讓它看成千上萬(wàn)張菠蘿的圖片才行。
不過(guò),這個(gè)事實(shí)或許從今天開(kāi)始改變了。今天,一篇人工智能論文登上了《科學(xué)》雜志的封面,為人們帶來(lái)了人工智能領(lǐng)域的一個(gè)重大突破:三名分別來(lái)自麻省理工學(xué)院、紐約大學(xué)和多倫多大學(xué)的研究者開(kāi)發(fā)了一個(gè)‘只看一眼就會(huì)寫(xiě)字’的計(jì)算機(jī)系統(tǒng)。(論文Human-level concept learning through probabilistic program induction見(jiàn)文末,或回復(fù)12可下載pdf格式。)

《科學(xué)》雜志封面
只需向這個(gè)系統(tǒng)展示一個(gè)來(lái)自陌生文字系統(tǒng)的字符,它就能很快學(xué)到精髓,像人一樣寫(xiě)出來(lái),甚至還能寫(xiě)出其他類似的文字——更有甚者,它還通過(guò)了圖靈測(cè)試。下面就是機(jī)器和人寫(xiě)出的字符。你猜哪些是機(jī)器寫(xiě)出來(lái)的?傻傻分不清了吧?

機(jī)器的作品是1,2;2,1;1,1
這三名研究者分別是紐約大學(xué)數(shù)據(jù)科學(xué)中心的Brenden Lake,多倫多大學(xué)計(jì)算機(jī)科學(xué)與統(tǒng)計(jì)學(xué)系的Ruslan Salakhutdinov和麻省理工學(xué)院大腦與認(rèn)知科學(xué)系的Joshua Tenenbaum。他們創(chuàng)造的AI系統(tǒng)能夠迅速學(xué)會(huì)寫(xiě)陌生的文字,從某種意義上說(shuō)明它領(lǐng)悟到了字符的本質(zhì)特征(也就是字符的整體結(jié)構(gòu)),同時(shí)還能識(shí)別出非本質(zhì)特征(也就是那些因書(shū)寫(xiě)造成的輕微變異)。

三名研究者從左到右分別是:Ruslan Salakhutdinov, Brenden Lake和Joshua B· Tenenbaum。
人類的概念具有極大的彈性,因此,盡管許多概念的邊界十分模糊,但我們依然能進(jìn)行明確的分類。這三位研究者聲稱,他們的系統(tǒng)就抓住了這種彈性。該系統(tǒng)能模仿人類的一個(gè)特殊天賦——從少量案例中學(xué)習(xí)新概念。它所根植的計(jì)算結(jié)構(gòu)叫做概率程序(probabilistic program),還可能有助于對(duì)人類獲得復(fù)雜概念的過(guò)程進(jìn)行建模。
Joshua B。 Tenenbaum是麻省理工學(xué)院大腦與認(rèn)知科學(xué)系的教授,他說(shuō):‘目前的人工智能領(lǐng)域大都聚焦在對(duì)模式進(jìn)行分類。但是,這種類型的智能所缺少的不是分類或識(shí)別的能力,而是思考。所以,盡管我們研究的只是手寫(xiě)字符,但依然大言不慚地使用“概念”這種詞。因?yàn)槲覀兡苡米址麃?lái)研究更加豐富和復(fù)雜的概念。我們能理解字符的來(lái)歷和構(gòu)件,也能理解如何用不同的方式來(lái)使用字符,并造出新的字符來(lái)。’
通過(guò)‘圖靈測(cè)試’
這篇論文的第一作者Brenden Lake曾在Tenenbaum的團(tuán)隊(duì)中獲得認(rèn)知科學(xué)博士學(xué)位,如今他是紐約大學(xué)的博士后。根據(jù)Lake的介紹,他們?cè)谡撐闹蟹治隽巳齻€(gè)核心原則。這些原則都很通用,既可以用在字符上,也可以用在其他的概念上:
組合性(compositionality):表征是由更簡(jiǎn)單的基元構(gòu)建而成。
因果性(causality):模型表征了字符生成的抽象因果結(jié)構(gòu)。
學(xué)會(huì)學(xué)習(xí)(learning to learn):過(guò)去的概念知識(shí)有助于學(xué)習(xí)新的概念。
研究者對(duì)這個(gè)AI系統(tǒng)進(jìn)行了幾項(xiàng)測(cè)試。
測(cè)試1:研究者向它展示了它從未見(jiàn)過(guò)的書(shū)寫(xiě)系統(tǒng)(例如藏文)中的一個(gè)字符例子,并讓它寫(xiě)出同樣的字符。這里并不是讓它復(fù)制出完全相同的字符,而是讓它寫(xiě)出9個(gè)不同的變體,就像人每次手寫(xiě)的筆跡都不相同一樣。例如,在看了一個(gè)藏文字符之后,算法挑選出該字符用不同的筆跡寫(xiě)出來(lái)的例子,識(shí)別出組成字符的筆畫(huà),并重畫(huà)出來(lái)。
測(cè)試2:研究者向系統(tǒng)展示了一個(gè)陌生書(shū)寫(xiě)系統(tǒng)中的幾個(gè)不同的字符,并讓它創(chuàng)造出一些相似的字符。
測(cè)試3:研究者讓它在一個(gè)假定的書(shū)寫(xiě)系統(tǒng)中創(chuàng)造出全新的字符。
與此同時(shí),人類被試也被要求做同樣的事情。最后,研究者要求一組人類裁判(來(lái)自亞馬遜土耳其機(jī)器人,Amazon Mechanical Turk)分辨出哪些字符是機(jī)器寫(xiě)的,哪些是人類寫(xiě)的。結(jié)果,裁判的正確率僅為52%,和隨機(jī)的結(jié)果差不多。于是,機(jī)器通過(guò)了所謂的視覺(jué)圖靈測(cè)試。

紅圈標(biāo)出的是機(jī)器的作品
傳統(tǒng)的機(jī)器學(xué)習(xí)系統(tǒng)(比如手機(jī)上的語(yǔ)音識(shí)別算法)在某些分類任務(wù)上的表現(xiàn)很好,但它們首先需要大量的數(shù)據(jù)集來(lái)進(jìn)行訓(xùn)練。相比之下,人類只需要少量的例子就能抓住某個(gè)概念的精髓。這種‘一次性學(xué)習(xí)’正是研究者希望他們的系統(tǒng)能模擬的能力。
學(xué)會(huì)如何學(xué)習(xí)
三位研究者采用的方法是‘貝葉斯程序?qū)W習(xí)’(BPL,Bayesian Program Learning),能讓計(jì)算機(jī)系統(tǒng)對(duì)人類認(rèn)知進(jìn)行很好的模擬。傳統(tǒng)的機(jī)器學(xué)習(xí)方法需要大量的數(shù)據(jù)來(lái)訓(xùn)練,而這種方法只需要一個(gè)粗略的模型,然后使用推理算法來(lái)分析案例,補(bǔ)充模型的細(xì)節(jié)。

在這篇論文中,研究者的模型只規(guī)定了字符由筆畫(huà)組成,筆畫(huà)由抬高筆觸來(lái)區(qū)分,而筆畫(huà)又由更小的子筆畫(huà)組成,子筆畫(huà)用筆尖速度為零的點(diǎn)來(lái)區(qū)分?!∮辛诉@個(gè)初始模型之后,研究者向AI展現(xiàn)了人類手寫(xiě)文字的方式,包括筆畫(huà)順序等,讓系統(tǒng)學(xué)習(xí)連續(xù)的筆畫(huà)和子筆畫(huà)之間的統(tǒng)計(jì)關(guān)系,以及單個(gè)筆畫(huà)所能容忍的變異程度。這個(gè)系統(tǒng)從未在它所分析的書(shū)寫(xiě)系統(tǒng)上進(jìn)行過(guò)任何訓(xùn)練,它只是推理出了人類寫(xiě)字的一般規(guī)律。
Tenenbaum說(shuō):‘每個(gè)星期,我們似乎都能讀到機(jī)器在人臉識(shí)別、語(yǔ)音識(shí)別方面與人類旗鼓相當(dāng)?shù)男侣?。但是,?duì)我這種研究心智的科學(xué)家來(lái)說(shuō),機(jī)器學(xué)習(xí)和人類學(xué)習(xí)之間的鴻溝是巨大的。我們希望彌合這個(gè)鴻溝,這是我們的長(zhǎng)期目標(biāo)。’
各方評(píng)價(jià)
劍橋大學(xué)的信息工程教授Zoubin Ghahramani說(shuō):‘我認(rèn)為這對(duì)人工智能、認(rèn)知科學(xué)和機(jī)器學(xué)習(xí)是一個(gè)重大的貢獻(xiàn)。深度學(xué)習(xí)目前已取得了重要的成功,這篇論文非常清醒地表明了深度學(xué)習(xí)的局限性,因?yàn)樯疃葘W(xué)習(xí)需要大量的數(shù)據(jù),并且在這篇論文所描述的任務(wù)上表現(xiàn)很差。這篇論文也展現(xiàn)了實(shí)現(xiàn)類人機(jī)器學(xué)習(xí)的重要方法。’

也有一些人對(duì)‘人工智能超越人腦’這種說(shuō)法持謹(jǐn)慎態(tài)度。艾倫人工智能研究所的Oren Etzioni說(shuō):‘我對(duì)“超人的表現(xiàn)”這種說(shuō)法非常謹(jǐn)慎。當(dāng)然,這個(gè)算法確實(shí)超過(guò)一般人的表現(xiàn),除了達(dá)斯汀·霍夫曼。’(指霍夫曼主演的《雨人》電影。)
與深度學(xué)習(xí)優(yōu)勢(shì)互補(bǔ)
多倫多大學(xué)和谷歌的人工智能先驅(qū)Geoffrey Hinton說(shuō)這個(gè)研究‘令人印象非常深刻’。他說(shuō),這個(gè)模型能通過(guò)視覺(jué)圖靈測(cè)試,這很重要,‘是一個(gè)不錯(cuò)的成就。’Hinton是深度學(xué)習(xí)的奠基者。深度學(xué)習(xí)近年來(lái)取得了舉世矚目的成就,被廣泛應(yīng)用在許多領(lǐng)域,例如語(yǔ)音翻譯、圖像識(shí)別等,還用在谷歌的圖像搜索和Facebook的人臉識(shí)別上,獲得了巨量的數(shù)據(jù)以供學(xué)習(xí)。
然而,這篇新論文說(shuō)‘貝葉斯程序?qū)W習(xí)’在某些方面比深度學(xué)習(xí)的表現(xiàn)更好。三位作者和Hinton都禮貌地表明,這兩種方法在不同的任務(wù)上各領(lǐng)風(fēng)騷,假如能彼此借鑒,一定能互相彌補(bǔ)。如果能建出一個(gè)混血系統(tǒng),說(shuō)不定能有更大的提升。在數(shù)據(jù)量巨大但較混亂的情況下,深度學(xué)習(xí)能發(fā)揮優(yōu)勢(shì);而在數(shù)據(jù)量少而清晰的情況下,貝葉斯學(xué)習(xí)占領(lǐng)上風(fēng)。
Hinton說(shuō),這篇論文最令人興奮的成果或許是能讓那些宣稱智能計(jì)算機(jī)系統(tǒng)的學(xué)習(xí)方式與人類完全不同的批評(píng)者閉嘴,因?yàn)樗麄兊闹饕摀?jù)正是計(jì)算機(jī)不能從單個(gè)例子中形成概念。
未來(lái)
在未來(lái),這種機(jī)器學(xué)習(xí)的技術(shù)能夠完成很多任務(wù),例如讀懂手語(yǔ)、提升語(yǔ)音識(shí)別軟件的性能等。運(yùn)用這種方法,或許只用向計(jì)算機(jī)展示一張人臉照片,它就能從任何角度識(shí)別出這個(gè)人。它甚至有可能用來(lái)制定軍事行動(dòng)計(jì)劃。
當(dāng)然,盡管這個(gè)成果很重要,但它對(duì)人工智能領(lǐng)域來(lái)說(shuō)只是一個(gè)小小的起點(diǎn),不代表未來(lái)的機(jī)器學(xué)習(xí)都必須采用這種方法。正如它顛覆了‘計(jì)算機(jī)如何理解概念’這個(gè)課題一樣,在這個(gè)日新月異的領(lǐng)域中,極有可能下個(gè)月就出現(xiàn)一種新方法,將它甩在后面飛揚(yáng)的塵土中。









