• 新聞中心

    新聞中心

    【WRC 大咖觀點】Melanie Mitchell《AI3.0——人工智能的能與不能》

    時間: 2021-10-27

    2021世界機器人大會第二天線下主論壇——“未來峰會”群星璀璨,產、學、研各領域大咖齊聚首,共話巔峰,為機器人未來發展領航。

    峰會現場,暢銷書《復雜》作者,波特蘭州立大學計算機科學教授、復雜系統前沿科學家Melanie Mitchell通過視頻形式進行演講,演講主題為《AI3.0——人工智能的能與不能》。以下為Melanie Mitchell演講內容全文整理。

    617916e75e026.png

    大家好!我是Melanie Mitchell,是美國圣菲研究所的一名教授。今天我要和大家談一談,要怎樣才能讓人工智能達到第三層次變得穩健,具有適應性和可解釋性,也就是我們所說的人工智能3.0。

    617916f1dbc3f.png

    你們很多人可能都知道,人工智能的起源可以追溯至1956年,在達特茅斯學院舉行的一個研討會,該研討會由麥卡錫、明斯基、羅切斯特和香農等先驅者主辦。這是當時研討會提案的第一頁,他們認為在一個夏天之內,他們將能夠研究出如何讓機器使用語言形成抽象理解和概念,解決現在留給人類的各種問題,完成自我改進。但是現在快過去70年了,所有這些關于如何讓機器完成這些事情的問題仍然沒有完全得到解決。

    人工智能的第一階段,我們稱之為“人工智能1.0”。是利用人機工程學知識,來讓機器擁有智能行為,例如一個專家系統可能會有一系列的規則來對不同種類的鳥兒進行分類。大家可以看到,這樣的做法在很多情況下都是可行的,但是這些系統又是很不穩定的。因為在遇到一些罕見情況時,比如一只翅膀受傷的鳥,系統可能就無法對其正確分類。這些專家系統得到了應用廣泛,但是它們并不能真的像人類一樣處理所有事情。

    人工智能2.0,下一階段是機器學習階段,也就是從數據中學習,以及我們現在所說的深度學習革命。從數據中學習包括聚類或分類,使用的是稱為支持向量機的統計學習技術,或者近期使用的受人腦結構啟發的神經網絡。利用像大腦中視覺系統一樣的結構,通過多層信息  處理各種分類和語言問題,深度神經網絡徹底改變了人工智能的許多領域。

    例如著名的ImageNet圖像識別大賽,我們可以在這張圖中看到歷年比賽選出的最佳程序的誤差率。大家可以看到,一旦開始使用深度神經網絡,誤差率就大幅下降了。到今天,它們的誤差率甚至低于人類在識別該數據集時的預計誤差率,這使得很多人工智能應用成為可能。比如面部識別,能夠識別道路上物體的自動駕駛汽車,能夠擊敗世界上最厲害的圍棋手的Alpha Go,以及像ALEXA這樣能夠和用戶對話、回答簡單問題的智能助手、機器翻譯?,F在使用深度神經網絡能夠在一瞬間將英語翻譯成中文,還有最近的一些成就,比如OpenAI的GPT-3系統能生成類似人類的語言,以及DeepMind的AlphaFold系統能夠僅從蛋白質的基因序列預測其結構。盡管這些系統已經取得了許多成就,卻也有其局限性。其中一個局限就是機器太復雜了,深層神經網絡可能有超過10億個參數,這是模擬神經元之間的權重,所以很難準確地理解它們到底學到了什么。

    而且事實證明,有時這些系統學會的東西并不是我們想要教給它們的。舉個簡單的例子,

    在我實驗室工作的一個學生訓練了一個深層神經網絡,他嘗試用這個系統來區分照片中是否有動物。在左邊大家可以看到,有一個動物是一只鳥,而在右邊沒有動物。這名學生用了一組自然照片來訓練該系統,并且完成得很好。但是當他詳細觀察機器所學到的內容時,他發現系統是利用背景的模糊度來判斷照片中是否有動物,因為在這些有動物的照片中,攝影師會聚焦在前景的動物上,而背景是模糊的,然而沒有動物的圖片則背景清晰。所以盡管這并不是我們希望機器學習的內容,但是它利用統計上的相關性很好地完成了任務,我們可以在許多機器學習項目中看到這種情況。

    另一組研究表明,當一個深度神經網絡經過了ImageNet圖像訓練,以99%的置信度識別像消防車這樣的物體。如果這些物體經過圖像處理呈現出不同的位姿,像這樣,現在神經網絡會以高置信度將其歸類為校車、消防船或雪橇,而人類是不會做出這樣的分類的。這確實表明該網絡所依賴的特征并不是人類所使用的對圖像進行分類的特征,而是其他我們根本不清楚的特征。很多例子都能說明這種情況,我們稱之為捷徑學習,這就是深度神經網絡如何學習統計關聯。在特定的數據集上表現不錯,但是卻不能進行很好地概括。而在語言處理中,機器有時可能是對的,但卻是誤打誤撞,對手可以利用深度神經網絡的這些弱點,以非人類的方式來愚弄它們。

    卡內基梅隆大學的一組研究人員設計出了一種眼鏡框,上面有五顏六色的圖案專門用來欺騙一個面部識別系統。他們用他們展示了不同類型的眼鏡框來騙系統,比如系統認為該論文的其中一個作者是女演員米拉·喬沃維奇,人不會犯這樣的錯誤。但不知何故,神經網絡根據某些神秘特征來進行分類,使得系統變得脆弱,從而受騙。

    另一個例子來自加利福尼亞大學的一個小組,他們把白色和黑色的貼紙貼在這樣的一個停車標志上欺騙深度學習視覺系統。即使在不同距離和多角度拍攝下,使其認為這是一個限速80的標志,所以這就關系到自動駕駛汽車的配置問題。自動駕駛汽車在很大程度上依賴于這類深度神經網絡視覺系統,所以下一步我們想要實現的就是人工智能3.0,我們需要克服許多還未解決的重大的挑戰。

    第一個就是小樣本學習,現在深度神經網絡需要從人類標記的成百萬上千萬個例子中學習,但在人類學習時不需要那么多例子。我們看幾個關于橋的例子就能認出不在我們訓練集中的新橋,這就是小樣本學習。我們也可以歸納出與我們學習內容大不相同的新概念,例如前一張幻燈片中的圖片沒有一座像這樣的橋,這座橋看起來大不相同,但是我們很快就能認出這是一種橋。同樣的我們也能確定,這張有意思的照片是一座水橋,而不是別的。汽車在高速路上過河,我們可以看出來是船在河上路過高速,高速公路就在這條河下方,這是對橋的概念的一種顛覆。但我們很容易理解并且認出來,我們必須要讓計算機能夠識別出來,不僅僅是概括,還要能抽象和類比。

    接著講橋的例子,我們可以認出這是一種橋,和我們之前看到的不太一樣,這群螞蟻在用身體搭橋來越過這個縫隙。還有更抽象的,我們會說雙手搭在一起或者鼻梁,我們把鼻子這個部分叫做鼻梁,因為它確實是連接臉部兩側的橋梁。在說到歌曲的時候,我們也會說歌的橋段。一首歌可以有一段主歌、一段副歌,一段主歌、一段副歌,所謂的橋段就是將歌曲引入一個新的部分,所以橋這個詞某種程度上是有很大隱喻意義的。我們可以對這個基本概念進行拓展,并且在各種各樣更加抽象的語境中使用。還有很多英語短語,比如縮小男女之間的性別差異,又比如拜登在競選總統期間,稱自己是通往新一代領袖的橋梁。我們可以非常清楚地理解這些隱喻,甚至沒有注意到它們是隱喻含義。所以這種抽象和類比的能力是讓機器能夠理解人類語言,像人類一樣進行概括的關鍵。

    霍夫斯塔特在他的文章《類比是認知的核心》中指出,事實上概念是一系列的類比,從橋的例子中大家就可以看出這一點。我們還需要機器穩健且具備常識,我之前舉的一些例子確實提出這樣的疑問,我們用數百萬個的例子訓練出來的系統到底有多穩???舉個例子,這是一張高速公路的照片,這條公路在暴風雪來臨前已經提前鋪好了融雪鹽,這些融雪鹽在經常下雪的地方很常見,融雪鹽會防止車輛在雪地或冰上打滑。但特斯拉的自動駕駛系統會對此感到很困惑,因為它沒有暴風雪或者鹽線的概念,它之前從來沒有見過這樣的東西,所以它無法根據自己的認識判斷將要發生什么,也不知道這些是不是車道。我們還看到,特斯拉撞上了停下來的車輛。比如這輛特斯拉在自動駕駛的過程中,撞上了這輛停下來的消防車,原因是特斯拉公司發現,它們的車沒有常識,不知道在哪些靜止物體,如廣告牌前面應該停下來,所以他們設置成在許多靜止物體前不需要停下來,因此它就撞上了這輛消防車。

    類似的自動駕駛汽車往往會在人們預想不到的情況下剎車,這樣一來,人們會撞上去追尾。也就是說,他們撞上了停著的車的車尾,是因為這些自動駕駛汽車很難弄清楚遇到什么樣的障礙物需要停下來。例如,他們可能不知道在遇到一個漂浮的塑料袋或者是風滾草,或是一群可能會飛走的鳥的時候是否需要停下來,而我們人類知道。如果前面的路上有很多碎玻璃  應該停下來,根據常識,我們知道這個雪人不是要過馬路的行人,這些都是我們人類所說的常識。這也正是今天的機器缺少的東西,所以有很多人在研究讓機器掌握常識。比如微軟聯合創始人保羅·艾倫,他投入了大量資金,在一所機構研究機器常識以及美國國防部正在試圖投入資金,研究如何讓機器擁有常識。但對于人工智能來說,這是一個巨大的挑戰。

    最后一個例子,大家看一下這張照片想象一下,假如你是一輛自動駕駛汽車,遇到這種情況你需要知道什么?我們常識的核心部分是我們的物理直覺,我們知道物體之間是如何相互作用的。比如說這位女士推著嬰兒車,嬰兒車有輪子,我們可以猜測它的速度。而且我們知道 如果她拉著這條狗,而這條狗站著不動,那么她得使勁拉才能讓狗動起來,這些都是我們的物理直覺。我們可以借此來預測接下來的場景,這一點對于安全駕駛來說是非常重要的??偟膩碚f,要人還有動物在現實世界里互動,我們也有直覺心理學的知識。比如說我們知道這位女士分心了,她不會注意到周圍的司機,我們知道很多這種因果關系的心理模型,我們知道是什么導致嬰兒車移動。而如今的機器深層神經網絡是利用統計關聯來做出決策的,它們無法輕易地找出原因。我們有著廣博的知識,比如我們知道這個人有腿,即使他的腿在嬰兒車后面我們看不到,我們也知道他可能穿了鞋子。即使我們看不見他的鞋子,因為我們對人類的行為非常了解。最后,我們可以進行抽象和類比,這樣我們就可以對這種情況進行抽象分類。也就是分心的行人或者是類似的事物,最后我們可以適當地對我們的決定給出詳細的解釋,機器目前是完全無法做到這一點的,讓我們很難理解他們為什么會犯這樣的錯誤。所以所有這些常識的核心組成部分將成為人工智能3.0系統打造的重點,這些都是為了實現我們想要的人工智能必須克服的挑戰。如果你有興趣想要了解更多內容,可以看我的書《AI 3.0》,我在書中詳細地討論了很多這方面的問題。

    感謝各位的聆聽!

    主辦單位

    北京市人民政府 中華人民共和國工業和信息化部 中國科學技術協會

    承辦單位

    中國電子學會 北京市經濟和信息化局 北京經濟技術開發區管委會
    獲取有關世界機器人大會的最新動態 請掃描左側二維碼關注大會官方微信
    中國電子學會 ? 2015-2021 All rights reserved備案號:京ICP備12041980號-10
    无码任你躁国语版视频,1000部做羞羞事禁片免费视频,偷拍与自偷拍亚洲精品农村的,波多野结衣AV一本一道