導讀
本文是人工智能研究院朱松純、朱毅鑫教授及團隊發表在ECCV 2022 論文Learning Algebraic Representation for Systematic Generalization in Abstract Reasoning 的介紹。
論文鍊接:
https://yzhu.io/publication/iq2022eccv/
01歸納推理與機器智商
假設給出兩個序列“a,b,c”和“d,e,f”并要求你依此填寫“g,h,?”中問号所對應的字符,你基本上可以毫不費力地填上“i”,因為這樣的序列構成了一種順序結構,每個字符都是上一個字符在字母表中的後一項。這個問題看似簡單,但其中所涉及的推理能力卻不容忽視:你需要通過僅僅兩個例子歸納出其中可能蘊含的隐藏關系,并應用這個關系,推斷接下來的問題中所需要填寫的内容。雖然推理過程看似複雜,但是這種能力其實在我們很小的時候就已經能夠掌握。在心理學的研究中,已經有不少的假說嘗試對這樣的能力進行解釋,包括“思想語言”(language of thought),“物理符号系統”(physical symbol system),和“代數思維”(algebraic mind)。
盡管這樣的能力在人類成長早期就已經出現,但我們在研究中發現,現有的人工智能系統在類似的問題中仍然無法取得人類水平的表現。具體表現為雖然我們給予了大量的參考數據用于學習,但是現有方法所訓練出來的人工智能系統模型,還是停留在計算統計量中的相關性,沒有能夠真正掌握歸納推理的精要:從現有的觀察中抽象隐藏規律,并依照這樣的規律去解決或預測接下來可能發生的事件。
到底怎樣的人工智能才能解決類似的歸納推理問題?在這項研究中,我們提出一種代數學習的方法來嘗試解決這類問題。在代數理論中,一條重要的公理就是皮亞諾公理。這條公理形式化地定義了代數系統和數字系統的根基,即如何構建一種公理化的體系去擴展我們的抽象符号系統。基于此,我們設計了一套能夠進行關系歸納的系統,來解決智能測試中的核心問題:瑞文測試(Raven's Progressive Matrices),也就是人們常說的IQ測試 [1, 2, 3]。
""
圖1(左):認知能力環。瑞文測試位于這個認知能力環的中心
圖2(右):瑞文測試的一個例子
在心理測量中,瑞文測試一直被認為是認知能力測試中的核心。它囊括了各種認知推理的能力,包括數字推理 [4],幾何類比,以及最重要的歸納推理。在這種測試中,被試需要從提供的8張圖片中尋找隐藏的關系,并利用這種關系去填補最後一張圖片中的空缺。人類在這個任務上的表現與他的“通用智能”(general intelligence)和“流體智能”(fluid intelligence)密切相關,因此被普遍認為能夠反映一個人的智商(IQ)。
近幾年來,有一些深度學習的方法嘗試提升人工智能系統在這個任務上的表現,但是我們發現,這類方法僅僅局限于學習題目表面上的統計相關性,無法深入發現題目中的規律,亦不能對這些規律進行拓展。
02一種神經-"半"符号的方法
為了解決這個問題,我們提出了一種基于代數理論的神經半符号方法,ALANS。ALANS使用神經方法理解基本的圖片,再使用符号方法去推斷隐藏的關系。
具體地,ALANS使用神經網絡的方案對每個題目中的圖片先進行初步的解譯:如理解每個物體所處的位置,他們的大小、形狀、顔色是什麼等。這些初步的解譯結果并不是簡單的堆疊;相反地,我們對每個物體保留一種概率的置信度。這樣的概率置信度有助于我們對整個系統進行概率上的解讀,也有助于我們保持系統的連續可倒特性。這些對于物體的初步理解被後續的置信分析過程整理成對一張圖片的整體理解。
圖3:使用神經方法進行單個物體的理解
圖4:對一張圖片中的所有物體進行置信分析
随後的符号過程使用代數理論去解答隐藏的關系。首先,符号系統利用皮亞諾公理将對單張圖片的理解轉化為高階矩陣空間中的點。這些高維空間的點有助于我們将原本離散的代數運算符轉化為矩陣空間中的變換。我們利用表示理論和代數系統的封閉性,将解析代數運算的問題轉變為代數系統上的優化問題。選取最簡單的線性優化問題來建模代數關系,不僅有解析解,且具有良好的可解釋性。我們用每個題目中的題幹部分分析隐藏關系,然後将分析所得的隐藏關系作用到題幹中的缺失部分以預測可能的結果,再将預測的結果與選項做比較,獲得最終的答案。由于我們的代數推理系統并不依賴于每個具體的運算符,而是可以在推理的過程中歸納新的運算符,因此我們稱我們的方法是半符号的。
圖5:使用代數理論歸納題幹圖片中的隐藏關系
圖6:根據歸納出的關系,預測最後一個序列中的剩餘項
在實驗中我們發現,ALANS模型在RAVEN [1] 和I-RAVEN [5] 兩個最常用的IQ測試數據集合中超過了現有的模型。它不僅泛化性能優異,而且在訓練的過程中還能自動學習出不同的視覺表征和規則表征 [6]。
表7:ALANS在各項泛化指标上與現有模型進行對比
此外,ALANS不僅僅能做選擇,還能做答案的生成,這點是與現有的模型的一個巨大區别 [7]。我們不僅能夠給定選項找答案,在不給選項的情況下,我們也能生成一張答案的圖片。下圖就是這樣的兩個例子。我們利用ALANS方法,直接補全了題幹中的缺失部分。這個補全方法除了在一些無關的随機變量上與選項中的正确答案不同,其他都與正确答案一模一樣 [8, 9]。
圖8:在兩個例子中,ALANS直接生成最後的答案
03總結與展望
未來,我們希望能夠繼續拓展這套歸納推理系統,引入更多、更加全面的代數結構,以幫助我們解決人工智能領域面對的各種挑戰性難題。
地址:北京市海澱區頤和園路5号(62755617) 反饋意見:its@pku.edu.cn
Copyright 版權所有©beat·365(中国)唯一官方网站 All Rrights Reserved.