AI在閱讀理解上首次擊敗人類
數十年來,研究人員一直追求對計算機系統(tǒng)進行語言理解培訓?,F在,科技巨頭阿里巴巴和微軟聲稱已朝著這一崇高目標邁出了第一步。兩種系統(tǒng)均使用斯坦福大學的問答數據集進行了測試,該數據集基于500篇維基百科文章,共收集了100,000個問題,這已成為不同AI研究小組爭奪第一個超越標準人類性能的戰(zhàn)場。
向系統(tǒng)提供了有關各種主題的文章中的多個段落,然后根據可用信息提示他們回答許多問題。
目前的人類得分為82.3,而由阿里巴巴和微軟構建的系統(tǒng)分別獲得82.44和82.65分,以其頭發(fā)的廣度擊敗了他們的生物競爭對手。
“我們很榮幸能見證機器在閱讀理解方面超越人類的里程碑。這意味著諸如“下雨的原因”這樣的客觀問題現在可以通過機器高精度地回答。”阿里巴巴自然語言處理首席科學家羅斯說。
一些新聞媒體已經掌握了新聞,聲稱人工智能現在可以比人類更好地閱讀,甚至可以以前所未有的方式減少對人類輸入的需求。
但是,正如許多其他評論員以及公司本身所指出的那樣,這不是“真正的”理解。換句話說,這些算法不知道它們在“讀”什么。
明顯的理解源于系統(tǒng)識別文章中包含的模式和匹配術語的能力。
此外,系統(tǒng)僅被提供了來自維基百科的干凈格式的材料,該材料被保證包含答案。用胡言亂語“污染”文本,或要求系統(tǒng)從幾個句子中推斷出含義,這會破壞流程,這意味著真正的理解仍然離我們很遠。
不過,在此之前,研究人員希望盡快在博物館,客戶服務機構中實施類似設計的系統(tǒng),這是一種旨在為醫(yī)療查詢提供答案的在線系統(tǒng)。
此外,世界各地的研究團隊目前正在訓練AI系統(tǒng),以解決SAT風格的數學問題和基礎科學問題。
標簽: AI