圖靈測試的著名目標(biāo)是測試人類與人交談和與機(jī)器交談時(shí)的任務(wù),從而測試人工智能的能力。它測試了AI充分理解人類語言以進(jìn)行自然的對話的能力。
任何試圖與AI聊天機(jī)器人或虛擬助手進(jìn)行對話的人都可以證明,在技術(shù)掌握這種最人類能力之前,還有一段路要走。馬里蘭大學(xué)的一項(xiàng)新研究旨在通過識別約1200個問題來幫助AI進(jìn)步,這些問題雖然對人類來說很容易回答,但傳統(tǒng)上卻阻礙了當(dāng)今可用的最佳技術(shù)。
研究人員解釋說:大多數(shù)回答問題的計(jì)算機(jī)系統(tǒng)都無法解釋為什么它們以自己的方式回答,但是我們的工作可以幫助我們了解計(jì)算機(jī)真正理解了什么。此外,我們已經(jīng)產(chǎn)生了一個數(shù)據(jù)集以在計(jì)算機(jī)上進(jìn)行測試,這將揭示計(jì)算機(jī)語言系統(tǒng)是否實(shí)際上正在閱讀并進(jìn)行人類能夠進(jìn)行的相同類型的處理。
更智能的機(jī)器
研究人員解釋說,當(dāng)今運(yùn)行的許多問答系統(tǒng)都依靠人或計(jì)算機(jī)來生成旨在訓(xùn)練系統(tǒng)的問題。這種方法的問題在于,很難理解為什么計(jì)算機(jī)努力地正確回答問題。研究人員認(rèn)為,通過更好地了解機(jī)器的殘端,我們可以更好地設(shè)計(jì)數(shù)據(jù)集進(jìn)行訓(xùn)練。
團(tuán)隊(duì)開發(fā)了一個系統(tǒng),該系統(tǒng)能夠在嘗試回答每個問題時(shí)顯示其思維過程,他們認(rèn)為,該系統(tǒng)不僅可以洞悉計(jì)算機(jī)正在經(jīng)歷的過程,而且如果部署在實(shí)際環(huán)境中,則可以讓人類提問者修改其查詢范圍。
人與機(jī)器之間的伙伴關(guān)系使1,213項(xiàng)已被計(jì)算機(jī)擊敗的問題得以成功回答。
作者解釋說:三到四年來,人們已經(jīng)意識到計(jì)算機(jī)問答系統(tǒng)非常脆弱,很容易被愚弄。但是這是我們知道的第一篇論文,實(shí)際上是使用機(jī)器來幫助人類打破模型本身。
該團(tuán)隊(duì)認(rèn)為,這些問題將成為有價(jià)值的數(shù)據(jù)集,以更好地指導(dǎo)自然語言處理工作,同時(shí)還可以充當(dāng)訓(xùn)練數(shù)據(jù)集,尤其是當(dāng)這些問題揭示了使基于AI的系統(tǒng)感到困惑的六個不同現(xiàn)象時(shí)。
這些失敗出現(xiàn)在語言領(lǐng)域,例如釋義或意想不到的上下文,或者推理能力的失敗,例如問題中各個元素的三角剖分或在得出結(jié)論時(shí)要求使用多個步驟。
研究人員解釋說:人類能夠進(jìn)行更多的概括,并看到更深的聯(lián)系。他們沒有無限的計(jì)算機(jī)存儲空間,但是他們?nèi)匀荒軌蛟谏种锌吹綐淠?。對?jì)算機(jī)存在的問題進(jìn)行分類有助于我們理解我們需要解決的問題,以便我們實(shí)際上可以使計(jì)算機(jī)開始通過樹木看森林,并以人類的方式回答問題。
可以說,在這種情況出現(xiàn)之前,還有很長的路要走,但是這項(xiàng)研究有趣地表明,在使機(jī)器更好地導(dǎo)航人類語言的細(xì)微差別方面取得了進(jìn)展。