99久久国产亚洲高清观看2020_国产免费成人_四虎国产精品永久地址入口_国产精品免费一区二区久久夜色_美国超碰在线_男人天堂tv

您的位置:首頁 > 管理 >

Aristo的AI系統可通過初二科學測試 正確答案超90%

2019-10-09 15:29:53 來源: 網易科技

上周,美國艾倫人工智能研究所(Allen Institute For Artificial Intelligence)的研究人員在一篇新論文中證明,他們設計的AI系統可以在初二

上周,美國艾倫人工智能研究所(Allen Institute For Artificial Intelligence)的研究人員在一篇新論文中證明,他們設計的AI系統可以在初二科學測試的多項選擇題中給出90%以上的正確答案,在高三科學測試中也表現得相當好,正確率超過80%。

圖:AI系統Aristo可在初二科學測試中給出90%以上的正確答案,在高三測試中的表現也相當棒

這個名為Aristo的AI系統參加了紐約攝政學院科學考試(New York Regents Science Exam,紐約州學生標準會考),但它可以享受某些優待,比如不需要解答涉及查看圖表的問題。盡管如此,研究人員在不同版本和不同年級的考試中測試了該程序,發現其表現相當穩定,絕對能與最好的學生一較高低。

Aristo展示了AI技術的高速發展歷程。該論文的作者指出,就在2016年,AI領域還沒有任何AI系統能夠在類似的初二科學考試中獲得及格成績。但自2016年以來,在AI領域發生了很多事情,尤其是用于這項任務的自然語言處理方面。

研究人員已經開發出新的方法來構建AI,使其能夠更好地完成自然語言處理任務,使AI系統能夠產生聽起來更自然的人類文本,并編寫新聞故事或詩歌。隨著AI在生成假面孔或視頻、“增強”真實圖像以及識別對象和面孔的能力方面變得更加復雜,計算機視覺已經得到了極大的改善。

AI系統已經征服了在線多人戰略游戲。隨著投資大量涌入該領域,今年搶眼的項目通常比幾年前的項目成本高得多。現在,進步的浪潮把我們帶到了能夠在科學測試中擊敗初二學生的AI系統中。

AI技術的快速發展使許多專家難以預測該領域的未來前景,他們中有些人預測相當于人類水平的AI出現可能只需10年或20年。但隨著AI系統變得越來越強大,它們將帶來更多挑戰。當它們達到人類水平的能力時,錯誤指定或設計不良的程序可能帶來災難性的風險。不過,這樣的結果是令人興奮的,它們也提醒我們,我們正在AI方面取得驚人的成就,這也許比我們制定AI政策、確保安全速度更快。

對這樣的項目的常見的批評是,AI只是反芻信息,而不是真正的思考。幾年前,這似乎是對AI系統所能做的事情的準確總結。當單詞相互關聯時,它們可以記住,但卻不能回答任何涉及更深層次概念理解的問題。這種情況一直在改變。當今最先進的AI系統仍然會犯概念性錯誤,但已經少了很多。

看看紐約攝政學院科學考試的這些問題(來自艾倫研究所的論文)就可以清楚地看出,要想在這次考試中取得好成績,你必須做許多類似概念推理的事情:

1)哪種設備能最好地分離鐵屑和黑胡椒的混合物?(1)磁鐵(2)濾紙(3)三臂天平(4)伏特計。

2)橡皮筋振動時會產生哪種形式的能量?(1)化學能量(2)光能(3)電能(4)聲能。

3)因為銅屬于金屬,所以它(1)在室溫下是液態的(2)不與其他物質發生反應(3)是不良導體(4)是良好的熱導體。

4)蘋果樹的哪個過程主要是細胞分裂的結果?(1)生長(2)光合作用(3)氣體交換(4)廢物去除。

這些當然不僅僅是關聯詞匯意義的問題。持懷疑態度的人仍然可以采取這樣的立場,即AI可能只是通過繪制詞語之間的關聯來解決這些問題:例如,“鐵屑”和“磁鐵”,“振動”和“聲音”,或者“金屬”和“良好的熱導體”。

但專注于研究復雜系統的專家梅蘭妮·米切爾(Melanie Mitchell)解釋稱:“語言模型將捕獲單詞之間的統計關聯,使其能夠在沒有任何真正理解的情況下回答問題。”

另一方面,這和我們學習科學時所做的真的有那么大的不同嗎?學習一個概念的大部分就是理解這個概念和你以前學過的其他概念之間存在的某種關系。目前還不清楚AI正在做的事情與人類正在做的事情有何根本不同。事實上,AI系統得到的能力越強,給出解釋的可能性就越小。

雖然AI取得這樣的成就很容易被低估,但也很容易被夸大。許多媒體用過分夸張的言辭報道了艾倫研究所的論文,這些報道對新的AI系統所具備的的能力做出了曲解。諸如“這個AI剛剛通過科學測試,可能比初中生更聰明”或“AI現在像初中生一樣聰明”這樣的標題,遠遠不夠準確。世界上還沒有任何AI系統具有2歲孩童那樣的解決問題能力,更不用說媲美初中生了。

像Aristo這樣的AI系統屬于狹義AI。它們非常擅長自己的工作,所要做的就是解決一個定義明確、高度具體化的問題。除了完成多項選擇題的科學考試外,Aristo不能解決其他問題。而正是在這方面,人類依然在計算機面前保持著絕對優勢,我們可以將從一個領域獲取知識去解決其他領域的全新問題。不過對于這種優勢能夠保持多久,我們仍無法確定。(作者:Kelsey Piper)

關鍵詞: Aristo AI系統 初二科學測試

精選 導讀

募資55億港元萬物云啟動招股 預計9月29日登陸港交所主板

萬科9月19日早間公告,萬物云當日啟動招股,預計發行價介乎每股47 1港元至52 7港元,預計9月29日登陸港交所主板。按發行1 167億股計算,萬

發布時間: 2022-09-20 10:39
管理   2022-09-20

公募基金二季度持股情況曝光 隱形重倉股多為高端制造業

隨著半年報披露收官,公募基金二季度持股情況曝光。截至今年二季度末,公募基金全市場基金總數為9794只,資產凈值為269454 75億元,同比上

發布時間: 2022-09-02 10:45
資訊   2022-09-02

又有上市公司宣布變賣房產 上市公司粉飾財報動作不斷

再有上市公司宣布變賣房產。四川長虹25日稱,擬以1 66億元的轉讓底價掛牌出售31套房產。今年以來,A股公司出售房產不斷。根據記者不完全統

發布時間: 2022-08-26 09:44
資訊   2022-08-26

16天12連板大港股份回復深交所關注函 股份繼續沖高

回復交易所關注函后,大港股份繼續沖高。8月11日大港股份高開,隨后震蕩走高,接近收盤時觸及漲停,報20 2元 股。值得一提的是,在7月21日

發布時間: 2022-08-12 09:56
資訊   2022-08-12

萬家基金再添第二大股東 中泰證券擬受讓11%基金股權

7月13日,中泰證券發布公告,擬受讓齊河眾鑫投資有限公司(以下簡稱齊河眾鑫)所持有的萬家基金11%的股權,交易雙方共同確定本次交易的標的資

發布時間: 2022-07-14 09:39
管理   2022-07-14

央行連續7日每天30億元逆回購 對債市影響如何?

央行12日再次開展了30億元逆回購操作,中標利率2 10%。這已是央行連續7日每天僅進行30億元的逆回購縮量投放,創下去年1月以來的最低操作規

發布時間: 2022-07-13 09:38
資訊   2022-07-13

美元指數創近20年新高 黃金期貨創出逾9個月新低

由于對美聯儲激進加息的擔憂,美元指數11日大漲近1%創出近20年新高。受此影響,歐美股市、大宗商品均走弱,而黃金期貨創出逾9個月新低。美

發布時間: 2022-07-13 09:36
資訊   2022-07-13

美股三大股指全線下跌 納斯達克跌幅創下記錄以來最大跌幅

今年上半年,美股持續回落。數據顯示,道瓊斯指數上半年下跌15 3%,納斯達克綜合指數下跌29 5%,標普500指數下跌20 6%。其中,納斯達克連續

發布時間: 2022-07-04 09:51
推薦   2022-07-04

融資客熱情回升 兩市融資余額月內增加超344億元

近期A股走強,滬指6月以來上漲4%,融資客熱情明顯回升。數據顯示,截至6月16日,兩市融資余額1 479萬億元,月內增加344 67億元,最近一個半

發布時間: 2022-06-20 09:41
資訊   2022-06-20

4個交易日凈買入超百億元 北向資金持續流入A股市場

北向資金凈流入態勢延續。繼6月15日凈買入133 59億元后,北向資金6月16日凈買入44 52億元。自5月27日至今,除6月13日以外,北向資金累計凈

發布時間: 2022-06-17 09:37
推薦   2022-06-17