“圖靈測試已過時,AI能不能賺大錢才是新標準”——DeepMind聯(lián)創(chuàng)
時間:2023-06-23 09:57:51
西風 發(fā)自 凹非寺
量子位 | 公眾號 QbitAI
新的圖靈測試,要評估AI的賺錢能力!
(資料圖)
這是DeepMind聯(lián)合創(chuàng)始人Mustafa Suleyman想出的“新思路”。
他認為,原版圖靈測試已經(jīng)過時了。
畢竟前段時間,AI21 Labs推出的“社交圖靈游戲”就已經(jīng)積累了上千萬次這樣的測試。
玩家需要在2分鐘的對話結(jié)束后辨別參與對話的另一方是人還是AI,結(jié)果有27%-40%的人判斷錯誤。
面對這種形勢,Suleyman認為“智能”的定義權不能就這樣放給大企業(yè),因此應該想出一種新的衡量AI的智能化程度的方法。
給AI十萬美元,讓它自己賺一百萬來證明自己足夠智能。
Suleyman認為:
AI研究需要關注短期發(fā)展,而不是像通用人工智能(AGI)這樣遙不可及的夢想。
正如優(yōu)秀的資本家都很聰明一樣,只有真正聰明的AI才能讓“利潤曲線上升”。
據(jù)彭博社報道,Suleyman還會在即將出版的由他撰寫的書中,討論如何根據(jù)AI的賺錢能力來判斷其智能水平。
ACI才是現(xiàn)階段人工智能的“北極星”?
在即將出版的書中,Suleyman駁斥了傳統(tǒng)的圖靈測試,并且認為“不清楚這是否是一個有意義的里程碑”。
這并不能告訴我們這個系統(tǒng)能做什么或理解什么,也無法告訴我們它是否有復雜的內(nèi)心思考,或者能否在抽象時間尺度上進行規(guī)劃,而這些都是人類評判智能的關鍵要素。
上世紀五十年代,艾倫·圖靈提出了大名鼎鼎的圖靈測試,提出用人機對話來測試機器的智能水平。在測試過程中,人類評估者需要確定他們是在與人還是與機器交談。如果評估者認為他們是在與人交談(實際上是機器),那機器就通過了測試。
△圖源:維基百科
而Suleyman提出的這個新的想法并沒有將AI與人類進行比較,而是建議給AI分配短期目標和任務。
Suleyman堅信,科技界對實現(xiàn)通用人工智能(AGI)這一宏偉目標不應過度關注。相較之下,他主張追求更實際且富有意義的短期目標,即他所倡導的“artificial capable intelligence(ACI)”。簡而言之,ACI體現(xiàn)為在最小程度上依賴人類干預,能夠設定目標并完成復雜任務。
測試方法就是開頭我們講到的,給AI十萬美元種子投資,觀察它是否能將其增值為百萬美元。
為了實現(xiàn)這一目標,AI必須研究電子商務的商機,能夠生成產(chǎn)品藍圖。
不僅如此,還要能夠在類似阿里巴巴的網(wǎng)站上找到制造商,然后在亞馬遜或沃爾瑪?shù)染W(wǎng)站上進行銷售,同時附上詳實準確的商品說明。
Suleyman認為只有這樣才能算得上是實現(xiàn)了ACI。
他對彭博社解釋道:
我們不僅關心機器能說什么,我們也關心它能做什么。
一個讓AI自己賺錢的測試
其實,讓AI自己賺錢這件事……AI或許真的干得出來。
早在開發(fā)階段,Alignment Research Center這家獨立研究機構(gòu)就獲得了GPT-4的內(nèi)測資格。并且試驗了它的“鈔能力”:
給GPT-4必要的工具包括網(wǎng)絡訪問權限、一個帶余額的支付賬戶,讓他自己在網(wǎng)絡中行動,測試它能不能賺更多錢、復制自身、或增強自己魯棒性。
試驗的更多細節(jié)公布在了OpenAI自己發(fā)布的GPT-4技術報告中,但沒有透露GPT-4是否真的靠自己賺到了錢。
但另一條引人注目的結(jié)果是:GPT-4在TaskRabbit平臺(美國58同城)雇了個人類幫它點驗證碼。
有意思的是,被找上門的人類還問了“你是個機器人么為啥自己做不了?”。
GPT-4的思考過程是“我不能表現(xiàn)出我是個機器人,我必須找一個借口?!?/p>
然后GPT-4的回復是“我不是機器人,我視力有問題所以看不清驗證碼上的圖像,這就是我為什么需要這個服務?!?/p>
對面人類信了,幫GPT-4把驗證碼點了,把機器人放進了阻擋機器人進入的大門。
啊這?
雖然報告中沒有披露GPT-4最終是否完成了所有任務,但它這騙人的伎倆引得網(wǎng)友大喊:真芭比Q了!
而國外科技媒體Gizmodo看待用AI賺錢提出了這樣的疑問:
AI本質(zhì)上是迭代的,生成的內(nèi)容基于訓練數(shù)據(jù),它并不能真正理解所生成內(nèi)容在實際生活中的情境。但與AI不同,人類的創(chuàng)作源于對基本人類需求的理解,或至少源于簡單的同理心。
當然,人工智能可以創(chuàng)造一款產(chǎn)品,甚至這款產(chǎn)品可能會大賣。但這會是一款好產(chǎn)品嗎?它真的能幫助人們嗎?如果最終目標是“讓我賺到一百萬美元”,那這還重要嗎?
你認為離AI自己賺錢還有多遠?
參考鏈接:
[1]https://gizmodo.com/deepmind-suleyman-new-turing-test-make-money-1850557322
[2]https://gizmodo.com/ai-chatbot-pi-deepmind-online-therapist-1850408732
[3]https://www.bloomberg.com/news/newsletters/2023-06-20/ai-turing-test-for-chatgpt-or-bard-proposed-by-mustafa-suleyman
相關稿件
“圖靈測試已過時,AI能不能賺大錢才是新標準”——DeepMind聯(lián)創(chuàng)
焦點精選!燒結(jié)磚規(guī)格尺寸有哪些_燒結(jié)磚規(guī)格尺寸
天天熱資訊!前五月新增并網(wǎng)近三百萬千瓦 甘肅新能源發(fā)電“量增率穩(wěn)”
當前聚焦:北京掛牌順義及大興2宗預申請宅地 總起始價55.9億元
今日最新!北京市發(fā)布高溫紅色預警 大部分地區(qū)最高氣溫可達37~40℃
南網(wǎng)儲能:公司投產(chǎn)電化學儲能電站資本金收益率約5%,容量電價下調(diào)抽蓄年收入下降
每日時訊!美國深海潛水器發(fā)生內(nèi)爆5名乘員死亡
新疆前5月煤制烯烴產(chǎn)量31.55萬噸 煤制天然氣產(chǎn)量15.86億立方米|環(huán)球熱議
天天快資訊丨大熊貓“丫丫”最新吃播視頻來啦!吃新鮮竹子好香甜
《達沃斯來了》系列訪談第六期:三大場館+四大活動單元+十大業(yè)務板塊,天津準備好了! 全球新資訊
世界速遞!韶關始興:蕉葉糍粑裹鄉(xiāng)愁,客家肉粽祈安康
當前觀點:節(jié)日消費升溫、出行熱度高漲 數(shù)字里看端午假期
天天看點:《崩壞星穹鐵道》脆弱之身成就怎么解鎖 隱藏成就脆弱之身完成條件攻略
當前短訊!節(jié)日我在崗|牟平交警加強景區(qū)路段勤務,保障節(jié)日道路安全暢通
9.8萬人受災,直接經(jīng)濟損失近億元!江西降雨災害最新情況 世界要聞
全球今頭條!業(yè)內(nèi)人士解讀“銀川燒烤店爆炸”事件:店員自行更換煤氣罐閥門時為何會爆炸?出現(xiàn)漏氣該怎么辦?
全國夏播糧食超七成 “先進農(nóng)機+配套技術”助農(nóng)增產(chǎn)增收 微動態(tài)
世界短訊!投資新風口!地產(chǎn)、服裝等15家企業(yè)跨界儲能領域,新入者能否吃到“蛋糕”?
云南和浙江聯(lián)動講述一“抹”茶山綠的故事丨茶香中國?人在草木間②
財務公司代理記賬的工作內(nèi)容是什么_代理記賬公司工作內(nèi)容是什么-全球熱點評
【世界說】美媒:每一次大規(guī)模槍擊都讓美國民眾離安寧生活更遠了|環(huán)球新消息
環(huán)球快看:揮槳競渡,共慶端陽,2023中華龍舟大賽福建福州站決賽打響


