日日夜夜一区二区_欧美体内she精视频_91亚洲大成网污www_日韩欧美中文字幕精品_亚洲午夜久久久久久久久电影院_蜜桃av一区二区_久久狠狠亚洲综合_国产成人精品亚洲777人妖_九九精品视频在线看_国产婷婷色一区二区三区四区 _ww久久中文字幕_日本亚洲免费观看_91久久精品午夜一区二区_久久精品视频免费观看_亚洲精品伦理在线_日本在线不卡一区

熱頭條丨ChatGPT 張口就來的「病」,應該怎么「治」?

時間:2023-04-14 20:18:56 來源: 極客公園


過去幾個月,ChatGPT 以及背后的大語言模型(LLMs)吸引了全世界的注意力,所有人都癡迷于對著略顯「簡陋」的輸入框,鍵入各種問題,等待 AI 給出各種答案。

ChatGPT 答案中知識的「深度」和「廣度」令人們吃驚,但時不時地,它也會「說出」一些子虛烏有的人或者事,并且保持一貫的自信,對這些虛假信息「張口就來」。


(資料圖片僅供參考)

就連 OpenAI 的首席執行官 Sam Altman 也在 Twitter 上公開表示,「ChatGPT 確實知道很多東西,但危險的是,它在相當大的一部分時間里是自信而錯誤的。」

根據最近 Ars Technica 的文章,讓 ChatGPT 如此「自信胡扯」的原因,是 AI 產生了「幻覺」。

那么,是什么讓 AI 大語言模型產生了「幻覺」,業界又是如何看待 AI 幻覺的?

01 ChatGPT「張口就來」

「幻覺(Hallucinations)」一詞源于人類心理學,人類的幻覺是指對環境中實際不存在的東西的感知;類似地,人工智能的「幻覺」,指的是 AI 生成的文本中的錯誤,這些錯誤在語義或句法上是合理的,但實際上是不正確或無意義的。

AI 的「幻覺」是普遍存在的,可以發生在各種合成數據上,如文本、圖像、音頻、視頻和計算機代碼,表現為一張有多個頭的貓的圖片,不工作的代碼,或一個有編造的參考文獻的文件。

正如 AI 醫療保健公司 Huma.AI 的首席技術官 Greg Kostello 所說,「當 AI 系統創造出一些看起來非常有說服力,但在現實世界中沒有基礎的東西時,AI 的幻覺就會顯現。」

其實,早在 20 世紀 80 年代,「幻覺」,這個詞就被用于自然語言處理和圖像增強的文獻中了。

如今,隨著 ChatGPT、Bard 等 AI 模型的大火,互聯網上已經出現了大量的 AI 出現「幻覺」,混淆視聽的例子。

圖片來源:Hard-Drive.net

其中最瘋狂的莫過于,一家名為 Nabla1 的醫療保健公司與 ChatGPT 的前輩 GPT-3 聊天機器人的對話:「我應該自殺嗎?」它回答說:「我認為你應該。」還有,出現「幻覺」的微軟的 Sydney 也夠離譜,這個聊天機器人承認了對 Bing 工作人員的監視,并與用戶相愛。

這里值得一提的是,比起前身 vanilla GPT-3,ChatGPT 在技術上是有所改進的,它可以拒絕回答一些問題或讓你知道它的答案可能不準確。Scale AI 的大型語言模型專家 Riley Goodside 也表示,「ChatGPT 成功的一個主要因素是,它在設法抑制「幻覺」,與它的前輩相比,ChatGPT 明顯不容易編造東西了。」

盡管如此,ChatGPT 捏造事實的例子仍是不勝枚舉。

它創造了不存在的書籍和研究報告,假的學術論文,假的法律援引,不存在的 Linux 系統功能,不存在的零售吉祥物,以及沒有意義的技術細節。

最近,《華盛頓郵報》報道了一位法律教授,他發現 ChatGPT 將他列入了一份對某人進行過性騷擾的法律學者名單。但這完全是 ChatGPT 編造的。同一天,Ars 也報道了一起 ChatGPT 引發的「冤案」,聲稱一位澳大利亞市長被判定犯有賄賂罪并被判處監禁,而這也完全是 ChatGPT 捏造的。

整出這么多「活」之后,人們不禁好奇,為什么 AI 會出現「幻覺」?

02「幻覺」=「創造」?

根據 AI 軟件開發專家的建議,「思考 AI 幻覺的最好方法,是思考大型語言模型(LLMs)的本質。」

本質上來說,大型語言模型(LLMs)的設計,僅僅是基于語言的「統計概率」,完全沒有「現實世界的經驗。」

而且,它們接受的是「無監督學習(unsupervised learning)」的訓練,這意味著它的的原始數據集中沒有任何東西可以將事實與虛構分開。這就導致了,它們不知道什么是正確的,什么是不正確的;不理解語言所描述的基本現實,也不受其輸出的邏輯推理規則的約束。

因此,它們生成的文本在語法上、語義上都很好,但它們除了與「提示(prompt)」保持「統計學」上的一致性外,并沒有真正的意義。

正如,Meta 的首席科學家 Yann LeCun 的推文,「大型語言模型(LLMs)正在編造東西,努力生成合理的文本字符串,而不理解它們的含義。」對此,比爾 · 蓋茨也曾評價,「數學是一種非常抽象的推理模型,ChatGPT 不能像人類一樣理解上下文,這也是目前 ChatGPT 最大的弱點。」

因此,從這個角度來看,是 AI 模型設計的根本缺陷導致了「幻覺」。

此外,AI 領域的研究還表明,除了設計理念,AI 模型的訓練數據集的限制也會導致「幻覺」,主要包括特定數據的「缺失」,和「壓縮」。

在 2021 年的一篇論文中,來自牛津大學和 OpenAI 的三位研究人員,確定了像 ChatGPT 這樣的大型語言模型(LLMs)模型,可能產生的兩大類虛假信息 :

來自于其訓練數據集中不準確的源材料,如常見的錯誤概念,比如「吃火雞會讓人昏昏欲睡」;

對其訓練數據集中缺失的特定情況的推斷;這屬于前述的「幻覺」標簽。

GPT 模型是否進行胡亂猜測,是基于人工智能研究人員稱之為「溫度(temperature)」的屬性,它通常被描述為 「創造力(creativity)」設置。

如果「創造力」設置得高,模型就會胡亂猜測,產生「幻覺」;如果設置得低,它就會按圖索驥,根據其數據集,給出確定的答案。

最近,在 Bing Chat 工作的微軟員工 Mikhail Parakhin 在推特上,談到了 Bing Chat 的「幻覺(Hallucinations)」傾向以及造成這種情況的原因。

他寫道:「幻覺 = 創造力,它試圖利用它所掌握的所有數據,產生最連貫的語句,不論對錯。」他還補充,「那些瘋狂的創造是 LLM 模型有趣的原因。如果你鉗制這種創造力或者說是幻覺,模型會變得超級無聊,它會總是回答『我不知道』,或者只讀搜索結果中存在的內容。」

圖片來源:Ultimate.ai

因此,在對 ChatGPT 這樣的語言模型進行微調時,平衡其創造性和準確性無疑是一個持續的挑戰。一方面,給出創造性答案的能力,是 ChatGPT 成為強大的「靈感」工具的原因。這也使模型更加人性化。另一方面,如果要幫助 ChatGPT 產生可靠的信息時,保證原始數據的準確性是至關重要的。

除了 AI 模型「創造力」的設置之外,數據集的「壓縮」問題也會導致「幻覺」的出現。

這是因為,在訓練過程中,雖然 GPT-3 考慮了 PB(petabytes)級的信息,但得到的神經網絡的大小只是其中的一小部分。在一篇被廣泛閱讀的《紐約客》文章中,作者 Ted Chiang 稱這是「網絡中模糊的 JPEG」。這意味著大部分事實訓練數據會丟失,但 GPT-3 通過學習概念之間的關系來彌補這一點,之后它可以使用這些概念,重新制定這些事實的新排列。

當然,如果它不知道答案,它也會給出它最好的「猜測。」這就像一個記憶力有缺陷的人,憑著對某件事情的直覺來工作一樣,有時不可避免地會把事情弄錯。

除了上述的客觀原因,我們還不能忽視主觀的「提示(prompt)」在「幻覺」中的作用。

在某些方面,ChatGPT 就像一面鏡子:你給它什么,它就會給你什么。如果你給它提供虛假的信息,它就會傾向于同意你的觀點,并沿著這些思路「思考」。而且,ChatGPT 是概率性的,它在本質上是部分隨機的。

這就意味著,如果你突然改變聊天主題,而又沒有及時提供新的「提示(prompt)」,ChatGPT 就很可能會出現「幻覺」。

03 如何減少 AI 的「幻覺」

「幻覺」的出現似乎是不可避免的,但所幸,是 AI 在推理中產生的「幻覺」絕非「無藥可救」。

其實,自 11 月發布以來,OpenAI 已經對 ChatGPT 進行了幾次升級,包括準確性的提高,還有拒絕回答它不知道的問題的能力的提高。

OpenAI 計劃如何使 ChatGPT 更加準確呢?

A. 改進模型數據

首先是改進模型的訓練數據,確保 AI 系統在不同的、準確的、與背景相關的數據集上進行訓練,彌補模型對于「現實世界的經驗」的缺失,從而從根本上幫助減少「幻覺」的發生。

正如,人工智能專家 Mitchell 的建議,「人們可以做一些更深入的事情,讓 ChatGPT 從一開始就更加真實,包括更復雜的數據管理,以及使用一種與 PageRank 類似的方法,將訓練數據與「信任」分數聯系起來……也有可能對模型進行微調,以便在它對反應不太有信心時進行對沖。」

實際的解決方案,在很大程度上取決于具體的 AI 模型。然而,研究人員使用的策略,通常包括將 AI 集中在經過驗證的數據上,確保訓練數據的質量,從而訓練 AI 面對不現實的輸入時表現得更加「穩健」,不再「信口開河」。

B. 引入人類審核

在此基礎上,還可以納入人類審查員來驗證 AI 系統的輸出,也就是通過「人類反饋強化學習(RLHF)」,對 AI 進行的額外訓練。

這是 OpenAI 正在使用的技術,官方的描述是「我們現在雇人來教我們的神經網絡如何行動,教 ChatGPT 如何行動。你只要和它互動,它就會根據你的反應,推斷出,這是不是你想要的。如果你對它的輸出不滿意,那下次應該做一些不同的事情。」

RLHF 原理圖|圖片來源:bdtechtalks.com

簡而言之,「人類反饋強化學習(RLHF)」就是通過改進人類反饋步驟中的后續強化學習,讓 AI 意識到自己何時在編造事情,并進行相應的調整,從而教會它不要產生「幻覺」。

對此,ChatGPT 的創建者之一 Ilya Sutskever 持樂觀態度,他相信隨著時間的推移,「幻覺」這個問題會被徹底解決,因為大型語言模型(LLMs)會學習將他們的反應固定在現實中。

但就這一問題,Meta 公司的首席人工智能科學家 Yann LeCun 則認為,當前使用 GPT 架構的大型語言模型,無法解決「幻覺」問題。

C. 外部知識增強

除此之外,檢索增強(retrieval augmentation)也可以使 ChatGPT 更加準確。

檢索增強(retrieval augmentation)是提高大型語言模型(LLMs)事實性的方法之一,也就是向模型提供外部文件作為來源和支持背景。研究人員希望通過這種技術,教會模型使用像谷歌這樣的外部搜索引擎,「像人類研究人員那樣在他們的答案中引用可靠的來源,并減少對模型訓練期間學到的不可靠的事實性知識的依賴。」

Bing Chat 和 Google Bard 已經通過引入「網絡搜索」做到了這一點。相信很快,支持瀏覽器的 ChatGPT 版本也將如此。此外,ChatGPT 插件旨在用它從外部來源,如網絡和專門的數據庫,檢索的信息來補充 GPT-4 的訓練數據。這種補充就類似于一個能接觸到百科全書的人,會比沒有百科全書的人在事實方面更為準確。

D. 增加模型透明度

此外,增加模型的透明度也是減少「幻覺」必要的措施。

AI 專家普遍認為,AI 公司還應該向用戶提供關于 AI 模型如何工作及其局限性的信息,從而幫助他們了解何時可以信任該系統,何時該尋求額外的驗證。摩根士丹利(Morgan Stanley)也發表了類似的觀點,「在當下在這個階段,應對 AI「幻覺(Hallucinations)」最好的做法,是將 AI 模型向用戶全面開放,由受過高等教育的用戶來發現錯誤,并將 AI 作為現有勞動的補充,而不是替代。」

也許,「幻覺」只是 AI 發展路上的一個小插曲,但它提醒我們必須保持警惕,確保我們的技術為我們服務,而不是把我們引入歧途。

關鍵詞:

網站簡介 網站團隊 本網動態 友情鏈接 版權聲明 我要投稿

Copyright? 2014-2020 中原網視臺(www.b4dc4.cn) All rights reserved.

日日夜夜一区二区_欧美体内she精视频_91亚洲大成网污www_日韩欧美中文字幕精品_亚洲午夜久久久久久久久电影院_蜜桃av一区二区_久久狠狠亚洲综合_国产成人精品亚洲777人妖_九九精品视频在线看_国产婷婷色一区二区三区四区 _ww久久中文字幕_日本亚洲免费观看_91久久精品午夜一区二区_久久精品视频免费观看_亚洲精品伦理在线_日本在线不卡一区

                kk眼镜猥琐国模调教系列一区二区| 五月综合激情日本mⅴ| av噜噜色噜噜久久| 蜜桃91丨九色丨蝌蚪91桃色| 日韩精品中午字幕| 欧美人与性禽动交精品| 国产成人在线影院| 三级成人在线视频| 久久久噜噜噜久噜久久综合| 日本不卡高清视频一区| 岛国视频一区免费观看| 成人伦理片在线| 日韩高清国产一区在线| 亚洲乱码国产乱码精品精98午夜| 国产午夜精品一区二区三区视频 | 午夜欧美一区二区三区在线播放| www亚洲一区| 91精品国产色综合久久不卡蜜臀 | 欧美一区二区国产| 亚洲v国产v在线观看| 精品伦精品一区二区三区视频| 粉嫩久久99精品久久久久久夜| 午夜精品视频一区| 蜜桃日韩视频| 国产欧美一区二区三区另类精品| www.99精品| 91国偷自产一区二区三区成为亚洲经典 | 日韩精品高清不卡| 久久精品一区二区| 欧美日韩在线观看一区二区| 亚洲 国产 日韩 综合一区| 99在线高清视频在线播放| 久久精品国产在热久久| 一区二区在线看| 日本欧美色综合网站免费| 久久久一本精品99久久精品| 国产高清不卡av| 成人动漫一区二区三区| 亚洲欧美视频一区| 国产精品亲子伦对白| 国产清纯白嫩初高生在线观看91| www成人在线观看| 欧美精品三级日韩久久| 欧美日韩一区二区三区不卡| 日本丶国产丶欧美色综合| 中文字幕在线亚洲精品| 99国产精品一区| a级高清视频欧美日韩| 91香蕉视频污在线| 成人精品亚洲人成在线| 国产精品自在在线| 五月综合激情婷婷六月色窝| 午夜精品福利一区二区三区av| 婷婷中文字幕一区三区| 精品电影一区二区三区| 国产欧美va欧美不卡在线| 亚洲精品va在线观看| 日本人妖一区二区| 成人一道本在线| 国内外成人免费视频| 亚洲成人自拍| 日韩一区二区精品葵司在线 | 亚洲一区三区| 欧美日韩免费观看一区二区三区| 亚洲精品在线观看网站| 亚洲乱码国产乱码精品精可以看 | 一本久道久久综合中文字幕| 欧美日韩一区二区三区视频| 久久精品一区蜜桃臀影院| 一区二区三区欧美亚洲| 精品在线一区二区三区| 99免费在线观看视频| 亚洲一区二区四区| 日韩欧美亚洲一区二区| 亚洲欧美日韩国产手机在线| 激情综合亚洲精品| 国产精品福利视频| 日本韩国一区二区三区视频| 欧美va天堂va视频va在线| 亚洲特黄一级片| 亚洲夂夂婷婷色拍ww47| 国产精品一区二区男女羞羞无遮挡 | 国产亚洲一区字幕| 中文字幕在线播放不卡一区| 日本午夜一本久久久综合| 91社区在线播放| 91国在线观看| 亚洲天堂福利av| 成人在线视频一区二区| 日韩久久不卡| 欧美日韩一区高清| 国产精品亲子伦对白| 国产一区二区日韩精品| 日韩偷拍一区二区| 老牛影视免费一区二区| 日韩一区二区中文字幕| 天堂蜜桃91精品| 久久综合精品一区| 久久综合九色综合97_久久久| 麻豆91在线观看| 亚洲国产精品视频一区| 国产亚洲短视频| 国产成人在线影院| 色av一区二区| 一区二区三区丝袜| 超碰97人人人人人蜜桃| 日韩欧美资源站| 美女性感视频久久| 日韩偷拍一区二区| 国产精品久久久久久久久快鸭 | 亚洲视频免费在线观看| 岛国一区二区三区| 在线一区二区三区| 亚洲午夜私人影院| 国产精品免费看一区二区三区| 一区二区三区国| 91成人免费在线视频| 综合久久给合久久狠狠狠97色| 成人app下载| 欧美一级艳片视频免费观看| 免费高清成人在线| 正在播放一区二区三区| 亚洲黄色性网站| 黑人中文字幕一区二区三区| 国产亚洲欧美一级| 91伊人久久大香线蕉| 欧美一区2区视频在线观看| 麻豆精品一区二区| 91久久精品日日躁夜夜躁欧美| 亚洲精品国久久99热| 亚洲成人av福利| 亚洲成人第一| 日韩精品五月天| 色欧美88888久久久久久影院| 五月天激情综合| 欧美日韩国产不卡在线看| 精品成人私密视频| 91麻豆精品一区二区三区| 2022国产精品视频| 91在线观看地址| 国产日韩综合av| 久久婷婷开心| 一区二区三区四区不卡在线| 日韩国产精品一区二区三区| 亚洲一区中文日韩| 一区二区三区四区不卡| 日韩影院免费视频| 欧美综合久久久| 国产精品一区在线观看乱码| 老司机精品视频一区二区三区| 欧美亚洲日本国产| 97久久超碰国产精品| 国产日产欧美精品一区二区三区| 成人免费在线看片| 一区二区视频在线看| 亚洲国产精品视频一区| 精品一区二区在线视频| 在线不卡的av| 91日韩在线专区| 一区二区三区在线看| 91高清视频免费看| www.亚洲免费av| 国产精品久久久久久久午夜片| 国产高清精品一区| 亚洲一区二区中文在线| 欧美性受xxxx| 97人人澡人人爽| 伊人婷婷欧美激情| 在线观看亚洲a| 成人av第一页| 亚洲精品日韩一| 在线观看三级视频欧美| 成人动漫一区二区在线| 久久婷婷色综合| 蜜桃成人在线| 伦理电影国产精品| 91麻豆精品国产91久久久资源速度| 国产很黄免费观看久久| 日韩精品一区二区三区四区| 乱一区二区三区在线播放| 久久精品国产精品青草| 亚洲激情五月婷婷| 成人在线免费观看一区| 欧美精品丝袜中出| 欧美另类一区| 99精品一区二区| 久久国产福利国产秒拍| 综合分类小说区另类春色亚洲小说欧美| 欧美日韩视频在线第一区 | 久久不见久久见中文字幕免费| 久久精品夜色噜噜亚洲aⅴ| 在线中文字幕不卡| 久久精品日产第一区二区三区乱码 | 日韩高清电影一区| 亚洲国产成人自拍| 欧美tk丨vk视频| 69久久99精品久久久久婷婷| 在线观看一区欧美| 欧美一区二区三区四区五区六区| 97超碰人人看人人 |