時(shí)間:2023-04-13 18:58:19 來源: 九派新聞
電腦屏幕上的“奶奶”說話了:“我和他(你爸)說,別喝酒,要節(jié)約,別打牌。”吳伍六(化名)對(duì)著屏幕和她聊著。“奶奶”眨眼,點(diǎn)頭,卻很少回答。
(資料圖)
這是他按照記憶里奶奶的表達(dá)方式修改的回答。現(xiàn)實(shí)中的她耳背,習(xí)慣用兩三個(gè)字說話。
奶奶去世兩個(gè)月了,吳伍六會(huì)和往常一樣拿起手機(jī)撥通她的電話,卻再也無法接通。3月份,他收到老家寄來的遺物后,想到用AI還原奶奶,“這是一個(gè)非常冒險(xiǎn),也很瘋狂的事情,但我內(nèi)心還是想去試試。”
吳伍六給ChatGPT詳細(xì)地描述了奶奶的形象、說話習(xí)慣,然后導(dǎo)入奶奶的照片、電話錄音并用AI工具生成動(dòng)態(tài)影像。十幾天后,“奶奶”出現(xiàn)了。對(duì)話第一遍時(shí),他很興奮,但還是發(fā)現(xiàn),AI生成的像是一個(gè)老道的長(zhǎng)者,而不是親人。
以下是與他的對(duì)話。
AI復(fù)原的奶奶。圖/吳伍六視頻截圖
【1】“我在做一件很瘋狂的事”
九派新聞:為什么想要用AI復(fù)原奶奶?
吳伍六:我奶奶是3個(gè)月前在老家去世的,過年本來想和她團(tuán)圓,但我下了高鐵就直接去了醫(yī)院,她病危了。我有很多想說的話跟她說,但是奶奶在醫(yī)院時(shí)已經(jīng)意識(shí)模糊,沒辦法跟我交流。直到她去世,我更感到有點(diǎn)無助,或者說是不知所措。
在奶奶生前,我就習(xí)慣了每天中午和她打電話,基本都會(huì)聊5到10分鐘。我回上海后,有很長(zhǎng)一段時(shí)間,中午就重復(fù)打那個(gè)號(hào)碼,電話那頭一直是無人接聽的狀態(tài),那段時(shí)間心情還是很低落的。
我有一些很想說的心里話,沒辦法和同事、朋友分享,因?yàn)閯傞_年,他們正處于過年歡樂氣氛下,我也不想和他們聊這種很傷感、難過的事。所以,這段時(shí)間我一直很沉默。我不知道該如何去表達(dá)和排遣。
九派新聞:當(dāng)時(shí)覺得AI復(fù)原能夠?qū)崿F(xiàn)嗎?
吳伍六:我是做設(shè)計(jì)的,最早接觸的是AI繪畫,之后我也接觸到AI新出的工具和應(yīng)用。收到老家寄來的奶奶的遺物之后,我心情很低落,所以我就在想,我能不能用AI這樣的工具去做這件事。因?yàn)槲铱戳藝?guó)外的一些視頻,理論依據(jù)上是可行的,但是國(guó)內(nèi)還沒有人去嘗試。
我當(dāng)時(shí)覺得,這樣的嘗試是非常冒險(xiǎn),也很瘋狂的,但是我內(nèi)心的想法還是去試試。讓我再和奶奶,或者說是虛擬意義上的“奶奶”再溝通一下,哪怕就一分鐘甚至半分鐘都好。
【02】“輸出相似度只有30%”
九派新聞:奶奶的頭像和聲音如何還原?
吳伍六:我找殯儀館的工作人員要了奶奶的遺照,那個(gè)照片經(jīng)過了高清修復(fù)。照片還算清楚,背景也干凈,做虛擬頭像的效果還是不錯(cuò)的。
我奶奶聲音這部分的處理有很大的工作量。但我存有一年半的通話錄音,我電話錄音是自動(dòng)開啟的。每一條去聽,把有關(guān)奶奶的聲音給提取出來,然后利用百度的一個(gè)開源平臺(tái)去做聲音克隆。
截取的音頻。圖/吳伍六視頻截圖
后面也遇到了一些困難。我提供的是湖北方言,技術(shù)識(shí)別難度很大。另外,奶奶跟我聊的內(nèi)容都是一些很家常的話,她的回答有限。
因?yàn)槟棠潭常芏嗍虑槲覀兌剂牡煤?jiǎn)短,聊得最多的就是:吃了沒有,喝了沒有,或者過得怎么樣,家里怎么樣。她的回答都很單一,基本上都是一些簡(jiǎn)短的生活類關(guān)心的話,這個(gè)樣本數(shù)據(jù)本身是不豐富的。
九派新聞:chatGPT模仿奶奶的效果如何?
吳伍六:GPT這種大語言模型,確實(shí)通用性很強(qiáng),但是要去做一些個(gè)性化定制,還是有局限性的。比如,我給它輸入了一些簡(jiǎn)短的信息,關(guān)于奶奶的生平背景、語言習(xí)慣、生活習(xí)慣,但是輸出來的相似度只能達(dá)到30%。主要的差別在于,AI感覺更像是扮演一個(gè)智慧的長(zhǎng)者,它能夠提供很多心理或者行為上的安慰,而且,你問一句話,它能回答很長(zhǎng)一段話。但在現(xiàn)實(shí)中,我奶奶是一個(gè)沒有什么文化的,84歲且反應(yīng)略顯遲鈍的農(nóng)村老人,她不太能進(jìn)行那么長(zhǎng)時(shí)間的深入交流,她更多的是點(diǎn)頭和微笑。
在視頻對(duì)話的過程中,我截取了一些GPT回復(fù)的內(nèi)容,然后再把對(duì)話內(nèi)容輸入到AI合成的軟件中生成音頻。但是我沒有完全按照它給的文本去輸出,還是按照我記憶中奶奶習(xí)慣性的回答去做的。目前AI的技術(shù)還不能完全理解人類情感,也只是支持標(biāo)準(zhǔn)化的神態(tài),比如抬手、比“耶”這些動(dòng)作是做不到的。
chatGPT模擬的對(duì)話。圖/吳伍六視頻截圖
【3】“反復(fù)觀看我會(huì)有些傷感”
九派新聞:視頻做了多久?
吳伍六:整個(gè)花了兩周。我記得很清楚,當(dāng)時(shí)是凌晨4點(diǎn),把視頻剪完之后,我想發(fā)給朋友或親人,但是我一下子就不知道該發(fā)給誰了,所以我就發(fā)給了我自己。那天快日出的時(shí)候,我看了很多很多遍。
我看第一遍的時(shí)候很興奮,非常興奮,覺得我好像做了一件超級(jí)瘋狂的事情。有點(diǎn)熱淚盈眶的感覺。
但是當(dāng)我反復(fù)去看這個(gè)對(duì)話的時(shí)候,我又有一點(diǎn)傷感了,因?yàn)槲矣窒肫鹆宋夷棠獭N抑翱吹竭z物的時(shí)候會(huì)傷感,現(xiàn)在當(dāng)我和她再次對(duì)話的時(shí)候又想起了奶奶在醫(yī)院的那段離別的場(chǎng)景,小時(shí)候的回憶又涌上心頭。其實(shí)這種感情是復(fù)雜的,悲喜交加的,或者說是既興奮又害怕,又有一點(diǎn)熟悉又陌生。
九派新聞:為什么會(huì)害怕?
吳伍六:她是我的奶奶,在一定程度上好像是的,但是也不完全是,這個(gè)遺憾通過某種方式去彌補(bǔ)之后,你會(huì)有一種失落。好像有一些還未完成的某些東西想要繼續(xù)去探索,就像樹洞一樣,這種方式可以作為你最親近人的一個(gè)形象去傾聽你的聲音,當(dāng)你找不到人聊天的時(shí)候,有一些心里話不知道跟誰說的時(shí)候,她可能是一個(gè)舒適的,排遣焦慮和自我安慰的對(duì)象。但也只能作為一個(gè)短期的鎮(zhèn)痛劑,不可能成為起死回生的靈丹妙藥。
九派新聞:這段視頻親人看過嗎?
吳伍六:我發(fā)給過我的親人,他們有點(diǎn)驚訝。特別是我爸,他給我的反饋就是驚訝,然后繼續(xù)看下去,又會(huì)發(fā)現(xiàn)有很多地方還是不相似。就像我剛才提到的那種熟悉而陌生的感覺。AI還是不能夠承接一個(gè)完整的,擁有過84年生活經(jīng)歷和鮮活生命的人。
也就是說,機(jī)器是可以學(xué)習(xí)人的行為、動(dòng)作、外貌、聲音,而且學(xué)的比人還要快,還要精準(zhǔn),但是就算是你讓一個(gè)表演老道的演員去演我的奶奶,她也可能演不出那種狀態(tài)。更何況讓一個(gè)AI表演,難度是非常非常大的。AI無法承載這些記錄了幾十年朝夕相處的,普通但溫暖的時(shí)光。
九派新聞?dòng)浾摺●R婕盈
編輯 曾金秋
【爆料】請(qǐng)聯(lián)系記者微信:linghaojizhe
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-13
頭條 23-04-12
頭條 23-04-12
頭條 23-04-12
頭條 23-04-12
頭條 23-04-12

【環(huán)球快播報(bào)】AI復(fù)原去世的“奶奶”:她像長(zhǎng)者而不是親人,“反復(fù)觀看會(huì)有些傷感”
世界觀點(diǎn):省委書記開會(huì)全程網(wǎng)絡(luò)直播,也是調(diào)研民意的好辦法丨九派時(shí)評(píng)
全球看點(diǎn):女子為拿回被騙的31萬堅(jiān)持再轉(zhuǎn)5萬,“我老公要和我離婚了”,怒懟民警耽誤她:我會(huì)怪你們的,要怪你們的!
卡塔爾和巴林決定恢復(fù)外交關(guān)系-天天觀速訊
永遠(yuǎn)的最佳拍檔!被問最想對(duì)吳孟達(dá)說什么,周星馳回應(yīng):I love you,后悔未曾親口表達(dá) 天天速遞