圖片來(lái)源:視覺(jué)中國(guó)
科技日?qǐng)?bào)記者?劉霞
生成式人工智能(AIGC)在目前的技術(shù)領(lǐng)域穩(wěn)居“C位”。其利用人工智能(AI)技術(shù),通過(guò)已有數(shù)據(jù)尋找規(guī)律,并通過(guò)預(yù)訓(xùn)練大模型、生成式對(duì)抗網(wǎng)絡(luò)等方法,自動(dòng)生成各種類(lèi)型的內(nèi)容,例如文章、視頻、圖片、音樂(lè)、代碼等。AIGC代表了AI技術(shù)發(fā)展的新趨勢(shì),過(guò)去傳統(tǒng)AI偏向分析能力,而現(xiàn)在AI正在生成新內(nèi)容,實(shí)現(xiàn)從感知理解世界到生成創(chuàng)造世界的躍進(jìn)。
過(guò)去,人們只能使用AIGC創(chuàng)建碎片化的對(duì)象。現(xiàn)在,人們?cè)絹?lái)越多地使用AIGC創(chuàng)建整個(gè)世界。據(jù)美國(guó)《福布斯》雙周刊網(wǎng)站近日?qǐng)?bào)道,AIGC技術(shù)領(lǐng)域正在噴涌出一些令人興奮和充滿(mǎn)活力的新功能,為富有想象力、有趣且有潛在用處的產(chǎn)品、服務(wù)和體驗(yàn)(包括但不限于游戲創(chuàng)作)開(kāi)辟了新機(jī)會(huì)。
深度學(xué)習(xí)加聊天
近年來(lái),隨著AI技術(shù)的不斷發(fā)展,聊天機(jī)器人在各個(gè)領(lǐng)域逐漸成了“香餑餑”,也成了人們非常喜歡的交互方式?;谏疃壬窠?jīng)網(wǎng)絡(luò)的聊天機(jī)器人更是成為了研究熱點(diǎn)。
這些聊天機(jī)器人由深度機(jī)器學(xué)習(xí)提供動(dòng)力,但靈感來(lái)自人類(lèi)大腦結(jié)構(gòu)。在訓(xùn)練過(guò)程中,超級(jí)計(jì)算機(jī)會(huì)讀取大量文本并進(jìn)行訓(xùn)練,這種訓(xùn)練使聊天機(jī)器人能夠在對(duì)話(huà)中結(jié)合上下文語(yǔ)境,產(chǎn)生類(lèi)似人類(lèi)的文本響應(yīng)。
目前,智能客服聊天機(jī)器人集成了這項(xiàng)技術(shù)。隨著這些機(jī)器人在語(yǔ)言翻譯、創(chuàng)造性寫(xiě)作、理解上下文并作出有意義反應(yīng)方面的能力不斷增強(qiáng),這些聊天機(jī)器人也可成為忙碌的專(zhuān)業(yè)人士的虛擬助理。
自然語(yǔ)音合成
當(dāng)大聲朗讀文本時(shí),許多AI機(jī)器人發(fā)出的聲音聽(tīng)起來(lái)不自然且令人不舒適。但科學(xué)家現(xiàn)在可利用文本-語(yǔ)音軟件領(lǐng)域的一些新工具,創(chuàng)建聽(tīng)起來(lái)更加自然而舒適的合成語(yǔ)音。
例如,AI文本轉(zhuǎn)語(yǔ)音公司ElevenLabs推出了AI配音功能,可將口語(yǔ)內(nèi)容轉(zhuǎn)換為另一種語(yǔ)言,同時(shí)保留原說(shuō)話(huà)者的聲音、語(yǔ)言模式、情感和語(yǔ)調(diào)。這款流行且功能強(qiáng)大的語(yǔ)音生成器讓任何人都可創(chuàng)建專(zhuān)業(yè)的畫(huà)外音。
這些工具可將文本轉(zhuǎn)換為具有不同聲音、風(fēng)格和語(yǔ)言的優(yōu)質(zhì)音頻,有望在電子游戲和娛樂(lè)行業(yè)大顯身手,為其中的動(dòng)畫(huà)角色賦予獨(dú)特的配音。它還可與其他技術(shù),例如神經(jīng)語(yǔ)言模型聊天機(jī)器人相結(jié)合,為用戶(hù)與名人進(jìn)行“對(duì)話(huà)”創(chuàng)造獨(dú)特且逼真的體驗(yàn)。
圖片創(chuàng)作編輯
有了新的AIGC圖片編輯工具,人們可做的將不再限于在照片上貼有趣的貓耳朵。
AI應(yīng)用程序EPIK可讓用戶(hù)生成懷舊的、90年代風(fēng)格的照片。與其他最近流行的AI應(yīng)用程序類(lèi)似,EPIK的工作原理是讓用戶(hù)首先上傳一系列自拍照,然后EPIK使用這些自拍照生成復(fù)古年鑒照片。近期,隨著來(lái)自世界各地的名人開(kāi)始在社交媒體上分享EPIK生成照片,該應(yīng)用程序10月飆升至蘋(píng)果應(yīng)用商店的榜首。
EPIK并非第一個(gè)因奇妙功能而走紅的AI照片應(yīng)用程序。此前,Lensa和Remini等產(chǎn)品也風(fēng)靡一時(shí),Lensa提供AI生成的“魔法頭像”;Remini則因其專(zhuān)業(yè)外觀的AI頭像而在今年夏天登上蘋(píng)果應(yīng)用商店榜首。
簡(jiǎn)而言之,這些新工具生成上傳照片的超現(xiàn)實(shí)版本,且擁有一系列風(fēng)格,如復(fù)古、優(yōu)雅、運(yùn)動(dòng)等。這些照片編輯工具顯然也可應(yīng)用于游戲、電影、平面廣告或任何依賴(lài)人類(lèi)圖像的東西。
AI情感陪伴
AI情感陪伴是指利用自然語(yǔ)言處理技術(shù),來(lái)模擬、理解、表達(dá)和滿(mǎn)足人類(lèi)的情感需求,從而提供給用戶(hù)一種類(lèi)似于人類(lèi)之間情感交流和支持的體驗(yàn)?;诖祟?lèi)工具創(chuàng)建的模型,能真實(shí)而富有同情心地與人類(lèi)討論思想和感受,進(jìn)行角色扮演,幫助管理用戶(hù)的焦慮情緒。
當(dāng)然,仍有很多人對(duì)與AI建立更加親密的關(guān)系感到不舒服,但開(kāi)發(fā)人員斷言,這些工具可幫助用戶(hù)更好地學(xué)習(xí)社交技能,體察自己的情緒或思維模式,管理自身的壓力,并努力改善情緒健康。
此外,鑒于這些AI模型能模仿人類(lèi)的聲音、言語(yǔ)模式、外表甚至性格,潛在用戶(hù)擔(dān)心別有用心之人利用這些工具實(shí)施欺詐、身份盜竊或其他犯罪行為。而這正是業(yè)界仍在努力解決的問(wèn)題。
《福布斯》網(wǎng)站強(qiáng)調(diào)稱(chēng),通過(guò)嚴(yán)格的身份驗(yàn)證,例如雙因素認(rèn)證、視網(wǎng)膜掃描、政府對(duì)數(shù)據(jù)隱私實(shí)施的嚴(yán)格規(guī)定,以及用戶(hù)更謹(jǐn)慎地與AI平臺(tái)共享某些數(shù)據(jù),上述AIGC工具有望在未來(lái)安全有效地為用戶(hù)提供一系列極具創(chuàng)新性且極有用的功能。