科技日報(bào)記者 張夢然
據(jù)最新一期《自然》雜志發(fā)表的一篇論文,谷歌深度思維團(tuán)隊(duì)報(bào)告了一種能為大語言模型生成文本添加水印的工具,可提高對合成內(nèi)容的鑒別和追溯能力。
大語言模型(LLM)是廣泛使用的人工智能(AI)工具,能為聊天機(jī)器人、文章寫作和其他目的生成文本。不過,人們很難識別并追溯AI生成文本的來源,使信息的可靠性受到質(zhì)疑。水印被認(rèn)為能解決這一問題,但生產(chǎn)系統(tǒng)對質(zhì)量和計(jì)算效率的嚴(yán)格要求阻礙了其規(guī)?;瘧?yīng)用。
深度思維團(tuán)隊(duì)此次利用一種全新采樣算法,開發(fā)出一個(gè)給AI生成文本添加水印的系統(tǒng),稱為SynthID-Text。該工具通過采樣算法對LLM的詞匯選擇進(jìn)行巧妙偏移,插入一個(gè)能被相關(guān)檢測軟件識別的簽名。這既可以通過一種“扭曲”路徑實(shí)現(xiàn)——該路徑能提高水印質(zhì)量但會輕微影響輸出質(zhì)量,也可以通過一種能保留文本質(zhì)量的“非扭曲”路徑實(shí)現(xiàn)。
深度思維已在多個(gè)公開模型上評估了這些水印的可檢測性,發(fā)現(xiàn)SynthID-Text的可檢測性優(yōu)于當(dāng)前其他方法。他們還用Gemini LLM的近2000萬次在線對話,評估了這些文本的質(zhì)量,結(jié)果顯示非扭曲水印形式不會降低文本質(zhì)量。此外,使用SynthID-Text對LLM運(yùn)行所需算力的影響可忽略不計(jì),減少了應(yīng)用上的障礙。
團(tuán)隊(duì)同時(shí)提醒道,編輯文本或改寫輸出就能避免出現(xiàn)文本水印。但該研究證明,一個(gè)為AI生成內(nèi)容的生成式文本添加水印的工具是可行的,其將提高AI使用的責(zé)任和透明度。