科技創(chuàng)新世界潮|技術(shù)“聯(lián)姻”,雙向奔赴:機(jī)器人或成人工智能領(lǐng)域“弄潮兒”

2024-05-30 18:23:27 來源: 科技日?qǐng)?bào) 點(diǎn)擊數(shù):

科技日?qǐng)?bào)記者?劉霞

觀看《星球大戰(zhàn)》長大的一代人可能會(huì)感到失望,他們目光所及之處,仍看不到C-3PO類機(jī)器人的影子。那些預(yù)想中具有常識(shí)、能在家里和職場為人類提供幫助的人形機(jī)器人何時(shí)會(huì)出現(xiàn)?

人工智能(AI)的快速發(fā)展或許很快會(huì)填補(bǔ)這一空白。


人形機(jī)器人使用OpenAI編程獲得語言和視覺。
  圖片來源:《自然》網(wǎng)站

《自然》網(wǎng)站近日?qǐng)?bào)道指出,AI和機(jī)器人技術(shù)“聯(lián)姻”,可能是一場將彼此推向新高度的“雙向奔赴”。AI給機(jī)器人灌輸常識(shí),讓其能像人一樣處理各種任務(wù);機(jī)器人則利用身體經(jīng)驗(yàn),幫助AI躍升為“通用AI”。但專家提醒,這條雙向奔赴之路仍面臨諸多挑戰(zhàn),包括收集海量精準(zhǔn)數(shù)據(jù)供機(jī)器人學(xué)習(xí)、應(yīng)對(duì)“喜怒無?!钡挠布?、解決安全問題等。

基礎(chǔ)模型助機(jī)器人“更聰明”

眾多機(jī)器人領(lǐng)域的AI科學(xué)家都希望,未來機(jī)器人能在更廣泛環(huán)境中自主適應(yīng)。例如,會(huì)幫顧客挑選產(chǎn)品的機(jī)械臂,能陪伴老人的智能人形機(jī)器人等。


當(dāng)看到提示“挑選滅絕動(dòng)物”時(shí),谷歌的RT-2選擇了恐龍雕像。
  圖片來源:谷歌“深度思維”公司

然而,控制這類機(jī)器人絕非易事。從OpenAI到谷歌“深度思維”公司,都致力于將多功能學(xué)習(xí)算法(基礎(chǔ)模型)嵌入機(jī)器人,以便其在聊天時(shí)表現(xiàn)得更像人類。這些想法的核心是給機(jī)器人灌輸常識(shí),使之能勝任各種任務(wù)。英偉達(dá)公司機(jī)器人技術(shù)營銷專家杰拉德·安德魯斯強(qiáng)調(diào),機(jī)器人技術(shù)目前正處于變革的關(guān)鍵時(shí)刻。該公司于3月推出了一款專為人形機(jī)器人設(shè)計(jì)的通用AI模型。谷歌“深度思維”公司則創(chuàng)建了現(xiàn)有最先進(jìn)的機(jī)器人基礎(chǔ)模型之一RT-2,其可以認(rèn)出明星的照片,盡管之前受到的訓(xùn)練中該明星并未出現(xiàn)過。

研究人員樂觀地認(rèn)為,基礎(chǔ)模型有助科學(xué)家研發(fā)出可以輔助人類勞動(dòng)的通用機(jī)器人。今年2月,人形機(jī)器人公司籌集6.75億美元,以在通用人形機(jī)器人中應(yīng)用OpenAI開發(fā)的語言和視覺模型。一段視頻顯示,機(jī)器人給人一個(gè)蘋果,以回應(yīng)人們“吃東西”的要求。

多樣數(shù)據(jù)讓機(jī)器人“更有經(jīng)驗(yàn)”

盡管聊天機(jī)器人正在接受來自互聯(lián)網(wǎng)數(shù)十億單詞訓(xùn)練,但機(jī)器人活動(dòng)的數(shù)據(jù)集還遠(yuǎn)遠(yuǎn)不夠。

數(shù)據(jù)匯集或是一種解決方法。美國斯坦福大學(xué)機(jī)器人研究專家亞歷山大·卡哈扎特斯基及其同事創(chuàng)建了開源數(shù)據(jù)集DROID2,匯集了德國Franka Robotics公司制造的Franka Panda 7DoF機(jī)械臂約350小時(shí)的視頻數(shù)據(jù),包括浴室、洗衣房、臥室等數(shù)百種環(huán)境的記錄。這種多樣性有助機(jī)器人在全新環(huán)境下更好地執(zhí)行任務(wù)。

加州AI公司Covariant也在努力擴(kuò)大機(jī)器人數(shù)據(jù)的規(guī)模。該公司于2018年開始從世界各地的30種機(jī)械臂中收集數(shù)據(jù),其“機(jī)器人基礎(chǔ)模型1”(RFM-1)不僅收集視頻數(shù)據(jù),還收集傳感器讀數(shù)。此類數(shù)據(jù)對(duì)于提升機(jī)器人任務(wù)執(zhí)行能力至關(guān)重要,比如讓機(jī)器人知道如何不碰傷香蕉。

此外,許多專家正致力于構(gòu)建3D虛擬現(xiàn)實(shí)環(huán)境,旨在通過這些環(huán)境來訓(xùn)練機(jī)器人。元宇宙平臺(tái)(Meta)和英偉達(dá)都在模擬領(lǐng)域投入大量資源,以擴(kuò)大機(jī)器人數(shù)據(jù)的規(guī)模,并建立了復(fù)雜的模擬世界b。通過這些平臺(tái),機(jī)器人能夠在短短幾個(gè)小時(shí)內(nèi)積累相當(dāng)于多年實(shí)際經(jīng)驗(yàn)的數(shù)據(jù)。

硬件和安全問題需考慮

許多機(jī)器人專家指出,盡管AI給了機(jī)器人更智慧的“大腦”,但其進(jìn)一步發(fā)展仍面臨諸多挑戰(zhàn)。機(jī)器人很復(fù)雜,而且硬件很容易損壞。

新加坡國立大學(xué)人機(jī)交互專家哈羅德·索赫說,機(jī)器人可能需要大量其他類型的數(shù)據(jù),如觸覺或本體感覺(身體在空間中的位置感)數(shù)據(jù)。這類數(shù)據(jù)集目前還不存在,但這是人形機(jī)器人高效工作所必需。

安全性必須認(rèn)真考量。大型語言模型已被證明會(huì)產(chǎn)生錯(cuò)誤、偏見,也可能誘騙人類或機(jī)器人做一些“壞事”。鑒于此,研發(fā)人員需要給機(jī)器人AI模型中植入一些規(guī)則。機(jī)器人無疑仍需要大量人工監(jiān)督。

盡管存在一定風(fēng)險(xiǎn),但AI與機(jī)器人的這場雙向奔赴仍值得期待。而AI通過與機(jī)器人相結(jié)合,增加與現(xiàn)實(shí)世界互動(dòng),有望超越學(xué)習(xí)模式做出預(yù)測,真正理解和推理世界。

責(zé)任編輯:常麗君

抱歉,您使用的瀏覽器版本過低或開啟了瀏覽器兼容模式,這會(huì)影響您正常瀏覽本網(wǎng)頁

您可以進(jìn)行以下操作:

1.將瀏覽器切換回極速模式

2.點(diǎn)擊下面圖標(biāo)升級(jí)或更換您的瀏覽器

3.暫不升級(jí),繼續(xù)瀏覽

繼續(xù)瀏覽