首頁|必讀|視頻|專訪|運營|制造|監(jiān)管|大數據|物聯網|量子|元宇宙|博客|特約記者
手機|互聯網|IT|5G|光通信|人工智能|云計算|芯片報告|智慧城市|移動互聯網|會展
首頁 >> 應用 >> 正文

使用 GPT-3 模型,研究人員研發(fā)出能聽懂英語指令并執(zhí)行家務的機器人

2023年5月15日 09:59  IT之家  作 者:遠洋

普林斯頓大學、斯坦福大學和谷歌的一組研究人員,利用 OpenAI 的 GPT-3 Davinci 模型,研發(fā)出了一款能聽懂英語指令并執(zhí)行家務的機器人,名為 TidyBot。這款機器人可以根據用戶的喜好,自動完成如分類洗衣服、撿起地上的垃圾、收拾玩具等任務。

GPT-3 Davinci 模型是一種深度學習模型,屬于 GPT 模型系列的一部分,可以理解和生成自然語言。該模型具有強大的總結能力,可以從大量的文本數據中學習復雜的對象屬性和關系。研究人員利用這種能力,讓機器人根據用戶提供的幾個示例對象放置位置,如“黃色襯衫放在抽屜里,深紫色襯衫放在衣柜里,白色襪子放在抽屜里”,然后讓模型總結出用戶的一般偏好規(guī)則,并應用到未來的交互中。

研究人員在論文中寫道:“我們的基本見解是,LLM(大型語言模型)的總結能力與個性化機器人的泛化需求非常匹配。LLM 展示了通過總結實現泛化的驚人能力,利用從海量文本數據集中學習到的復雜對象屬性和關系!

他們還寫道:“與需要昂貴的數據收集和模型訓練的傳統方法不同,我們展示了 LLM 可以直接開箱即用地實現機器人領域的泛化,利用它們從海量文本數據中學習到的強大的總結能力!

研究人員在論文網站上展示了一個機器人,它能夠將洗衣服分為淺色和深色,回收飲料罐,扔掉垃圾,收拾包和餐具,將散落的物品放回原處,并將玩具放入抽屜。

研究人員首先測試了一個基于文本的基準數據集,其中輸入了用戶偏好,并要求模型創(chuàng)建個性化規(guī)則來確定物品歸屬。模型將示例總結為一般規(guī)則,并使用總結來確定新物品的放置位置;鶞蕡鼍岸x在四個房間中,每個房間有 24 個場景。每個場景包含兩到五個放置物品的地方,并且有相同數量的已見和未見物品供模型分類。他們寫道,這個測試在未見物品上達到了 91.2% 的準確率。

當他們將這種方法應用到真實世界的機器人 TidyBot 時,他們發(fā)現它能夠成功地收拾 85% 的物體。TidyBot 在八個真實場景中進行了測試,每個場景有一組十個物品,并在每個場景中運行機器人 3 次。據IT之家了解,除了 LLM,TidyBot 還使用了一個叫做 CLIP 的圖像分類器和一個叫做 OWL-ViT 的物體檢測器。

佐治亞理工學院交互計算學院的助理教授徐丹飛(Danfei Xu)在談到谷歌的 PaLM-E 模型時表示,LLM 使機器人具有更多的問題解決能力!耙郧暗娜蝿找(guī)劃系統大多依賴于一些形式的搜索或優(yōu)化算法,這些算法不太靈活,也很難構建。LLM 和多模態(tài) LLM 使這些系統能夠從互聯網規(guī)模的數據中受益,并輕松地用于解決新問題。”他說。

編 輯:章芳
聲明:刊載本文目的在于傳播更多行業(yè)信息,本站只提供參考并不構成任何投資及應用建議。如網站內容涉及作品版權和其它問題,請在30日內與本網聯系,我們將在第一時間刪除內容。本站聯系電話為86-010-87765777,郵件后綴為#cctime.com,冒充本站員工以任何其他聯系方式,進行的“內容核實”、“商務聯系”等行為,均不能代表本站。本站擁有對此聲明的最終解釋權。
相關新聞              
 
人物
工信部張云明:大部分國家新劃分了中頻段6G頻譜資源
精彩專題
專題丨“汛”速出動 共筑信息保障堤壩
2023MWC上海世界移動通信大會
中國5G商用四周年
2023年中國國際信息通信展覽會
CCTIME推薦
關于我們 | 廣告報價 | 聯系我們 | 隱私聲明 | 本站地圖
CCTIME飛象網 CopyRight © 2007-2024 By CCTIME.COM
京ICP備08004280號-1  電信與信息服務業(yè)務經營許可證080234號 京公網安備110105000771號
公司名稱: 北京飛象互動文化傳媒有限公司
未經書面許可,禁止轉載、摘編、復制、鏡像