,DeepMind、普林斯頓大學和斯坦福大學的研究人員近日提出了一項名為 LATM的創新框架,該框架可以將像 GPT-4 這樣的大型語言模型轉變為工具制造者(IT之家注:即讓模型自己生成軟件工具來處理新任務)。
LATM 的創新之處在于它為語言模型引入了工具制造和使用的概念,使得模型能夠自主創建適用于不同任務的工具。這一框架不僅能夠提高模型的靈活性和適應性,還能夠為生成式 AI 提供更加高效和經濟的解決方案。該框架主要包含以下兩個關鍵部分:
-
工具制造:作為工具制造者,LLM 專門為特定任務設計軟件工具,這些工具以 Python 函數的形式實現。
-
工具使用:另一個 LLM 作為工具使用者,可以調用這些軟件工具來處理新的請求。
這種設計可以讓 LATM 能夠將任務分配給最適合的 LLM,將需要具備高強度算力才能實現的工具制造過程可以分配給功能強大、資源密集型的模型,例如 GPT-4;而將相對簡單的使用工具過程分配給輕量級、經濟高效的模型,例如 GPT-3.5 Turbo。這種方法不僅增強了 LLM 解決問題的能力,而且可以顯著降低處理一系列任務的平均計算成本,以最大程度提升框架效率。
實驗結果驗證了 LATM 在復雜推理任務上的有效性。研究人員發現,LATM 能夠達到與資源密集型模型相當的性能,并具有更高的成本效益。這一大型語言模型方法仿照了人類創造和使用工具的進化過程,可促進大型語言模型生成工具的發展。
研究人員認為,LATM 將為自然語言處理領域帶來重大的突破,并在實際應用中發揮重要作用,這一創新可高效提升生成式 AI 的效率,以加速促進自然語言處理和人工智能領域的發展。
IT之家的小伙伴們可以在這里找到論文信息。
聲明:本網轉發此文章,旨在為讀者提供更多信息資訊,所涉內容不構成投資、消費建議。文章事實如有疑問,請與有關方核實,文章觀點非本網觀點,僅供讀者參考。
猜你喜歡
-
游客在進入北京環球度假區時須核驗北京健康
具體如下:北京環球度假區繼續按照相關政府部門的限流要求,以預約入園的形式加強人流動態監測和...詳情
2022-04-28
-
杭州湘湖的草坪人氣很高不少人在這里搭帳篷
湘湖邊亂搭帳篷,煞了春日風景景區出臺最新政策,將設置臨時帳篷搭建區,后續還要增設露營服務區...詳情
2022-04-14
-
南非徐霞客在云南:從行萬里路到吃百碗米線
題:南非徐霞客在云南:從行萬里路到吃百碗米線的文化之旅杜安睿來自南非,是一名國際注冊會計師...詳情
2022-04-10
-
廣州新增3例本土確診病例雙層觀光巴士全部
廣州新增3例本土確診病例雙層觀光巴士全部停運廣州市政府新聞辦公室21日公布的信息顯示,過去...詳情
2022-03-22