Events

【讀書會:Agents in the Era of LLMs】

讀書會
AI Agents
強化學習
多 Agent 系統

NTUAI 技術部 Mark 深入分析大型語言模型時代下的 AI Agent 核心概念與技術。從強化學習到多 Agent 系統,並實作多國語言翻譯工具範例。

NTUAI 技術部 Mark 進行 AI Agents 讀書會分享的現場照片

這次讀書會中由技術部的 Mark 深入淺出地剖析了在大型語言模型時代下,AI #Agent 的核心概念、前沿技術與實務開發。

課程一開始,Mark 點出 AI Agent 與一般語言模型的根本區別在於「行動力」。語言模型擅長生成內容,而 AI Agent 則具備了執行具體動作、與環境互動並產生實際影響的能力。為了更容易理解 Agent 的「思考模式」,Mark 生動地比喻了諾貝爾獎得主卡尼曼的「#快思慢想」理論:現今的聊天模型如同直覺的「系統一」,反應迅速;而更進階的推理模型則像深思熟慮的「系統二」,在給出答案前會進行一系列的推理與規劃。

接著,Mark 解釋 AI Agent 學習與進化的核心是透過 #強化學習(Reinforcement Learning, RL)讓 Agent 像學徒般,透過在環境中不斷嘗試並接收獎勵或懲罰訊號,從而學習到在特定情境下做出最佳決策。為了克服傳統強化學習在語言模型上成本高昂的挑戰,Mark 特別介紹了兩種創新的「口語回饋」機制:一種是根據最終成果給予評價,另一種則是在過程中的每一步都給予指導,這讓 Agent 的訓練變得更有效率。此外,他也提到了曾擊敗世界頂尖棋手的 #AlphaGo Zero 所使用的蒙地卡羅樹搜尋(#MCTS)技術,作為強化學習中經典且強大的演算法範例。

分享的重點,從單一 Agent 的概念,延伸到了更複雜、也更具應用潛力的「多 Agent 系統」。Mark 強調,透過讓多個各具專長的 Agent 協同合作或競爭,能解決遠比單一 Agent 更複雜的任務。

Mark 與現場的社員也親手建立自己的 Agent。Mark 以建立一個「多國語言翻譯工具」為例,使用 #OpenAI 框架與 #LangGraph 來 Demo如何建構一個由「總指揮 Agent」和多個「專業翻譯 Agent」(如西班牙語、法語、繁體中文等)組成的多 Agent 系統。當使用者輸入翻譯請求後,總指揮 Agent 能智慧地判斷並呼叫對應的翻譯 Agent 來完成任務,完美體現了多 Agent 協作的強大能力。

總結來說,Agent 的發展將不僅是單一模型智慧的提升,而會更著重於建構如 Mark 在讀書會中 Demo 的「多 Agent 協作系統」。NTUAI 認為未來將會有一個如「總指揮」般的核心 Agent,負責理解複雜任務並將其拆解,再智慧地分派給各具專長的專家 Agent(如翻譯、編碼、分析等)共同完成。這種模式將釋放出前所未有的潛力,去解決過去單一 AI 難以觸及的複雜挑戰。

活動照片

活動照片1 活動照片2 活動照片3 活動照片4