• 正文
  • 相關(guān)推薦
申請(qǐng)入駐 產(chǎn)業(yè)圖譜

能“邊想邊干”的AI智能體問(wèn)世

03/31 15:33
474
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

3月31日,智譜在中關(guān)村論壇上正式發(fā)布AutoGLM沉思,這一全新智能體不僅具備深度研究能力(Deep Research),還能實(shí)現(xiàn)實(shí)際操作(Operator),真正推動(dòng)AI Agent進(jìn)入“邊想邊干”的階段。

在現(xiàn)場(chǎng)演示環(huán)節(jié)可以看到,該智能體可以像人類一樣打開(kāi)并瀏覽網(wǎng)頁(yè),完成數(shù)據(jù)檢索、分析,并生成萬(wàn)字報(bào)告,還可以自主選擇通過(guò)寫稿掙錢,完成從上網(wǎng)搜索征稿啟事、根據(jù)要求構(gòu)思寫稿、通過(guò)郵件向平臺(tái)投稿獲取稿費(fèi)等一系列復(fù)雜操作。

記者從發(fā)布會(huì)上了解到,從2023年10月最早推出具備Function Call能力的智譜清言,到2024年1月率先上線支持智能體編排的GLMs,再到2024年10月推出全球首個(gè)設(shè)備操控智能體AutoGLM,智譜一直引領(lǐng)AI Agent上界的探索。此次,智譜推出全新的AutoGLM沉思模型被認(rèn)為是全球首個(gè)集深度研究與實(shí)際操作能力于一體的Agent,這是自主智能體技術(shù)的一次重要進(jìn)步,也是設(shè)備操控智能體的進(jìn)一步升級(jí)。

智譜CEO張鵬表示,AutoGLM沉思體現(xiàn)了智譜對(duì)AI Agent的核心理解,即讓機(jī)器不僅能夠思考,還能主動(dòng)行動(dòng),實(shí)現(xiàn)“邊想邊干”的目標(biāo)。這一能力的實(shí)現(xiàn)依賴于三個(gè)關(guān)鍵特性:一是深度思考,能夠模擬人類在面對(duì)復(fù)雜問(wèn)題時(shí)的推理與決策過(guò)程;二是感知世界,能夠像人一樣獲取并理解環(huán)境信息;三是工具使用,能夠像人一樣調(diào)用和操作工具,完成復(fù)雜任務(wù)。

不同于OpenAI 的Deep Research(深度研究)功能,智譜AutoGLM沉思不僅能深入研究,還能真正執(zhí)行任務(wù),推動(dòng)AI Agent從單純的思考者,進(jìn)化為能交付結(jié)果的智能執(zhí)行者。其背后的沉思模型作為全新的Agent大腦,能夠通過(guò)強(qiáng)化學(xué)習(xí),讓模型學(xué)會(huì)自我批評(píng)、反思甚至沉思,并通過(guò)更長(zhǎng)的深度思考時(shí)間換取更優(yōu)的效果。它突破了實(shí)時(shí)聯(lián)網(wǎng)搜索、動(dòng)態(tài)工具調(diào)用、深度分析和自我驗(yàn)證,實(shí)現(xiàn)真正的長(zhǎng)程推理和任務(wù)執(zhí)行。

據(jù)悉,在斯坦福大模型中心《AI指數(shù)2024》選定的智能體基準(zhǔn)評(píng)測(cè)AgentBench上,智譜AutoGLM系列模型在5個(gè)測(cè)試環(huán)境中也取得了 SOTA的成績(jī)。其中,在Phone Use基準(zhǔn)(AndroidLab & AndroidWorld)中,AutoGLM-Phone的任務(wù)成功率較此前最佳成績(jī)提升超過(guò)20%;在Browser Use基準(zhǔn)上,AutoGLM-Web也全面超越OpenAI GPT-4o和Anthropic Claude-3.5-Sonnet,展現(xiàn)了在網(wǎng)頁(yè)交互場(chǎng)景中的領(lǐng)先能力。

GUI智能體領(lǐng)域,智譜自研模型GLM-PC(CogAgent)在多個(gè)權(quán)威評(píng)測(cè)榜單上取得SOTA 成績(jī)。憑借僅9B的參數(shù),CogAgent超越了包括GPT-4o + UGround、Claude Computer Use等更大規(guī)模的同類模型或商用API

智譜方面表示,目前,AutoGLM沉思已在智譜清言PC客戶端上線,用戶可免費(fèi)體驗(yàn)其研究能力和操作能力。此次發(fā)布的為 preview版本,核心支持 research 場(chǎng)景;在未來(lái)兩周,智譜將進(jìn)一步擴(kuò)展更多智能體執(zhí)行能力。包括推出“虛擬機(jī)”版本,進(jìn)一步增強(qiáng)AI Agent的實(shí)際落地能力。另外,沉思功能也已正式上線智譜清言網(wǎng)頁(yè)端、PC端和手機(jī) App,免費(fèi)、不限量地開(kāi)放給用戶。這也是國(guó)內(nèi)首個(gè)正式開(kāi)放的Deep Research功能。

作者丨宋婧編輯丨諸玲珍美編丨馬利亞監(jiān)制丨趙晨

相關(guān)推薦