2025年3月12日,OpenAI正式發(fā)布Agent 開發(fā)套件,旨在讓AI能夠自主操作計算機。這一系列工具與API的推出,標(biāo)志著AI技術(shù)在自動化任務(wù)執(zhí)行領(lǐng)域邁出重要一步。
全新的Responses API深度融合了對話式API的交互簡潔性與助手API的工具調(diào)用能力,為開發(fā)者提供了統(tǒng)一的接口范式。該API支持動態(tài)任務(wù)解析與工具鏈自主調(diào)度,顯著降低了復(fù)雜業(yè)務(wù)流程的架構(gòu)復(fù)雜度。
內(nèi)置工具包括網(wǎng)絡(luò)搜索、文件搜索和計算機使用等功能,極大地擴展了AI的應(yīng)用場景。Web搜索工具支持GPT-4o和GPT-4o-mini模型,能夠獲取網(wǎng)絡(luò)最新信息并提供清晰的引用。
升級后的文件搜索工具支持多種文件格式,還能優(yōu)化查詢、過濾元數(shù)據(jù)、自定義排序。計算機使用工具由與Operator相同的Computer-Using Agent (CUA)模型提供支持,可捕獲模型生成的鼠標(biāo)和鍵盤操作。
全新的Agents SDK基于Swarm框架升級,用于協(xié)調(diào)單代理和多代理工作流。集成的可觀測性工具則用于追蹤和檢查智能代理工作流的執(zhí)行情況,確保任務(wù)的高效完成。
在Responses API的加持下,開發(fā)者只需調(diào)用一次API,即可利用多種工具和多輪模型交互解決復(fù)雜任務(wù)。這一設(shè)計極大地簡化了智能體的核心邏輯、編排和交互,降低了開發(fā)者構(gòu)建智能體的入門門檻。
OpenAI表示,將繼續(xù)全力支持Chat Completions API,為不需要內(nèi)置工具的開發(fā)者提供新模型和功能?;贏ssistants API測試版的反饋,他們已經(jīng)把關(guān)鍵改進整合到Responses API中。
價格方面,Web搜索每千次查詢分別為GPT-4o搜索30美元和GPT-4o-mini搜索25美元;文件搜索每千次查詢2.5美元,文件存儲0.1美元/GB/天(首GB免費);計算機使用工具則按每輸入百萬token/3美元和每輸出百萬token/12美元計費。