作者?|??香草
編輯?|??李水青
三大核心能力,主打工作效率提升。智東西5月30日報道,騰訊混元大模型首個App“騰訊元寶”今天正式上線。騰訊元寶定位于全能AI助手,針對效率場景的信息獲取、處理和生產(chǎn)三大核心需求進行了優(yōu)化;面向日常生活場景,元寶提供了圖像生成、生活幫手、UGC創(chuàng)作等特色AI應(yīng)用,并新增了創(chuàng)建個人智能體等功能。
據(jù)介紹,此次產(chǎn)品能力升級,背后來源于騰訊混元底層模型的持續(xù)迭代。騰訊混元大模型于去年9月發(fā)布,到目前整體性能提升超50%,包括參數(shù)規(guī)模從千億升級至萬億、預訓練語料從萬億升級至7萬億tokens、架構(gòu)升級為混合專家MoE等。發(fā)布會后,智東西等少數(shù)媒體與騰訊云副總裁、騰訊混元大模型負責人劉煜宏進行了深入交談。目前市面上已經(jīng)有不少同類大模型App,元寶的差異化優(yōu)勢是什么?劉煜宏稱,騰訊的優(yōu)勢主要在于三個方面:一是產(chǎn)品工程能力較強,在工程方面能夠壓縮成本;二是騰訊的產(chǎn)品體系是最全的,對各個應(yīng)用領(lǐng)域的適配度更強;三是混元大模型本身的性能優(yōu)勢,騰訊從去年就開始在文生圖方面采用DiT架構(gòu),也很早就開始采用MoE架構(gòu),技術(shù)演進很快。談到與其他AI產(chǎn)品是否存在同質(zhì)化現(xiàn)象,劉煜宏稱,騰訊做大模型最初是為了滿足公司內(nèi)部業(yè)務(wù)需求,在這個過程中發(fā)現(xiàn)很多用戶、企業(yè)也有這方面的需求,所以開放給大家使用。在產(chǎn)品化上,騰訊最優(yōu)先考慮的是用戶需求,用戶是否需要這個產(chǎn)品、需要哪些功能,而不是去對標競品。在商業(yè)模式方面,劉煜宏稱元寶App目前暫時沒有在C端收費的計劃。作為騰訊推出的首款混元大模型原生應(yīng)用,騰訊元寶表現(xiàn)如何?智東西第一時間上手體驗了元寶App,發(fā)現(xiàn)其雖然與市面上已有的大模型App有一些重合的功能,但在生成速度、內(nèi)容優(yōu)質(zhì)程度上,表現(xiàn)出一定的優(yōu)勢。
01.萬億參數(shù)、上下文窗口256k面向三大核心需求定向優(yōu)化
劉煜宏首先談道,現(xiàn)階段AI應(yīng)用雖然層出不窮,但整體AI產(chǎn)品滲透率仍然很低。頭部AI產(chǎn)品日活躍用戶規(guī)模約為百萬,按互聯(lián)網(wǎng)用戶規(guī)模12.32億來看,在整個互聯(lián)網(wǎng)滲透率不到1%。
在騰訊看來,滲透率低主要是因為大模型仍在發(fā)展期,產(chǎn)品解決方案不夠成熟,應(yīng)用場景有限;其次,用戶層面的認知仍在建立,據(jù)騰訊調(diào)查,目前對AI的需求主要集中在搜索、效率場景,有約45%的人將其當作搜索引擎來用。
騰訊于去年9月發(fā)布了混元大模型并推出小程序版,當時的模型為千億參數(shù)規(guī)模,預訓練語料萬億tokens,4k上下文窗口。經(jīng)過不到一年的迭代,目前混元大模型效果整體提升50%,達到萬億參數(shù),預訓練預料7萬億tokens,上下文窗口擴展到256k。目前,騰訊內(nèi)部已有600+業(yè)務(wù)接入混元大模型。劉煜宏透露,混元每天調(diào)用量超2億,公司內(nèi)部有23%左右的代碼都由AI生成。基于用戶洞察,騰訊認為大模型原生AI產(chǎn)品需要滿足兩大需求。一是貼近用戶場景,包括職場辦公、學習充電、休閑娛樂等;二是滿足高頻需求,如搜索問答、效率提升、創(chuàng)意生成。針對這些需求,騰訊推出全能AI助手騰訊元寶App,面向效率場景的三大核心需求——信息獲取、處理和生產(chǎn),進行定向優(yōu)化。
據(jù)介紹,在AI搜索方面,騰訊元寶接入了微信搜一搜、搜狗搜索等搜索引擎,并通過AI搜索增強,提升時新類和知識類問題效果;同時,內(nèi)容覆蓋微信公眾號等騰訊生態(tài)內(nèi)容及互聯(lián)網(wǎng)權(quán)威信源,答案準確性更高;此外,元寶還會提供所引用的參考資料,并給出相關(guān)推薦,方便快速溯源及延伸閱讀。在AI總結(jié)方面,元寶可上傳最多10個PDF、word、txt等多種格式文檔,并能夠一次性解析多個微信公眾號鏈接、網(wǎng)址,支持256k原生窗口上下文,相當于一本《三國演義》或是英文原版《哈利波特》全集。在AI寫作方面,元寶支持多輪問答,能夠?qū)υ挼膬?nèi)容整理成報告,按照要求進行結(jié)構(gòu)化輸出。此外在日常生活場景,騰訊元寶也能有問必答,提供圖像生成、內(nèi)容創(chuàng)作、學習助手、生活幫手、UGC創(chuàng)作等多種AI應(yīng)用。劉煜宏稱,在騰訊看來,大模型AI產(chǎn)品的用戶價值終點是“服務(wù)于每個普通人的生活”。元寶網(wǎng)頁端、小程序端也同步上線,同時將聯(lián)合騰訊系業(yè)務(wù)、合作伙伴、騰訊元器創(chuàng)作者等,共創(chuàng)AI應(yīng)用生態(tài)。
02.AI搜索一鍵總結(jié)實時熱點AI總結(jié)精準提煉英文財報
打開騰訊元寶App,主頁面是一個對話框,頂部有兩個小模塊,分別顯示日期、天氣、實時資訊以及隨機問題建議;下方提供了在AI搜索、文檔總結(jié)、網(wǎng)頁總結(jié)、AI作圖等能力方面的隨機提問建議。
提問入口設(shè)計比較簡潔,同時豐富的提問建議也降低了普通用戶首次使用的門檻。點擊頂部的“元寶”按鍵,會出現(xiàn)開始新對話、刪除聊天記錄的選項,此外還可以切換語音音色,目前有20多種音色可供選擇,還提供了創(chuàng)建自己聲音的功能。
據(jù)劉煜宏介紹,元寶在工作場景目前主要的優(yōu)化方向是AI搜索、AI總結(jié)、AI寫作。我首先試了一下在AI搜索場景下系統(tǒng)推薦的問題:“10元咖啡阿姨”是什么梗?元寶很快給出了回答,從起源、背景信息、社會反響、社會意義等方面介紹了這個事情的發(fā)生經(jīng)過和后續(xù)影響,并推薦了更多內(nèi)容和可以進一步追問的選擇。
當我追問:阿姨的咖啡店在哪里可以找到?元寶準確地答出店鋪地址,并補充了營業(yè)時間和相關(guān)注意事項。
除了了解當下的熱點信息之外,我也想了解未來的趨勢或可能發(fā)生的事。我問道:蘋果下個月的WWDC可能會發(fā)什么?元寶首先告訴了我WWDC的具體時間,隨后按新產(chǎn)品、新功能、其他亮點等類別進行了歸納整理。
不過這個回答中存在部分不夠準確的信息,如將Vision Pro劃分為“新產(chǎn)品”等。點開這句回答的參考資料鏈接,可以看到是一篇去年6月Vision Pro發(fā)布的新聞稿。在平日的搜索中,對圖片的識別和提問也是很常見的需求。我上傳了一張小貓實拍圖,問元寶這是什么品種的貓。元寶首先答出這是英國短毛貓,但我想進一步了解是英短里的什么品種,追問后,元寶準確地將范圍縮小到銀漸層或藍金漸層。
在AI總結(jié)能力上,元寶支持256k上下文窗口。我首先上傳了一篇Llama的論文,讓元寶替我解讀。元寶從引言、方法、主要結(jié)果等方面提煉了論文的主要信息,最后總結(jié)了該論文的主要貢獻。
英文財報的信息提取也是日常工作中的高頻場景。我上傳了一個187頁的英偉達年度財報文件,元寶進行文件解析后,顯示有64.2萬字。隨后我要求元寶總結(jié)主要內(nèi)容,它從財務(wù)表現(xiàn)、市場地位、業(yè)務(wù)戰(zhàn)略等角度進行了總結(jié)。
在財務(wù)表現(xiàn)部分,元寶提到了英偉達在2024財年取得的營收、凈利潤數(shù)據(jù)。平時在使用AI提煉這類內(nèi)容時,有時會遇到數(shù)據(jù)不準確的問題,我還是打開財報文件自己核實了一下。值得慶幸的是,元寶提供的數(shù)據(jù)十分準確。
隨后我又上傳了《三體》全集電子書,元寶解析后顯示字數(shù)達到92.9萬。我問道:云天明講了什么樣的童話?元寶稱,基于文檔內(nèi)容,云天明講的童話故事是《國王的新畫師》、《饕餮海》和《深水王子》。故事的名字是準確的,不過我真正想問的是故事內(nèi)容,于是追加道:總結(jié)這三個故事。這次元寶的回答有些偏差,一方面沒能完整地概括故事內(nèi)容,另一方面出現(xiàn)了不停重復一句話的情況。
看來,90多萬字的長度還是有些超出元寶的能力范圍了。發(fā)布會上提到,元寶可以一次性解析多個微信公眾號鏈接。于是我輸入了兩個智東西公眾號的文章鏈接,讓元寶總結(jié)主要內(nèi)容。元寶精準提煉了文章內(nèi)容,并在最后總結(jié)了兩篇文章的共同點。
最后再來試一下AI寫作功能,我讓元寶幫我寫一份宣傳智能汽車產(chǎn)業(yè)峰會的小紅書文案。元寶對小紅書平臺的風格拿捏得不錯,用了豐富的表情符號,文章結(jié)構(gòu)也比較合理,最后還補充了相關(guān)Tag。
六一兒童節(jié)馬上就要到了,我讓元寶幫我策劃一場適合小學的親子活動。元寶給出的策劃方案十分詳細,包括每個環(huán)節(jié)的時間內(nèi)容,在內(nèi)容上策劃了運動會、手工制作、表演等形式,并貼心地提供了活動準備、注意事項相關(guān)的建議。
體驗下來,我的感受是元寶的生成速度比較快,搜索、總結(jié)內(nèi)容方面雖然出現(xiàn)了一些小失誤,但瑕不掩瑜,整體準確度還是比較高的。此外在標注出的參考資料上,能看到有不少出自微信公眾號文章,這樣的信息來源為元寶提供了內(nèi)容上的差異化競爭力。
03.智能體打造多模態(tài)創(chuàng)意應(yīng)用化身種草達人、旅行規(guī)劃師
除了對話式AI,元寶還提供了多種智能體功能,主要分為工作、生活兩大類,包括翻譯、PPT、文案撰寫、營銷專家等效率類工具,以及創(chuàng)意貼紙、創(chuàng)意繪畫、AI頭像等娛樂向工具。根據(jù)系統(tǒng)推薦,我首先體驗了“創(chuàng)意貼貼貼”功能,它能根據(jù)文字輸入或圖像輸入創(chuàng)建不同風格的貼紙。我上傳了一張貓咪全身照,元寶很快生成了4張對應(yīng)的貼紙圖像。雖然看花色似乎有些差異,不過整體神態(tài)、動作、顏色都比較符合。
在創(chuàng)意繪畫智能體中,元寶可以根據(jù)簡單的文字描述生成對應(yīng)圖像,實際體驗下來生成時長大概在5秒。點開生成的圖像可以看到,元寶自動擴展了提示詞,增加了更多細節(jié)、景別描述等。
旅行達人智能體可以幫助制定旅行計劃,我提問道:去澳門玩兩天,有什么建議?元寶為我列出了一個時間表,并提供了交通方式、住宿選擇、價格參考等。
我還體驗了種草文案寫手智能體,根據(jù)提示,只需輸入商品名稱就可以生成宣傳文案。我輸入了樟腦丸,看看這個東西要怎么去安利。元寶首先給它定位為“超級實用的小物件”,隨后從產(chǎn)品特點、使用感受、實際效果、使用方法來進行種草,最后給出了使用注意事項。
整體來看,元寶在智能體能力上表現(xiàn)也不錯,作為工作、生活幫手能提供有價值的信息。雖然目前官方提供的智能體選擇還不是特別豐富,不過與騰訊元器打通后,應(yīng)該會呈現(xiàn)出更多有趣的功能選擇。
04.結(jié)語:大模型App賽道又一強力選手入場
隨著騰訊元寶的正式上線,大模型App賽道再次迎來一位強有力的選手。現(xiàn)階段,元寶雖然在功能創(chuàng)新、實時信息搜索準確度上仍有提升空間,不過在生成速度、內(nèi)容質(zhì)量上也有一定優(yōu)勢。作為業(yè)務(wù)廣泛的互聯(lián)網(wǎng)大廠,騰訊在產(chǎn)品工程能力、技術(shù)創(chuàng)新上都有很大的積累。我們期待元寶在未來的迭代中呈現(xiàn)出更豐富的功能和更高的水準,也期待它的加入能為大模型App賽道帶來良性競爭。