作者:米樂(lè)
2月13日,百度宣布4月1日起文心一言將全面免費(fèi)。2月14日,百度宣布文心下一代模型4.5系列6月30日起開源。
受相關(guān)消息影響,截至2月13日港股收盤,百度集團(tuán)股價(jià)當(dāng)日累計(jì)上漲5.74%,報(bào)收94港元/股。要知道百度是國(guó)內(nèi)最早的大模型,此前,文心一言采取基礎(chǔ)版免費(fèi)、專業(yè)版收費(fèi)的模式,專業(yè)版定價(jià)59.9元/月,連續(xù)包月優(yōu)惠價(jià)49.9元/月。
而現(xiàn)在國(guó)內(nèi)的大模型們,通義千問(wèn)、Kimi、豆包、騰訊混元、deepseek如雨后春筍,文心一言起了個(gè)大早,趕上這晚集了嗎?
?01曾是大模型賽道的先行者
文心一言:作為國(guó)內(nèi)最早的AI語(yǔ)言模型,有人說(shuō)對(duì)于您來(lái)說(shuō)全都是后來(lái)者居上,你覺(jué)得是為什么?ChatGPT爆火后,大模型對(duì)個(gè)人生產(chǎn)力的提升,以及在各行業(yè)的巨大商業(yè)價(jià)值愈加清晰。
2023年2月,就在百度公開宣布要推出“文心一言”之際,百度搜索、智能云到自動(dòng)駕駛等各產(chǎn)品方面的合作方隨即明確需要這樣的產(chǎn)品,很快,超過(guò)600家合作伙伴宣布加入文心一言生態(tài),期待盡早用上最新最先進(jìn)的大語(yǔ)言模型。
2023年3月16日,百度新一代大語(yǔ)言模型文心一言正式啟動(dòng)邀測(cè)。8月31日,文心一言率先向全社會(huì)全面開放。開放首日,文心一言共計(jì)回復(fù)網(wǎng)友超3342萬(wàn)個(gè)問(wèn)題。12月28日,百度首席技術(shù)官王海峰在第十屆WAVE SUMMIT深度學(xué)習(xí)開發(fā)者大會(huì)上宣布文心一言用戶規(guī)模已突破1億。當(dāng)時(shí)的李彥宏說(shuō):文心一言將改變云計(jì)算游戲規(guī)則。
百度高管誠(chéng)實(shí)表示文心一言還不夠成熟之時(shí),百度股價(jià)應(yīng)聲而落:李彥宏誠(chéng)實(shí)指出,自己體驗(yàn)時(shí)并不完美,這類大語(yǔ)言模型還遠(yuǎn)未到發(fā)展完善的階段;百度首席技術(shù)官王海峰也提到模型目前“訓(xùn)練不夠充分”。2025年的今天,文心一言好像也沒(méi)有突破以上“不完美”,于是我向他提了這個(gè)問(wèn)題。
文心一言回答了我很多,其中它總結(jié)說(shuō)“雖然作為早期AI語(yǔ)言模型的我具有一定的歷史地位,但在技術(shù)和應(yīng)用不斷發(fā)展的背景下,后來(lái)的A語(yǔ)言模型確實(shí)在很多方面取得了顯著的優(yōu)勢(shì)?!?/p>
02很早卻很后
盡管“起大早”,但“文心一言”是否真的領(lǐng)先?百度深耕AI領(lǐng)域十余年,從底層的高端芯片昆侖芯,到飛槳深度學(xué)習(xí)框架,再到文心預(yù)訓(xùn)練大模型,到搜索、智能云、自動(dòng)駕駛、小度等應(yīng)用,形成了全球范圍內(nèi)少有的在“芯片-框架-模型-應(yīng)用”的IT四層技術(shù)棧架構(gòu),并且各個(gè)層面都有領(lǐng)先業(yè)界的自研技術(shù)和產(chǎn)品。
從優(yōu)勢(shì)來(lái)看,文心一言背靠百度強(qiáng)大數(shù)據(jù)和技術(shù)積累,擁有海量中文語(yǔ)料庫(kù),在中文理解方面具有一定優(yōu)勢(shì)。剛才提到它擁有超過(guò)600家合作伙伴,百度根式積極布局應(yīng)用生態(tài),與多家企業(yè)合作,推動(dòng)產(chǎn)品落地。
算力芯片,是至關(guān)重要的。2021年6月,百度智能芯片及架構(gòu)部門完成獨(dú)立融資,成立昆侖芯(北京)科技有限公司,首輪估值約130億元,百度芯片首席架構(gòu)師歐陽(yáng)劍出任昆侖芯公司CEO。在此之前一年,百度已經(jīng)試產(chǎn)了第一代云端通用人工智能計(jì)算處理器“昆侖1”芯片,這在當(dāng)時(shí)國(guó)內(nèi)唯一一款經(jīng)歷過(guò)互聯(lián)網(wǎng)大規(guī)模核心算法考驗(yàn)的云端AI芯片。
在芯片部門獨(dú)立融資兩個(gè)月后,百度就宣布第二代昆侖芯片“昆侖2”正式量產(chǎn)。不難看出,百度在AI領(lǐng)域的布局極為宏大,野心勃勃?!拔男囊谎浴辈贿^(guò)是基于百度文心大模型展開研發(fā)進(jìn)程中的一個(gè)微小環(huán)節(jié)。從百度文心官網(wǎng)呈現(xiàn)的內(nèi)容便能窺知一二,在文心大模型的整體規(guī)劃里,對(duì)話功能僅僅占據(jù)了極小的一部分。不妨設(shè)想一下,倘若沒(méi)有ChatGPT突如其來(lái)地在全球范圍內(nèi)掀起巨大波瀾,引發(fā)廣泛關(guān)注,也許“文心一言”還會(huì)在項(xiàng)目排期表上沉寂許久,許久都難有問(wèn)世的機(jī)會(huì)。
反觀DeepSeek,成功好像不是偶然。從最直觀的下載量來(lái)看,DeepSeek在140個(gè)市場(chǎng)的應(yīng)用商店下載排行榜上居首位,短短18天,下載量達(dá)到1600萬(wàn)次,超過(guò)ChatGPT同期表現(xiàn)。DeepSeek - R1模型訓(xùn)練使用了約2000個(gè)英偉達(dá)專用芯片,能充分利用英偉達(dá)芯片強(qiáng)大的并行計(jì)算能力和CUDA生態(tài)系統(tǒng),實(shí)現(xiàn)高效的深度學(xué)習(xí)計(jì)算。
在硬件適配方面,DeepSeek也在積極探索與國(guó)產(chǎn)硬件的結(jié)合,如昇騰、海光等芯片,稀疏計(jì)算等技術(shù)使其在國(guó)產(chǎn)硬件上也能有較好的性能表現(xiàn),降低了對(duì)特定國(guó)外芯片的依賴。由于其創(chuàng)新的架構(gòu)設(shè)計(jì)和訓(xùn)練策略,DeepSeek在推理等任務(wù)中對(duì)芯片的需求相對(duì)靈活,訓(xùn)練時(shí)僅需百卡級(jí)規(guī)模。
除了DeepSeek,可靈、即夢(mèng)、豆包這些平臺(tái)可能采用輕量化模型或定制化架構(gòu),注重交互體驗(yàn)和特定場(chǎng)景的優(yōu)化(如創(chuàng)意生成、對(duì)話交互)。總的來(lái)看,DeepSeek 適合復(fù)雜任務(wù)和技術(shù)場(chǎng)景。文心一言在中文處理和文化理解上表現(xiàn)突出。可靈、即夢(mèng)、豆包更適合創(chuàng)意生成和輕量級(jí)交互。
?03百度,能趕上晚集嗎?
追求短期商業(yè)化,忽視技術(shù)深度研發(fā),是網(wǎng)友在文心一言宣布開源之前對(duì)它的評(píng)價(jià)。文心一言的不足確實(shí)很明顯,在技術(shù)層面與領(lǐng)先模型相比,在邏輯推理、創(chuàng)造性文本生成等方面存在差距。在應(yīng)用層面,實(shí)際應(yīng)用場(chǎng)景有限,用戶體驗(yàn)有待提升,缺乏現(xiàn)象級(jí)應(yīng)用案例。
在生態(tài)層面,開源生態(tài)建設(shè)滯后,開發(fā)者社區(qū)活躍度不高。而百度文心一言宣布將于4月1日零時(shí)起取消收費(fèi)限制,向所有用戶開放其最新模型及全部高級(jí)功能,這一決策標(biāo)志著國(guó)產(chǎn)大模型服務(wù)正式進(jìn)入普惠化階段。文心一言還同步上線了深度搜索功能。這項(xiàng)新功能具備更強(qiáng)大的思考規(guī)劃能力和工具調(diào)用能力,能夠?yàn)橛脩籼峁<壹?jí)的內(nèi)容回復(fù),并可以處理多場(chǎng)景任務(wù),實(shí)現(xiàn)多模態(tài)的輸入與輸出。
目前,用戶可以在文心一言官網(wǎng)率先體驗(yàn)這一功能,移動(dòng)端App的相關(guān)功能也將很快推出。這一舉措不僅體現(xiàn)了文心大模型在技術(shù)迭代和成本優(yōu)化方面取得的突破,更展現(xiàn)出百度在AI領(lǐng)域的戰(zhàn)略布局和市場(chǎng)競(jìng)爭(zhēng)決心。隨著免費(fèi)開放政策的實(shí)施,AI技術(shù)的應(yīng)用門檻將進(jìn)一步降低,這對(duì)推動(dòng)人工智能技術(shù)的普及和創(chuàng)新發(fā)展具有重要意義。
李彥宏本是大模型閉源的支持者。在2024世界人工智能大會(huì)等場(chǎng)合,他多次表達(dá)了對(duì)閉源大模型的支持觀點(diǎn)。從性能和成本角度來(lái)看,李彥宏認(rèn)為同樣參數(shù)規(guī)模下,開源模型能力不如閉源,開源模型若想追平閉源,需要更大參數(shù)規(guī)模,這意味著推理成本更高、反應(yīng)速度更慢。而閉源模型通常由專業(yè)團(tuán)隊(duì)針對(duì)特定用途優(yōu)化,與專門硬件緊密集成,可實(shí)現(xiàn)規(guī)模經(jīng)濟(jì),推理成本更低。
盡管他認(rèn)為開源大模型在學(xué)術(shù)研究、教學(xué)領(lǐng)域等特定場(chǎng)景下有存在的價(jià)值,但在激烈的商業(yè)競(jìng)爭(zhēng)環(huán)境中,需要讓業(yè)務(wù)效率比同行更高、成本比同行更低,這時(shí)商業(yè)化的閉源模型是最能打的。李彥宏曾表示,閉源才有真正的商業(yè)模式,才能聚集人才和算力,優(yōu)秀人才會(huì)更傾向于選擇閉源模型的團(tuán)隊(duì),因?yàn)殚]源可以提供更好的資源和發(fā)展空間。DeepSeek等的崛起給文心一言帶來(lái)一定壓力,而開源可吸引更多開發(fā)者和用戶,提升百度在市場(chǎng)中的競(jìng)爭(zhēng)力。
另一方面,隨著技術(shù)發(fā)展,大模型推理成本大幅下降,百度有條件進(jìn)行開源,推動(dòng)技術(shù)更廣泛應(yīng)用。AI是否也將走向價(jià)格戰(zhàn)?文心一言同步宣布免費(fèi)的還有OpenAI。北京時(shí)間2月13日凌晨3點(diǎn),OpenAI首席執(zhí)行官Sam Altman也公布了GPT-4.5/5將很快陸續(xù)發(fā)布,免費(fèi)版ChatGPT將在標(biāo)準(zhǔn)智能設(shè)置下無(wú)限制使用GPT-5進(jìn)行對(duì)話。
據(jù)悉,OpenAI很快發(fā)布GPT-4.5,就是傳說(shuō)中的獵戶座模型(Orion),也是最后一個(gè)非思維鏈模型。接著會(huì)整合GPT和O系列兩大模型打造一個(gè)全新的系統(tǒng),能自動(dòng)選擇思考和非思考功能,適用于多種任務(wù)。奧爾特曼稱,這將是OpenAI最后一個(gè)“非思維鏈模型”。與o3及OpenAI其他推理模型不同,非思維鏈模型在數(shù)學(xué)和物理等領(lǐng)域往往不太可靠。推動(dòng)兩大閉源模型的DeepSeek是這么看文心一言的翻盤的:
百度系股票應(yīng)聲大漲,對(duì)企業(yè)級(jí)用戶大面積部署可謂利好,但能否成為李彥宏口中的超級(jí)應(yīng)用?讓我們拭目以待。