• 正文
    • 01、文心?4.5?和?X1,百度“死磕”
    • 02、百度變了
    • 03、百度,沒下牌桌
    • 04、結(jié)語
  • 相關(guān)推薦
申請入駐 產(chǎn)業(yè)圖譜

承認(rèn)百度仍在AI第一梯隊(duì)沒那么難

03/18 11:55
516
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

作者丨董子博,編輯丨林覺民

2025 年,百度的“天”變了。

“前 Deepseek 時代”,圈里不少人還悲觀地認(rèn)為,中國沒有模型能跟上 GPT 的腳步,對百度來說,模型不掉隊(duì),應(yīng)用生態(tài)做起來,就能夠留在牌桌上;

而 Deepseek 一出,風(fēng)云變幻、誰與爭鋒——原本,文心 4.0 在國內(nèi)也算數(shù)得上號的大模型,在 Deepseek 面前,也不得不甘拜下風(fēng)。

于是,巨大的壓力給到了百度:

發(fā)新模型,必然面臨質(zhì)疑,要被拿去在顯微鏡下和 Deepseek 作比較,在冷眼下遭遇批判;

不發(fā)新模型,百度的技術(shù)實(shí)力更沒了展現(xiàn)的機(jī)會,無端的猜測又會甚囂塵上,客戶的信心也會被損傷。

進(jìn)退維谷,百度的選擇,是亮出寶劍,非要試一試自己的成色——即使面臨批評和貶損,百度也決心放下面子,把自己最新的模型成果展示出來。

放下面子,拼了老命,也死活不下牌桌,百度是怎么想的?

01、文心?4.5?和?X1,百度“死磕”

談戰(zhàn)略之前,先聊點(diǎn)實(shí)著的——百度新發(fā)的文心 4.5 和 X1 好用嗎?

作為百度新一代的原生多模態(tài)大模型,文心 4.5 首先是在多模態(tài)的能力上進(jìn)一步升級。今天的文心 4.5,不僅可以理解照片、工作圖表、視頻內(nèi)容,準(zhǔn)確摘取靜態(tài)、動態(tài)圖像中的細(xì)節(jié)信息;甚至還能理解網(wǎng)絡(luò)笑話、梗圖中的幽默和諷刺,并連貫地完成推理。

當(dāng)大模型能力越來越卷、用戶標(biāo)準(zhǔn)越來越高,模型之間最細(xì)微的差距,就決定了實(shí)際生成結(jié)果在體驗(yàn)上的天差地別——原生和非原生的區(qū)別,也由此顯現(xiàn)。

預(yù)訓(xùn)練階段更深層次的模態(tài)融合、專為跨模態(tài)交互和理解設(shè)計的模型機(jī)制,都是原生多模態(tài)模型的優(yōu)勢。

3月,李彥宏在人民網(wǎng)上發(fā)表了一篇署名文章,其中就提到了原生與非原生多模態(tài)大模型的區(qū)別——原先,所謂的“多模態(tài)模型”,只是幾個單模態(tài)模型訓(xùn)練后再進(jìn)行拼接;而原生多模態(tài)大模型,勝在以統(tǒng)一的架構(gòu),去實(shí)現(xiàn)對復(fù)雜世界的統(tǒng)一理解。

本次發(fā)布的文心 4.5,在原生多模態(tài)的角度,思路與谷歌的 Gemini,Meta 的 Llama 4,OpenAI 的 GPT-4o 一致。

而文心 4.5,則是在多模態(tài)異構(gòu)專家擴(kuò)展技術(shù)上更進(jìn)一步,就如同根據(jù)圖像、視頻、文字等不同領(lǐng)域,給智囊團(tuán)請來了一群術(shù)業(yè)有專攻的“專家”,并且通過一套自適應(yīng)模態(tài)感知損失函數(shù),讓“專家”們可以實(shí)力相當(dāng),也就更能完成協(xié)作,執(zhí)行復(fù)雜跨模態(tài)任務(wù)的處理。

多模態(tài)能力之外,針對大模型不少老生常談的技術(shù)難關(guān),百度在文心 4.5 也交上了這一期的“答卷”:

面對長文本處理問題和多輪交互,百度優(yōu)化了 FlashMask 動態(tài)注意力掩碼,提高了長序列建模能力和訓(xùn)練效率;

針對大模型的學(xué)習(xí)效率和幻覺問題,文心 4.5 則繼續(xù)在預(yù)訓(xùn)練數(shù)據(jù)下了苦功夫,通過知識分級采樣、數(shù)據(jù)壓縮與融合、稀缺知識點(diǎn)定向合成等技術(shù),百度將數(shù)據(jù)質(zhì)量大幅提升,模型的質(zhì)量和成本也都得到了保障;

而對強(qiáng)化學(xué)習(xí)效率至關(guān)重要的后訓(xùn)練(Post-training)技術(shù),文心 4.5 一樣沒落下,通過融合多種評價方式,百度將一套自反饋迭代式的后訓(xùn)練技術(shù)用到了大模型的后訓(xùn)練當(dāng)中,將強(qiáng)化學(xué)習(xí)的穩(wěn)定性和魯棒性全面提升,讓模型理解人類意圖的能力更上一層樓。

對標(biāo) GPT-4.5,文心 4.5 已經(jīng)有了相對亮眼的成績;而對標(biāo) GPT-o1 和 Deepseek R1 的文心 X1,也交出了一份不錯的答卷。

據(jù)了解,百度文心 X1 采取了遞進(jìn)式的強(qiáng)化學(xué)習(xí)訓(xùn)練方法,并且基于思維鏈和行動鏈根據(jù)結(jié)果反饋進(jìn)行了端到端的模型訓(xùn)練,給訓(xùn)練效果增色不少;而 Deepseek 最引人注目的評估系統(tǒng),百度在文心 X1 上也做了革新,他們建立了一套同意的評估系統(tǒng),并將多種類型的獎勵機(jī)制融合,讓模型的訓(xùn)練獲得了更魯棒的反饋。

一系列的努力之下,相比文心 4.0,X1 的文本創(chuàng)作能力顯然更強(qiáng),也更擅長梳理邏輯、分析復(fù)雜問題、生成觀點(diǎn)、提供情緒價值——能和用戶聊“思考深的”,也能聊“感情真的”;

而到了多模態(tài)的范疇,文心 X1 也沒丟了系列由來已久的跨模態(tài)能力,在圖片理解的精準(zhǔn)度更上一層樓,還能細(xì)節(jié)識別圖片是否有 P 圖痕跡,兼具一副火眼金睛。

相比 Deepseek,剛剛面世的文心 X1 測試下來,在文本的創(chuàng)意和個性化上稍遜一籌。但除了前者所不具備的多模態(tài)能力之外,文心 X1 更大的優(yōu)勢在于“家底厚”——文心大家族支持的“高級搜索”“文檔問答”“AI繪圖”“TreeMind樹圖”“百度學(xué)術(shù)檢索”等等工具,都能在文心 X1 上用到,讓用戶獲得沉浸的一站式 AI 體驗(yàn)。

在能力上來說,兩款模型在文心 4.0 的基礎(chǔ)上又實(shí)現(xiàn)了一次“飛升”;而在成本上,文心 4.5 和 X1 卻再次“跳水”,依靠芯片、模型、框架等層面的聯(lián)合優(yōu)化,文心 4.5 的推理成本只有 GPT-4.5 的 1%,而 X1 的推理成本也只是 Deepseek R1 的一半左右。

成本優(yōu)勢建立了起來,如何讓用戶更便宜地把大模型用起來,百度就有了底氣:

今天,文心 4.5 和 X1 都已在文心一言官網(wǎng)上線,免費(fèi)向用戶開放;

面對企業(yè)用戶和開發(fā)者,文心 4.5 已在百度智能云千帆大模型平臺上,輸入價格為0.004元/千tokens,輸出0.016元/千tokens,約為GPT4.5價格的1%;文心X1定價為輸入0.002元/千tokens,輸出0.008元/千tokens,也即將上線千帆。

百度搜索、文小言等百度的當(dāng)家產(chǎn)品,也正在逐步接入文心 4.5 和 X1,把最強(qiáng)大的 AI 能力讓社會普惠。

近十年,百度的累計研發(fā)投入,已經(jīng)超過 1800 億,李彥宏在今年 1 月的 25 周年全員信中寫道,很多年里,百度收入的 20% 以上,都被投入到了研發(fā)當(dāng)中——這么看,文心 4.5 和 X1 的迭代速度雖然在“意料之外”,但也算是高投入之下的“情理之中”。

然而,這次文心的雙料發(fā)布,卻遠(yuǎn)不止是新技術(shù)迭代這么簡單——百度鮮有地放下面子,用誠實(shí)的姿態(tài),把自己的優(yōu)點(diǎn)和缺點(diǎn)暴露在用戶的眼皮底下,究竟圖點(diǎn)什么?

02、百度變了

像開頭說的一樣,當(dāng)下這個時點(diǎn),在 Deepseek 占領(lǐng)了無數(shù)圈內(nèi)外用戶心智的當(dāng)口,從市場角度看,百度發(fā)布文心 4.5 和 X1 是一個正確的選擇嗎?

一樣的困境,整整兩年前,在面對 OpenAI 和 ChatGPT 時,百度就已經(jīng)經(jīng)歷過了一次。

當(dāng)時,是李彥宏許久之后首次出席線下會議演講,還是熟悉的白襯衣、熟悉的不緊不慢的語調(diào)。甫一開場,他并沒盯著提詞器里的講稿,比起“早有預(yù)謀”的臺詞,更像有感而發(fā)的感嘆,犀利地拋出了一個問題:

“最近一段時間,很多朋友問我:‘為什么是今天,你們真的 ready 了嗎?’”

與其說這個問題問的是別人,不如說,這個問題李彥宏或許也問了自己很多遍。但思前想后,百度不怕被與 OpenAI 比較,也不怕丟面子,有好東西,必須得讓客戶和用戶先用上。

兩年后,文心 4.5 和 X1 發(fā)布,百度更是必須保證更新頻率,缺乏旗艦?zāi)P偷墓?,留?AI 的第一梯隊(duì)也難以服眾。

今天,百度變了,變得不再愛面子:

先前站隊(duì)閉源,Deepseek 通過開源嘗到了甜頭,那就聞過則喜、從善如流;

Deepseek、Llama 等模型確實(shí)各有千秋,那就踐行“拿來主義”、在搜索、地圖、文庫、智能云等 ToC、To B 產(chǎn)品體系里海納百川,讓用戶自主選擇;

在未來,智能體和 AI 應(yīng)用,沒法被一家公司大包大攬,那百度就甘當(dāng)綠葉,不做“超級應(yīng)用”,而要幫助人們打造更多“超級有用”的應(yīng)用;

過去做事慢條斯理、貽誤軍機(jī),今天在內(nèi)部,文心 4.5 全面免費(fèi),PC、移動雙端直接上現(xiàn)貨,等等決策都在半天之內(nèi)完成,絕不拖泥帶水;

而體現(xiàn)在迭代速度上,百度模型迭代的速度仍在加快,文心 4.5 全部開放之后,最晚 6 月底就將公布開源版本,下半年則有望見到文心 5.0 的面世。

百度變得不愛面子,也變得越來越開放、越來越務(wù)實(shí)——不躺平,也不茍著。

在今年的“世界政府峰會”WGS 訪談時,李彥宏提到:“我認(rèn)為創(chuàng)新不能被計劃,你不知道創(chuàng)新何時到來,你所能做的就是營造一個有利于創(chuàng)新的環(huán)境。

枕戈待旦,百度還在謙卑地等著一個機(jī)會。但在今天,即使面臨著諸多強(qiáng)敵的挑戰(zhàn),百度還在大模型的第一梯隊(duì)嗎?

03、百度,沒下牌桌

今天,評價所謂“第一梯隊(duì)”的 AI 公司,或許還并不能存在一個共識性的標(biāo)準(zhǔn)。

幾個頂流 AI 玩家,更像八仙過海,有些以技術(shù)見長,有些重視產(chǎn)品,還有些則干脆專注市場營銷,各有各的優(yōu)勢,也各有各的活法。

如果把百度算進(jìn)第一梯隊(duì)的 AI 公司當(dāng)中,或許有人基于一貫的刻板印象,并不會同意;

然而,數(shù)據(jù)是直接、有力的,百度在中國的 AI 商業(yè)化實(shí)踐,的確可以名列前茅——2024年,文心大模型的日均調(diào)用量已經(jīng)達(dá)到了 16.5 億次,相比一年前的同期數(shù)據(jù),狂增33倍;飛槳平臺上,1808 萬個開發(fā)者和 43 萬家企業(yè),已經(jīng)創(chuàng)建了 101 萬個模型;而文心千帆已經(jīng)幫助客戶完成了 3.3 萬個模型的精調(diào)、開發(fā)了 77 萬個企業(yè)應(yīng)用。

巨大的 B、C 端使用量,已經(jīng)幫助百度建立起了一個初具動能的用戶飛輪。同時,每天不停運(yùn)轉(zhuǎn)的百度搜索、近億 AI 用戶的百度文庫,以及地圖、網(wǎng)盤等多款億級用戶產(chǎn)品,都是百度內(nèi)部試驗(yàn) AI 效能提升的試驗(yàn)田,肩負(fù)的不僅是百度這家科技公司的技術(shù)未來,更是這家上市公司的商業(yè)未來。

過去 24 個月里,AI 行業(yè)中大的變化,李彥宏說,是“大模型基本消除了幻覺”,這也讓用戶們可以更放心地使用 AI,而不擔(dān)心遭到幻覺的反噬——這也是大模型推向商業(yè)化的必要條件。

而到了 2025,不同公司的生存策略正逐漸趨同:獨(dú)角獸們?yōu)榱藵M足資本的期待,而必須展現(xiàn)自己的盈利能力;而大廠更是如此,要依靠持續(xù)不斷的現(xiàn)金業(yè)務(wù)支撐營收和財報,這樣股價才能有所保障。

而 Deepseek 面世后,看似通過先進(jìn)的技術(shù)力“殺死了比賽”,其實(shí)整個 AI 大行業(yè)反而有了向好的趨勢。

一方面,Deepseek 的確通過開源,救活了一些基礎(chǔ)模型能力較差的公司和產(chǎn)品,讓他們也能通過接入 Deepseek 的方式,獲得一些流量;

另一方面,Deepseek 在國內(nèi)突然爆炸式的營銷,讓不少企業(yè)單位——尤其是國央企、事業(yè)單位——一改之前對 AI 的謹(jǐn)慎態(tài)度,紛紛加速擁抱 AI,讓本地部署的一體機(jī)生意在近期反而增色不少。

于是,李彥宏在今年的首次內(nèi)部講話中,他提到,加大 AI 應(yīng)用商業(yè)化實(shí)踐同樣相當(dāng)重要。AI 應(yīng)用在全行業(yè)的爆發(fā),只會加速玩家的淘汰,而那些缺乏商業(yè)化能力的公司和產(chǎn)品,恐怕更要遭殃。

早在別人大談 AGI 時,百度就很早提出要在商業(yè)化落地上取得成績,要通過 AI 業(yè)務(wù)給自己造血,絲毫沒有行業(yè)“前輩”的“偶像包袱”——翻譯過來就是:“賺錢,不寒摻?!?/p>

百度的商業(yè)化保證,是其作為一個25年大廠日積月累的龐大矩陣。百度底層有芯片,有智算中心、萬卡集群;中間有模型,有模型精調(diào)、APP 開發(fā)工具鏈、有大模型商店;頂層有自己的原生 AI 產(chǎn)品,有亟待重構(gòu)的老牌大 DAU 產(chǎn)品,有豐富的渠道和頗具深度的用戶池子——中間不少要素,即使是同等量級的大廠也難望項(xiàng)背。

今天,百度還帶著兩款技術(shù)更先進(jìn),免費(fèi)的文心大模型前來挑戰(zhàn),而還很少有人知道,百度文心 5.0 的底牌究竟長什么樣子。

能留在牌桌上,百度的底牌,是它獨(dú)特的生態(tài)位,是它巨大的體量和它平臺型、生態(tài)型公司的特點(diǎn),讓它可以與整個大賽道與有榮焉。

04、結(jié)語

相比兩年前,AI 大模型的賽道,變化其實(shí)沒有那么大。

誠然,技術(shù)在日新月異地進(jìn)步,玩家們來了又走,七百多天里,賽道經(jīng)歷了百端待舉,也經(jīng)歷了“群模亂舞”。今天市場重回理性,Deepseek 又強(qiáng)勢入局,頗有一掃六合之勢;Manus 又以智能體作為切口,讓人們對 AI 產(chǎn)生了新的遐想。

但未曾改變的是,AI 的方向仍然被一群人引領(lǐng)著。他們兼具浪漫主義與實(shí)干家精神,技術(shù)頭腦與商業(yè)眼光,讓他們能夠一直目光如炬,照亮自己,也同樣照亮他人的前路。

今天的百度亦屬于這個行伍,他們是天生的挑戰(zhàn)者,挑戰(zhàn)更強(qiáng)的對手,挑戰(zhàn)更復(fù)雜的技術(shù),挑戰(zhàn)昨天的自己。

當(dāng)心中有夢的時候,面子又算得了什么呢?

百度

百度

百度是擁有強(qiáng)大互聯(lián)網(wǎng)基礎(chǔ)的領(lǐng)先AI公司。是全球?yàn)閿?shù)不多的提供AI芯片、軟件架構(gòu)和應(yīng)用程序等全棧AI技術(shù)的公司之一,被國際機(jī)構(gòu)評為全球四大AI公司之一。百度以“用科技讓復(fù)雜的世界更簡單”為使命,堅持技術(shù)創(chuàng)新,致力于“成為最懂用戶,并能幫助人們成長的全球頂級高科技公司”。

百度是擁有強(qiáng)大互聯(lián)網(wǎng)基礎(chǔ)的領(lǐng)先AI公司。是全球?yàn)閿?shù)不多的提供AI芯片、軟件架構(gòu)和應(yīng)用程序等全棧AI技術(shù)的公司之一,被國際機(jī)構(gòu)評為全球四大AI公司之一。百度以“用科技讓復(fù)雜的世界更簡單”為使命,堅持技術(shù)創(chuàng)新,致力于“成為最懂用戶,并能幫助人們成長的全球頂級高科技公司”。收起

查看更多

相關(guān)推薦