• 正文
    • 文心一言幕后的支撐者
    • 從大模型到千行萬業(yè)
    • 企業(yè)何去何從
    • 后記:生成式AI未來可期
  • 相關(guān)推薦
申請入駐 產(chǎn)業(yè)圖譜

文心一言的四次進(jìn)化論

2023/05/26
1801
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

“揭開文心一言飛速升級背后的秘密?!?/p>

“兩個多月,四次迭代,核心場景推理性能提高50倍?!?/p>

這是百度在過去70天間為文心一言交出的成績單。僅僅在兩周前的技術(shù)交流會上,文心一言性能提升還不過十倍。

也是在那次交流會上,百度首次現(xiàn)場演示了大模型微調(diào)過程,文心一言背后的絕對功臣“文心千帆”才開始悄然走進(jìn)公眾視野。

此前,公眾對于百度更為熟知的一直是“文心一言”這一對話式AI產(chǎn)品,鮮少有人看到為其提供支撐的文心千帆大模型平臺。

而現(xiàn)在,它終于適時地開始浮出水面,這對于熱衷擁抱大模型的企業(yè)而言,無疑是一個好消息。

文心一言幕后的支撐者

文心一言的迭代速度令人驚嘆,在5月23日的技術(shù)交流會上,百度智能云副總裁朱勇表示,自內(nèi)測以來,通過算法和模型的持續(xù)優(yōu)化,文心一言的推理性能已經(jīng)大幅提升50倍。

僅僅在兩個多星期以前,文心一言的推理性能還停留在提升10倍的水平。在剛剛過去的二十天,基于文心千帆大模型平臺,百度通過四層架構(gòu)(芯片-框架-模型-應(yīng)用)的端到端優(yōu)化,文心一言將高頻場景下的推理性能進(jìn)一步提升了5倍。此前,文心一言的推理成本已經(jīng)降到最初的十分之一,性能的提升也意味著相關(guān)成本進(jìn)一步的下降。

不少人可能還在好奇,文心千帆和文心一言有什么區(qū)別,是什么關(guān)系。如果用最通俗的話,文心一言更像一個To C產(chǎn)品,為用戶提供大模型對話的能力,而文心千帆則是開發(fā)、訓(xùn)練到應(yīng)用大模型的平臺。

更具體的講,文心千帆提供的服務(wù)能夠覆蓋人工智能研發(fā)的全生命周期,包括:數(shù)據(jù)管理、模型訓(xùn)練、模型評估、預(yù)測部署和插件服務(wù)等,能夠端到端地幫助客戶開發(fā)和部署大模型應(yīng)用。

在5月9日的技術(shù)交流會上,百度智能云就曾對外展示“文心千帆大模型平臺”,表示其是全球首個一站式的企業(yè)級大模型平臺。

5月23日的交流會中,百度智能云AI與大數(shù)據(jù)平臺總經(jīng)理忻舟對這一定義做了進(jìn)一步闡述。前述概念中有兩組關(guān)鍵字:其一是“一站式”,這意味著,文心千帆將提供從模型開發(fā)、應(yīng)用、推理,到數(shù)據(jù)回流、開發(fā)的全閉環(huán)過程,涵蓋大模型整個開發(fā)生命周期;其二是“企業(yè)級”,也就是文心千帆將提供眾多企業(yè)相關(guān)服務(wù),比如智能管控、數(shù)據(jù)安全、賬號管理等等。不僅支持文心一言的大模型服務(wù),也支持第三方的大模型。

過去一段時間,文心一言的迭代速度已經(jīng)側(cè)面證明了文心千帆在訓(xùn)練大模型方面的能力。我們看到百度成為國內(nèi)第一個發(fā)布大語言模型的企業(yè),也欣喜看到過去幾十天間文心一言火箭般的升級速度。

基于這樣的變化,我們可以預(yù)見,未來的一段時間,在文心千帆的加持下,文心一言的升級速度或許會更加超出我們的想象。

與此同時,文心一言快速的迭代充分證明了文心千帆平臺的能力,讓更多想用大模型能力的企業(yè)堅定擁抱。

從企業(yè)側(cè)來看,文心千帆近期舉辦的四場技術(shù)交流會,場場爆滿,參會的幾乎都是企業(yè)客戶。據(jù)悉,截至目前,已經(jīng)有15萬家企業(yè)申請文心千帆的內(nèi)測。300余生態(tài)伙伴與百度簽約,展開在400多種場景內(nèi)的探索。

值得注意的是,文心千帆不僅支持文心一言的大模型服務(wù),也支持第三方的大模型。換句話說,客戶使用第三方大模型也可以在文心千帆上進(jìn)行部署和訓(xùn)練。

從企業(yè)需求側(cè)來看,當(dāng)今企業(yè)擁抱大模型,最關(guān)注的三個焦點是模型效果、成本和安全。即大模型與能給自身企業(yè)帶來多大的業(yè)務(wù)提升,以及自己是否用得起,以及數(shù)據(jù)是否能保證安全。

先來看效果,文心一言的訓(xùn)練成果已然從側(cè)面反映出,文心千帆作為大模型平臺的能力。此前,5月9日的現(xiàn)場演示顯示,僅十分鐘左右的微調(diào)以后,模型效果就得到了明顯提升。據(jù)了解,這樣的微調(diào)過程每次大約僅需標(biāo)注100條數(shù)據(jù),且模型能夠在類似的問題中產(chǎn)生一定的泛化能力。據(jù)百度智能云介紹,文心千帆開發(fā)效果的提升主要依托于AI大底座的能力,AI大底座的千卡并行線性加速比可以達(dá)到90%以上,訓(xùn)練資源利用率超過70%,模型開發(fā)迭代效率提升100%。而來自客戶的反饋也在證明這一點,AI大底座提供的端到端優(yōu)化能力大大提高了模型迭代速度,這打動了成立35年的金山辦公,雙方很快一拍即合,并且已經(jīng)開始逐漸在具體產(chǎn)品上落實。

就成本側(cè)而言,百度杰出系統(tǒng)架構(gòu)師王雁鵬表示,企業(yè)主要關(guān)注點集中于開發(fā)成本,即算力。但實際上,它占總成本的比例可能并不高,且這一成本可以通過很多方法降低,比如四層架構(gòu)端到端的優(yōu)化。算法、框架、系統(tǒng)和芯片,是一體化的。百度智能云副總裁朱勇表示,除了算力等整個底層資源的消耗,整個智能應(yīng)用的開發(fā),需要大量人力成本,大模型的出現(xiàn)使得這些工作門檻足夠低,這些工作交給文心千帆都將是個不錯的選擇。

在安全層面,忻舟坦言,公有云需要非常高的安全機(jī)制,有完善的指令監(jiān)控、日志監(jiān)控、審核以及資源隔離機(jī)制,可以保證數(shù)據(jù)安全。從而在一定程度上保證用戶私域的數(shù)據(jù)安全。此外,客戶還可以選擇私有化部署的方式。

同時,為了保護(hù)用戶的數(shù)據(jù)隱私,百度不會拿用戶數(shù)據(jù)做模型訓(xùn)練和迭代優(yōu)化。并且在符合政策要求情況下,這些數(shù)據(jù)會被刪除。

會后的交流中,忻舟進(jìn)一步解釋道:“我們要把這個功能每一個角度都做的足夠好,不用做的太復(fù)雜,其實更多的是靈活性更強(qiáng)一些,讓我們的客戶和用戶基于足夠的靈活性,能夠根據(jù)自己的業(yè)務(wù)需求開發(fā)自己所需要的場景的應(yīng)用,這是從產(chǎn)品角度來講需要精心設(shè)計的?!?/p>

從大模型到千行萬業(yè)

大模型的落地場景遠(yuǎn)不止文心一言。在更具體的行業(yè)層面,大模型的應(yīng)用場景擁有更大的想象空間。

剛剛過去的一季度,百度智能云首次實現(xiàn)盈利。百度智能云副總裁朱勇告訴雷峰網(wǎng),百度云能夠盈利,一方面在于不斷提升的產(chǎn)品標(biāo)準(zhǔn)化程度,是產(chǎn)品驅(qū)動;另一方面,基于芯片、框架、模型、應(yīng)用的四層架構(gòu)以及端到端優(yōu)化,都使得其成本不斷降低。

當(dāng)然,朱勇也表示,“大模型出現(xiàn)之后,我們也看到業(yè)界、客戶、合作伙伴的熱情,當(dāng)前都在積極聯(lián)合測試開發(fā),這對于我們接下來很多的項目,或者說很多產(chǎn)品落地、產(chǎn)品的發(fā)布節(jié)奏是非常有幫助的,未來可能會產(chǎn)生更多的收入來源?!?/p>

百度智能云六大智能產(chǎn)品正基于文心一言升級,經(jīng)安全評估完成后將會上線。包括金融、政務(wù)、客服、寫作等行業(yè)和領(lǐng)域。

以智能創(chuàng)作為例,平臺將全方位賦能內(nèi)容生產(chǎn)者高效創(chuàng)作,高品質(zhì)內(nèi)容一步到位。從選題策劃、文本創(chuàng)作到圖片、視頻制作,涵蓋各個層面。

在選題上,智能創(chuàng)作平臺將提供新聞線索、熱點發(fā)現(xiàn)、事件脈絡(luò)梳理等一系列功能;基于大模型的輔助創(chuàng)作將升級為AI自動創(chuàng)作,單篇創(chuàng)作時間從小時級縮減到分鐘級,實現(xiàn)文章全流程自動化寫作且支持交互式內(nèi)容修訂;提供16類場景化圖片,且提供圖片編輯、圖生圖等功能;實現(xiàn)圖文到視頻一站式生成和處理。

據(jù)百度智能云AI應(yīng)用產(chǎn)品部總經(jīng)理劉倩介紹,智能客服的應(yīng)答輔助、會話小結(jié)、智能工單、客服知識庫等功能在基于大模型完成升級后,知識生產(chǎn)效率提升9倍,多輪對話構(gòu)建成本下降65%,可讓終端用戶獲得到更聰明更擬人的的體驗。

再如,在政務(wù)行業(yè),百度基于大模型打造了一網(wǎng)辦|政務(wù)服務(wù)助手、一問通|社區(qū)咨詢服務(wù)助手、一問通|社區(qū)咨詢服務(wù)助手、一網(wǎng)管|城運洞察助手、一屏觀|智能分析助手等一系列產(chǎn)品,助力政府機(jī)構(gòu)實現(xiàn)數(shù)字智能和政務(wù)體驗的雙增長。

可以看到,大模型已經(jīng)不再是遙不可及的前沿技術(shù),基于它的應(yīng)用場景正逐漸深入到企業(yè)的生產(chǎn)鏈路中以及人們的日常生活。

除一系列智能應(yīng)用外,預(yù)計未來將會有越來越多的產(chǎn)品基于大模型升級,最先從中獲益的是百度網(wǎng)盤等七大企業(yè)級產(chǎn)品。據(jù)悉,基于大模型的百度網(wǎng)盤企業(yè)版,將為企業(yè)提供數(shù)字智能管理平臺。升級后的百度網(wǎng)盤能夠通過對話式交互,幫助企業(yè)版用戶對文件內(nèi)容進(jìn)行總結(jié)、翻譯、問答等加工處理。據(jù)百度智能云副總裁朱勇透露,百度將在所有業(yè)務(wù)中都集成文心一言的能力,內(nèi)部做了非常詳細(xì)的規(guī)劃。

企業(yè)何去何從

此前,在《從智能云首次盈利,看百度如何在大模型時代奔流》一文中,雷峰網(wǎng)就曾提及,隨著大模型到來,百度智能云的客戶超出預(yù)期,不少過去不太愿意用的機(jī)構(gòu)開始主動與百度溝通。換句話說,越來越多的企業(yè)正選擇擁抱大模型。

在5月9日的發(fā)布會上,百度工程師首次現(xiàn)場通過“文心千帆”演示了大模型微調(diào)的過程。當(dāng)時,忻舟還表示,“快且收斂,是大模型應(yīng)用訓(xùn)練中一個非常重要的指標(biāo)。只快不收斂,大模型的訓(xùn)練是沒有用的。文心千帆在多機(jī)多卡訓(xùn)練性能方面,可以更快達(dá)到收斂的狀態(tài),在全球權(quán)威AI基準(zhǔn)評測MLPerf榜單中排名世界第一。”在忻舟看來,企業(yè)想用好大模型,只有大模型仍不夠,還需要有成熟完備的大模型生產(chǎn)平臺。

事實上,也確實如此,客戶的積極溝通和擁抱說明了一切。除卻上文提到的金山辦公外,金蝶、軟通動力等不少企業(yè)都已經(jīng)或正在與文心千帆溝通簽約事宜。

5月18日,在百度智能云合作伙伴大會上,金蝶與文心千帆現(xiàn)場簽約,正式成為文心千帆的合作伙伴。金蝶中國助理總裁韓革纓在演講中表示,目前金蝶已經(jīng)接入了百度文心一言大模型,不斷在各種探索驗證并產(chǎn)生了不錯的成果。未來,金蝶還會結(jié)合百度文心一言等大模型,利用金蝶的行業(yè)知識、專有數(shù)據(jù),在特定任務(wù)上進(jìn)行行業(yè)模型的打造,不斷去升級金蝶原有的NLP、OCR等應(yīng)用,探索更多的業(yè)務(wù)場景。

朱勇坦言,文心千帆大模型平臺,將為企業(yè)提供開發(fā)應(yīng)用大模型的最好的環(huán)境,是客戶擁抱AI的最佳路徑。我們希望文心千帆大模型平臺,能夠讓我們的客戶和合作伙伴用最簡單的方式,用上大模型,用好大模型。

如前所述,文心千帆不僅提供包括文心一言在內(nèi)的大模型服務(wù),也為客戶提供了完整的工具鏈和開發(fā)訓(xùn)練環(huán)境,能充分滿足客戶需求。

未來,文心千帆主要將提供兩種服務(wù):

第一,以文心一言為核心,提供大模型服務(wù),幫助客戶改造產(chǎn)品和生產(chǎn)流程。朱勇表示,這有點“淘金”的意味,真正的挖掘金子,通過提供模型服務(wù)的方式賦能客戶。

第二,作為大模型生產(chǎn)平臺,企業(yè)可以在文心千帆上基于任何開源或閉源的大模型,開發(fā)自己的專屬大模型。朱勇對此解釋道,“從百度來說,作為業(yè)界頭部的AI公司,百度還是希望能夠更加全面,給客戶提供各種各樣的服務(wù),只要跟大模型相關(guān)的,都是我們的‘菜’?!?/p>

此外,針對不同客戶需求,文心千帆也將會針對性提供多樣性的服務(wù)模式:公有云層面,文心千帆提供推理、微調(diào)、托管等服務(wù);私有化部署方面,文心千帆則通過軟件授權(quán)、軟硬一體、租賃服務(wù)的方式交付給客戶。

盡管文心千帆為客戶提供了大模型從開發(fā)、訓(xùn)練、微調(diào)、數(shù)據(jù)回流等全閉環(huán)過程,涵蓋整個生命周期,但并不是所有的企業(yè)都適于從頭開發(fā)訓(xùn)練基礎(chǔ)模型。

朱勇坦言,其實訓(xùn)練一個基礎(chǔ)模型成本是非常高的,如果真的要做一個千億級的大模型,需要單機(jī)群萬卡以上的算力,不僅要有GPU卡,還要有能夠把GPU的集群資源利用起來,這個往往不是很多的公司能做的。

在他看來,未來,基礎(chǔ)模型(大的底層模型)可能就那么幾家,但是基于此,會有很多不同專業(yè)和行業(yè)類型的大模型,這些不同領(lǐng)域的模型將來支撐上層非常繁榮的領(lǐng)域應(yīng)用。

據(jù)忻舟介紹,從行業(yè)來看,目前大模型普及較多的領(lǐng)域以信息化和技術(shù)普及率較高行業(yè)為主,比如,金融、能源以及泛互聯(lián)網(wǎng)行業(yè)等。

后記:生成式AI未來可期

近兩月來,大模型遍地開花。企業(yè)關(guān)注的焦點,已經(jīng)從大模型的產(chǎn)品功能,轉(zhuǎn)向如何以更快的速度用好大模型,完成產(chǎn)業(yè)鏈的創(chuàng)新再造,實現(xiàn)彎道超車。

百度智能云方面透露,目前已有15萬企業(yè)申請文心一言內(nèi)測,其中有超300家生態(tài)伙伴在400多個具體場景取得測試成效,包括辦公提效、知識管理、智能客服、智能營銷等代表性場景。

作為國內(nèi)最早發(fā)布大模型產(chǎn)品的企業(yè),百度在大模型領(lǐng)域的探索一直在路上:從文心一言的發(fā)布,到一系列應(yīng)用場景的展示,再到如今文心千帆步入內(nèi)測階段,為企業(yè)提供開發(fā)AI應(yīng)用的各種工具鏈及整套環(huán)境,試圖覆蓋人工智能研發(fā)的全生命周期。

正如文心千帆負(fù)責(zé)人忻舟的話:“生成式AI是百年難見的技術(shù)變革,我們雖然在起步中,技術(shù)還在發(fā)展中,但我相信它的未來一定會為我們帶來很多自己應(yīng)用的創(chuàng)新和效率的提升。我們擁有最多的人、企業(yè)、場景,百度努力在生成式AI大模型路上。

百度

百度

百度是擁有強(qiáng)大互聯(lián)網(wǎng)基礎(chǔ)的領(lǐng)先AI公司。是全球為數(shù)不多的提供AI芯片、軟件架構(gòu)和應(yīng)用程序等全棧AI技術(shù)的公司之一,被國際機(jī)構(gòu)評為全球四大AI公司之一。百度以“用科技讓復(fù)雜的世界更簡單”為使命,堅持技術(shù)創(chuàng)新,致力于“成為最懂用戶,并能幫助人們成長的全球頂級高科技公司”。

百度是擁有強(qiáng)大互聯(lián)網(wǎng)基礎(chǔ)的領(lǐng)先AI公司。是全球為數(shù)不多的提供AI芯片、軟件架構(gòu)和應(yīng)用程序等全棧AI技術(shù)的公司之一,被國際機(jī)構(gòu)評為全球四大AI公司之一。百度以“用科技讓復(fù)雜的世界更簡單”為使命,堅持技術(shù)創(chuàng)新,致力于“成為最懂用戶,并能幫助人們成長的全球頂級高科技公司”。收起

查看更多

相關(guān)推薦