• 正文
    • ? AI大模型:知識淵博卻缺“實(shí)戰(zhàn)”的大學(xué)生
    • ? 大模型訓(xùn)練:海量數(shù)據(jù)鑄就智慧“大腦”
    • ? MoE架構(gòu):讓大模型“術(shù)業(yè)有專攻”
    • ? 如何用好AI大模型:像老師傅帶新人一樣訓(xùn)練它
    • ? AI時(shí)代,我們?nèi)绾巫蕴帲?/span>
  • 相關(guān)推薦
申請入駐 產(chǎn)業(yè)圖譜

與AI共處 — 喂Ta,養(yǎng)Ta,利用Ta

03/06 14:30
613
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點(diǎn)資訊討論

在剛剛過去的春節(jié),科技圈最火的話題非DeepSeek莫屬,不少人將其視作影響國運(yùn)的重磅產(chǎn)品,各行業(yè)的公司都紛紛接入,一時(shí)間風(fēng)頭無兩。近來一直關(guān)注著AI領(lǐng)域的各種產(chǎn)品,從最初只是下載幾個(gè)AI APP當(dāng)作高級搜索引擎,偶爾用它處理些文字工作,到如今深入研究,對AI大模型的理解也在逐步加深。

? AI大模型:知識淵博卻缺“實(shí)戰(zhàn)”的大學(xué)生

在我看來,AI大模型就像一位剛從名校畢業(yè)的大學(xué)生,飽讀詩書,學(xué)習(xí)過海量公開資料和信息,邏輯推理能力也十分出色,既能陪你談天說地,又能隨時(shí)提供各類知識與數(shù)據(jù)。可它有個(gè)明顯短板,就是缺乏專業(yè)領(lǐng)域的歷練。像DeepSeek、ChatGPT這些大模型,專業(yè)知識儲備不足,很難直接應(yīng)用到具體技術(shù)開發(fā)工作中。盡管我們看到AI在蛋白質(zhì)結(jié)構(gòu)探索、新材料研發(fā)、醫(yī)療診斷等領(lǐng)域有成功案例,但這背后都是專業(yè)團(tuán)隊(duì)長期對模型進(jìn)行專門訓(xùn)練,并開發(fā)相應(yīng)應(yīng)用程序的成果。

? 大模型訓(xùn)練:海量數(shù)據(jù)鑄就智慧“大腦”

大模型訓(xùn)練中,數(shù)據(jù)準(zhǔn)備至關(guān)重要,一般分為公開語料和專有數(shù)據(jù)。公開語料來源廣泛,像Common Crawl這個(gè)非營利組織,致力于用大規(guī)模分布式爬蟲系統(tǒng)定期抓取整個(gè)Web,并把原始數(shù)據(jù)(約300TB)存儲在可公開訪問的數(shù)據(jù)庫中;Wikipedia約20GB的精選文本;BooksCorpus這個(gè)由開發(fā)者soskek創(chuàng)建的多語種書籍語料庫,整理了約11,000本書籍,方便研究者和開發(fā)者用于訓(xùn)練和驗(yàn)證NLP模型;還有BigQuery從GitHub獲取的代碼。專有數(shù)據(jù)則依據(jù)訓(xùn)練目的和領(lǐng)域而定,常見的是企業(yè)內(nèi)部文檔(需合規(guī)清洗)和學(xué)術(shù)論文(如arXiv等開放資源)。這就好比人類學(xué)習(xí),想成為文學(xué)家或?qū)<遥孟仁熳x大量書籍,站在巨人肩膀上?!笆熳x唐詩三百首,不會作詩也會吟”“觀千劍而知器”說的就是這個(gè)道理。我們把大模型核心的神經(jīng)網(wǎng)絡(luò)想象成大腦,每個(gè)參數(shù)如同人腦神經(jīng)元,參數(shù)(神經(jīng)元)越多,理論上大模型(大腦)的知識就越豐富,也就越聰明。所以現(xiàn)在主流大模型如ChatGPT、GROK和DeepSeek等參數(shù)量都在萬億左右。

? MoE架構(gòu):讓大模型“術(shù)業(yè)有專攻”

人再聰明也不可能樣樣精通,頂級數(shù)學(xué)家很難同時(shí)是歷史學(xué)家,機(jī)械工程師也難以成為優(yōu)秀外科醫(yī)生。AI大模型也是如此,所以DeepSeek采用了MoE(Mixture-of-Experts,混合專家)模型架構(gòu)。換成人話就是:先用一個(gè)語言大模型處理用戶輸入,遇到語言大模型處理不了的專業(yè)領(lǐng)域問題,就調(diào)用醫(yī)學(xué)、建筑學(xué)等附屬專家模型。這就像大腦和小腦的分工協(xié)作,大腦負(fù)責(zé)認(rèn)知、情緒調(diào)控和決策,小腦在運(yùn)動協(xié)調(diào)、學(xué)習(xí)記憶和時(shí)間感知中發(fā)揮作用,配合起來效率更高。

? 如何用好AI大模型:像老師傅帶新人一樣訓(xùn)練它

以我的經(jīng)驗(yàn),使用大模型就像領(lǐng)導(dǎo)帶新人,也和老師傅帶剛畢業(yè)的大學(xué)生類似。假如你是老師傅,領(lǐng)導(dǎo)分配來一個(gè)名校畢業(yè)的研究生,你得先給他介紹公司產(chǎn)品、業(yè)務(wù)、流程和崗位工作內(nèi)容,再給他一堆技術(shù)文檔讓他自學(xué),接著一點(diǎn)點(diǎn)傳授工作中的具體操作步驟、專用工具使用方法等,工作中還要及時(shí)發(fā)現(xiàn)他的問題并幫他提升。使用大模型也是這個(gè)流程,要輸入海量本領(lǐng)域?qū)I(yè)知識對其訓(xùn)練,檢查輸出,調(diào)整輸入重新訓(xùn)練,開發(fā)接口程序讓模型投入實(shí)際工作,而且這個(gè)過程可能要不斷重復(fù),才能讓系統(tǒng)達(dá)到最佳效果。模型最終能否達(dá)到預(yù)期,不僅取決于自身算法和結(jié)構(gòu),更取決于訓(xùn)練它的人。就像天資聰慧的畢業(yè)生,若師傅水平有限,幾年后也可能碌碌無為。對模型進(jìn)行訓(xùn)練的能力不足,模型輸出就會和期望相差甚遠(yuǎn)。

此外,使用模型的人需要具備準(zhǔn)確描述目的的能力。愛因斯坦說過:“提出一個(gè)問題往往比解決一個(gè)問題更重要?!泵鎸π袠I(yè)專家,若提不出有效問題,他也很難幫到你。以前我們覺得學(xué)好數(shù)理化走遍天下,可工作后會發(fā)現(xiàn),文科好的人往往發(fā)展更好,因?yàn)樗麄儽磉_(dá)、交流和共情能力更強(qiáng)。在AI時(shí)代,這些能力愈發(fā)關(guān)鍵,只要能準(zhǔn)確描述問題或訴求,AI就能快速給出答案。所以建議大家學(xué)習(xí)AI提示語(網(wǎng)絡(luò)上有很多教程),不但可以提升和AI交流的能力,也能提升在工作中的表達(dá)能力。

? AI時(shí)代,我們?nèi)绾巫蕴帲?/h2>

通過自己最近學(xué)習(xí)AI知識的過程,發(fā)現(xiàn)AI相關(guān)的基礎(chǔ)知識非常繁雜,自己設(shè)計(jì)模型不現(xiàn)實(shí)。唯有從應(yīng)用角度入手,才能有所收獲。此處分享一些心得和理解,僅供參考。

AI的火爆既帶來機(jī)遇,也潛藏危險(xiǎn),它能幫我們解決工作問題、節(jié)省時(shí)間成本,但也會消滅很多附加值不高的工作崗位,如簡單的文字工作和圖像處理。目前,我們普通人無法與AI比拼知識的廣度和數(shù)量,但可以在某些具體的領(lǐng)域比拼思考的深度。如果我們?nèi)匀贿€停留在對知識進(jìn)行死記硬背的階段,那么距離被AI替代就不遠(yuǎn)了。然而,如果你能夠深入的思考所學(xué)習(xí)過的每個(gè)知識點(diǎn),并將其融會貫通,那么,至少在短時(shí)間內(nèi)你的崗位還是安全的。

在可見的未來,會用AI的人大概率活得更輕松、收獲更多,對于“白領(lǐng)”更是如此。善于使用AI工具的人會產(chǎn)出數(shù)倍于傳統(tǒng)方式的成果。AI是人類能力的放大器,能力基數(shù)較高的人通過AI工具的使用會全面碾壓能力基數(shù)低的人。

每個(gè)人都要思考的一個(gè)問題是:如何使用AI并與它共存。普通人得清楚自己在AI時(shí)代的價(jià)值、發(fā)展方向。當(dāng)下我們所能做的,就是學(xué)習(xí)AI使用方法,讓它為我們服務(wù),并找準(zhǔn)自己的定位,同時(shí)提升自己的思考能力與系統(tǒng)思維。

侯哥工作感悟:侯哥?@Roy 專注汽車電子電氣架構(gòu)開發(fā)

刪改編:娜可不敢

相關(guān)推薦

登錄即可解鎖
  • 海量技術(shù)文章
  • 設(shè)計(jì)資源下載
  • 產(chǎn)業(yè)鏈客戶資源
  • 寫文章/發(fā)需求
立即登錄

既搞過通信,也做過零部件,正在做整車;既做過開發(fā),也搞過測試,參與過生產(chǎn);經(jīng)歷過民企、合資,也去過外資、國企;既醉心于工程技術(shù),也研究人文歷史;豐富的經(jīng)歷,跨界的經(jīng)驗(yàn),造就了不一樣的思考角度。