DeepSeek作為人工智能領域的創(chuàng)新先鋒,憑借其突破性技術為現(xiàn)有AI Agent賦予了更強大的任務執(zhí)行與決策支持功能。而企業(yè)接入DeepSeek將帶來哪些創(chuàng)新與實踐價值,DeepSeek該如何打破發(fā)展瓶頸,其落地場景與效果表現(xiàn)如何等問題仍需探索。
本文將結(jié)合數(shù)勢科技的實踐,探討如何通過DeepSeek和現(xiàn)有大模型的整合,推動企業(yè)在數(shù)字化經(jīng)營中的新變革。
分享嘉賓|岑潤哲 數(shù)勢科技 數(shù)據(jù)智能產(chǎn)品總經(jīng)理
01DeepSeek的到來,對于大數(shù)據(jù)分析和應用領域,是“天然的利好”
數(shù)據(jù)應用賽道中,DeepSeek帶來了諸多改變與優(yōu)勢。在數(shù)據(jù)分析領域,DeepSeek接入后,其在數(shù)學及編程能力的增強具有顯著優(yōu)勢,極大地提升了對復雜數(shù)據(jù)的處理、統(tǒng)計與分析能力。在數(shù)據(jù)應用領域,代碼能力與數(shù)學能力至關重要。DeepSeek到來后,無論是前期的數(shù)據(jù)清洗和特征挖掘,中期構建指標體系與指標語義層,還是后期的數(shù)據(jù)可視化及報告生成等環(huán)節(jié),其數(shù)學能力與推理能力的提升,對數(shù)據(jù)應用的全鏈路機制都產(chǎn)生了積極影響。特別是在復雜數(shù)據(jù)清洗、數(shù)據(jù)可視化以及深度報告生成方面,DeepSeek都帶來了諸多利好。
從技術視角來看,其思維鏈對數(shù)據(jù)分析極為有利。在數(shù)勢服務的眾多金融機構中,以往大模型存在一個問題:雖然能給出答案,但答案的推導過程是黑盒化的。而在DeepSeek的論文中,能夠從V3的基礎模型做強化模型成為DeepSeek-R1-Zero,強化學習不僅獎勵準確性,還注重過程與結(jié)構的規(guī)范性。這一機制的優(yōu)勢在于,不僅能準確進行數(shù)據(jù)分析,還能將條理清晰的推理思路總結(jié)呈現(xiàn)給用戶。例如,用戶進行企業(yè)經(jīng)營分析時,應該從哪些維度選取何種指標,DeepSeek能將思考過程以步驟的形式呈現(xiàn)出來。這種激勵機制,極大地增強了數(shù)據(jù)分析報告的說服力,是數(shù)據(jù)應用領域的一大亮點。
作為推理模型,R1在推理時十分注重Token輸出,輸出的Token越多,思考越細致,出錯概率越低。在進行復雜代碼生成、數(shù)據(jù)數(shù)學計算及決策時,R1的表現(xiàn)明顯優(yōu)于蒸餾后的版本或千問模型。然而R1存在速度慢的問題,因為處理復雜任務需要消耗更多Token進行思考。因此可以采用結(jié)合的思路,即使用蒸餾后的相對小參數(shù)量(如32B)的模型,先進行任務分類與實體抽取,該模型在這方面與R1效果相差不大,且速度更快。然而,當用戶的數(shù)據(jù)分析任務極為復雜時,可能會調(diào)用如R1這類推理模型進行深度推理與規(guī)劃,以更好地滿足用戶的分析需求。
通過近期就模型選用問題與多家金融機構進行的交流來看,若場景主要是滿足用戶的快速數(shù)據(jù)檢索需求,例如詢問今年某月份的余額增速情況,此時無需調(diào)用R1這類長推理模型進行復雜任務拆解,使用V3模型進行讀取識別與要素解析,即可快速提取數(shù)據(jù)。但如果用戶的分析需求并非簡單的數(shù)據(jù)提取,而是像撰寫信貸報告或詳細的銀行信貸資產(chǎn)增速分析報告,這類高階的數(shù)據(jù)推理或行動計劃輸出任務,V3模型的快速思考可能無法很好地完成。這種情況下,R1的推理模型更為適用,它能夠?qū)⑷蝿者M行拆解。比如在分支行業(yè)績對比復盤時,確定應關注的指標,并將任務細化為具體步驟。因此,現(xiàn)在很多主流AI產(chǎn)品都會設置“是否啟用深度思考”的按鈕。從某種意義上講,這是通過產(chǎn)品的功能操作,讓用戶能夠選擇此次是進行快思考還是慢思考。未來,此類融合方案或許會成為眾多產(chǎn)品的標配。
02?數(shù)勢SwiftAgent的革新與應用
?目前數(shù)勢在SwiftAgent中加入了“深度思考”按鈕,一旦用戶開啟該按鈕,便會調(diào)用R1模型進行深度推理與分析。數(shù)勢的工具主要面向一些頭部企業(yè),通過接入DeepSeek后對部分能力特性進行了升級,從四個方面極大地提升了大模型的能力。
前端代碼生成能力極為出色。實驗得出,直接讓R1基于原始數(shù)據(jù)生成代碼,此時它在前端快速獲取可視化呈現(xiàn)的能力非常強。以往,大家更多地是借助BI工具來配置一系列看板或駕駛艙,而現(xiàn)在,直接將原始數(shù)據(jù)交給R1生成H5或JS代碼,其表現(xiàn)十分出色,這極大地增強了可視化能力。
其次推理能力顯著提升了報告的深度。以往模型可能只能給出一些較為基礎、缺乏深度的表述,而現(xiàn)在它能夠真正思考指標是否存在問題,是否需要進行假設推斷等,這大幅提升了報告的質(zhì)量和深度。數(shù)據(jù)分析報告的難點在于,指標口徑的準確性至關重要,結(jié)論需基于指標異常進行推斷,甚至有時還需結(jié)合企業(yè)內(nèi)部知識庫或相關文檔生成合理建議。當數(shù)據(jù)需要可視化呈現(xiàn),如轉(zhuǎn)化為表格以進行對比,或進行異常結(jié)論挖掘時,相較于以往如千問模型的思考深度更優(yōu),且整個過程對用戶具有可觀測性。
以財務數(shù)據(jù)異常分析為例,用戶輸入財務數(shù)據(jù),模型能夠明確告知用戶,因某指標下降故而進行異常分析,其思考過程中的每一個節(jié)點都能直觀地向用戶解釋分析的原因。如此一來,在呈現(xiàn)報告時,用戶能夠清晰理解報告撰寫的邏輯,而不像以往大模型輸出結(jié)果時,雖有內(nèi)容卻難以理解分析的依據(jù)。從這個層面來看,大模型思考過程的白盒化是一項重大變革,極大地增強了用戶對結(jié)果的可信度,也提升了數(shù)據(jù)解讀報告的能力。過去報告可能僅有純文字,如今則可融入圖片、表格等數(shù)據(jù)可視化元素,為用戶帶來更好的使用體驗。
此外哪些能力適合由大模型直接生成代碼去完成,哪些更適合通過工具調(diào)用。目前大模型寫代碼的能力很強,但有時仍需編寫Function Code,而非直接讓大模型生成代碼。這主要分為兩種情況:如果代碼的范式能夠固化,此時大模型直接寫代碼的準確率會非常高?。所謂固化范式,以圖表為例,基本圖表具有固定范式,從數(shù)據(jù)分析可視化的角度來看,其模式早已固定,無論何時,餅圖的呈現(xiàn)方式基本一致。在這種情況下,大模型編寫代碼時表現(xiàn)出色,基本不會出錯。然而,對于業(yè)務邏輯靈活的代碼,大模型則不太適合直接編寫。業(yè)務邏輯通常涉及數(shù)據(jù)庫中事實表與維度表的關聯(lián),這種關聯(lián)具有很強的業(yè)務邏輯,且不同公司內(nèi)部表與表之間的關系各不相同。若讓大模型強行編寫涉及三到四個表的復雜關聯(lián)代碼,其生成的代碼往往會出現(xiàn)問題。所以建議通過指標平臺的API取數(shù)接口,實現(xiàn)指標維度的拼接來獲取數(shù)據(jù),這種方式更為妥當。
03?金融行業(yè)案例與展望
以下將詳細分享某城市商業(yè)銀行開展智能數(shù)據(jù)分析的成功案例,近期該銀行將內(nèi)部的千問模型替換為DeepSeek V3和R1后,取得了一定的效果提升。該客戶產(chǎn)品面臨的主要問題是解決行領導在數(shù)據(jù)提取和分析方面的痛點。這家銀行以往依靠分析師角色,通過人工提取數(shù)據(jù)表格的方式,為領導提供諸如收入、存貸款情況、同業(yè)負債情況等報表。對于銀行領導而言,其數(shù)據(jù)需求較為靈活,今日可能關注幾個分支行的余額增速,明日則可能關注業(yè)績排名。然而,銀行缺乏足夠的分析師來滿足這些多樣化需求。因此,銀行期望通過自然語言查詢機制,一方面釋放分析師的時間,提升取數(shù)效率;另一方面,為領導提供更敏捷的歸因分析及報告分析能力,以便洞察行內(nèi)指標變化的異動原因,從而顯著提升工作效果與效率。項目完成后的第一周,領導們提交了數(shù)千條查詢請求,系統(tǒng)使用率較高。同時,結(jié)合指標語義層,數(shù)據(jù)準確性高,從問詢到輸出數(shù)據(jù)的時間基本僅需5秒左右。
這家銀行開展此項目,以及眾多企業(yè)尋求類似服務,本質(zhì)上源于兩個問題。
需求與供給的錯配。即便頭部銀行或大型企業(yè)擁有分析師及ETL人員,但隨著業(yè)務不斷拓展,需求持續(xù)增長,企業(yè)不可能招募等量工程師編寫腳本以滿足所有需求,導致人力供給與需求不匹配。因此,企業(yè)期望借助AI agent滿足日常取數(shù)和用數(shù)的分析訴求,解放人力。
指標口徑層面存在黑盒問題。不同部門對同一指標名稱可能存在不同理解,在底層數(shù)倉中口徑不一致。所以,構建指標語義層,統(tǒng)一指標口徑,使部門間擁有共通的數(shù)據(jù)語言,成為亟待解決的問題。?
在實施方案中融合了大模型能力與指標語義層交互能力。當用戶提出問題時,首先由大模型進行判斷。若任務復雜,如需要生成深度歸因報告,則通過路由將需求轉(zhuǎn)至DeepSeek R1處理;若只是簡單的數(shù)據(jù)提取,如按時間、機構、貸款余額等條件提取數(shù)據(jù),使用V3或更快的模型即可。即先由大模型進行意圖理解,若為復雜任務,則進入任務規(guī)劃階段,由規(guī)劃層進行多任務編排。在指標查詢環(huán)節(jié),通過指標語義層,提取用戶自然語言中的要素。例如用戶詢問各分支行業(yè)績情況,其中分支行為維度,過去三個月為時間,業(yè)績對應若干指標,存在一套映射邏輯。最后將這些指標語義邏輯翻譯成SQL語句執(zhí)行,并通過R1這樣的推理模型對報告進行總結(jié),反饋給用戶。目前大模型在完整的數(shù)據(jù)提取方面能力有限,因為其對SQL底表邏輯的理解存在局限,不過大模型在任務識別與報告生成方面表現(xiàn)出色。因此,將大模型擅長與不擅長的部分區(qū)分開來,進行方案融合,以更好地實施相關項目。
該銀行的技術團隊曾嘗試直接使用R1模型生成SQL。當表結(jié)構較為簡單,例如查詢近7日資產(chǎn)時,R1生成的SQL能夠正常運行。然而,當問題中的任務指令較多,不僅需要提取數(shù)據(jù),還涉及歸因分析以及報告撰寫等任務時,單純通過代碼生成工具來完成就較為困難。此時會先利用R1進行多任務規(guī)劃,第一個任務可能是取數(shù),第二個任務通過歸因分析小模型進行維度歸因,最后借助知識庫生成報告。通過這種結(jié)合Agent架構與Function Code形式,能夠更好地滿足業(yè)務方在真實復雜業(yè)務場景下的分析需求,這些需求不僅包括數(shù)據(jù)提取,還涵蓋高階的數(shù)據(jù)洞察、歸因、異常檢測以及報告撰寫等,這也是企業(yè)實際會面臨的問題。
在為該金融機構提供服務時,采取分場景推進的方式。因為不可能一開始就覆蓋所有場景。在項目一期,首先解決行領導對行內(nèi)業(yè)績指標對比的自然語言分析與報告生成需求。到了項目二期,則聚焦于實際業(yè)務,如信貸、對公貸款業(yè)務,進行風險評估、財務分析或信用卡分析等,從總部視角逐步擴展到各個業(yè)務線的領域和場景。項目一期上線后,用戶體驗良好。以往,無論是行長還是分支行領導,數(shù)據(jù)提取流程都是向分析師提出需求,由分析師進行加工,這個過程來回可能需要4個小時。而現(xiàn)在,算法能夠主動幫助用戶發(fā)現(xiàn)指標問題,例如告知用戶行內(nèi)不良率或貸款余額近期的變化,提醒領導關注。領導若想進一步了解各機構業(yè)務表現(xiàn)不佳的原因,進行詳細的數(shù)據(jù)歸因洞察,可按照分支行、產(chǎn)品類型、客戶類型等維度進行問詢。
最后,若領導需要向總行領導匯報,系統(tǒng)可結(jié)合企業(yè)已有的數(shù)據(jù)庫和知識庫生成包含異常原因及應對措施等內(nèi)容的簡單報告。在接入DeepSeek后,該銀行認為其思維鏈生成及數(shù)據(jù)解讀模塊得到了顯著增強。以往報告可能只有純文字,現(xiàn)在則融合了表格、副文本、圖表與文字,大大提高了報告的易讀性和可解釋性,這也是DeepSeek接入后的優(yōu)勢所在。
最后分享一下對于DeepSeek的未來,尤其是推理模型演進方向的展望。
第一,DeepSeek的出現(xiàn)實現(xiàn)了AI平權。這一成果意義重大,意味著無論是頭部企業(yè)還是中型企業(yè),都具備了部署開源模型的資源與能力,在這一點上,大企業(yè)和小企業(yè)處于同等地位,這是AI平臺發(fā)展的體現(xiàn)。未來,數(shù)據(jù)應用組件將以DeepSeek為核心,分析組件作為執(zhí)行部分協(xié)同運作,這樣能使強大的核心與不同的技能池有效配合,更好地滿足企業(yè)需求。
第二,目前DeepSeek仍無法掌握企業(yè)內(nèi)部的私域知識及數(shù)據(jù)編織邏輯。在此情況下,數(shù)據(jù)應用產(chǎn)品需承擔“翻譯器”的角色。即在推理模型與企業(yè)級復雜數(shù)據(jù)結(jié)構之間構建語義層,以此作為連接用戶自然語言與底層數(shù)據(jù)表格架構的橋梁,但這是大模型的通用能力所無法實現(xiàn)的。原因在于,DeepSeek當前的上下文處理能力為64K或128K,然而企業(yè)實際數(shù)據(jù)量,大型機構通常可達幾十PB甚至上百PB。顯然,無法將全部數(shù)據(jù)輸入模型進行分析。因此,未來其64K或128K的上下文更適合用于推理,將任務細致拆解,再由“手腳”組件逐一執(zhí)行,獲取數(shù)據(jù)、開展相關分析,并將結(jié)果反饋給核心進行總結(jié)報告,這種模式更具有可行性。
第三,目前在使用R1時,存在無法控制思維鏈長度的問題,這導致其輸出有時較為啰嗦。若R1未來取得進展,希望它能夠?qū)崿F(xiàn)對模型輸出的控制。例如能夠在某些場景下將Token控制在1000個以內(nèi),而在另一些場景下,允許2000個Token的輸出。如果未來能夠?qū)崿F(xiàn)對Token的控制,那么在眾多應用場景中,將能夠靈活選擇輸出風格。比如,選擇“謹慎型”輸出,回答問題更加嚴謹;或者選擇相對活潑、簡潔的輸出風格。