• 正文
    • ▎從L1到L5,AI數(shù)字人階梯式進化
    • ▎“量產(chǎn)”高級別AI數(shù)字人,提效百業(yè)
  • 相關推薦
申請入駐 產(chǎn)業(yè)圖譜

從L1~L5,你面前的數(shù)字人是幾級智能?

2022/04/28
428
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

從電影中逼真的CG人物,到能夠與我們面對面進行互動的智能服務助手,數(shù)字人會經(jīng)歷幾級進化?

近日,在 “中國元宇宙發(fā)展高峰論壇”上,商湯科技聯(lián)合增強現(xiàn)實核心技術產(chǎn)業(yè)聯(lián)盟(CARA)共同發(fā)布AI數(shù)字人白皮書——《企業(yè)級AI數(shù)字人 數(shù)字經(jīng)濟發(fā)展“新動能”》,定義數(shù)字人的發(fā)展五階段。 

商湯科技智能產(chǎn)業(yè)研究院院長田豐在活動演講中表示,數(shù)字人正在從有顏無智的“CG數(shù)字模特”,進化為可提高生產(chǎn)力、驅動創(chuàng)新服務的“擬人服務式AI”,融入數(shù)字中國的千行百業(yè),成為數(shù)字經(jīng)濟的新交互媒介、新商業(yè)智能服務、新政務便民窗口。

▎從L1到L5,AI數(shù)字人階梯式進化

從形象寫實到理解智能,從手工制作到自動生產(chǎn),整個AI數(shù)字人的進化歷程,可以劃分為五個階段:

L1級:主要以人工制作為主;

L2級:依靠動捕設備采集表情、肢體等動作,例如電影動畫制作;

L3級:可依靠算法驅動口型、表情和動作,例如虛擬化身實時互動;

L4級:實現(xiàn)部分智能化交互,在垂直領域創(chuàng)新服務模式;

L5級:實現(xiàn)完全智能化交互,打造真正的個性化虛擬助手;

達到L4級別,意味著數(shù)字人實現(xiàn)了AI仿真動畫生成能力與自然語言理解能力的結合。

此時的數(shù)字人,可通過學習大量真人會話、語氣、表情和動作,根據(jù)表達內容生成相應神態(tài)和全身動作,輸出栩栩如生的擬人效果。同時,結合AI算法在制作流程中的深度融合(AIGC),制作效率也得到了大幅提升。

也只有達到L4或更高級別,AI數(shù)字人才能真正走入千行百業(yè),推動生產(chǎn)力變革。

▎“量產(chǎn)”高級別AI數(shù)字人,提效百業(yè)

作為AI數(shù)字人技術領導者,商湯以原創(chuàng)的多模態(tài)交互、深度學習和全棧式的AIGC(AI Generated Content)技術,構建了智能化生成、智能化驅動和智能化交互三大引擎,打造出“一站式”AI數(shù)字人生產(chǎn)流水線,讓AI數(shù)字人“更聰明、更專業(yè)”,并實現(xiàn)“聽得懂,看得見,說得出”的人機交互效果。

得益于自動化流水線,商湯已根據(jù)行業(yè)需求,快速、靈活地創(chuàng)建了諸多不同角色的AI數(shù)字人,在文旅、展館、金融、教育、商超等實體產(chǎn)業(yè)中規(guī)?;瘧?。

比如,在上海中共一大紀念館中,商湯AI數(shù)字人擔任講解員,為參會者講解黨史;在廣州永旺商城,商湯AI數(shù)字人則是導購員,為顧客提供智能的問詢服務;在寧波銀行上海分行,商湯AI數(shù)字人擔任大堂經(jīng)理,提供各類業(yè)務咨詢和問題回復;在醫(yī)院場景,AI數(shù)字人可以為患者進行分診導診,為患者帶來有溫度的關懷;在智能汽車車艙中,AI數(shù)字人還可化身虛擬行車伴侶,為人車交互融入更多情感元素。

伴隨技術的發(fā)展,AI數(shù)字人將不僅局限于我們所看到的人物形象,它也會成為可以通過不斷機器學習,突破想象力的AI智能體。

未來,無論在現(xiàn)實世界還是影視、游戲作品中,AI數(shù)字人都將無處不在,為我們增添娛樂體驗、帶來便捷服務、實現(xiàn)效率提升,深刻改變人們的生活和工作方式。

相關推薦

登錄即可解鎖
  • 海量技術文章
  • 設計資源下載
  • 產(chǎn)業(yè)鏈客戶資源
  • 寫文章/發(fā)需求
立即登錄

商湯科技是國家科技部授予的“智能視覺”人工智能開放創(chuàng)新平臺,以“堅持原創(chuàng),讓AI引領人類進步”為使命和愿景,建立并打造全球領先的深度學習平臺和超算中心,并研發(fā)一系列AI技術。關注商湯科技SenseTime,與我們一同擁抱AI大時代。