• 正文
    • 01.語言理解力暴漲,人人化身玩機達人? 小藝變得更聰明了
    • 02.數(shù)千字文章秒生摘要 圖文多模創(chuàng)作不在話下,小藝更能干了
    • 03.從通用到“專屬”,AI也可以更有溫度
    • 04.重構(gòu)大模型與智慧助手? 顛覆體驗離不開硬核技術(shù)創(chuàng)新
    • 05.打通軟硬全鏈條,讓大模型成為“系統(tǒng)級”能力,全場景生態(tài)加速落地
    • 06.結(jié)語:大模型掀起語音助手進化潮? 華為已先行一步
  • 推薦器件
  • 相關(guān)推薦
申請入駐 產(chǎn)業(yè)圖譜

大模型掀起智慧助手“進化”新浪潮,華為小藝已提前交卷

2023/08/11
1735
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

作者?|??云鵬? ?編輯?|??漠影

秒懂你的想法,一句話生成圖文,更聰明懂你的智慧助手已經(jīng)走入現(xiàn)實。

在今天的AI大模型時代,AI和終端場景要如何結(jié)合才能真正為我們的生活帶來便利?這是當下每一家科技巨頭都在思考和面對的問題。

在大模型落地千行百業(yè)的大潮之下,智能手機作為與普通消費者生活最為貼近的產(chǎn)品,也在快速卷入AI革命的浪潮中。

iOS版、安卓版ChatGPT的先后發(fā)布讓更多人可以接觸到大模型帶來的技術(shù)紅利,而語音助手與大模型的結(jié)合也成為科技巨頭們正在爭奪的關(guān)鍵高地。

一邊谷歌計劃徹底重塑其智能語音助手,將大模型能力融入,另一邊蘋果Siri也曾被多次曝光將融入大模型相關(guān)能力,微軟的Copilot則已經(jīng)完成對Cortana的替代。

終端設(shè)備中的AI迎來一場大模型革命,已成大勢所趨。一直被消費者詬病不夠“智能”的語音助手,究竟要如何借助大模型變得“更智能”?

就在8月4日,華為率先交出了一份答卷。

在華為盤古L0基座大模型的基礎(chǔ)上,華為針對終端消費者場景構(gòu)建了大量的場景數(shù)據(jù)與精調(diào)模型后的L1層對話模型,并將該模型用在了智慧助手小藝中,全新的小藝在今年華為開發(fā)者大會上正式亮相。

基于此,華為也成為國內(nèi)率先將大模型能力融入智慧助手并面向消費者落地的科技公司。

用華為的話來說,在大模型的加持下,小藝變得“更聰明、更能干、更貼心”了?;谌A為大模型和AI技術(shù)的進步,小藝迎來了一次顛覆性的智能化革新,而這些新體驗,也將進一步擴展至華為“1+8”的產(chǎn)品生態(tài)中。

大模型的融入究竟能給如今的智慧助手們帶來怎樣的“進化”?華為是如何克服重重行業(yè)此前未能突破的難題將大模型成功落地在終端中的?小藝掀起的智能語音助手新革命又將對產(chǎn)業(yè)有著怎樣深遠的影響?

可以確定的是,讓智慧助手給我們每個人的日常生活真正帶來便利和樂趣,華為把這件事又往前推了一大步。

01.語言理解力暴漲,人人化身玩機達人? 小藝變得更聰明了

從大模型進入大眾視野的第一天起,一個討論就從未停息:由大模型驅(qū)動的聊天機器人是否會取代手機上的智慧助手?

今天,從華為給出的答案來看,兩者絕非替代關(guān)系,由大模型賦能的智慧助手能夠帶來的體驗革新,可以說讓許多曾經(jīng)的“想象”真正走入了“現(xiàn)實”。智慧助手越來越像你真正的管家、朋友,人工智能的“智能化”邁入了新的階段。

縱觀小藝的升級,最直觀的體現(xiàn)就是:小藝真的變“聰明”了,它知道我在說什么、能夠更精準地讀懂我話里的意思了。

比如我可以直接跟小藝說,“能不能把手機壁紙設(shè)置成實時天氣?”此時小藝就能明白我是想要全景天氣壁紙。

對于再復(fù)雜一點的場景,比如今晚我想請人吃飯,就可以直接跟小藝說,“找一家附近評分高的海鮮餐廳,最好有適合四個人的優(yōu)惠套餐”,此時小藝可以準確理解我的意圖,并直接調(diào)用美團服務(wù)給我找到相關(guān)餐廳。

當我隨手拍一個海報,針對海報圖片,就可以用自然交流的方式去問小藝相關(guān)的信息并獲取服務(wù),比如我可以跟小藝說,“我想?yún)⒓蛹夹g(shù)論壇,導(dǎo)航去圖上的地址”,此時小藝就可以準確識別海報中的地址信息并打開導(dǎo)航App進行導(dǎo)航。

在大模型能力的加持下,小藝還可以處理更加復(fù)雜的場景編排任務(wù),幫我們創(chuàng)造專屬于自己的特殊場景。如果喜歡運動健身,我可以讓小藝創(chuàng)建一個“晨跑場景”,要求為“每周一到周五早上6點半為我播報當天天氣,6點半到7點我會跑步,當我戴上藍牙耳機的時候,就播放收藏的歌曲,并把手機設(shè)置為靜音模式”。

這一系列看似復(fù)雜的操作,都可以通過這“一句話的時間”讓小藝直接設(shè)置完成。可以說,在“更聰明”的小藝的幫助下,我們不再需要一項項地查看玩機技巧和大量的功能說明,每個人都可以成為“玩機達人”,因為我們只需要問小藝就可以了。

小藝這種能力的提升,讓很多智能手機具有的強大功能,可以簡單便捷地、通過語音口述的方式被用戶所接觸到。

縱觀小藝在“更聰明”層面的諸多升級,我們能清晰地看到,大模型能力的融入,搬開了阻礙用戶養(yǎng)成智慧助手使用習(xí)慣的最大絆腳石之一——不夠自然的對話、無法隨心所欲的自然交流。

想要真正讓智能語音助手從好玩、新奇走向好用,甚至成為一種“習(xí)慣動作”,優(yōu)秀的語言理解和交互能力是必不可少的。大模型讓智能語音助手真正能夠讀懂、聽懂我們,其易用性的提升是極為顯著的。

02.數(shù)千字文章秒生摘要 圖文多模創(chuàng)作不在話下,小藝更能干了

除了自然語言理解能力的跨越式迭代,大模型加持下的小藝在生產(chǎn)力方面效率提升也十分可觀,這也是大模型應(yīng)用的強項之一,智能語音助手終于可以參與到我們平時工作的具體內(nèi)容中來了。

比如當我們在一些內(nèi)容資訊App上看到一篇文章,就可以問小藝,“這篇文章主要講了什么”,此時小藝就可以快速對文章內(nèi)容進行重點總結(jié)并生成簡短的摘要。

根據(jù)華為在開發(fā)者大會上的演示,對于一篇3000多字的文章,一次輸入給模型,模型可以在幾秒之內(nèi)完成對文章的總結(jié)。

我們還可以進一步針對這篇文章的內(nèi)容去延伸問一些問題,小藝都可以從文章中找到相關(guān)信息組成簡潔明了的答案呈現(xiàn)給我們。

不僅是文章、新聞,小藝甚至還可以讀論文,可以說,在大模型能力的加持下,每個人都有機會在小藝的幫助下不斷地提升自己的能力。

除了理解文章,小藝還可以“寫文章”。當我要和一個初次見面的合作伙伴開會時,我可以直接跟小藝口述會議的時間、邀請的公司人員以及討論內(nèi)容,小藝就會幫我寫一封會議邀請的郵件。

據(jù)了解,目前小藝已經(jīng)學(xué)習(xí)了上百種的文案風(fēng)格,包括各類書信、公文、商業(yè)文案、祝福語、故事、工作總結(jié)等。

其實不只是文字,對于圖片的生成和創(chuàng)作,小藝同樣拿手。比如在特定的節(jié)日,我只要把相關(guān)主題、風(fēng)格告訴小藝,小藝就可以根據(jù)我的照片,一鍵生成一張屬于我的創(chuàng)意卡片。借助多模態(tài)大模型技術(shù),小藝無疑可以幫我們更好地使用手機里的大量影像素材。

縱觀小藝在辦公生產(chǎn)力方面的提升,可以說小藝已經(jīng)不僅是生活中懂我的朋友,更是我們工作中的得力助手。大模型能力的融入顯著促進了智慧助手生產(chǎn)效率的提升。

在當下這個快節(jié)奏的時代,小藝快速提供靈感、輔助創(chuàng)作、節(jié)省時間獲取關(guān)鍵信息的這一系列能力,都顯得十分“需求對口”。

大模型讓智能語音助手從“需要”變?yōu)椤氨匾保瑥摹澳苡谩弊優(yōu)椤昂糜谩?,實用性得到了顯著提升。

03.從通用到“專屬”,AI也可以更有溫度

在大模型的加持下,小藝在各方面的能力都有了長足進步,而當我們將時間線拉長,我們還能看到“進化”后的小藝帶來的更深層價值。

隨著小藝與我們相處的時間越來越長,我們和小藝不斷地交流,小藝就會變得越來越懂我們,給出的建議也會更加貼心和個性化,從一個通用智慧助手變?yōu)槲业?strong>“專屬貼心管家”。

比如我在開會時有一些待辦事項,可以通過“隨口描述”的方式讓小藝記錄下來,小藝可以對我口述的內(nèi)容進行理解,并將這些重要事項提煉出來,放在日歷或者備忘錄中。

這還沒完,等過一段時間,如果我還要根據(jù)上次開會的待辦事項,再次與合作伙伴開會,我就可以讓小藝根據(jù)之前記錄的信息直接寫出一封新的會議邀請郵件。

當然,對于生活中的一些重要時刻,比如父母的生日,小藝可以幫我記住,并且在提醒的同時,為我提供更多的服務(wù)推薦,比如餐廳的選擇、禮物的購買建議,這些服務(wù)可以一觸直達對應(yīng)的App。

此外,當我們出差時,如果我是一個喜歡美食的人,小藝就會幫我推薦一些當?shù)氐拿朗?,如果小藝此前知道我喜歡旅游,它就會給我介紹一些當?shù)氐木包c。

當小藝對我們更了解的時候,小藝提出的建議也會更加個性化,有更高的概率契合我們當下的實際需求。

值得一提的是,小藝相關(guān)的個性化數(shù)據(jù)和學(xué)習(xí)都是在端側(cè)進行的處理的,從而保證數(shù)據(jù)的安全和隱私。在華為看來,安全與隱私保護是他們在所有AI場景設(shè)計和體驗創(chuàng)新中遵循的第一原則。AI不能無中生有,更不能被濫用,AI是輔助而不是替代,AI是增強而不是虛構(gòu)。

正如華為所思考的一樣,在AI技術(shù)高速發(fā)展的當下,用更負責(zé)任地態(tài)度去做更透明的AI,審慎創(chuàng)新善用AI,必然是所有科技企業(yè)都應(yīng)堅持的方向。

04.重構(gòu)大模型與智慧助手? 顛覆體驗離不開硬核技術(shù)創(chuàng)新

不論是更聰明、更能干的小藝,還是更個性化、更貼心的小藝,抑或是語音交流更加逼真、更有溫度的小藝,大模型正讓智能語音助手變得更加易用、實用、好用,從根本上解決用戶使用語音助手中遇到的諸多“頑疾”,帶來體驗上的“質(zhì)變”。

而在這種質(zhì)變的背后,華為在硬核技術(shù)層面的積累和創(chuàng)新無疑是關(guān)鍵支撐。

實際上,華為從底層就重構(gòu)了大模型與智慧助手的整個協(xié)作系統(tǒng),摒棄了過去多個系統(tǒng)獨立構(gòu)建的“割裂”模式,讓大模型成為智慧系統(tǒng)的大腦,以大模型為核心,無縫利用大模型的高階能力,對系統(tǒng)進行全面增強。

這一架構(gòu)方向挑戰(zhàn)巨大,此前業(yè)界沒有成熟的商用案例,但華為仍然決定做“第一個吃螃蟹的人”。

為此華為構(gòu)造了各場景下的語料數(shù)據(jù),并設(shè)計了能讓系統(tǒng)理解、可執(zhí)行的模型輸出,同時華為給大模型注入了可信的結(jié)構(gòu)化、非結(jié)構(gòu)化知識,讓大模型能夠?qū)W習(xí)到通識、邏輯關(guān)系。

具體來看,華為在預(yù)訓(xùn)練、設(shè)備操控以及端云協(xié)同方面的突破都可圈可點。

首先,預(yù)訓(xùn)練的能力強不強,是對各家內(nèi)功的真正考驗。在預(yù)訓(xùn)練中,華為構(gòu)建大量的不同類型表達的語料庫,讓大模型在預(yù)訓(xùn)練的階段中就成為精通各類表達的大師。

同時,華為從一開始就希望小藝向著“更智能的私人助理”這一方向去進化。為此華為將大模型的能力進行細化拆解,在此基礎(chǔ)上構(gòu)建完整的測試數(shù)據(jù)集,并使用能力樹指導(dǎo)數(shù)據(jù)構(gòu)建和大模型能力構(gòu)建。

在設(shè)備操控方面,如何利用大模型進行設(shè)備控制,實現(xiàn)真正的智能化設(shè)備控制,是用戶體驗?zāi)芊駥崿F(xiàn)跨越式升級的關(guān)鍵。

為此,華為將設(shè)備控制中大模型生成文本的格式做到了幾乎百分百的遵從度,讓中樞系統(tǒng)高效解析和對接。同時為了解決場景復(fù)雜的挑戰(zhàn),華為詳細梳理消費者場景制定工具使用說明書,讓大模型“先學(xué)習(xí)再上崗”。

針對大模型高昂推理成本和推理時延的難題,華為設(shè)計了多套完全不同的工具調(diào)用范式,將工具調(diào)用等待時間加速了一倍。

從最終落地結(jié)果來看,小藝所使用的大模型,可以很好地覆蓋對話、出行旅游、設(shè)備操控、吃穿住行等各類終端消費場景,其知識范圍、事實性、實時性以及安全合規(guī)等多方面都得到了針對性優(yōu)化和增強。

最后在端云協(xié)同方面,個性化數(shù)據(jù)處理需要端側(cè)模型,端側(cè)算力和功耗的限制又使得云側(cè)模型不可或缺。云側(cè)和端側(cè)要如何分配任務(wù)、協(xié)同配合,是對廠商技術(shù)的考驗。華為在大模型端云協(xié)同領(lǐng)域積累的技術(shù)能力,讓個性化體驗得以實現(xiàn)。

據(jù)了解,針對消費者在不同設(shè)備不同場景下的需求,華為小藝背后的大模型擁有端側(cè)和云側(cè)等形態(tài)。在小藝與大模型的結(jié)合中,端側(cè)大模型會先對用戶請求和上下文信息做一層預(yù)處理,再將預(yù)處理后的需求發(fā)送到云側(cè),從而最大化地發(fā)揮“端側(cè)模型快”和“云側(cè)模型強”的優(yōu)勢。

從重構(gòu)大模型與智慧語音助手的協(xié)同關(guān)系,到克服諸多大模型落地終端場景面臨的技術(shù)挑戰(zhàn),華為還是那個我們熟悉的華為,技術(shù)創(chuàng)新能力仍然是華為最硬的底牌。

05.打通軟硬全鏈條,讓大模型成為“系統(tǒng)級”能力,全場景生態(tài)加速落地

正如我們開頭所說,AI和終端場景要如何結(jié)合才能真正為我們的生活帶來便利,是當下終端側(cè)AI技術(shù)落地應(yīng)用需要回答的關(guān)鍵問題。

華為小藝的一系列技術(shù)、能力升級,讓我們看到了大模型如何更加貼近消費者的使用場景,大模型的應(yīng)用如何“更接地氣”?小藝可以說做了一個很好的示范。

華為從用戶體驗出發(fā),用技術(shù)解決問題,將傳統(tǒng)語音助手在體驗上的“不可能”變成了可能。

相比OpenAI的ChatGPT、谷歌的Bard這些生成式AI聊天機器人,華為的小藝是在HarmonyOS操作系統(tǒng)層面,為華為終端用戶提供語音對話、圖文識別、服務(wù)建議、設(shè)備智慧能力開放和設(shè)備互聯(lián)管理的應(yīng)用。

硬件、軟件、系統(tǒng)到應(yīng)用層全鏈條的打通,華為讓大模型成為“系統(tǒng)級”能力,這是其他產(chǎn)品所無法比擬的,也是華為的核心優(yōu)勢之一。

從云端服務(wù)器中的芯片,到終端設(shè)備中的鴻蒙操作系統(tǒng)和鴻蒙應(yīng)用生態(tài),華為這種全棧式技術(shù)能力是小藝與大模型結(jié)合如此高效且順利的關(guān)鍵支撐。

華為相關(guān)AI專家告訴智東西,系統(tǒng)級的入口跟操作系統(tǒng)結(jié)合地更加緊密,跟生態(tài)的互聯(lián)也做到了系統(tǒng)生態(tài)底層,這種互聯(lián)才是真正高效的。

與此同時,華為小藝基于華為鴻蒙生態(tài)形成的優(yōu)勢也是其獨特競爭力。

目前華為的各類終端產(chǎn)品面向全場景布局,其中“1+8”這幾類核心產(chǎn)品小藝都已完成覆蓋,未來結(jié)合全場景設(shè)備的業(yè)務(wù)形態(tài),華為能夠?qū)碛写竽P湍芰Φ男∷嚥渴鸬较M者全場景體驗上。

基于小藝的大模型能力在華為全場景業(yè)務(wù)生態(tài)中全面落地,已經(jīng)只是時間的問題了。

06.結(jié)語:大模型掀起語音助手進化潮? 華為已先行一步

此次基于大模型技術(shù),小藝掌握了更多技能,從更自然流暢的對話交互到更高效便捷的生產(chǎn)力應(yīng)用,從更懂你的主動服務(wù)到更有溫度的個性化服務(wù),華為已經(jīng)成為科技巨頭中將大模型與端側(cè)用戶體驗結(jié)合的最為緊密的一個。

目前,華為全新的小藝智慧助手將在今年8月底開放邀請測試,并于晚些時候在搭載HarmonyOS 4.0及以上操作系統(tǒng)的部分機型中通過OTA升級,具體升級計劃會稍晚公布。

真正讓大模型服務(wù)于普通消費者,讓每個人享受到生成式AI帶來的體驗革新,這是小藝對于產(chǎn)業(yè)和用戶最大的價值所在。

面向未來,大模型與智能語音助手的結(jié)合必將更加緊密,隨著后續(xù)各路科技巨頭的跟進,智能語音助手的“進化”浪潮將勢不可擋。未來還會有哪些新的應(yīng)用場景、新的應(yīng)用形態(tài)和功能涌現(xiàn)出來,都令人充滿想象空間。

推薦器件

更多器件
器件型號 數(shù)量 器件廠商 器件描述 數(shù)據(jù)手冊 ECAD模型 風(fēng)險等級 參考價格 更多信息
MCF52258CAG66 1 Freescale Semiconductor MCF522XX 32-bit MCU, ColdFire V2 core, 512KB Flash, 66MHz, QFP 144
$12.68 查看
MK10DX256VLH7R 1 Freescale Semiconductor Kinetis K 32-bit MCU, ARM Cortex-M4 core, 256KB Flash, 72MHz, QFP 64
$9.1 查看
MK70FN1M0VMJ12R 1 Freescale Semiconductor 32-BIT, FLASH, 120MHz, RISC MICROCONTROLLER, PBGA256, 17 X 17 MM, MAPBGA-256
暫無數(shù)據(jù) 查看
華為

華為

華為創(chuàng)立于1987年,是全球領(lǐng)先的ICT(信息與通信)基礎(chǔ)設(shè)施和智能終端提供商。目前華為約有19.7萬員工,業(yè)務(wù)遍及170多個國家和地區(qū),服務(wù)全球30多億人口。華為致力于把數(shù)字世界帶入每個人、每個家庭、每個組織,構(gòu)建萬物互聯(lián)的智能世界:讓無處不在的聯(lián)接,成為人人平等的權(quán)利,成為智能世界的前提和基礎(chǔ);為世界提供最強算力,讓云無處不在,讓智能無所不及;所有的行業(yè)和組織,因強大的數(shù)字平臺而變得敏捷、高效、生機勃勃;通過AI重新定義體驗,讓消費者在家居、出行、辦公、影音娛樂、運動健康等全場景獲得極致的個性化智慧體驗。

華為創(chuàng)立于1987年,是全球領(lǐng)先的ICT(信息與通信)基礎(chǔ)設(shè)施和智能終端提供商。目前華為約有19.7萬員工,業(yè)務(wù)遍及170多個國家和地區(qū),服務(wù)全球30多億人口。華為致力于把數(shù)字世界帶入每個人、每個家庭、每個組織,構(gòu)建萬物互聯(lián)的智能世界:讓無處不在的聯(lián)接,成為人人平等的權(quán)利,成為智能世界的前提和基礎(chǔ);為世界提供最強算力,讓云無處不在,讓智能無所不及;所有的行業(yè)和組織,因強大的數(shù)字平臺而變得敏捷、高效、生機勃勃;通過AI重新定義體驗,讓消費者在家居、出行、辦公、影音娛樂、運動健康等全場景獲得極致的個性化智慧體驗。收起

查看更多

相關(guān)推薦