即將告別五味雜陳的2022年,站在AI產業(yè)的角度去回顧、總結,今年很想做一篇“不一樣”的內容。
我們追尋了很多AI的超能力,AI的賦能作用,AI的智能價值……那么,有哪些事情是AI做不了的?可能是因為技術還需要突破,這是我們未來的創(chuàng)新點;可能是因為應用需求還不成熟,需要時間沉淀和產業(yè)界的共同努力;可能是因為成本不夠經濟,還需要在商業(yè)落地環(huán)境中進一步打磨;也可能,確實存在一些AI在短期內甚至長期來看都無法替代的領域……
只有找到產業(yè)的剛需,找到AI的自驅力,看到AI應用的邊界,明白AI的“有所為”和“有所不為”,我們對于AI的理解,以及對于AI落地的動力和方向才會更為清晰。
在這篇年終特寫中,<與非網>對話幾位AI產業(yè)人士,他們之中有工程師、有企業(yè)高管、有剛參加工作的新人,也有大廠出身抽離AI的資深人士……從另一個角度,他們解讀了AI。
AI變強,成敗蕭何
湯煒偉從事人工智能芯片及相關產品的開發(fā)落地工作,對于“AI的智能價值,以及AI賦能行業(yè)的價值”,他的理解是,AI賦能行業(yè)——本質上是生產力的提升,俗稱“降本增效”,在行業(yè)中提升生產效率,或者節(jié)省成本、釋放人力。
這一輪AI的爆發(fā),如果從2016的AlphaGo算起,也有六七年時間了。這些年里,大量的AI技術爆發(fā)并得到了應用,如互聯(lián)網、安防、消費電子、機器人、智能制造等。“這是一次新的生產力革命,在不同領域的降本增效都有著不俗表現(xiàn),也催生了很多商業(yè)模式和創(chuàng)業(yè)公司的出現(xiàn)”,湯煒偉表示。
他列舉了大家都熟悉的例子,如:計算機視覺中的人臉識別、車輛識別技術,這些應用達到了大體量的大型底庫下的高識別率——這就相當于用計算機和機器部署了很多雙“慧眼”和后臺對應的“記憶力”和“智腦”,替代了警察、保安等人為的繁重工作,并且顯著提高了安全保障效率。
再比如工業(yè)機器視覺,在生產線上以高速攝像頭加上AI智能識別,相比于傳統(tǒng)上人工判斷生產缺陷的方式,帶來了多倍的生產效率提升,并且避免了人為的疲勞帶來的誤判,充分發(fā)揮了機器的高準確率,以及在相對單調的任務上不知疲倦的特性等。
此外還有互聯(lián)網推薦,如抖音、快手等短視頻推薦,對于用戶的娛樂體驗帶來了無以倫比的感受。讓用戶沉浸于此的重要原因,就是推薦的內容和用戶的心理、愛好等越來越高的匹配度,這背后是推薦算法越來越優(yōu)化的表現(xiàn)。
“然而,任何的單一技術都存在局限性和應用的邊界”,湯煒偉指出。這一輪AI技術浪潮以深度神經網絡為核心,它師承歷史的聯(lián)接學派,以設計不同的神經網絡結構來表達智能的能力。
那么,在這樣一種發(fā)展背景下,AI如何承上啟下,實現(xiàn)更強的AI?
湯煒偉表示,“產業(yè)界和學術界有一種觀點,未來的AI智能技術也許是綜合了多種技術的組合,或者是一種全新的技術的顛覆才能帶來更強的AI?!?/p>
回歸到神經網絡發(fā)展的三要素:數據、算法、算力,它們既成就了深度學習技術,其實也在一定程度上限制了AI的發(fā)展。
首先是數據,在神經網絡的很多應用領域需要海量的數據(可能是百萬級甚至千萬級),然而,并不是所有行業(yè)都能輕松獲得這樣量級的數據。數據要么是難以獲得(如人臉數據涉及隱私),要么是標注成本極高(如醫(yī)療影像數據的標注具有極高的專業(yè)度,醫(yī)生的專業(yè)時間則意味著極高成本),要么數據本身就是小數據(如工業(yè)元器件的表面缺陷,沒有海量的數據)。 這些都給“數據”帶來了越來越多的挑戰(zhàn),迫使大家采用數據增強、對抗網絡等方法來解決或者緩解數據相關問題。
其次是算法,深度神經網絡的參數量越來越大,如GPT-3的1750億參數,這樣海量規(guī)模的算法的訓練和收斂、數據輸入輸出,以及算法的部署等,都帶來了很大的成本挑戰(zhàn)。這其中包括顯性的算力、存儲、網絡等成本,也包括工程師的學習、熟悉、調試等大量的學習和開發(fā)成本。
第三是算力,雖然在眾多硬件廠商和生態(tài)圈的共同努力下,算力的單位成本在不斷下降。但是,應對超大模型的算力成本,仍然是極為高昂的,如GPT-3,訓練一次的成本可能高達數百萬美金。這樣高昂的成本,潛在將眾多資金不足的創(chuàng)業(yè)型公司攔在門檻之外,阻礙了他們應用和發(fā)展大模型的能力。
除了三要素,湯煒偉認為還有一點——就是當前的AI系統(tǒng),對于環(huán)境感知的復雜性、對于智能處理分析和推理的綜合準確性的提升,還有很大的提升空間。
例如環(huán)境感知的復雜性:在逆光、暗光等光線不佳情況下,難以獲得目標的清晰圖像,自然很難得到神經網絡的正常處理。再比如智能處理分析的完備性,如:智能門鎖貓眼觀察到的外部人員,如何判斷他是想進門,還是經過,亦是徘徊或者有破壞等不良意圖,這些都有待于多種傳感器、更聰明的算法和軟件邏輯的組合技術去進一步突破。
此外,AI系統(tǒng)依賴于“數據/經驗”,會導致它對沒見過的corner case難以處理?!斑@方面可以舉出很多例子,如掃地機對于纖細型電源線的難以識別,自動駕駛系統(tǒng)對于一些交通意外的難以理解和識別等”,湯煒偉表示,“如果要探討AI的‘不可為’,其實是有時間和空間的限制的,云端AI越來越強大,就像最近很火的chat GPT,但在端側想實現(xiàn)這種實時性的互動,難度還是很大的。既要看到現(xiàn)在所處的現(xiàn)實,也要從‘不起眼’的突破中找到變強的力量”。
語音應用駛入深水區(qū),持續(xù)拷問商業(yè)化能力
深聰智能董事長周偉達表示,人工智能確實受到了很大的關注,也取得了一定的成果。對于“AI的不可為”,他從宏觀和微觀兩個角度分享了自己的洞察。
從宏觀角度來看,需要明確AI在當前承擔的角色,它被人類創(chuàng)造并服務于大眾生活、企業(yè)增效。在這一進化過程中,它雖然不斷進行著升級和完善,但始終無法進行有效的道德判斷和情感思考,相對于真實的人類而言,它依舊有些“高冷”。
從微觀角度來看,從人工智能行業(yè)的落地來看,對“不可為”的這種看法或許來自目前的商業(yè)化落地程度,這也是整個行業(yè)和產業(yè)都在關注的問題。
深聰智能作為思必馳旗下的語音芯片設計公司,正面臨著智能語音應用駛入深水區(qū)的局面,一方面需要在場景端進行商業(yè)化拓展,另一方面仍需在技術領域繼續(xù)投入,來適應復雜場景的需求?!吧虡I(yè)化探索”是智能語音繼續(xù)向前發(fā)展需要解決的一個問題,既需要與傳統(tǒng)產業(yè)融合,又需要解決新興市場剛需和產品方案的配套問題。
不管是傳統(tǒng)還是新興應用領域,商業(yè)化的探索并不容易,特別是要在多個行業(yè)同步推進的情況下,基于技術構建系統(tǒng)解決方案的能力、渠道能力、實現(xiàn)精準卡位的能力、持續(xù)盈利的能力……對智能語音的落地都至關重要。
此外,在芯片與算法融合發(fā)展的趨勢下,如何研發(fā)出更高性能、更低功耗的語音芯片;以及在多模態(tài)融合發(fā)展的態(tài)勢下,如何進一步挖掘市場需求和底層技術能力,都是智能語音企業(yè)構筑競爭壁壘的關鍵。
目前,深聰智能語音芯片已經在黑白電、小家電、車載硬件、會議辦公設備等多個場景得到了應用,不僅為大眾生活提供了語音交互體驗,也為企事業(yè)單位提供了降本增效的服務,應用邊界在逐步拓寬。
放眼整個AI領域也是如此,很多企業(yè)都在打通各類資源,協(xié)同上下游產業(yè),都在為AI技術的落地和應用不斷努力。周偉達樂觀認為,現(xiàn)在的“不可為”,在未來一段時間會變?yōu)椤按笥锌蔀椤?,這意味著市場空間將會帶來不錯的機遇。同時,作為AI領域的從業(yè)者,作為技術型企業(yè),通過協(xié)同上下游的產品需求、方案優(yōu)化、實踐部署等環(huán)節(jié),可以加速AI的商業(yè)化落地和應用。
開放環(huán)境下,AI推理仍需突破
保險行業(yè)正處在數字化轉型的關口,嘗試用各種科技智能手段降本增效。車險理賠領域,兼具理賠業(yè)務本身的流程規(guī)范和定核損環(huán)節(jié)智能化程度有待提升的特點,使得行業(yè)人士認為,可以嘗試用AI解決一些共性問題,例如通過圖像/視頻理賠,盡量減少人工,提高效率。
當前的理賠流程是,理賠人員需要人工確認車輛損失、審核必要證件,所以為了提高效率,行業(yè)嘗試用AI視覺來充當人的眼睛和大腦,一個核心的攻關場景就是智能定損。
劉金龍是中國人保的一名AI算法工程師,在他看來,“對于開放環(huán)境的事件處理,AI是缺乏原理理解能力的,因此對于無法窮舉的開放場景工作任務,目前還是難以勝任的?!?/p>
這背后的邏輯是——人工智能是一定規(guī)則下的智能,而開放環(huán)境打破了特定的規(guī)則,由于開放環(huán)境的數據來源不穩(wěn)定,一旦出現(xiàn)特征不足的數據,就難以智能起來。
以車險理賠場景的一個實際事件為例。當前都是通過圖像實現(xiàn)車輛的定損操作,但圖像是由車主或修理廠人員拍攝的,難免出現(xiàn)不規(guī)范操作,如果圖像拍攝得過于局部,AI就無法判斷損傷所述部件(如下圖)。這時,AI就可能會給出一個很混亂的結果,無法非常準確地完成任務。
究其主要原因,還是因為場景非常開放、圖像來源沒有約束性,一旦出現(xiàn)AI未學習過(數據特征不足)的情形,AI便“不可為”。 劉金龍表示,“AI完成工作的前提是:預設規(guī)則,對于無法窮舉所有規(guī)則的事件就會表現(xiàn)出不夠智能的一面,主要還是因為AI對于開放環(huán)境中基于原理的推理能力是不足的?!?/p>
除此之外,劉金龍認為在需要投入感情(情感)的工作方面,還只能作為一種輔助工具來運用。
例如教書育人,需要教師用心、用情去認知每一個學生,然后根據不同學生的特點,用不同的方法引導學生打開心中疑問;教師也需要以身作則,幫助學生樹立正確的價值觀、人生觀。同時,教育需要理解事物的原理,剖析其中的真諦,但AI目前是只接受結果不可解釋過程的一項技術,是無法把事物的本質展現(xiàn)給學生的。而學生學習的目的卻是理解事物的本質,進而舉一反三、融會貫通。
其次在老年人的陪護方面,需要一個有情感的人去交流、去陪伴,而不是冷冰冰的機器人的簡單對話,或是機械地輔助自理生活。
再比如法律工作,“法律無情,人有情”,在處理法律工作的過程中并不全部是依據法律條文一一定責的過程,而是法律、事實和情感的交互過程,進而交融出一個合理的結果。
“以上都不僅僅是經驗主義,也不是程序化工作,也沒有辦法數字化。因此,這些目前均不適合AI來獨立完成”, 劉金龍說道。
寫在最后
我們向往AI更智能,幫助我們“躺平”。但正如本文三位產業(yè)人士所探討,從AI本身的原理和特性、AI落地的商業(yè)化探索,AI與實際場景交融的短板來看,總還是有那么一些“不可為”。
就像萬里星光中,還尚且朦朧的點滴光亮,照亮了AI的真相和方向。