明敏 發(fā)自 凹非寺,量子位 | 公眾號(hào) QbitAI
想體驗(yàn)今年大火的空間計(jì)算,不用等蘋果了。
喏,手指一捏,空間搜索馬上開啟,各類內(nèi)容一下子在眼前鋪開。
只需轉(zhuǎn)轉(zhuǎn)頭,就能看到更多內(nèi)容。
眼睛聚焦在哪個(gè)卡片上,都能被選中突出。
通過語音即可輸入搜索關(guān)鍵字,搜索結(jié)果仿佛從遠(yuǎn)處空間沖過來的一樣。
而且感興趣的內(nèi)容被會(huì)放在最容易被注意的地方。
最后大手一揮,就能關(guān)閉界面。
蕪湖~把搜索放到3D空間里之后,交互方式、信息排布等,完全不一樣了。
界面從小屏擴(kuò)展成了整個(gè)眼前的“幕布”,能放入更多信息。
呈現(xiàn)內(nèi)容的方式徹底打破了2D局限,不同窗口的空間深度不同,更加直觀表示了信息的優(yōu)先級(jí)。
打開界面的方式也更加自然簡(jiǎn)單,手、頭、眼配合即可搞定。
沒想到,今年搜索引擎不僅要被AI變革,還要被AR變革。
如上效果,就是由一臺(tái)AR眼鏡+一臺(tái)AR主機(jī)實(shí)現(xiàn)的,它們組合之后,開始被稱為“空間計(jì)算機(jī)”,能把計(jì)算機(jī)的功能放到虛實(shí)結(jié)合的世界里。
而且它離我們并不遙遠(yuǎn),目前已經(jīng)實(shí)現(xiàn)量產(chǎn),已知發(fā)售比Vision Pro更早。
價(jià)格嘛,也更加親民了一些,只需8998元。
不過話說回來,AR眼鏡組合AR主機(jī)不是新鮮事物了。
為什么這一回,可以稱得上是“空間計(jì)算機(jī)”?
率先實(shí)現(xiàn)單攝SLAM交互
如上提到了AR眼鏡和AR主機(jī),是一個(gè)AR空間計(jì)算套組Rokid AR Studio,為Rokid最新發(fā)布的新品:
- Rokid Max Pro
- Station Pro
和蘋果Vision Pro走的VST(視頻透視)路線不同,這臺(tái)“空間計(jì)算機(jī)”屬于OST(光學(xué)透視),簡(jiǎn)單理解就是能通過眼鏡看到真實(shí)的現(xiàn)實(shí)世界。
Rokid Max Pro是Rokid最新一代AR眼鏡,重量為76g,僅有一個(gè)攝像頭。
其背后計(jì)算能力的支持,主要來自Station Pro。
該主機(jī)搭載高通第一代驍龍XR2+,相較于驍龍XR2,它能將續(xù)航提升50%,散熱提升30%。
由此,Station Pro續(xù)航能力是手機(jī)方案的2倍以上,可以達(dá)到厘米級(jí)6DoF跟蹤精度和極低MTP(Motion to Photon)渲染延遲。
二者結(jié)合后,主要關(guān)注的便是在空間、計(jì)算兩方面,帶來新體驗(yàn)。
其一是在空間維度力求更加自然的信息交互。
比如現(xiàn)在,抬抬胳膊就能擁有一塊電子虛擬手表。
握住拳頭,手表就會(huì)切換界面,顯示天氣溫度。
而且手表上的信息是立體的,手腕轉(zhuǎn)動(dòng)后,表盤上的內(nèi)容隨之轉(zhuǎn)動(dòng),而且呈現(xiàn)內(nèi)容也會(huì)變成3D模式。
如果放下胳膊,手表就會(huì)消失;轉(zhuǎn)動(dòng)視角,面前的屏幕也不會(huì)移動(dòng)。
這種信息交互呈現(xiàn)方式,不會(huì)讓人覺得脫離物理世界,好像只是把電腦、手表虛擬化了,感覺更加逼近人們本來的交互習(xí)慣。
在游戲場(chǎng)景下,能實(shí)現(xiàn)360度全方位沉浸式打怪,捏住手指即可發(fā)出攻擊。
以及前面提到的空間搜索,一下子把搜索引擎升維,變成了3D的感覺。
所有內(nèi)容在眼前鋪開,通過排布位置、深度信息體現(xiàn)主次。
甚至都不需要鼠標(biāo)、鍵盤這些工具了,動(dòng)動(dòng)嘴即可開啟搜索,轉(zhuǎn)轉(zhuǎn)頭和眼睛,就能鎖定想找的內(nèi)容。這些也都是人們?nèi)粘I罾镒钭匀坏慕换シ绞健?/p>
其二是在計(jì)算維度,Rokid Max Pro+Station Pro確實(shí)更像計(jì)算機(jī)了。
首先在界面顯示上,可以支持多個(gè)窗口并列排布,但是是3D的,也就是把周圍環(huán)境都變成桌面。
這樣一來,轉(zhuǎn)轉(zhuǎn)頭即可看到另一個(gè)窗口,也讓AR呈現(xiàn)“不再只是一塊更大屏幕”。
其次在處理能力上,Station Pro搭載12G RAM+128G ROM,能支持十余個(gè)任務(wù)并行,幾乎和日常在電腦上處理的任務(wù)量相當(dāng)。
最后在續(xù)航方面,Rokid Max Pro+Station Pro能實(shí)現(xiàn)5-6小時(shí)續(xù)航,和一臺(tái)Windows辦公本水平相當(dāng)。
值得一提的是,以上所有效果,都是基于單攝SLAM方案實(shí)現(xiàn),要知道目前業(yè)內(nèi)諸多產(chǎn)品都還是采用雙攝、多攝。
創(chuàng)新性地把攝像頭數(shù)量壓縮到僅剩一個(gè),能讓AR眼鏡的功耗更低、結(jié)構(gòu)更簡(jiǎn)單、成本更低,由此也能讓實(shí)際佩戴更加舒適、價(jià)格更實(shí)惠。
但單目方案也給技術(shù)提出更高要求,因?yàn)樗鼰o法得到絕對(duì)的尺度信息,需要通過初始化恢復(fù)尺度信息,而初始化的好壞直接影響算法的最終精度。
Rokid利用IMU輔助、濾波算法、SLAM算法等,通過軟件方面的加持,最終率先為行業(yè)帶來了單攝SLAM方案,進(jìn)而推動(dòng)行業(yè)向前發(fā)展。
綜上,從空間和計(jì)算兩個(gè)維度出發(fā),Station Pro組合Rokid Max Pro,打破了人們對(duì)AR的一些既往認(rèn)知:只是一塊更大的屏幕、交互體驗(yàn)偏傳統(tǒng)……
這些效果實(shí)現(xiàn)的背后,既得益于底層硬件的能力進(jìn)階,也離不開廠商本身對(duì)虛實(shí)結(jié)合、人機(jī)交互的深刻理解和嘗試。
由此官方直接將Station Pro+Rokid Max Pro定義為一臺(tái)“空間計(jì)算機(jī)”。
也標(biāo)志著在通往空間計(jì)算這條路上,VST陣營下的蘋果、OST陣營下的Rokid,現(xiàn)在都已交出最新答卷。
此外這次發(fā)布也重磅介紹了Rokid和Google的合作:Station(國際版)成為全球首款經(jīng)谷歌認(rèn)證的AR版便攜式Android TV?設(shè)備。
通過Rokid Station(全球版),用戶可以在Google Play上下載熟悉的應(yīng)用和游戲,包括 YouTube、Hulu、Disney+、TVer、AbemaTV等,還有海量沉浸式游戲,輕松上手。用戶還可以自己安裝APP;此外,它還支持HDCP和云游戲。
這也傳遞出了一個(gè)事實(shí)——如今行業(yè)正在加碼對(duì)于AR軟件和生態(tài)的建設(shè),AR行業(yè)進(jìn)入了軟件系統(tǒng)和生態(tài)建設(shè)的第二階段。
不過AR硬件作為ToC產(chǎn)品,大眾如何理解它非常關(guān)鍵。這幾年雖然AR新品層出不窮,但是由于最常見的場(chǎng)景還是觀影、游戲等,它暫時(shí)還沒有被正式歸入生產(chǎn)力工具行列。
而在此時(shí)此刻直接打出“空間計(jì)算機(jī)”的概念,更是對(duì)大眾認(rèn)知構(gòu)成挑戰(zhàn)。
為什么會(huì)這么做?
在這背后,有趨勢(shì)的直接推動(dòng),也有行業(yè)本身的發(fā)展節(jié)奏使然,更有Rokid作為行業(yè)引領(lǐng)者長(zhǎng)期以來的思考理解。
空間計(jì)算機(jī),為什么是現(xiàn)在?
直接原因來自最新趨勢(shì)。
今年蘋果發(fā)布Vision Pro,把一個(gè)行業(yè)內(nèi)的專業(yè)詞匯帶到了大眾面前:
空間計(jì)算。
自此,關(guān)于AR/MR的想象有了一個(gè)更具體的表述,也將AR/MR的終極目標(biāo)直接刻畫出來。
即,將計(jì)算能力與物理空間相結(jié)合,通過頭顯設(shè)備將數(shù)字信息融合到真實(shí)世界中,以提供一種更直觀、更沉浸式的交互方式,讓用戶能在現(xiàn)實(shí)世界中與數(shù)字內(nèi)容進(jìn)行互動(dòng)。
Rokid創(chuàng)始人兼CEO 祝銘明(Misa)非常坦誠地說,蘋果做過一輪市場(chǎng)教育以后,對(duì)于行業(yè)來說是一個(gè)時(shí)機(jī)。
蘋果將這一概念拋出去后,我們也可以直接用它來和市場(chǎng)用戶溝通。AR本身默認(rèn)定位就是空間技術(shù)、虛實(shí)融合,只是今天把背后的技術(shù)變成了一個(gè)產(chǎn)品描述方式。
坦白講,這件事也只有蘋果能做到。
由此也引出深層原因,行業(yè)本身到了擁抱空間計(jì)算的階段。
技術(shù)方面,無論是空間、交互還是處理計(jì)算層面,目前都發(fā)展到了更加成熟的階段。
比如空間方面,6DoF實(shí)現(xiàn)了對(duì)頭部視野角度變化、身體移動(dòng)位移變化的精準(zhǔn)檢測(cè);SLAM則能類比自動(dòng)駕駛中道路精度地圖和車輛空間感知。
交互方面,頭動(dòng)、眼動(dòng)追蹤已是目前頂尖XR設(shè)備的標(biāo)配,眼動(dòng)追蹤的精確度可以達(dá)到1度。以及微手勢(shì)交互的應(yīng)用也相對(duì)成熟。
而在計(jì)算處理方面,如高通已推出第一代驍龍XR2+,提升續(xù)航和散熱能力,支持在更小更輕薄設(shè)備中搭載。支持并行感知技術(shù),包括頭部、手勢(shì)和手柄追蹤、3D 重建以及低時(shí)延視頻透視。引入全新圖像處理管線,能夠?qū)崿F(xiàn)低于 10 毫秒的時(shí)延,能提供更好的透視MR體驗(yàn)。
另外,在軟件系統(tǒng)和生態(tài)建設(shè)方面,AR也已進(jìn)入第二階段,也就是更加原生獨(dú)立的階段。
所謂第一階段,是指軟件系統(tǒng)和生態(tài)更加依賴手機(jī)、電腦等傳統(tǒng)移動(dòng)終端。
這一階段是必然的,因?yàn)榇罱ㄔS富AR的系統(tǒng)和生態(tài)無法一蹴而就。
自研操作系統(tǒng)難度系數(shù)很大,需要具備全棧式能力。加之AR設(shè)備本身就面臨功耗、續(xù)航、計(jì)算性能幾方面難平衡的尷尬,給操作系統(tǒng)提出了更高要求。
生態(tài)方面的建設(shè)則還需要聚集行業(yè)及開發(fā)者的力量,這更是一個(gè)需要積累、摸索的過程。
目前來看,第一階段已經(jīng)基本進(jìn)行完畢。
以Rokid為例,其自研底層操作系統(tǒng)YodaOS-Master,沉淀已有5-6年,并在今年完成最新升級(jí)。正是在這一系統(tǒng)的支持下,Station Pro可以實(shí)現(xiàn)單攝SLAM、微手勢(shì)交互、視覺定位VPS等,Rokid Max Pro則可以在計(jì)算能力大幅提升的前提下,機(jī)身重量?jī)H增加1g。
生態(tài)建設(shè)方面,Rokid在今年Open Day上發(fā)布的AR創(chuàng)作工具靈境,實(shí)現(xiàn)了10分鐘內(nèi)建造屬于自己的AR數(shù)字空間,這是為了吸引更多開發(fā)者、創(chuàng)作者來壯大AR內(nèi)容生態(tài)。
目前Rokid UXR 2.0 開放SDK,并支持Unity等OpenXR標(biāo)準(zhǔn)的主流引擎,以及MRTK接口,開發(fā)者可以輕松開發(fā)移植。
同時(shí),在Master系統(tǒng)里,Rokid還內(nèi)置了自研JSAR引擎和小組件容器,JS開發(fā)者可以輕松上傳自己的組件。由此可以更進(jìn)一步推動(dòng)行業(yè)生態(tài)共創(chuàng)。
另外在全行業(yè)范圍內(nèi),大家也對(duì)技術(shù)變革興趣濃厚,尤其是科技大廠,在擁抱新技術(shù)上的意愿很強(qiáng)烈。比如目前Rokid和阿里巴巴、華為、微軟Bing都有深度合作。
所以,對(duì)于AR來說是時(shí)候大力建設(shè)更加獨(dú)立和原生的系統(tǒng)和生態(tài)了。
如何體現(xiàn)這種原生?錨定空間計(jì)算。Rokid在系統(tǒng)生態(tài)上的建設(shè)就是實(shí)踐案例。
最后在市場(chǎng)方面,AR眼鏡已經(jīng)成為大眾普遍接受的一種形態(tài),是時(shí)候把AR真正帶到人們生活中去了。
AR市場(chǎng)的發(fā)展最開始興起在ToB,行業(yè)愿意花一定資金擁抱新技術(shù)進(jìn)行升級(jí),AR行業(yè)由此有機(jī)會(huì)得到真實(shí)的市場(chǎng)反饋、不斷進(jìn)行技術(shù)迭代。
后面AR開始在觀影、游戲等方面打開場(chǎng)景,逐步讓消費(fèi)者接受一個(gè)架在眼前的終端設(shè)備。
如今這種習(xí)慣已經(jīng)建立,需要將真正的AR引入到用戶生活中了。
怎樣向用戶傳遞什么是“真正的AR”?空間計(jì)算是最好的體現(xiàn)方式之一。
綜上多方面原因,也就不難理解為什么行業(yè)玩家Rokid會(huì)在此刻連發(fā)兩款新品,并組成一臺(tái)“空間計(jì)算機(jī)”。
而且對(duì)于空間計(jì)算機(jī)的定義,Rokid也給出了初步思考,關(guān)鍵在于滿足這樣幾個(gè)核心指標(biāo)。
第一,搭建起和真實(shí)世界、用戶的自然交互;
第二,展現(xiàn)和處理能力,能夠撐起“計(jì)算機(jī)”的稱號(hào);
第三,良好的軟件兼容性、生態(tài)豐富性。
而隨著Rokid“空間計(jì)算機(jī)”的提出,頭顯兩大發(fā)展路線VST和OST,如今都已用實(shí)際產(chǎn)品交出最新答卷。
一邊是蘋果Vision Pro為代表的的VST,另一邊是Rokid Max Pro為代表的的OST。
二者在表現(xiàn)形態(tài)上不盡相同,但都主打空間計(jì)算。
這意味著對(duì)于下一階段的目標(biāo),行業(yè)已經(jīng)達(dá)成共識(shí);但是在具體實(shí)現(xiàn)路徑上,尚不能形成定論。
而在這兩種不同的技術(shù)路線之下,共同構(gòu)成了對(duì)于下一代人機(jī)交互的最新理解。
人機(jī)交互下一頁,OST還是VST?
先來看這兩條路徑分別是什么。
VST(視頻透視),以蘋果Vision Pro等為代表。
它利用攝像頭等傳感器,捕捉真實(shí)世界的影像,然后投射到屏幕上,看到的內(nèi)容都是虛擬重建的。
優(yōu)點(diǎn)是可以構(gòu)建一個(gè)更加虛擬的世界,效果更加夢(mèng)幻。
但是這也意味著對(duì)硬件、光線要求更高。
如Vision Pro采用多攝像頭、雙芯片方案,也進(jìn)一步拉高了頭顯重量和成本價(jià)格。
OST(光學(xué)透視),代表產(chǎn)品有Hololens、Rokid Max Pro等。
它可以通過一層玻璃,讓人看到的永遠(yuǎn)是真實(shí)世界,在此基礎(chǔ)上構(gòu)建虛擬物品,可以和現(xiàn)實(shí)世界產(chǎn)生交互。
它的優(yōu)點(diǎn)是能讓人感受真實(shí)的世界,眼鏡形式更加輕便。
但在目前底層硬件技術(shù)的制約下,也勢(shì)必需要犧牲性能、續(xù)航和散熱。而且還需要不斷在性能和重量之間做取舍。
目前來看,這兩條路線并駕齊驅(qū),都用自己的方式詮釋了對(duì)空間計(jì)算的理解。
從更底層來看,二者對(duì)于新一代人機(jī)交互方式的理解,有相同之處,也有區(qū)別點(diǎn)。
先來看相同點(diǎn)。
二者在初步認(rèn)知上達(dá)成一致,都認(rèn)為要將數(shù)字內(nèi)容融入到真實(shí)空間里。那么就意味著要和真實(shí)世界產(chǎn)生交互。
在交互方式上,它們也紛紛選擇采用更加接近人類本能的手勢(shì)操作、眼動(dòng)、頭動(dòng),由此和傳統(tǒng)二維的人機(jī)交互方式徹底分隔開來。
以及在操作系統(tǒng)和內(nèi)容方面,無論是蘋果還是Rokid都一定程度上向2D內(nèi)容生態(tài)兼容,這是為了能讓用戶更加自然過渡到頭顯設(shè)備場(chǎng)景下。
比如Vision Pro的系統(tǒng)仿佛是iOS、MacOS、iPadOS直接升維后的效果,為了能讓用戶更快習(xí)慣。
Rokid AR Studio也兼容2D生態(tài),如愛奇藝、騰訊視頻、嗶哩嗶哩、優(yōu)酷、芒果TV、影牛牛、隨樂游、無影云電腦等都能在Rokid Station Pro進(jìn)行使用。其中,無影云電腦為適配3D生態(tài)特別定制了空間大屏。其他手機(jī)、PAD等移動(dòng)終端的眾多2D安卓應(yīng)用也可在其中使用。
但相對(duì)而言,VST和OST路線之間還是存在諸多差異,從這些差異背后也能窺見二者對(duì)于人機(jī)交互大命題的不同理解。
其一,在佩戴舒適性和效果呈現(xiàn)的優(yōu)先級(jí)方面,二者選擇不同。
蘋果顯然是將效果呈現(xiàn)更為前置,為此不惜Vision Pro中放入2塊芯片、12個(gè)攝像頭、5個(gè)傳感器,整個(gè)頭顯重量達(dá)到450克,成為限制用戶使用時(shí)長(zhǎng)的一個(gè)重要因素。
Rokid始終堅(jiān)持佩戴舒適優(yōu)先,Rokid Max Pro的重量?jī)H有76g,可以輕松架在鼻梁上。但這勢(shì)必會(huì)使得眼鏡端上算力受限,所以Rokid推出了AR主機(jī)的概念,希望以一種中間形態(tài),來緩解目前OST路線面臨的困境。
而輕便有限的好處是能拉長(zhǎng)用戶的使用時(shí)長(zhǎng),同時(shí)不連接手機(jī)使用,可以更好和手機(jī)等傳統(tǒng)移動(dòng)終端搶時(shí)長(zhǎng),推動(dòng)AR更進(jìn)一步走向獨(dú)立。
據(jù)Rokid數(shù)據(jù)顯示,在用戶使用Station后,有90%用戶都放棄了連接手機(jī)的方案。
其二,在生態(tài)構(gòu)建方面,二者走向兩條不同的道路。
一直以來蘋果都是構(gòu)建自己的獨(dú)立生態(tài),它能通過自身強(qiáng)大的軟硬件能力,不斷加強(qiáng)用戶對(duì)于產(chǎn)品與產(chǎn)品之間的交互使用體驗(yàn),并召集大量開發(fā)者豐富軟件生態(tài)。這也是蘋果幾乎最獨(dú)特的魅力。
但這也意味著,蘋果拿出的技術(shù)方案、產(chǎn)品規(guī)格,對(duì)行業(yè)內(nèi)大部分玩家意義不大。
另一邊,以Rokid為代表的OST路線玩家,致力于構(gòu)建更加開放的生態(tài),聯(lián)合更多行業(yè)力量來共建新標(biāo)準(zhǔn)、新規(guī)范。
比如微軟HoloLens沉淀下來的MRTK工具包,在幾天前正式宣布將獨(dú)立發(fā)展,由此它將成為一個(gè)真正的跨平臺(tái)開源工具包。通過MRTK構(gòu)建的體驗(yàn),可以兼容任何支持OpenXR的設(shè)備。
以及這一次Rokid最新提出的對(duì)于空間計(jì)算的思考,也會(huì)更新到OpenXR標(biāo)準(zhǔn)中去,供行業(yè)參考。這樣一來,對(duì)于行業(yè)標(biāo)準(zhǔn)的定義更新,將由整個(gè)行業(yè)推動(dòng),發(fā)展速度將會(huì)十分可觀。
與此同時(shí),安卓AR開放生態(tài)也開始發(fā)力。目前通過Rokid Station(全球版),可以在Google Play上下載熟悉的應(yīng)用和游戲,以及體驗(yàn)Android TV。
無論是共識(shí)還是差異,對(duì)于當(dāng)下尚處在發(fā)展早期的AR/MR行業(yè)而言,都意義深遠(yuǎn)。
蘋果和Rokid,作為VST和OST路線的領(lǐng)軍代表,率先給出對(duì)空間計(jì)算的理解,也使它們成為了當(dāng)下行業(yè)真正意義上的引領(lǐng)者。
未來,二者會(huì)繼續(xù)保持并駕齊驅(qū),還是會(huì)走向截然相反的道路,目前還無法給出判斷。
但可以確定的是,對(duì)AR的終極構(gòu)想,一定以新一代人機(jī)交互為底座。
而它的根本邏輯是什么?
更沉浸虛擬還是更融合現(xiàn)實(shí)?更連續(xù)還是更碎片化?對(duì)于廣大用戶來說,如何適應(yīng)從實(shí)體交互走向虛擬?如何將自身與虛實(shí)相生的世界融合?
這些都是AR行業(yè)將會(huì)面臨的挑戰(zhàn)。
總之,空間計(jì)算概念走向大眾,才只是真實(shí)AR世界撕開的第一道裂縫。
接下來的該如何“盲人摸象”,拼湊出終極AR的所有版圖,還有很長(zhǎng)的路要走。
話說回來,你對(duì)實(shí)現(xiàn)了空間計(jì)算的AR設(shè)備有哪些期待?會(huì)因?yàn)榭臻g計(jì)算的實(shí)現(xiàn)而想要購入設(shè)備嗎?希望它能在哪些場(chǎng)景發(fā)揮作用?
歡迎評(píng)論區(qū)留言分享~