• 正文
  • 相關(guān)推薦
申請入駐 產(chǎn)業(yè)圖譜

Fraunhofer IIS:音頻編解碼技術(shù)的演進讓用戶感受更佳的聽覺體驗

原創(chuàng)
2017/10/09
10
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

無論是打電話,還是觀看視頻內(nèi)容,音頻效果的好壞直接決定著用戶體驗的好壞,為了滿足越來越高的用戶需求,音視頻編解碼公司都在為手機、電腦、電視、VR 等電子產(chǎn)品開發(fā)新的音視頻編解碼技術(shù),從而為用戶提供勁爆的視聽體驗。最近,音頻及媒體技術(shù)研究機構(gòu) Fraunhofer IIS 帶來了一系列最新的移動音頻技術(shù),包括:增強型語音編解碼器 EVS 技術(shù)、xHE-AAC 技術(shù)、Cingo 技術(shù)和音頻后期制作插件 Cingo Composer,以及 MPEG-H 解決方案。在現(xiàn)場,筆者還親自感受了新技術(shù)所帶來的更加清晰、沉浸式的聽覺體驗。
?


Fraunhofer IIS 中國區(qū)業(yè)務(wù)代表 Toni Fiedler 先生

EVS 技術(shù):讓移動通話更清晰
在打電話的時候,你是否遇到過音質(zhì)不清晰的體驗?想必大多數(shù)人都遇到過這種問題,那時你不得不讓對方再重復(fù)一遍,而如今 Fraunhofer IIS 推出了增強型語音服務(wù) (EVS)有望解決這一問題。Toni Fiedler 先生介紹,“EVS 技術(shù)是下一代 3GPP VoLTE 編解碼器,即 AMR-WB 的升級版。EVS 也是超寬頻 VoLTE/VoWiFi 服務(wù)中唯一指定的編解碼器,它能夠為用戶帶來全高清語音通話質(zhì)量,并能媲美當(dāng)今數(shù)字媒體服務(wù)的通話保真度,配合 EVS 先進的魯棒性和抗丟包功能,樓宇室內(nèi)信號覆蓋得到了顯著提升?!?br /> ?


EVS 技術(shù)體驗現(xiàn)場

筆者在現(xiàn)場對采用 EVS 技術(shù)的移動電話做了通話體驗,如上圖所示,左側(cè)的 AMR 和 AMR-WB 技術(shù)是現(xiàn)在手機上所采用的音頻編解碼技術(shù),傳輸碼率可以設(shè)置為 7.4bit、12.2 bit、12.65 bit、23.85 bit 四檔,隨著傳輸碼率變大,語音越來越清晰;EVS-SWB 技術(shù)可以設(shè)置為 9.6 bit、13.2 bit、16.4 bit、24.4 bit,隨著傳輸碼率變大,語音傳輸也越來越清晰。經(jīng)過對比發(fā)現(xiàn),采用 EVS-SWB 技術(shù)的 9.6 bit 碼率通話比采用 AMR-WB 技術(shù)的 23.85 bit 通話更加清晰。由此可見,新的音頻編解碼技術(shù)將為用戶提供更佳的音頻傳輸效果。


筆者也問了這項技術(shù)的目前的使用情況,Toni Fiedler 先生解釋,“美國 T-Mobile,日本 NTT DoCoMo,德國 Vodafone Germany,德國 Deutsche Telekom 先后為其用戶帶來具有 EVS 技術(shù)的 VoLTE 服務(wù)。在中國,中國移動已完成了針對 EVS 技術(shù)的一輪實驗室和外場試點測試,而中國移動研究院也已完成測試規(guī)范企標(biāo)制定工作,并在其官方微信上發(fā)布了測試結(jié)果?!笨梢?,中國用戶也會很快用上采用 EVS 技術(shù)的移動通信設(shè)備?!癊VS 技術(shù)由 12 家企業(yè)合作研發(fā),其中就包含了重要的中國企業(yè)。我認為這是中國技術(shù)走向世界舞臺的一個典型案例,而這也為 EVS 走入中國市場奠定了堅實的基礎(chǔ)。” Toni Fiedler 補充。

xHE-AAC 技術(shù):2G 用戶的福音
在中國,目前大部分移動用戶采用的都是 4G 通信,隨著 5G 技術(shù)的研發(fā),不遠的未來我們會切換到 5G,這也意味著手機通話更清晰,上網(wǎng)更快,人們對 5G 的愿景是“信息隨心至,萬物觸手及”,Toni Fiedler 指出,xHE-AAC 技術(shù)是為低比特率音視頻流媒體應(yīng)用而開發(fā)的,能夠輕松滿足數(shù)字廣播和移動音視頻流媒體應(yīng)用的需求,即在極低的比特率下(單聲道低至 6 kbit/s,立體聲低至 12kbit/s)傳輸各式各樣的高品質(zhì)音頻內(nèi)容。因此,在網(wǎng)絡(luò)發(fā)生擁堵時,xHE-AAC 流媒體播放器能夠按需切換至極低的比特率流,并實現(xiàn)連續(xù)不間斷的還放效果。當(dāng)網(wǎng)絡(luò)環(huán)境變好時,xHE-AAC 客戶端能夠獲取一個更高的比特率版本,并能在整個比特率范圍內(nèi)實現(xiàn)無縫切換。通過高效的編碼效率而節(jié)省出的音頻帶寬能夠使視頻質(zhì)量得到進一步提升。

5G 時代還需要低比特率音視頻流媒體嗎?筆者感到大惑不解,Toni Fiedler 的解釋點醒了筆者,“在印度、印度尼西亞以及非洲國家還有數(shù)十億用戶采用 2G 通信技術(shù),xHE-AAC 技術(shù)帶來了穩(wěn)定可靠且不間斷的音頻流媒體服務(wù)。憑借該項技術(shù),流媒體服務(wù)提供商能夠顯著降低 CDN 開銷并帶來更為簡易的編碼媒資管理方式,而用戶也能夠在享受高品質(zhì)流媒體服務(wù)的同時節(jié)省月度流量。”


筆者在現(xiàn)場體驗了采用 xHE-AAC 技術(shù)的音頻播放效果,無論在那種碼率下播放,音頻效果始終如一,而且可以實現(xiàn)無縫切換,用戶感覺不到切換帶來的變化。


MPEG-H & Cingo:讓用戶感受沉浸式 VR 聽覺體驗
雖然近來 VR 市場變得比較平靜,Toni Fiedler 表示 Fraunhofer IIS 依然為 VR 設(shè)備提供基于 MPEG-H 的端到端 VR 音頻系統(tǒng),他解釋,“這個系統(tǒng)囊括了沉浸式聲音的制作、傳輸、還放乃至渲染環(huán)節(jié)。MPEG-H 的先進性能包括:沉浸式聲音:MPEG-H 包含的 3D 音頻組件能夠帶來沉浸式聲音體驗;互動式音頻:用戶可以根據(jù)自身需求調(diào)整混音比例;通用傳輸:MPEG-H 能夠在任何環(huán)境和設(shè)備上呈現(xiàn)最佳還放效果?!?/p>

?

筆者在現(xiàn)場體驗了法國情景喜劇《Vaudeville》,帶上 VR 頭盔,用戶可以 360 度旋轉(zhuǎn)身臨其境觀看,似乎置身于情景劇中,聲音來自四面八方,非常逼真。這是 Fraunhofer IIS 與法國超媒體創(chuàng)新機構(gòu) b<>com 技術(shù)研究所合作的成果,基于 MPEG-H 中 HOA 技術(shù)的端到端空間音頻制作、傳輸、還放以及渲染系統(tǒng)。為了讓 VR 還放系統(tǒng)端的集成工作變得更加簡單,F(xiàn)raunhofer IIS 為其提供了 VR 音頻 SDK,從而使其擁有解碼 MPEG-H 3D 音頻的能力以及最佳的音頻渲染效果,進而打造優(yōu)質(zhì)的 VR 體驗。而 b<>com 空間音頻工具箱則是全球頂尖的 HOA 音頻前期和后期制作解決方案。

對于 VR 來說,除了硬件設(shè)備,內(nèi)容制作也非常重要,F(xiàn)raunhofer IIS 為內(nèi)容制作者提供了 Cingo Composer 插件,最近更新了 BETA 版本插件,憑借該插件,聲音設(shè)計師能夠輕松的進行混音,聲像定位并實現(xiàn)音頻對象的監(jiān)聽。該插件能夠輸出 MPEG-H 格式的音頻元素和元數(shù)據(jù),并為現(xiàn)有平臺提供 FOA 和 5.1 格式音頻內(nèi)容。只需進行一次混音,便能夠輸出各種擬定發(fā)行的音頻格式。

與非網(wǎng)原創(chuàng)內(nèi)容,未經(jīng)允許,不得轉(zhuǎn)載!

更多相關(guān)內(nèi)容,請參照:與非網(wǎng) Fraunhofer IIS 專區(qū)。

相關(guān)推薦

  • 鑫創(chuàng)SSS1700替代Cmedia CM6533 24bit 96KHZ USB音頻編解碼芯片
    方案
    4827
    2024/06/21