Fraunhofer IIS:音頻編解碼技術的演進讓用戶感受更佳的聽覺體驗

原創(chuàng)
2017/10/09
9
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

無論是打電話,還是觀看視頻內(nèi)容,音頻效果的好壞直接決定著用戶體驗的好壞,為了滿足越來越高的用戶需求,音視頻編解碼公司都在為手機、電腦、電視、VR 等電子產(chǎn)品開發(fā)新的音視頻編解碼技術,從而為用戶提供勁爆的視聽體驗。最近,音頻及媒體技術研究機構 Fraunhofer IIS 帶來了一系列最新的移動音頻技術,包括:增強型語音編解碼器 EVS 技術、xHE-AAC 技術、Cingo 技術和音頻后期制作插件 Cingo Composer,以及 MPEG-H 解決方案。在現(xiàn)場,筆者還親自感受了新技術所帶來的更加清晰、沉浸式的聽覺體驗。
?


Fraunhofer IIS 中國區(qū)業(yè)務代表 Toni Fiedler 先生

EVS 技術:讓移動通話更清晰
在打電話的時候,你是否遇到過音質不清晰的體驗?想必大多數(shù)人都遇到過這種問題,那時你不得不讓對方再重復一遍,而如今 Fraunhofer IIS 推出了增強型語音服務 (EVS)有望解決這一問題。Toni Fiedler 先生介紹,“EVS 技術是下一代 3GPP VoLTE 編解碼器,即 AMR-WB 的升級版。EVS 也是超寬頻 VoLTE/VoWiFi 服務中唯一指定的編解碼器,它能夠為用戶帶來全高清語音通話質量,并能媲美當今數(shù)字媒體服務的通話保真度,配合 EVS 先進的魯棒性和抗丟包功能,樓宇室內(nèi)信號覆蓋得到了顯著提升?!?br /> ?


EVS 技術體驗現(xiàn)場

筆者在現(xiàn)場對采用 EVS 技術的移動電話做了通話體驗,如上圖所示,左側的 AMR 和 AMR-WB 技術是現(xiàn)在手機上所采用的音頻編解碼技術,傳輸碼率可以設置為 7.4bit、12.2 bit、12.65 bit、23.85 bit 四檔,隨著傳輸碼率變大,語音越來越清晰;EVS-SWB 技術可以設置為 9.6 bit、13.2 bit、16.4 bit、24.4 bit,隨著傳輸碼率變大,語音傳輸也越來越清晰。經(jīng)過對比發(fā)現(xiàn),采用 EVS-SWB 技術的 9.6 bit 碼率通話比采用 AMR-WB 技術的 23.85 bit 通話更加清晰。由此可見,新的音頻編解碼技術將為用戶提供更佳的音頻傳輸效果。


筆者也問了這項技術的目前的使用情況,Toni Fiedler 先生解釋,“美國 T-Mobile,日本 NTT DoCoMo,德國 Vodafone Germany,德國 Deutsche Telekom 先后為其用戶帶來具有 EVS 技術的 VoLTE 服務。在中國,中國移動已完成了針對 EVS 技術的一輪實驗室和外場試點測試,而中國移動研究院也已完成測試規(guī)范企標制定工作,并在其官方微信上發(fā)布了測試結果?!笨梢?,中國用戶也會很快用上采用 EVS 技術的移動通信設備?!癊VS 技術由 12 家企業(yè)合作研發(fā),其中就包含了重要的中國企業(yè)。我認為這是中國技術走向世界舞臺的一個典型案例,而這也為 EVS 走入中國市場奠定了堅實的基礎?!?Toni Fiedler 補充。

xHE-AAC 技術:2G 用戶的福音
在中國,目前大部分移動用戶采用的都是 4G 通信,隨著 5G 技術的研發(fā),不遠的未來我們會切換到 5G,這也意味著手機通話更清晰,上網(wǎng)更快,人們對 5G 的愿景是“信息隨心至,萬物觸手及”,Toni Fiedler 指出,xHE-AAC 技術是為低比特率音視頻流媒體應用而開發(fā)的,能夠輕松滿足數(shù)字廣播和移動音視頻流媒體應用的需求,即在極低的比特率下(單聲道低至 6 kbit/s,立體聲低至 12kbit/s)傳輸各式各樣的高品質音頻內(nèi)容。因此,在網(wǎng)絡發(fā)生擁堵時,xHE-AAC 流媒體播放器能夠按需切換至極低的比特率流,并實現(xiàn)連續(xù)不間斷的還放效果。當網(wǎng)絡環(huán)境變好時,xHE-AAC 客戶端能夠獲取一個更高的比特率版本,并能在整個比特率范圍內(nèi)實現(xiàn)無縫切換。通過高效的編碼效率而節(jié)省出的音頻帶寬能夠使視頻質量得到進一步提升。

5G 時代還需要低比特率音視頻流媒體嗎?筆者感到大惑不解,Toni Fiedler 的解釋點醒了筆者,“在印度、印度尼西亞以及非洲國家還有數(shù)十億用戶采用 2G 通信技術,xHE-AAC 技術帶來了穩(wěn)定可靠且不間斷的音頻流媒體服務。憑借該項技術,流媒體服務提供商能夠顯著降低 CDN 開銷并帶來更為簡易的編碼媒資管理方式,而用戶也能夠在享受高品質流媒體服務的同時節(jié)省月度流量?!?/p>


筆者在現(xiàn)場體驗了采用 xHE-AAC 技術的音頻播放效果,無論在那種碼率下播放,音頻效果始終如一,而且可以實現(xiàn)無縫切換,用戶感覺不到切換帶來的變化。


MPEG-H & Cingo:讓用戶感受沉浸式 VR 聽覺體驗
雖然近來 VR 市場變得比較平靜,Toni Fiedler 表示 Fraunhofer IIS 依然為 VR 設備提供基于 MPEG-H 的端到端 VR 音頻系統(tǒng),他解釋,“這個系統(tǒng)囊括了沉浸式聲音的制作、傳輸、還放乃至渲染環(huán)節(jié)。MPEG-H 的先進性能包括:沉浸式聲音:MPEG-H 包含的 3D 音頻組件能夠帶來沉浸式聲音體驗;互動式音頻:用戶可以根據(jù)自身需求調(diào)整混音比例;通用傳輸:MPEG-H 能夠在任何環(huán)境和設備上呈現(xiàn)最佳還放效果?!?/p>

?

筆者在現(xiàn)場體驗了法國情景喜劇《Vaudeville》,帶上 VR 頭盔,用戶可以 360 度旋轉身臨其境觀看,似乎置身于情景劇中,聲音來自四面八方,非常逼真。這是 Fraunhofer IIS 與法國超媒體創(chuàng)新機構 b<>com 技術研究所合作的成果,基于 MPEG-H 中 HOA 技術的端到端空間音頻制作、傳輸、還放以及渲染系統(tǒng)。為了讓 VR 還放系統(tǒng)端的集成工作變得更加簡單,F(xiàn)raunhofer IIS 為其提供了 VR 音頻 SDK,從而使其擁有解碼 MPEG-H 3D 音頻的能力以及最佳的音頻渲染效果,進而打造優(yōu)質的 VR 體驗。而 b<>com 空間音頻工具箱則是全球頂尖的 HOA 音頻前期和后期制作解決方案。

對于 VR 來說,除了硬件設備,內(nèi)容制作也非常重要,F(xiàn)raunhofer IIS 為內(nèi)容制作者提供了 Cingo Composer 插件,最近更新了 BETA 版本插件,憑借該插件,聲音設計師能夠輕松的進行混音,聲像定位并實現(xiàn)音頻對象的監(jiān)聽。該插件能夠輸出 MPEG-H 格式的音頻元素和元數(shù)據(jù),并為現(xiàn)有平臺提供 FOA 和 5.1 格式音頻內(nèi)容。只需進行一次混音,便能夠輸出各種擬定發(fā)行的音頻格式。

與非網(wǎng)原創(chuàng)內(nèi)容,未經(jīng)允許,不得轉載!

更多相關內(nèi)容,請參照:與非網(wǎng) Fraunhofer IIS 專區(qū)。

相關推薦

  • 鑫創(chuàng)SSS1700替代Cmedia CM6533 24bit 96KHZ USB音頻編解碼芯片
    方案
    5046
    2024/06/21