• 正文
  • 相關推薦
申請入駐 產(chǎn)業(yè)圖譜

TWS搶占AIoT入口,這項技術是關鍵!

原創(chuàng)
2020/07/27
143
加入交流群
掃碼加入
獲取工程師必備禮包
參與熱點資訊討論

隨著智能可穿戴設備的發(fā)展,語音交互正在迎來一個新的拐點。

它其實早已走進我們的生活,從可智能對話的機器人,到有事沒事“嘿 Siri”,再到風靡全球的智能音箱,“小度”、“小愛”……這些指令甚至是三歲孩童也能脫口而出。而隨著可穿戴設備的傳輸、續(xù)航、價格等痛點被逐個擊破,類似 TWS 耳機這樣的設備也有望普遍具備 AI 語音功能,讓 AI 能力隨身行走。

不過,語音喚醒——作為語音交互的第一步,在超低功耗場景下的性能、集成度、成本等突破就變得更加重要。

為可穿戴設備增加語音喚醒,難在哪里?

針對 TWS 等可穿戴設備,杭州國芯日前專門推出了一款 AI 語音喚醒芯片 GX8002,將 AI 喚醒做到了“微瓦”級別。

為什么要給 TWS 增加專門的語音喚醒能力?主要挑戰(zhàn)有哪些?杭州國芯 AI 事業(yè)部總經(jīng)理凌云告訴<與非網(wǎng)>,語音喚醒需要 Always on 工作狀態(tài),這樣設備在休眠或鎖屏狀態(tài)下也能檢測到用戶的聲音,一旦接收到喚醒詞,立刻讓設備進入等待指令的狀態(tài),開啟語音交互第一步。

由于需要持續(xù)工作,包含麥克風ADC、語音處理識別等整個鏈路都要工作。因此在可穿戴設備中增加喚醒功能,最大的挑戰(zhàn)就是功耗,以往一些藍牙 SoC 芯片做這類應用,待機功耗需要十幾毫瓦,這對產(chǎn)品待機時間影響非常大。

方寸之間見天地——超低功耗、高集成度的背后

GX8002 采用了 MCU+NPU 架構,集成了國芯第二代自研神經(jīng)網(wǎng)絡處理器 gxNPU V200、平頭哥 CK804 處理器等。經(jīng)測試,該芯片在 VAD 待機模式下功耗低至 70μW,運行功耗為 0.6mW,支持多級喚醒,通過 NPU 能力,單芯片可實現(xiàn)語音喚醒、指令識別、AI 降噪、聲紋識別等眾多功能。

?

?

據(jù)了解,GX8002 超低功耗的背后,離不開兩大技術突破——自研神經(jīng)網(wǎng)絡處理器 gxNPU V200 和自研硬件 VAD。與第一代神經(jīng)網(wǎng)絡處理器相比,第二代專門針對低功耗進行了優(yōu)化,計算能效達到了普通 DSP 的 10 倍以上。支持 DNN/CNN/RNN 等各種模型,自動實現(xiàn)網(wǎng)絡量化壓縮,可以和 TensorFlow 等訓練平臺直接對接。

?

?

同時,國芯設計了全新的 VAD 模塊,通過增加更多特征分析來判斷人聲,過濾能力更強。凌云表示,傳統(tǒng) VAD 大多是基于聲音的能量來做 VAD 判斷,當處于嘈雜環(huán)境時容易失效。為此,國芯設計了全新的 VAD 模塊,通過對信號進行頻譜分析,抽取語音的多個特征信息,進行智能判斷。同時會跟蹤環(huán)境的底噪,自動調整判決的閾值。而所有的 VAD 處理都是通過硬件實現(xiàn)的,不依賴于主系統(tǒng),這對于所有的 AI 語音應用都是有效的,對低功耗產(chǎn)品則更加重要。

除了將復雜邏輯硬件化,提升 VAD 的待機比例對于整個產(chǎn)品的功耗降低也非常有價值,根據(jù)實際測試,在辦公室、地鐵、馬路、咖啡館等場合,GX8002 可以讓 VAD 待機的比例平均達到 70%以上,即 70%以上時間處于 70μW 的 VAD 待機模式。通過 VAD 的有效過濾,芯片日常使用的平均功耗基本低于 300μW。

“傳統(tǒng)的語音 AI 主要還是以 CPU 軟解為主,在一些功耗成本不敏感的產(chǎn)品可以繼續(xù)使用”,凌云表示,“但是在可穿戴設備市場,必須要追求極致?!?/p>

為了將喚醒部分所占用的體積盡可能縮減,國芯將喚醒所需的所有部件進行了集成,包括音頻 ADC、Flash、電源 LDO 等,甚至還有晶振。單芯片就可以完成所有喚醒工作,無需外圍器件。

GX8002 首批產(chǎn)品采用 QFN20,3mm*3mm 封裝,五月份已量產(chǎn),預計今年下半年會有相關產(chǎn)品陸續(xù)上市。據(jù)稱,Q3 還將推出更小的 WLCSP 封裝,尺寸可達 1.4*2.4mm,滿足更加精密產(chǎn)品的需求。

TWS+語音 AI 是未來趨勢

TWS——已經(jīng)成為智能音箱之后一個新的現(xiàn)象級應用。根據(jù) IDC 數(shù)據(jù)顯示,TWS 耳機 2019 年全球出貨量為 1.705 億臺,與 2018 年的 4860 萬臺相比,增長了 250.5%,占據(jù)整個可穿戴設備市場的 50.7%。

剖析 TWS“網(wǎng)紅體質”的背后,不僅僅是可觀的市場規(guī)模,還有它作為 AIoT 智能連接入口的潛質。過去認為 AI 多用于機器人,后來發(fā)現(xiàn)似乎不需要這么復雜的身軀,智能音箱爆發(fā)了。而僅靠語音喚醒就可以獲得 AI 能力,其實這個載體還可以更小。

?

在 TWS 第一波市場潮流中,主流的藍牙音頻供應商盆滿缽盈,于是更多的小玩家涌入,試圖切一角蛋糕。但是,正如所有消費電子的發(fā)展趨勢一樣,如果沒有差異化賣點和功能創(chuàng)新,市場將很快走向紅海,陷入價格的侵蝕之中

對于廣大投身于 TWS 的中小品牌來說,突破無線連接、通話體驗的同時,產(chǎn)品本身的創(chuàng)新點也是增加消費者粘性的重要因素。國芯最新的語音喚醒芯片,對于這些廠商顯得尤為及時。GX8002 幾乎適配市場上所有的藍牙方案,它與藍牙芯片搭配使用,就如同增加了一個語音開關按鍵,通過共用的麥克風,實現(xiàn)語音觸發(fā)。

這就極大地方便了那些使用成熟藍牙方案的設備商,在不改變原有主體設計的情況下,疊加 AI 芯片,就可以將藍牙耳機升級為智能耳機,滿足了靈活、快速的設計需求。價格方面,國芯采用了累積采購量的階梯價格模式,起步價 0.65 美元,盡量減輕成本負擔。

?

?

TWS 加入語音 AI 將成為趨勢。對于品牌耳機來說,能夠在硬件方面更進一步,打通硬件品質、軟件服務的體驗;白牌耳機則可以在保證高性價比的前提下提供更豐富的功能。

目前,國芯已經(jīng)打通了杰理、恒玄、絡達、瑞昱、博通、易兆微、中科藍訊等藍牙合作方,這將為設備商大大節(jié)省具有 AI 語音能力的 TWS 研發(fā)周期。

“國芯盡量通過技術優(yōu)化提升 AIoT“入口”建設的便利性,并提升產(chǎn)品的體驗。通過在 AI 語音領域的持續(xù)耕耘,將 AI 技術應用到各種場景,之前已經(jīng)有了高性能的產(chǎn)品應用在智能家居和車載領域,GX8002 的推出補齊了低功耗和近場的應用”,凌云表示,“目前我們完成了人 - 車 - 家的全場景覆蓋,AI 語音產(chǎn)品可以說是國內市場上較為齊全的。”

當前,AI 的兩大應用當屬語音和視覺,這兩大領域之間也有著一定的傳承性和關聯(lián)性。語音 AI 仍是一個早期成長中的市場,國芯一方面在擴大覆蓋場景,另一方面也在尋找體量較大的細分市場(例如車載、TWS 等),進行更深入、更有針對性地布局。據(jù)凌云透露,未來,國芯會在語音業(yè)務的基礎上,開拓視覺 AI 業(yè)務,以及語音+視覺的多模態(tài)產(chǎn)品方向。

相關推薦

登錄即可解鎖
  • 海量技術文章
  • 設計資源下載
  • 產(chǎn)業(yè)鏈客戶資源
  • 寫文章/發(fā)需求
立即登錄