來源:歌爾微電子
發(fā)布時間:2024-10-23
閱讀量:17
智能語音技術(shù)是人工智能應(yīng)用最廣泛的技術(shù)之一,在眾多的人工智能產(chǎn)品中應(yīng)用,此技術(shù)可以減少設(shè)備操作的學(xué)習(xí)成本,讓智能設(shè)備聽懂人類的自然語言從而更便捷地滿足用戶的需求。
智能聲學(xué)傳感器方案是一種邊緣計算的解決方案,可以解決傳統(tǒng)云計算模式下存在的高延遲、受限于網(wǎng)絡(luò)穩(wěn)定性等問題,將語音處理程序放置在靠近用戶和語音數(shù)據(jù)收集點的位置,通過本地化語音處理,實現(xiàn)離線語音喚醒及控制。由于無需聯(lián)網(wǎng),語音處理和反饋的時間較短,因此語音交互時客戶感覺不到明顯的延遲,用戶體驗較好。
歌爾微作為MEMS聲學(xué)傳感器行業(yè)龍頭企業(yè),深耕MEMS聲學(xué)傳感器新技術(shù)研究,在智能聲學(xué)傳感器技術(shù)方面取得突破,研發(fā)出了集成AI語音芯片的智能聲學(xué)傳感器產(chǎn)品。該產(chǎn)品是在傳統(tǒng)MEMS聲學(xué)傳感器基礎(chǔ)上引入AI語音芯片,將語音信號采集部分和語音信號處理單元集成在一起的新型聲學(xué)傳感器,借助于語音芯片強大的信號處理能力,在器件本體實現(xiàn)語音喚醒、語音識別、事件檢測等自主功能。該方案為應(yīng)用系統(tǒng)提供一種靈活的低功耗集成化語音解決方案。
歌爾微為客戶推出的智能聲學(xué)傳感器優(yōu)點十分突出。其采用優(yōu)化的專用AI語音處理芯片,達到超低的運行功耗,其支持數(shù)字信號輸出的智能聲學(xué)傳感器的總體監(jiān)聽功耗小于0.5mW,達到與傳統(tǒng)數(shù)字式MEMS聲學(xué)傳感器相當(dāng)。同時,通過疊片式集成封裝技術(shù),將AI語音處理芯片封裝進了聲學(xué)傳感器的內(nèi)部,實現(xiàn)了小尺寸的效果,其集成尺寸可以達到與傳統(tǒng)MEMS聲學(xué)傳感器相當(dāng)。MEMS聲學(xué)傳感器收集到的音頻信號無需向外部網(wǎng)絡(luò)傳遞,直接在器件本體內(nèi)AI語音處理芯片中進行信號處理,該本地化的處理方式使語音交互的延遲降低到0.5s之內(nèi),大大提升了用戶體驗。
其采用了AI語料訓(xùn)練的技術(shù),語音命令的識別率高。
語音交互是人與人之間最自然的交互方式,其使用的門檻低,幾乎不需要額外學(xué)習(xí),也不需要設(shè)置額外的遙控器,可以解放雙手進行遠距離、無接觸式的控制,這在設(shè)備的控制應(yīng)用上具有天然的優(yōu)勢。尤其在全球疫情的背景之下,非接觸式的控制更是一種較為安全選擇。在智能設(shè)備的語音喚醒或命令的應(yīng)用中,命令詞可根據(jù)客戶的需求進行訓(xùn)練,識別率可達到95%及以上,誤識別指標(biāo)可達到≤2次/24H??梢詮V泛適用于燈具、空調(diào)、風(fēng)扇等智能家電設(shè)備,TWS、智能手表、VR/AR等穿戴設(shè)備,以及其它需要長時間、低功耗待機等待喚醒或命令的設(shè)備。
除了實現(xiàn)語音喚醒、語音命令之外,智能聲學(xué)傳感器還可以通過語料的訓(xùn)練實現(xiàn)多種聲音事件的探測。比如,可識別嬰兒啼哭的聲音、玻璃破碎的聲音、特定呼救的聲音、警笛報警的聲音、以及其它具有特征的聲音。在此模式下,智能聲學(xué)傳感器可以很簡單地讓用戶的設(shè)備具備兒童看護、危險事件警報、聲音防盜、治安監(jiān)控等智能功能。
微信掃碼分享