米樂(lè)M6:【硅麥應(yīng)用】敏芯I2S MEMS麥克風(fēng)芯片在智能音箱中的應(yīng)用
作者:米樂(lè)發(fā)布時(shí)間:2025-06-06
1.引言
智能音響是眾多勝任智能家庭管家設(shè)備中最具有潛力的,即作為未來(lái)家庭人工智能(AI)的入口,作用至關(guān)重要。目前,美國(guó)的亞馬遜、中國(guó)的京東等科技公司,已經(jīng)朝著這個(gè)方向不斷努力,并且初步顯露成效。亞馬遜在2015年推出智能音箱Echo,京東在2016年推出智能音箱叮咚(DingDong),谷歌的Google Home也正在后來(lái)者居上。這些產(chǎn)品,主要在三個(gè)方面將聲音的人機(jī)交互的作用加以發(fā)揮:智能家居中心;家庭購(gòu)物入口;大數(shù)據(jù)獲取。
Amazon Echo GoogleHome 京東的DingDong
未來(lái),預(yù)計(jì)會(huì)有更多形式的智能聲音獲取終端進(jìn)入家庭,作為利用人機(jī)聲音交互的軟、硬件通道。
無(wú)論在何種方案中,用戶非常看重的一項(xiàng)功能,就是語(yǔ)音識(shí)別。如果這項(xiàng)功能缺失,那么人機(jī)通過(guò)聲音交互的方式就不能完全自主,必須依賴(lài)其它途徑開(kāi)始、結(jié)束交互過(guò)程,用戶體驗(yàn)必會(huì)大打折扣。因此,目前各個(gè)主流產(chǎn)品中,都具有語(yǔ)音識(shí)別功能。

然而,我們知道如果要想識(shí)別用戶說(shuō)出的命令,麥克風(fēng)必須一直在錄音狀態(tài),并且語(yǔ)音識(shí)別算法也要一直在工作,這就是連續(xù)語(yǔ)音識(shí)別的基本前提。因此,設(shè)法降低這部分系統(tǒng)設(shè)計(jì)的功耗和復(fù)雜度,是整個(gè)智能音箱軟、硬件設(shè)計(jì)的核心之一。
2.目前的麥克風(fēng)信號(hào)處理的主流方案
智能音箱采用N個(gè)(目前多見(jiàn)7個(gè)或8個(gè))麥克風(fēng)芯片構(gòu)成麥克風(fēng)陣列拾取周邊的聲音信號(hào)。市面上見(jiàn)到的智能音箱通常采用“模擬輸出MEMS麥克風(fēng)+ 音頻ADC + 處理器”的音頻信號(hào)通路形式,如下圖所示:
Amazon Echo的音頻處理板實(shí)物拆解圖
*橙色:德州儀器TLV320ADC310192分貝SNR低功耗立體聲ADC(X4)
*綠色:S10530090 V6麥克風(fēng)(X7)米樂(lè)
以亞馬遜的Echo為例,典型的信號(hào)通路形式如下圖,其中兩路模擬麥克風(fēng)輸出共用一顆雙通道音頻ADC,ADC將信號(hào)轉(zhuǎn)換為I2S/PCM音頻格式傳送給應(yīng)用處理器,應(yīng)用處理器需要具有足夠多通道的串行數(shù)據(jù)接口來(lái)接收I2S/PCM信號(hào)。
例如圖中7顆麥克風(fēng),后續(xù)即需要4顆獨(dú)立的音頻ADC同時(shí)輸出4路I2S/PCM信號(hào),DM3725CUS100處理器具有多達(dá)5路的串行數(shù)據(jù)接口(MCBSP)兼容I2S/PCM 格式的音頻信號(hào)。當(dāng)然亦可采用通道數(shù)更多的音頻ADC。
3.用I2S輸出的數(shù)字麥克風(fēng)形成的代替優(yōu)化方案
相對(duì)于現(xiàn)在智能音箱“模擬麥克風(fēng)+ 音頻ADC + 處理器”的方案,敏芯可提供直接I2S數(shù)字輸出的硅麥克風(fēng)芯片,集成了上述“模擬麥克風(fēng)+ 音頻ADC”的功能。I2S麥克風(fēng)芯片在芯片內(nèi)部先將模擬信號(hào)數(shù)字化后再轉(zhuǎn)化為標(biāo)準(zhǔn)的I2S信號(hào),由于省去了音頻ADC,節(jié)省BOM,節(jié)省PCB空間,使設(shè)計(jì)更簡(jiǎn)單化。優(yōu)化過(guò)的信號(hào)通路如下圖所示,采用多路I2S信號(hào)轉(zhuǎn)1路TDM格式的IC(Lattice Semiconductor 公司的iCE40 Ultra 的iCE5LP4K),將不必要求主控IC具有同樣數(shù)量的I2S音頻接口,節(jié)省IO端口數(shù)量。或者可以采用Rockchip新推出的RK3229芯片,其本身具有4ch I2S接口,如果需要更多I2S接口,將多個(gè)RK3229進(jìn)行級(jí)聯(lián)即可實(shí)現(xiàn)。
4.未來(lái)智能音箱的發(fā)展趨勢(shì)— 低功耗語(yǔ)音喚醒
目前的智能音箱解決方案為了保持聲音識(shí)別功能,麥克風(fēng)陣列、ADC以及后續(xù)處理算法始終保持在工作狀態(tài),因此功耗較大,這就造成了例如亞馬遜的Echo必須插電工作。然而智能音箱是一類(lèi)移動(dòng)互聯(lián)網(wǎng)時(shí)代的智能硬件,方便攜帶是其作為智能硬件的重要因素,插電工作必將嚴(yán)重影響產(chǎn)品的用戶體驗(yàn)。
將來(lái)的新一代智能音箱,預(yù)期會(huì)借鑒智能手機(jī)中(例如中興天機(jī)手機(jī))的語(yǔ)音喚醒功能,即在低功耗模式下,只有麥克風(fēng)以及專(zhuān)用語(yǔ)音芯片處于工作狀態(tài),而其他電路部分則處于休眠狀態(tài)。只有麥克風(fēng)偵測(cè)到用戶設(shè)定的“特定語(yǔ)音信號(hào)”時(shí),整個(gè)系統(tǒng)才被激活。通過(guò)語(yǔ)音喚醒功能,極大的降低了整個(gè)系統(tǒng)的整體功耗,才使用電池供電的智能音箱系統(tǒng)成為可能。
Lattice半導(dǎo)體公司的FPGA芯片iCE5LP4K支持語(yǔ)音喚醒功能的應(yīng)用,并且可支持連續(xù)發(fā)出喚醒和指令,使語(yǔ)音交互更加自然。米樂(lè)M6