米樂m6網(wǎng)址:啟英泰倫降低語音芯片成本新方法
作者:米樂發(fā)布時(shí)間:2025-02-11
【愛集微點(diǎn)評】啟英泰倫將芯片中的CPU和各個(gè)硬件計(jì)算模塊,采用有效的并行處理方式進(jìn)行連接,通過數(shù)據(jù)并行搬運(yùn),可以減少CPU處理能力要求,從而降低了芯片成本。
集微網(wǎng)消息,啟英泰倫第三代智能語音芯片發(fā)布后的短短三個(gè)月里,銷量就高達(dá)百萬,并位于離線語音芯片市場銷售前列。
雖然采用云端語音識別可以解決語音所需要的算力問題,得到比較好的語音識別效果,但卻存在語音隱私安全泄露、實(shí)時(shí)性差等問題,因此行業(yè)也需要離線的語音識別技術(shù)方案。而在離線語音識別中,由于無法調(diào)用云端硬件資源,終端硬件處理能力有限,且終端產(chǎn)品對成本和性能,包括響應(yīng)時(shí)間、判斷準(zhǔn)確率等綜合要求都較高,如何利用有限的硬件處理資源,結(jié)合算法軟件設(shè)計(jì)高性價(jià)比,高實(shí)時(shí)性以及高識別率的語音識別方法是一個(gè)具備挑戰(zhàn)性的技術(shù)問題。

為此,啟英泰倫于2021年2月14日申請了一項(xiàng)名為“一種終端硬件和算法軟件處理相結(jié)合的離線語音識別方法”的發(fā)明專利(申請?zhí)? 202110186016.6),申請人為成都啟英泰倫科技有限公司。
圖1 離線語音識別方法具體實(shí)施方式示意圖
圖1是本發(fā)明中離線語音識別方法具體實(shí)施方式示意圖,包括CPU和直接內(nèi)存訪問模塊,其中直接內(nèi)存訪問模塊和CPU之間連接有第一緩存(連接語音預(yù)處理模塊)、第二緩存(連接語音端點(diǎn)檢測、直接內(nèi)存訪問和硬件計(jì)算模塊)和第三緩存(連接直接內(nèi)存訪問和神經(jīng)網(wǎng)絡(luò)計(jì)算模塊)米樂m6網(wǎng)址。
圖2 離線語音識別方法具體實(shí)施流程示意圖米樂m6網(wǎng)址
圖2為離線語音識別方法具體實(shí)施流程示意圖,麥克風(fēng)實(shí)時(shí)抓取用戶發(fā)出溫度相關(guān)的模擬語音信號,發(fā)送到芯片內(nèi)部的語音數(shù)據(jù)采集模塊,語音數(shù)據(jù)采集模塊將該模擬語音信號轉(zhuǎn)化為數(shù)字語音信號,通過芯片內(nèi)部的直接內(nèi)存訪問模塊發(fā)到第一緩存(S1)。CPU對第一緩存的數(shù)據(jù)量進(jìn)行監(jiān)控,當(dāng)?shù)谝痪彺嬷械臄?shù)據(jù)積累到預(yù)設(shè)的門限值時(shí),由CPU將第一緩存中的數(shù)據(jù)搬運(yùn)到語音預(yù)處理模塊(S2)。語音預(yù)處理模塊接收到CPU從第一緩存?zhèn)鱽淼臄?shù)字語音信號時(shí),對該信號進(jìn)行處理,得到潔凈語音信號,并通知CPU,由CPU將該潔凈語音信號存放到第二緩存中(S3)。
直接內(nèi)存訪問模塊將第二緩存中的潔凈語音信號同時(shí)發(fā)送到語音端點(diǎn)檢測模塊和硬件計(jì)算模塊(S4)。語音端點(diǎn)檢測模塊計(jì)算判斷當(dāng)前潔凈語音信號是否是有效語音信號,以及有效語音信號的開始和結(jié)束端點(diǎn),如果發(fā)現(xiàn)是有效語音信號,則通知硬件計(jì)算模塊將端點(diǎn)信息發(fā)送(S5)。硬件計(jì)算模塊根據(jù)語音端點(diǎn)檢測模塊的通知判斷直接內(nèi)存訪問模塊發(fā)來的潔凈語音信號是有效語音信號,之后硬件計(jì)算模塊計(jì)算得到語音聲學(xué)特征并通知CPU(S6)。
最后,CPU將硬件計(jì)算模塊計(jì)算出的語音聲學(xué)特征結(jié)果數(shù)據(jù)存放到神經(jīng)網(wǎng)絡(luò)處理前置緩存,直接內(nèi)存訪問模塊并行將語音聲學(xué)特征結(jié)果發(fā)送到神經(jīng)網(wǎng)絡(luò)計(jì)算模塊,神經(jīng)網(wǎng)絡(luò)計(jì)算模塊實(shí)時(shí)讀取芯片外部FLASH存儲器中存放的聲學(xué)模型參數(shù),對語音聲學(xué)特征結(jié)果數(shù)據(jù)進(jìn)行神經(jīng)網(wǎng)絡(luò)計(jì)算(S7)。
簡而言之,啟英泰倫將芯片中的CPU和各個(gè)硬件計(jì)算模塊,采用有效的并行處理方式進(jìn)行連接,通過數(shù)據(jù)并行搬運(yùn),可以減少CPU處理能力要求,從而降低了芯片成本。
啟英泰倫以自主的人工智能芯片計(jì)算架構(gòu)和傳感信息處理核心技術(shù)為基礎(chǔ),挖掘市場痛點(diǎn)及消費(fèi)者潛在需求,為社會更好的提供服務(wù),這次智能語音芯片出色的銷量就是對啟英泰倫實(shí)力的最好證明。