「專利解密」知存科技的新型語音處理芯片是如何工作的?
作者:米樂發(fā)布時間:2025-02-16
集微網(wǎng)消息,8月6日,北京知存科技有限公司(以下簡稱“知存科技”)宣布完成近億元的A輪融資,此輪融資由中芯聚源領(lǐng)投,普華資本、招商局創(chuàng)投、三峽鑫泰、科訊創(chuàng)投、燕緣雄芯跟投。
據(jù)悉,知存科技成立于2017年,主要研發(fā)NOR Flash存算一體AI芯片,主要針對語音識別和視覺識別兩個領(lǐng)域,目前正在進(jìn)行Demo芯片的測試,運(yùn)算效率為15TOPS/W,預(yù)計半年內(nèi)進(jìn)入量產(chǎn)階段。
語音芯片是指可以接收、處理、存儲和/或播放語音信號的IC(集成電路)。隨著集成電路技術(shù)的不斷發(fā)展,語音芯片對語音信號的處理功能也日漸豐富。例如,語音芯片可以實現(xiàn)對語音檢測、識別、合成等功能。目前,人工智能的興起,為語音處理技術(shù)賦予了更多的技術(shù)手段也對語音芯片的運(yùn)算、存儲能力提出了新的挑戰(zhàn)。因此,有必要提供一種運(yùn)算、存儲性能更適應(yīng)的語音芯片。
就在去年18年12月29日,知存科技申請了一項名為“一種語音處理芯片、系統(tǒng)與方法”的發(fā)明專利(申請?zhí)枺?01811654163.6),申請人為北京知存科技有限公司。
根據(jù)目前公開的專利資料,讓我們一起來解讀一下這項語音處理芯片中的技術(shù)吧。
如上圖所示為語音處理系統(tǒng)的示意圖。語音處理系統(tǒng)可以處理人聲檢測、關(guān)鍵詞喚醒、命令識別、語音識別、聲紋識別和語音合成等。語音處理系統(tǒng)包括語音采集裝置、網(wǎng)絡(luò)、語音處理裝置和存儲設(shè)備。其中,語音信號采集裝置,語音處理裝置和存儲設(shè)備通過網(wǎng)絡(luò)相互通信連接。
語音信號采集裝置可以采集至少一個語音信號米樂m6網(wǎng)址。采集語音信號的方法可以包括:直接獲取已有音頻、利用音頻處理軟件捕獲截取聲音、利用麥克風(fēng)錄制聲音等。語音信號采集裝置可以同時采集多個語音信號,并可以將所采集的語音信號分別進(jìn)行存儲。

網(wǎng)絡(luò)可以促進(jìn)信息和數(shù)據(jù)的交換。系統(tǒng)中的一個或多個部件(例如,語音采集裝置、語音處理裝置和存儲設(shè)備)可以通過網(wǎng)絡(luò)向系統(tǒng)中的其他部件發(fā)送信息和數(shù)據(jù)。
語音處理裝置可以對語音信號進(jìn)行處理。語音處理可以包括人聲檢測、關(guān)鍵詞喚醒、命令識別、語音識別、聲紋識別和語音合成等。
在了解了系統(tǒng)的組成部分之后,我們再來看看該系統(tǒng)是如何工作的。
如上圖所示為語音處理的流程圖。首先,語音處理裝置可以接收語音信號,語音信號表征至少一段語音,語音處理裝置可以經(jīng)由網(wǎng)絡(luò)接收來自語音信號采集裝置和存儲設(shè)備的語音信號。
其次,語音處理裝置可以對語音信號進(jìn)行預(yù)處理,得到預(yù)處理后的語音信號。該預(yù)處理可以包括濾波、采樣、平滑、模擬/數(shù)字轉(zhuǎn)化和快速傅里葉變換等中的至少一種或多種米樂M6。語音處理裝置可以保存預(yù)處理后的語音信號,并將其發(fā)送至閃存芯片進(jìn)行下一步處理。
最后,語音處理裝置可以控制閃存芯片對預(yù)處理后的語音信號進(jìn)行運(yùn)算,得到運(yùn)算結(jié)果。其中,閃存芯片包括閃存陣列,閃存陣列用于在計算模式下對接收的數(shù)據(jù)進(jìn)行計算,在編程模式下對參與計算的參數(shù)進(jìn)行調(diào)整。
可以看到該語音處理芯片設(shè)計十分簡潔,利用不多的幾個模塊就實現(xiàn)了語音處理功能。這樣的語音處理芯片在我們的日常生活中也有很多的應(yīng)用之處,例如不斷興起的物聯(lián)網(wǎng)技術(shù)中與用戶進(jìn)行語音交互的部分,就可以利用這樣的技術(shù)。期待該技術(shù)能夠?qū)ξ覀兊纳顜砀嗟捏@喜和便利。(校對/Jurnan)