來源:內容由半導體行業觀察(ID:icbank)編譯自allaboutcircuit,謝謝。
加州大學的研究人員在患者大腦的言語中心植入了 253 個電極,攔截信號,如果不是中風,這些信號可能會傳送到她的嘴唇、舌頭、下巴和喉部的肌肉。
人工智能 (AI) 不僅僅是生成式 AI,例如 ChatGPT。人工智能的另一面,解釋性人工智能,解讀我們周圍的世界。加州大學 (UC) 舊金山分校和伯克利分校的研究人員正在開發一種系統,該系統使用解釋性人工智能來為近 20 年來無法自己說話的人說話。
使用人工智能重建語音
加州大學項目正在與一位前數學老師 Ann 合作,她在 2005 年經歷了腦干中風。這次中風使她陷入了一種稱為閉鎖綜合癥 (LIS) 的狀態,盡管她的個性和性格使她的肌肉使用極其有限。認知能力完好無損。大多數肌肉控制指令起源于腦干,包括言語所需的指令。雖然安不能說話,但她的言語中樞仍然功能齊全。
UC系統從源頭捕獲語音信號。研究人員開發了一種傳感器,該傳感器具有由 253 個電極組成的超薄網絡,植入 Ann 大腦的語言中樞表面。電極收集信號并將其發送到大型計算系統,該系統使用人工智能將信號轉換為音素。然后,語音合成程序將這些音素轉換為類似人類的聲音,速度高達每分鐘不到 80 個單詞。
研究人員面臨著將大腦信號解讀為可用于語音合成的信息的嚴峻挑戰。
傳感器輸入 253 個信號乘以給定時間間隔的采樣率,得到一個三維矩陣。這個數據矩陣看起來一點也不像音頻信號。相反,它代表了發出聲音所需的所有肌肉。數以萬計的信號被發送到腦干,進行翻譯、解釋,然后重新傳輸到全身的肌肉,但這個 UC 系統只捕獲和解碼了 253 個點。
為了解碼這個矩陣,計算機對表示進行分段評估,就像計算機可能將照片解釋為像素網格或矩陣一樣。矩陣運算還使用了卷積,即兩個近似匹配的函數的矩陣乘法。例如,如果您想查看單像素網格中的圖像是否是汽車的一部分,矩陣乘法會將原始像素網格組合成帶有過濾器網格的卷積,其中包含汽車的表示。結果將是估計匹配概率的網格值。多次運行卷積,您將獲得更準確的概率。
再現Ann聲音的計算機系統使用 Speech Graphics 開發的軟件來顯示一個化身,模擬與她的聲音相關的面部動作。有了這個系統,安的家人自中風以來第一次可以與她輕松地交談。通過從視頻中提取安自己的語音音素,她中風時還是嬰兒的女兒現在可以聽到她母親通過復制自己的聲音進行交流。
IBM 的模擬 AI 芯片向語音以外的應用致敬
如上所述的人工智能系統需要大量的計算能力和能量。這通常將應用限制于研究和資金充足的商業應用。研究人員必須設計出新方法,讓像安這樣的人能夠將這樣的系統帶回家。IBM 研究中心正致力于通過改進的模擬人工智能芯片來解決這個問題。
IBM 研究團隊最近采用了一種新方法, 采用乘法累加 (MAC) 架構來進行模擬內存計算。該芯片具有 3500 萬個相變非易失性存儲器 (NVM) 器件以及模擬低功耗外圍電路,封裝在 34 個區塊中。這些區塊通過大規模并行區塊間通信進行通信,并提供每瓦 12.4 萬億次操作 (TOPS/W) 的持續性能。該芯片在 CFAR-10 圖像識別基準測試中的識別率為 92.81%。
作為人工智能加速器,IBM 芯片架構將使便攜式、個人、實時人工智能成為現實。潛在的應用遠遠超出了語音本身。模擬人工智能處理器的持續發展可能會帶來更高的性能、更低的成本和更低的功耗,可應用于許多領域。最終,信號可以在大腦的運動部分被接收,就像在這個 UC 原型中一樣,并連接到任何預期的肌肉群或任何需要控制的設備。將來,相同的方法可以應用于輪式移動設備或外骨骼。
*免責聲明:本文由作者原創。文章內容系作者個人觀點,半導體行業觀察轉載僅為了傳達一種不同的觀點,不代表半導體行業觀察對該觀點贊同或支持,如果有任何異議,歡迎聯系半導體行業觀察。
今天是《半導體行業觀察》為您分享的第3513期內容,歡迎關注。
推薦閱讀
★你不一定知道的英特爾
★誰在搶GPU?
★RISC-V:等風來,借風勢,乘風起
半導體行業觀察
『半導體第一垂直媒體』
實時 專業 原創 深度
識別二維碼,回復下方關鍵詞,閱讀更多
晶圓|集成電路|設備|汽車芯片|存儲|臺積電|AI|封裝
回復 投稿,看《如何成為“半導體行業觀察”的一員 》
回復 搜索,還能輕松找到其他你感興趣的文章!
本文鏈接:http://www.tebozhan.com/showinfo-27-7582-0.html他們在做偉大的芯片:用模擬AI,讓中風患者發聲
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 新一輪DRAM采購潮來了