7 月 4 日消息,科技媒體 9to5Mac 昨日(7 月 3 日)發布博文,對比測試了蘋果系統的全新轉錄 API,認為該 API 在速度上優于 OpenAI 的 Whisper 模型,但在準確性上仍有一定差距。
注:該媒體使用一段 9to5Mac Daily 的播客音頻測試,長度為 7 分 31 秒,對比了蘋果的新轉錄 API、OpenAI 的 Whisper Large v3 Turbo(通過 MacWhisper 應用)和英偉達的 Parakeet v2 模型。
測試平臺為 M2 Pro 芯片的 MacBook Pro 筆記本,配備了 16GB 內存,使用 Metric: cer 和 Metric: wer 兩款 Hugging Face Spaces 來分析實際的字符錯誤率(CER)和單詞錯誤率(WER)。
結果顯示,Parakeet v2 的轉錄時間最短,僅為 2 秒,但 CER 和 WER 較高;Whisper Large V3 Turbo 的準確性最高,但轉錄時間長達 40 秒;蘋果的模型在速度上接近 Parakeet,但準確性優于后者。
模型轉錄時間字符錯誤率單詞錯誤率Parakeet v22 seconds5.8%12.3%Whisper Large V3 Turbo40 seconds0.2%1.5%Apple9 seconds1.9%10.3%該媒體還使用了 ChatGPT、Claude 和 Gemini為基線來計算 CER 和 WER。結果顯示,每個模型的性能都有所不同,但 Whisper 在準確性上仍領先。
ChatGPT (o4-mini-high)
模型轉錄時間字符錯誤率單詞錯誤率Parakeet v22 seconds6.0%12.3%Whisper Large V3 Turbo40 seconds0.4%1.4%Apple9 seconds2.1%10.2%Claude (Sonnet 4)
模型轉錄時間字符錯誤率單詞錯誤率Parakeet v22 seconds8.4%11.0%Whisper Large V3 Turbo40 seconds0.1%1.0%Apple9 seconds3.5%8.2%Gemini (2.5 Pro)
模型轉錄時間字符錯誤率單詞錯誤率Parakeet v22 seconds7.6%12.3%Whisper Large V3 Turbo40 seconds0.3%0.4%Apple9 seconds3.4%5.3%相關閱讀:
《8 秒轉錄 30 分鐘播客:MacWhisper 應用接入英偉達 Parakeet 模型》
《45 秒 AI 轉錄 34 分鐘 4K 視頻:蘋果 Speech 技術力壓群雄,比 OpenAI Whisper 快 55%》
本文鏈接:http://www.tebozhan.com/showinfo-24-166017-0.html速度與準確性的權衡:蘋果新語音轉錄 API 對比測試
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: 小米手環 8 全量推送桌搭模式,“閑置手環再就業”秒變機器人
下一篇: 全球首款三折疊屏手機華為 Mate XT 官方首次降價:全系優惠 2000 元(17999 元起),另 Mate X5 直降 4000 元(8999 元起)