亞馬遜公司(Amazon)在年度云科技盛會AWS re: Invent上宣布,其語音轉文字平臺Amazon Transcribe將支持100種口語語言,這一突破得益于生成式人工智能(Generative AI)技術的驅動。同時,AWS還推出了多項AI功能,包括通話轉錄(call transcription)等。
據The Verge報道,Amazon Transcribe是一種完全受管控的自動語音識別(ASR)服務。它基于生成式AI和數十億個參數的語音基礎模型(speech foundation model),可以提供超過100種語言的語音轉文字服務,同時提供更準確的標點和大小寫格式,以提高可讀性。此外,對于電話語音轉文字的正確性提高了30-70%。
新的語音基礎模型是以數百萬小時、超過100種語言的無標記語音數據為基礎進行訓練的。這種模型通過自我監督式演算法學習人們用不同語言和口音說話的普遍模式。此外,為了確保非常規語言和常規語言的語音轉文字都能達到高正確性,AWS通過智能數據采樣最佳化訓練數據以平衡各種語言的代表性。
在2022年后期,Amazon Transcribe支持的語言數量已經達到了79種,還具備自動語言識別、自動標點、定制化詞匯等功能。同時,它能夠識別嘈雜環境以及音頻和視頻格式中的語音。根據AWS的統計,語音基礎模型讓多數語言在Amazon Transcribe進行語音轉文字的正確性顯著提升了20-50%。
此外,AWS還宣布了Amazon Personalization產品的兩項新功能,包括能夠根據用戶過去的觀看行為推薦新節目的Amazon Personalization以及能夠撰寫傳送到主題建議列表的標題或電子郵件主旨的Content Generation。
在競爭激烈的市場中,Otter.ai主要面向普通消費者和企業用戶提供AI語音轉文字服務,并于2023年6月推出了總結工具;而Meta Platforms也在開發一種基于生成式AI、能夠識別近100種口語語言的翻譯模型。
本文鏈接:http://www.tebozhan.com/showinfo-27-35478-0.htmlAmazon Transcribe利用生成式AI支持100種語言
聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。郵件:2376512515@qq.com
上一篇: ispace新登月載具:月面運輸革新