您的位置: 首頁 >科技 >

谷歌將一個離線聽寫AI壓縮到它的鍵盤應用程序中

2022-04-24 12:36:01 編輯:長孫昭超 來源:
導讀 谷歌已經更新了其Gboard鍵盤應用程序的Android與人工智能驅動的聽寫離線工作。該公司表示,它已經將一個基于云的語音識別神經網絡系統(tǒng)有效

谷歌已經更新了其Gboard鍵盤應用程序的Android與人工智能驅動的聽寫離線工作。該公司表示,它已經將一個基于云的語音識別神經網絡系統(tǒng)有效地小型化為80MB的移動應用程序更新,并且它將允許更快和更可靠的聽寫。

這很大,因為這意味著你不需要你的手機連接到服務器來提供高質量的語音識別結果-而且你也不需要訪問高速Wi-Fi網絡來使用這個功能。


新系統(tǒng)自2014年以來一直在運行,它避免了傳統(tǒng)的三步語音識別過程,以一步解決方案。通常,語音識別軟件首先將口語單詞映射到稱為音素的音頻片段中,然后將這些音素連接起來形成索引詞,最后將它們轉換成文本。

谷歌的團隊開發(fā)了一種新的方法,不斷處理你的演講,并一次輸出一個字符。它還壓縮了它的語言和發(fā)音模型的圖表,以匹配音頻文字從2GB到80MB,這樣它就可以很容易地適用于大多數手機。

它目前只能在美式英語的Pixel設備上使用,但谷歌語音識別和移動輸入組的組長Francoise Beaufays告訴Verge,該公司應該能夠在未來提供更多的語言和更多的設備。

我們將很快把Gboard的新語音識別功能通過它的步伐。如果你有一部Pixel手機,你可以通過從這個頁面下載Gboard來自己嘗試它。

2019年TNW會議來了!看看我們輝煌的新位置,鼓舞人心的發(fā)言者和活動排隊,以及如何成為這一年度技術奢侈的一部分,點擊這里。


免責聲明:本文由用戶上傳,如有侵權請聯(lián)系刪除!

2016-2022 All Rights Reserved.平安財經網.復制必究 聯(lián)系QQ280 715 8082   備案號:閩ICP備19027007號-6

本站除標明“本站原創(chuàng)”外所有信息均轉載自互聯(lián)網 版權歸原作者所有。