您的位置: 首頁 >產(chǎn)經(jīng) >

微軟創(chuàng)造了新的語音識別記錄 出錯率達(dá)到了5.1%

2020-01-07 14:37:46 編輯: 來源:
導(dǎo)讀 微軟表示,其語音識別技術(shù)實現(xiàn)了一個新的行業(yè)里程碑,將錯誤率降低到5 1%,在廣泛認(rèn)可的準(zhǔn)確性測試中與多個人類轉(zhuǎn)錄器的錯誤率相匹配。 該公司的人工智能和研究小組今天晚上宣布的新

微軟表示,其語音識別技術(shù)實現(xiàn)了一個新的行業(yè)里程碑,將錯誤率降低到5.1%,在廣泛認(rèn)可的準(zhǔn)確性測試中與多個人類轉(zhuǎn)錄器的錯誤率相匹配。

該公司的人工智能和研究小組今天晚上宣布的新結(jié)果超過了微軟去年公布的5.9%的前低點;以及今年早些時候IBM宣布的5.5%的錯誤率。

微軟研究小組的語音識別工作提供了用于產(chǎn)品的底層技術(shù),包括其Cortanavirtual助理、演示文稿翻譯器和微軟認(rèn)知服務(wù)。

在最新的測試中,微軟降低了其錯誤率,“對我們基于神經(jīng)網(wǎng)絡(luò)的聲學(xué)和語言模型進(jìn)行了一系列改進(jìn),”微軟技術(shù)研究員黃學(xué)東在解釋這一成就的帖子中說。

這是微軟為推進(jìn)人工智能的最新技術(shù)并將這些新方法推向市場而做出的更廣泛努力的一部分。在CEO薩蒂亞·納德拉(Satya Nadella)的領(lǐng)導(dǎo)下,微軟去年組建了一個新的5000人人工智能和研究小組,作為公司內(nèi)部的第四個工程部門,以及Office、Windows和云組。

微軟在人工智能和云領(lǐng)域與亞馬遜、蘋果、IBM、谷歌和其他主要技術(shù)參與者競爭。雷德蒙公司的新愿景聲明特別增加了對人工智能的參考,稱其戰(zhàn)略是為“智能云和注入人工智能的智能邊緣構(gòu)建一流的平臺和生產(chǎn)力服務(wù)”。

下面是黃如何解釋他們?yōu)檫_(dá)到這一最新里程碑所做的事情。

我們引入了一個額外的CNN-BLSTM(卷積神經(jīng)網(wǎng)絡(luò)結(jié)合雙向長時記憶)模型來改進(jìn)聲學(xué)建模..此外,我們結(jié)合來自多個聲學(xué)模型的預(yù)測的方法現(xiàn)在在幀/Senone和單詞級別都這樣做了。

此外,我們還通過使用Adialog會話的整個歷史來預(yù)測下一步可能會發(fā)生什么,從而加強(qiáng)了識別器的語言模型,從而有效地允許模型適應(yīng)會話的主題和局部上下文。

我們的團(tuán)隊也從使用可用的最可伸縮的深度學(xué)習(xí)軟件Micros of tCognitiveToolkit2.1(CNT K)中獲益匪淺,用于探索模型體系結(jié)構(gòu)和優(yōu)化我們模型的超參數(shù)..此外,微軟在云計算基礎(chǔ)設(shè)施方面的投資,特別是Azure GPU,有助于提高我們訓(xùn)練模型和測試新想法的有效性和速度。



免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請聯(lián)系刪除!

最新文章

精彩推薦

圖文推薦

點擊排行

2016-2022 All Rights Reserved.平安財經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082   備案號:閩ICP備19027007號-6

本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。