北京冬奧會與科大訊飛可謂是“一拍即合”,前者匯聚世界不同國家、不同語言的人群,后者具有面向冬奧場景的多語音、多語言處理關(guān)鍵技術(shù)。早在2019年,科大訊飛就組建了北京2022年冬奧會和冬殘奧會示范應(yīng)用專項團隊,借助先進的機器翻譯和多語言語音轉(zhuǎn)換技術(shù),圍繞“人和人之間溝通無障礙、人和組織之間溝通無障礙、人和賽事之間溝通無障礙”三大方向,加速應(yīng)用場景落地。
基于智能語音新一代人工智能開放創(chuàng)新平臺,科大訊飛研發(fā)定制了具有冬奧特征的多語種語音及語言服務(wù)平臺,可提供面向冬奧場景定制優(yōu)化的語音識別、語音合成、機器翻譯、自動問答等多種核心能力。達成60個語種語音合成,69個語種語音識別,168個語種機器翻譯和3個語種的交互理解,覆蓋面超過全球超200個國家和地區(qū),同時還能識別內(nèi)容進行文本書面化處理。而機器領(lǐng)域的突破,可支持168種語言的機器翻譯;自動問答的多
語種信息獲取及交互技術(shù),可支持中、英、日等3種語言的交互理解。
語言是一門藝術(shù)、一種智慧,也是促進世界相知相融的重要工具。北京2022年冬奧會和冬殘奧會上,科大訊飛擔綱官方自動語音轉(zhuǎn)換與翻譯獨家供應(yīng)商,是科技發(fā)展的大勢所趨,也是自身核心技術(shù)發(fā)展的水到渠成。然而,由于自動語音轉(zhuǎn)換與翻譯涉及技術(shù)眾多,難度和挑戰(zhàn)非常大,科大訊飛在為賽事提供技術(shù)支持的過程中,也遇到了不少難點。
在多語種語音語言技術(shù)研發(fā)領(lǐng)域,由于涉及60多個語種的語音識別合成翻譯等技術(shù)研發(fā),除了中英文之外,針對其他語種(比如瑞典語、波蘭語等)語料比較少的問題,通過源頭核心技術(shù)創(chuàng)新,在端到端建模和無監(jiān)督、弱監(jiān)督訓練方面取得重大突破,例如在多語種語音識別方面,100小時有監(jiān)督數(shù)據(jù)加上大量無標簽語音和文本數(shù)據(jù)可以達到1萬小時有監(jiān)督訓練的效果。這項技術(shù)也在OpenASR國際低資源多語種語音識別挑戰(zhàn)賽的15個語種受限賽道和7個語種非受限賽道系統(tǒng),全部取得第一名的成績。
在語音同傳技術(shù)實時性和效果的平衡上,我們知道,同傳要解決兩個問題,第一是要將語音識別轉(zhuǎn)寫出來,第二是將轉(zhuǎn)寫的內(nèi)容翻譯出來,以前這兩個任務(wù)是單獨建模先后完成的,現(xiàn)在我們提出“流式的CAAT語音翻譯框架”模型,在一個模型內(nèi)解決這兩個問題,從而實現(xiàn)同傳效果的“又快又好”。這些技術(shù)創(chuàng)新,對于保障冬奧場景下的語音同傳應(yīng)用效果起到非常關(guān)鍵的作用。
在多語種自動問答中,融合了數(shù)字人生成、語音識別、語音合成、自然語言理解等多項技術(shù),并結(jié)合FAQ問答、文檔集合問答、知識庫問答和基于文本蘊含識別的多源答案驗證等技術(shù)進行知識庫構(gòu)建,最終實現(xiàn)人們可以和冬奧虛擬志愿者“愛加”用六種語言自由互動交流。
講好中國故事、傳遞中國聲音,科大訊飛自創(chuàng)建以來始終致力于語音及語言、自然語言理解、機器學習推理及自主學習等核心技術(shù)研究,在行業(yè)發(fā)展史上樹立了從“能聽會說”到“能理解會思考”的關(guān)鍵里程碑。此次擔當北京2022冬奧會和冬殘奧會官方自動語音轉(zhuǎn)換與翻譯獨家供應(yīng)商,科大訊飛更是不斷攻堅克難,突破了多語種語音語言技術(shù)的研發(fā)、語音同傳技術(shù)實時性和效果的平衡、多語種智能(自動)問答三大技術(shù)難題,讓多語種交流、同傳又準、又好、又快,真正實現(xiàn)了交流無國界、溝通無障礙。讓我們一起,為中國技術(shù)實力點贊!
免責聲明:市場有風險,選擇需謹慎!此文僅供參考,不作買賣依據(jù)。
本站違法和不良信息舉報 聯(lián)系郵箱: 5855973@qq.com
關(guān)于我們| 客服中心| 廣告服務(wù)| 建站服務(wù)| 聯(lián)系我們
中國焦點日報網(wǎng) 版權(quán)所有 滬ICP備2022005074號-20,未經(jīng)授權(quán),請勿轉(zhuǎn)載或建立鏡像,違者依法必究。