国偷自产av一区二区三区-精品无码国产av一区二区三区-中文字幕无码日韩专区免费-国产精品成人网站

Facebook發(fā)布新AI模型 支持多語言語音翻譯

推特網(wǎng)消息:近日社交媒體巨頭Meta公司發(fā)布了一款新的人工智能(AI)模型,可以翻譯和轉(zhuǎn)換數(shù)十種語音或文本文字,可望成為實(shí)現(xiàn)跨語言即時(shí)通訊工具的基石。

據(jù)稱,這款新模型被命名為SeamlessM4T,它代表大規(guī)模多語言和多模式機(jī)器翻譯。Meta公司表示,它可以支持近100種語言的語音到文本,或從文本到文本的翻譯,以及35種語言的語音到語音翻譯。

它是在Creative Commons CC BY-NC 4.0許可證下發(fā)布的,允許研究人員對其進(jìn)行迭代。

除了 SeamlessM4T,Meta 還發(fā)布了其開放翻譯數(shù)據(jù)集 SeamlessAlign 的源數(shù)據(jù)。

Meta公司表示,“建立一個(gè)通用的語言翻譯器,就像《銀河系漫游指南》中虛構(gòu)的巴別魚一樣,具有挑戰(zhàn)性,因?yàn)楝F(xiàn)有的語音到語音和語音到文本系統(tǒng)只覆蓋世界上一小部分語言,”。Meta表示,SeamlessM4T代表了“重大突破”,因?yàn)檫@種新模型可以一次性完成整個(gè)翻譯任務(wù),不像其他大型翻譯模型將翻譯劃分到不同的系統(tǒng)。

如果SeamlessM4T 能夠正常運(yùn)行,那么它的一個(gè)有趣功能是它據(jù)稱能夠識別說話者何時(shí)進(jìn)行代碼切換,或何時(shí)有人在一個(gè)句子中在兩種或多種語言之間轉(zhuǎn)移。例如,Meta在一段視頻中演示了該模型可以立即區(qū)分印地語、泰盧固語和英語。

SeamlessM4T建立在Meta以前的翻譯模型之上。去年,Meta發(fā)布了其“不落下任何一種語言”(No Language Left Behind)文本到文本機(jī)器翻譯模型,該模型支持200種語言。它還開發(fā)了SpeechMatrix,一個(gè)用于多語言語音到語音翻譯的數(shù)據(jù)集和用于語音識別的大規(guī)模多語言語音。Meta去年演示了其通用語音翻譯器,將閩南語轉(zhuǎn)換為英語。

語言翻譯對于像Meta這樣的公司來說很重要,這些公司雇傭了數(shù)千名員工來審核大量不同語言的Facebook和Instagram帖子。很多時(shí)候,小眾語言的團(tuán)隊(duì)規(guī)模較小,最終依賴于自動審核,而自動審核在這些語言中效果不佳。如果允許人工智能訪問這些小眾語言的數(shù)據(jù)集,那么審核將變得更為簡單。

根據(jù)部落格文章,Meta正將這套模型提供給公眾用于非商業(yè)用途。

Meta今年發(fā)布一連串多為免費(fèi)的人工智慧模型,其中包括名為Llama的大型語言模型,對微軟(Microsoft)公司支持的OpenAI和Alphabet旗下的谷歌(Google)出品的專利模型構(gòu)成嚴(yán)峻挑戰(zhàn)。

扎克伯格說,開放的AI生態(tài)系統(tǒng)對Meta更有利,因?yàn)楣就高^有效群眾外包(Crowd-sourcing)方式,為旗下社群平臺創(chuàng)建面向消費(fèi)者的工具,比向這些模型的使用者收費(fèi)獲益更多。