以太幣交易所 以太幣交易所
Ctrl+D 以太幣交易所
ads
首頁 > BTC > Info

在元宇宙里怎么交朋友?Meta發布跨語種交流語音模型 支持128種語言無障礙對話_XLS

Author:

Time:1900/1/1 0:00:00

改名 Meta 之后,Facebook 的元宇宙愿景正在一點點實現。這一次,Facebook 把目光投在了元宇宙社交上。

Meta 發布語音處理模型 XLS-R

近日,Meta 正式發布 XLS-R——一套用于各類語音任務的新型自監督模型。據悉,XLS-R 由海量公共數據訓練而成(數據量是過去的十倍),能夠將傳統多語言模型的語言支持量增加兩倍以上。目前,XLS-R 共支持 128 種語言。

Meta 認為,語音交流是人們最自然的一種交互形式。“隨著語音技術的發展,我們已經能夠通過對話同自己的設備及未來的虛擬世界直接互動,由此將虛擬體驗與現實世界融為一體。”

西班牙桑坦德銀行將在元宇宙舉行數字頒獎典禮:7月8日消息,西班牙桑坦德銀行將于7月14日在元宇宙為其“桑坦德X全球挑戰賽|區塊鏈”舉行頒獎儀式。該比賽總共有大約400個參賽項目。申請的截止日期是2022年6月9日,之后由國際專家組成的評審團選出20名決賽選手。7月7日,決賽選手向桑坦德銀行的開放式創新團隊Fintech Station展示了其參賽方案。(Finbold)[2022/7/9 2:01:29]

這與扎克伯格此前宣稱的“公司業務將以元宇宙優先”不謀而合。此前,扎克伯格曾概述了他建立“元世界”的計劃:一個建立在我們自己的數字世界之上的數字世界,包括虛擬現實和增強現實。“我們相信元宇宙將會接替移動互聯網”。

而 XLS-R 作為元宇宙社交中必不可少的一環,可以幫助母語不同的人在元宇宙無障礙對話。

時尚品牌Zara推出可在元宇宙穿戴的產品Lime Glam:4月12日消息,快時尚品牌Zara推出全新系列春夏款限量產品Lime Glam。這些服裝和配飾可以在Zepeto元宇宙內穿戴,也可以在實體店購買。

如果買家選擇實體版,也將獲得數字版本,從而簡化購買流程。Zara網站上專門展示了部分穿著Lime Glam系列產品的虛擬化身。Zepeto應用程序還為該特定系列提供照相亭、數字墻和地板。(Cryptoslate)[2022/4/12 14:19:13]

值得一提的是,為了通過單一模型實現對多種語言的廣泛語音理解能力,Meta 對 XLS-R 進行了微調,使其獲得語音識別、語音翻譯及語言識別等功能。據介紹,XLS-R 在 BABEL、CommonVoice 以及 VoxPopuli 語音識別基準測試,CoVoST-2 的外語到英文翻譯基準測試,以及 VoxLingua107 語言識別基準測試中都取得了不錯的成績。

三星高管暗示將推出一款可在元宇宙平臺上運行的新設備:3月3日消息,三星電子 Device eXperience 部門負責人兼公司副總裁Han Jong-hee暗示將推出一款可在 元宇宙平臺上運行的新設備。韓鐘熙表示:“我們正在為發布做準備,力求完美。不過,三星沒有有透露新設備的預計發布日期,也沒有透露該設備將在元宇宙平臺上實現哪些功能,市場傳言新設備可能是游戲玩家的頭戴式顯示器、智能眼鏡或其他形式的硬件。(韓國先驅報)[2022/3/3 13:34:56]

為了盡可能降低功能訪問門檻,目前,Meta 與 Hugging Face 聯手發布了模型本體,并通過 fairseq GitHub repo 全面開放。

試用地址:https://huggingface.co/spaces/facebook/XLS-R-2B-22-16

曼城計劃在元宇宙中建造阿提哈德球場復制品:金色財經報道,英超冠軍曼城計劃在元界建造一個阿提哈德體育場的復制品。據報道,該運動隊將與索尼公司合作建設該項目,為期三年。該項目將為俱樂部的球迷提供遠程體育場訪問權限。該項目將使用索尼公司子公司 Hawk-EYE 的圖像分析和骨骼跟蹤技術創建。該計劃旨在為曼城球迷遠程提供同樣激動人心的體育場體驗。(crypto.news)[2022/2/23 10:09:36]

XLS-R 工作原理

據介紹,XLS-R 在 wav2vec 2.0 訓練集上接受了超過 43 萬 6 千小時的公開語音錄音訓練,從而實現了對語音表達的自監督學習方法。這樣的訓練量已經達到去年發布的當時最強的模型 XLSR-53 的 10 倍。利用從會議記錄到有聲讀物的多種語音數據來源,XLS-R 的語言支持范圍擴展到 128 種,涵蓋的語種量達到前代模型的近 2.5 倍。

作為 Meta 打造的有史以來最大模型,XLS-R 中包含超過 20 億個參數,性能遠高于其他同類模型。Meta 表示,事實證明,更多參數能夠更充分地體現、數據集中的各類語種。此外,Meta 還發現,規模更大的模型在單一語言預訓練方面的性能也同樣優于其他較小模型。

Meta 在四種主要多語言語音識別測試中對 XLS-R 做出評估,發現它在 37 種語言上獲得了超越以往模型的效能。具體測試場景為:BABEL 中選取 5 種語言,CommonVoice 中選取 10 種語言,MLS 中選取 8 種語言,以及 VoxPopuli 上選取 14 種語言。

BABEL 上的單詞錯誤率基準測試結果。XLS-R 較前代模型實現了顯著改進。

此外,Meta 還評估了語音翻譯模型,即將錄音資料直接翻譯成另一種語言。為了打造一套能夠執行多種任務的模型, Meta 同時在 CoVoST-2 基準測試的數個不同翻譯方向上對 XLS-R 進行了微調,使其能夠在英語與多達 21 種語言之間實現內容互譯。

在使用 XLS-R 對英語以外的其他語言進行編碼時,獲得了顯著的效能提升,這也是多語言語音表達領域的一次重大突破。據 Meta 介紹,XLS-R 在低資源語言學習中實現了顯著改進,例如印尼語到英語的翻譯,其中 BLEU 準確率平均翻了一番。BLEU 指標的提升是指模型給出的自動翻譯結果與處理同一內容的人工翻譯結果間重合度更高,代表著模型在改進口語翻譯能力方面邁出了一大步。

以 BLEU 指標衡量的自動語音翻譯準確率,其中較高值表示 XLS-R 從高資源語言(例如法語、德語)、中資源語言(例如俄語、葡萄牙語)或低資源語言(例如泰米爾語、土耳其語)語音記錄翻譯至英語時的準確率。

Meta 認為,XLS-R 證明擴大跨語言預訓練規模可以進一步提高低資源語言的理解性能。它不僅提高了語音識別率,同時也將由外語到英語的語音翻譯準確率提高了一倍以上。

“XLS-R 是我們朝著以單一模型理解多種不同語言(語音)目標邁出的重要一步,也代表著我們在利用公共數據推進多語言預訓練方面做出的最大努力。我們堅信這是一條正確的探索方向,將讓機器學習應用更好地理解所有人類語音、并促進后續研究,大大降低語音技術在全球范圍內、特別是服務匱乏社群中的使用門檻。我們將不斷開發新方法,通過低監督學習拓展模型的語言理解能力、逐步使其覆蓋全球 7000 多種語言,實現算法的持續更新。”Meta 提到。

https://ai.facebook.com/blog/xls-r-self-supervised-speech-processing-for-128-languages/

Tags:XLSMETAETAMETPIXLS Vault (NFTX)metamask安卓下載metamaskMetagames

BTC
2021年Etherscan新增的21個功能_ETH

對于以太坊與其逐漸壯大的生態來說,2021年是重要的一年。隨著 DeFi 和 NFT 促使新一代用戶首次使用區塊鏈,以太坊的采用率直線上升。當終端用戶為牛市所興奮時,開發者可能為此備受煎熬.

1900/1/1 0:00:00
UST會崩盤嗎?_UST

我們每天都在說Terra崩盤的事情,這是因為我們對于他這種“左腳踩右腳”的經濟模式保持懷疑。但是,如果我們聚焦于它的兩大核心之間的關系,即LUNA和UST的關系以及效用廣度上,這種崩盤的可能性有.

1900/1/1 0:00:00
工信部提出培育元宇宙等新興領域創新型中小企業_區塊鏈

2022年1月24日,在工業和信息化部召開的中小企業發展情況發布會上,有媒體提問:改造提升傳統產業的重要支點,也是中小企業實現高質量發展的重要路徑.

1900/1/1 0:00:00
為迎接「合并」 以太坊 2.0 更名_以太坊

眾所周知,以太坊是一個正在發生重要變化的區塊鏈網絡。近幾年,去中心化應用程序(Dapp)以及其他區塊鏈技術形式獲得了前所未有的發展,而其中諸多技術均構建于以太坊之上.

1900/1/1 0:00:00
Web3的變革:用去中心化中間件協議取代中間商_WEB

加密貨幣和更廣泛的區塊鏈生態系統正在幫助我們改變日常生活的現狀。隨著這些新興技術的出現,Web3作為一種使用中間件區塊鏈協議的無需許可的、開放式創新被引入.

1900/1/1 0:00:00
逐層分解Web3的組成架構_WEB

行業已經對Web3提出了許多定義,但在Coinbase,我們通常認為Web3是一個利用區塊鏈技術的無信任、無許可和去中心化的網際網路。Web3的定義特徵主要來自“所有權”.

1900/1/1 0:00:00
ads