神经机器模型能翻译200种语言
《自然》5日发表的神经一篇论文报道了一个Meta人工智能(AI)模型的底层技术。该模型能翻译200种不同语言,机器增加了机器翻译的模型语言数量。 神经机器翻译模型利用人工神经网络翻译各种语言。译种语这些模型通常需要大量可在线获取的神经数据加以训练,但并非所有语言数据都是机器公开、低成本或是模型普遍可及的,这类语言被称为低资源语言。译种语一味地增加模型翻译语言数量,神经可能会影响模型的机器翻译质量。 此次,模型Meta的译种语法国研究团队和“不落下任何语言”(NLLB)团队开发了一种跨语言技术,能让神经机器翻译模型学习如何利用翻译高资源语言的神经预存能力,实现对低资源语言的机器翻译。研究团队开发了一个在线多语言翻译工具,模型名为“NLLB-200”。该工具能容纳200种语言,其低资源语言数量是高资源语言数量的3倍,翻译表现则比当今已有系统高44%。 由于团队在许多低资源语言上只能获取1000—2000例样本,为了扩大“NLLB-200”的训练数据量,他们用一个语言识别系统发现了这些特定语言的更多实例。团队还从互联网存档中挖掘双语文本数据,帮助提升其翻译质量。 研究团队指出,这个工具可以帮助很少被翻译的那些语言的使用者,让他们也能用上互联网和其他技术。此外,教育是一个非常重要的应用,因为这个模型可以帮助低资源语言使用者获取更多图书和研究文章。但团队也表示,目前误译的情况仍有可能出现。
-
上一篇
-
下一篇
- 最近发表
-
- 世界标准日浙江主题活动举行
- 吃遍東京港區名店全攻略(二):港區眾多的「坂道」,流傳著各自的傳奇故事
- 《只要好好活著,就很了不起》:達文西創作《蒙娜麗莎》是為了向世人展示——地球與人類其實非常相似
- 除了「食材新鮮、價格不貴」,美食部落格有多少能寫出更深層的色香味?
- 中国羽协公示苏迪曼杯参赛运动员名单
- 戰後初期外省詩人如何與臺籍詩人接觸認識?《臺灣詩報》公道價一本一千元
- 【2021電視金鐘獎】《天橋上的魔術師》拿下最佳戲劇、導演獎,楊雅喆:得獎永遠能讓你怦然心動,是很好的回春方法
- 史上首位得票未過半的國民黨主席,朱立倫:今晚民進黨要開始擔心了!
- “到北京 吃什么”,这份榜单告诉你
- 《精準解答》:為什麼好多人每到周一就開始懷疑人生?因為他們沒有用整體思維看待自己的工作
- 随机阅读
-
- 网络赌球黑产调查:“像传销”,下级只管拉更多人来赌球
- 王溢嘉《人生沒有最好,不錯就好》:大江健三郎因靈魂的不斷拷問,勇敢承擔起做為一個父親的責任
- 【影評】《沙丘》:感官體驗實屬上乘,難以想像這一趟史詩旅途還會迎來什麼光景
- 14年修不動的《菸害防制法》,背後的「佛地魔」運用三招暗黑手法不斷拖延
- 福建省曝光一批虚假违法广告典型案例
- 《療癒次級創傷》:有時候,受到「次級創傷」的人並不清楚痛苦是從何而來
- 《失去青春的孩子》:一個房間14個室友,她展開朝九晚十的美髮建教生活
- 《失去青春的孩子》:一個房間14個室友,她展開朝九晚十的美髮建教生活
- 千秋街道举办基本公卫服务定期抽查核实培训_
- 從海軍江字級巡防艦的浴血戰史,看新世代陀江級如何成為匿蹤殺手?
- 2021搞笑諾貝爾獎:虬髯金鐘罩、犀牛倒掛金鉤、性高潮是最有效的「舒鼻適」?
- 兩位台東老農30年的釋迦栽植變遷故事:目睹台灣精緻農業發展成果的代表作
- 浙江海宁:保障首届长三角露营装备博览会消费安全
- 《玩提案》:開始提案前,用「四大極點」管理你想傳遞的訊息
- 《減法的力量》:布魯斯.史普林斯汀「去蕪存菁」的美學,徹底改變了我們聆聽搖滾樂的方式
- 《香港釣太郎》:常見魚類指南——烏頭常在岸邊「遊憩」、黃腳鱲「釣完又釣」⋯⋯
- 中国能建国际集团吕泽翔会见中国能建广东院党委书记、董事长黄志秋
- 《打造韌性》:虛實整合的數位轉型這件「事」,關鍵仍在於處理與「人」有關的課題
- 《書法,漢字最美的歷史》:東晉穆帝永和九年上巳節,因為王羲之的〈蘭亭序〉而永載史冊
- 蘋果受惠於北美電信商5G補貼大戰,今年前9個月iPhone已狂賣2.39億台
- 搜索
-
- 友情链接
-