神经机器模型能翻译200种语言
《自然》5日发表的神经一篇论文报道了一个Meta人工智能(AI)模型的底层技术。该模型能翻译200种不同语言,机器增加了机器翻译的模型语言数量。 神经机器翻译模型利用人工神经网络翻译各种语言。译种语这些模型通常需要大量可在线获取的神经数据加以训练,但并非所有语言数据都是机器公开、低成本或是模型普遍可及的,这类语言被称为低资源语言。译种语一味地增加模型翻译语言数量,神经可能会影响模型的机器翻译质量。 此次,模型Meta的译种语法国研究团队和“不落下任何语言”(NLLB)团队开发了一种跨语言技术,能让神经机器翻译模型学习如何利用翻译高资源语言的神经预存能力,实现对低资源语言的机器翻译。研究团队开发了一个在线多语言翻译工具,模型名为“NLLB-200”。该工具能容纳200种语言,其低资源语言数量是高资源语言数量的3倍,翻译表现则比当今已有系统高44%。 由于团队在许多低资源语言上只能获取1000—2000例样本,为了扩大“NLLB-200”的训练数据量,他们用一个语言识别系统发现了这些特定语言的更多实例。团队还从互联网存档中挖掘双语文本数据,帮助提升其翻译质量。 研究团队指出,这个工具可以帮助很少被翻译的那些语言的使用者,让他们也能用上互联网和其他技术。此外,教育是一个非常重要的应用,因为这个模型可以帮助低资源语言使用者获取更多图书和研究文章。但团队也表示,目前误译的情况仍有可能出现。
- 最近发表
- 随机阅读
-
- 福建举办消费者权益保护工作业务培训班
- 桑涧镇开展“扫黄打非”专项检查_
- 我市交通运管部门整治旅游客运市场
- 議場內大亂鬥! 沈伯洋跨人群「頭著地」緊急送醫
- “希望野生动物能够奔跑在山林中”
- 《白城魔鬼》推薦序:為什麼最光明的年代裡,會出現這最黑暗的殺戮?
- 陸軍營區驚傳工安意外!灌漿施作釀鷹架倒塌 壓傷9工人
- 关于办理销户客户结存电费清退的公告_
- 因地制宜推动有机循环农业发展的若干思路与对策(六)
- 布林肯稱烏可用美武器打擊公投4地 俄駐美大使:已近危險邊緣
- 詐騙假長髮哥抓到了 原是論壇小編自導自演
- 夏季百日攻坚行动收官 泉州市空气优良天数比例上升
- 金融马拉松,中行如何做好国际化的“头雁”?丨透视银行业年报⑧
- 從《台灣鐵道線路圖》,見證「鐵道萬能」的1930年代
- 浙江苍南:加强团购商家检查 发布消费提醒告诫书
- 月亮之上的科技嫦娥丨“探月”动力从哪来?发动机零件也能3D打印
- 三大赛事同期举办 双奥之城再燃冰雪激情
- 金曲35/完整入圍名單揭曉!楊乃文8入圍大贏家 林俊傑、熱狗搶歌王
- 定制mRNA载体可快速创建并自带“导航”,为治疗多种器官疾病开辟新途径
- 2020年贺岁纪念币来了 12月19日开始预约
- 搜索
-
- 友情链接
-