免费足球贴士网(www.zq68.vip):调戏微软文言文AI翻译:“永不舍汝”、“其母之”是什么鬼?

欧博电脑版

欢迎进入欧博电脑版(www.aLLbetgame.us),欧博官网是欧博集团的官方网站。欧博官网开放Allbet注册、Allbe代理、Allbet电脑客户端、Allbet手机版下载等业务。

,

泉源 | 量子位(QbitAI)

作者 | 梦晨 萧箫

听说微软搞了个AI翻译文言文?

赶快来试试,先来一段《曹刿论战》的开头:

我震惊了,居然能把“我”翻译成“鲁国”,“公”翻译成“鲁庄公”。

岂非AI除了学习文言文词汇和语法,还熟读了《左传》?

换成诗显示又将若何?

虽然翻译出来不是很有文学性,但AI准确明白到了“望着统一个月亮”这层意思。

嚯,这个翻译极大地引起了我的兴趣。

若是百度和微软一起上科场

既然翻译出准确词意不是太难,那文言文中的特殊语法AI能否掌握?

为了更好地评估微软翻译的能力,这里请出老牌选手百度翻译,让它们比试一下。

第一题:秦时明月汉时关

这里考点是互文的修辞方式,应该明白成秦汉时期的明月、秦汉时期的关口。

百度的谜底是:

看来百度没明白到位,再看看微软的谜底:

微软准确明白了互文,率先拿下1分。

第二题:东风又绿江南岸

这句的考点是词类活用,绿原本是个形容词,在这里用作动词。

照样百度先来:

没问题,接下来是微软:

等一下,虽然绿用作动词翻译对了,可是后面怎么多了一个“可是”?

岂非……把后半句诗也输进去试试:

果真云云,看来微软翻译在用整句举行训练的时刻掌握了句与句之间的转折关系,厥后不知怎么又算到前半句里了。

这次百度扳回一局,1:1平。

最后一题磨练一下文言文中的另一个常见语法征象――倒装

好比《邹忌讽齐王纳谏》中的“我孰与城北徐公美?”

按老例百度先:

然后是微软:

看来两个AI都学会了倒装句的用法,最终效果2:2平,各有千秋。

微软翻译虽然多学会了一个互文,但事实照样年轻选手,对句子之间关系的处置需要再演习。

接下来挑战一下微软文言文翻译的极限。

好比 *** 实在就有个文言文版叫维基大典,内里恰好有微软的词条。

免费足球贴士网

免费足球贴士网(www.zq68.vip)是国内最权威的足球赛事报道、预测平台。免费提供赛事直播,免费足球贴士,免费足球推介,免费专家贴士,免费足球推荐,最专业的足球心水网。

来试试让微软AI翻译一下自己公司的先容:

看起来现代的伪文言文对于这个刚出生的小AI来说照样太苛刻了。

虽然也稀奇训练了“微软”和“电脑”这种现代才泛起的名词,但遇到“一九七五年”这种古代不用的表达就不行了,前老板比尔盖茨的名字也没认出来。

“立之者”这里还按古文的语境脑补出一个“国君”,可能这就是过拟合吧。

说到现代的表达方式,实在这个翻译工具还可以倒过来用,把白话文译成文言文。

好比诸葛丞相那句“我从未见过有云云恬不知耻之人!”要是用文言文说出来是不是就更对味了?

那么,这样的模子是怎么“炼成”的呢?

Transformer加成,

专攻训练数据

用AI搞文言文翻译,确实不是头一回见。

百度是最早用机械学习做文言文翻译的,还申请过相关专利:“一种在白话文与文言文之间举行文体转换的方式和装备”。

相关文言文翻译的模子也不少,从机械学习、RNN到Transformer都有,像微软这次接纳的,就是Transformer模子:

不外,文言文翻译中的训练数据,却一直是个难点。

相比于其他主流语言(中文现代文、英文等),文言文可以说是训练数据少少,同时还存在句式变换、繁简夹杂等问题,造成翻译的生硬。

这次微软的文言文翻译,主要就解决了四个方面的数据问题:

其一,针对数据量不足,行使相同字词举行数据合成和增强。文言文和现代文有一些相同寄义的字词,若是对这些词语举行召回、对齐,再扩展到短词短句,就能合成大量可用的训练数据。

其二,针对句式变换不天真,对数据花样举行变形,提升鲁棒性。文言文断句和现代文不太一样,为此研究职员通过数据花样变形,来扩大训练数据量,让模子也学会翻译类似语句。

其三,针对字体识别不力,用简繁夹杂数据训练,提升模子识别能力。为了让机械学习能同时识别简繁夹杂的文言文,研究职员在训练模子时会将简体中文和繁体中文数据夹杂在一起举行训练,确保翻译模子不失足。

其四,针对现代文的“新词”,专门确立相关数据集和识别模子,确保不“乱翻译”。为了阻止模子在遇到现代文中的“高铁、电脑、互联网”这种词时泛起杂乱(例如将高铁翻译成高处的铁块),研究职员建了一个模子,专门用来识别这些新词。除了新词,也针对博客、论坛、微博等新文体举行训练。

然而这都还只是文言文和中文之间的互译,整点英文试试?

英译中,bug藏不住了

这次微软的文言文翻译是直接整合到了Bing翻译里,岂非还可以把文言文翻译成外语?

先挑战一下单个的英文句子:

Never gonna give you up

看来简朴句没有难倒AI,我们提升一下难度,用一首对照著名的英文诗“当你老了”试试:

等等,“昏暗”、“阴景深”、“弯下腰在酒边”……这都是什么鬼?

简朴的句子似乎还好,然而一到长句子,怎么就翻译成这样了?

不外,微软也说过,这次主要实现的是文言文和现代文互译,说明其他语言在翻译成文言文之前,应该也需要先翻译成现代文。

那来看看微软的英译中效果怎么样:

破案了,微软的英译中确实不太行……可能也是导致英文翻译成文言文泛起失误的缘故原由。

相比之下,从文言文翻译现代文、再翻译到中文的效果要稍微好一点。

顺带一提,虽然正经的英文字句翻译得不太行,不外在这种字词的翻译上……竟然另有点文艺?

看来以后可以和翻译模子学习若何优雅地骂人了。(手动狗头)

若是人人还调戏出了什么好玩的翻译,迎接留言~

微软文言文翻译地址:https://cn.bing.com/translator

参考文献

[1]https://weibo.com/msra?profile_ftype=1&is_all=1#1630370728811[2]https://mp.weixin.qq.com/s/5cpBuUXfeb0r13JSyNuS_Q

添加回复:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。