您现在的位置:广东省翻译协会网站>> 译界资讯>> 国际>>正文内容

揭秘谷歌“译”图技术重大突破:向量空间数学原理

谷歌工程师利用其训练的语言翻译技术开发出机器学习算法,能够根据图片写出标题。

 

 

将一种语言翻译成另一种语言一直不是件容易的事情。但最近几年,谷歌通过开发机器翻译运算法转化了这道程序,用谷歌翻译改变了跨文化交流的本质。


  现在,谷歌正在用同样的机器学习技术将图片翻译成文字,也就是利用系统自动识图生成标题,准确地描述画面的内容,这将对搜索服务、自动发布、以及视障人士上网有着重大意义。


  语言翻译惯用的方法是一个将字词逐个翻译,再重新排列组合生成译文的反复过程。但近些年,谷歌已经发明出如何利用其庞大的搜索数据库,以一种颠覆性方式翻译文本。


  这一方法的实质是计算出所有词与其他词相连或相近出现的频率,然后在一个抽象的向量空间内定义这些词,并表示出彼此的关系。如此一来,这个空间的每个词都用一个向量表示,而句子则是由向量组合而成。


  谷歌还做了一个重要的设想,就是不管对于哪种语言来说,个体的词语彼此间存在着相同的关系。比如,"国王-男性+女性=女王"这一向量在任何语言中都适用。


  这就使得语言翻译问题转化成了向量空间运算法。谷歌翻译的处理方法是将句子转化为一个向量,然后将这个向量用另一种语言生成对等句。


  目前,OriolVinyals和谷歌公司的其他员工正在利用类似的方法将图片翻译成文字。这种技术是利用神经网络来研究一个有100,000张图片和其标题的数据集,以学习怎样将这些图片内容进行分类。


  但是,他们的运算法并非是通过生成一系列词语来描述这些图片,而是生成一个向量来表现这些词的关系。然后,将这个向量嵌入到谷歌既有的翻译运算法里,生成英语或其他语种的标题。实际上,谷歌的机器学习法已经学会了将图片"翻译"成文字。


  为了测验此方法的有效性,他们从亚马逊土耳其机器人平台(AmazonMechanicalTurk)聘请了评估员,对以这种方法自动生成的标题,其他方法自动生成的标题,以及人所给出的标题进行了评级。


  结果表明,谷歌的新系统NeuralImageCaption(NIC)表现得非常出色。它使用了PASCAL这一知名的数据集,明显胜出了其他自动法。Vinyals和同伴们称:"目前最先进的系统的Bleu(一种机器翻译自动评估法--编者注)分值是25,而NIC获得了59分的高分,人工识图则达到69分。"


  这个结果让人甚感欣慰,此技术看来已成定局,但随着训练数据集规模的扩大还将做出进一步改善。谷歌团队称:"这些实验很清楚地表明,随着我们用于图片描述的数据集规模逐渐扩大,NIC系统的性能也会随之提高。"


  不难看出,这是另一项艰巨的任务,而人类凌驾于机器的局面已经时日不多了。


【字体: 】【收藏】【打印文章
上一篇:我只是对人生过敏
下一篇:澳洲塔州将中文翻译列技术移民清单 吸引中国移民