Google Translate 的工作原理

  • 发表于
  • 业界
Google Translate 的工作原理

Google上传了一段视频解释了Google Translate是如何运作的,在这里你还可以看到Google Translate在过去4年里都做了哪些改进。

视频里说到,GoogleTranslate是一个免费工具,帮助你瞬间翻译语句、文档甚至是整个网页,不够它是如何工作的呢?难道Google雇了一屋子的翻译大牛?当然不是, 所有翻译都是计算机完成的,这些计算机使用一种称作“统计机器翻译”的程序来按照大量文字排序生成翻译。

退一步说,如果你想教某人一个新语言肯定得从词汇表和语法开始,告诉他们如何组成整句。教电脑翻译也是这个顺序,先告诉他们词汇表和一些语法规矩。 但是语言是复杂的,有很多时候都是没有规则而言的,很难捕捉到并一一说清楚。对于一个计算机程序来说,翻译质量一般都很差,而GoogleTranslate则从另外的角度入手。

Google并不想教电脑每个语言的规则,而是让它们自己找到这些规则。这些电脑要分析数百万人肉翻译的文档,包括图书、联合国文件、全世界的网站 等等。电脑们扫描这些文字找到其中的规律──也就是翻译后文字和原始文字之间的必然性。一旦机器找到了这个序列,就可以翻译类似的文字了。当你数十亿次重 复这一过程就找到了数十亿种序列。对于一些翻译的并不多的文档来说,找到的序列也就不会太多,这就造成了GoogleTranslate翻译质量的下降。Google也一直在让电脑捕捉并学习更多的文档,这样他们的翻译水平会越来越高。

继续观看官方的视频:

原始视频地址