有机器翻译还用学外语吗? 大数据无法取代人工

佚名 发表于:14年07月16日 11:00 [转载] 赛迪网

  • 分享:
[导读]机器翻译出错闹笑话的段子数不胜数,但大数据的应用却令这种技术手段日趋完善。

机器翻译出错闹笑话的段子数不胜数,但大数据的应用却令这种技术手段日趋完善。甚至有支持者认为,机器翻译终将取代人力,让人类克服语言障碍交流。然而,技术真能参透人类语言的丰富和微妙之处吗?

初级机器翻译更像一部电子词典,擅长翻译单个字词和简单句子,但对多义词却束手无策。正因如此,尽管发展多年,纯粹的机器翻译仍然错漏百出。大数据时代的来临,可能彻底改写这种局面。

输入的文本资料越多,机器翻译的准确率越高。各门语言的情况不一样,建立一个机器翻译模式,通常需要3000万个单词或者100多万个句子。多亏有联合国和欧盟这样的机构存在,其翻译人员历经多年积累起丰富的平行语料库(也称翻译记忆库),为机器翻译研发人员省去不少麻烦。

这也解释了以数据和资料庞大著称的谷歌(584.78, -0.09, -0.02%)为何在机器翻译领域表现卓越。谷歌的机器翻译专有系统堪称业界典范,能够实现63种常用语言的交互翻译。

然而,人类语言如此复杂、微妙,远非平行语料库能够囊括。如果涉及比喻或者任何诗意的语言,就非常困难,专家表示,如果用到一个翻译系统从未见过的双关语,电脑只会字面直译。

如果考虑各种语言的出处和文化差异,有些字词无法翻译,即所谓的不可译性现象,则根本不能指望机器翻译取代人工翻译。

[责任编辑:redsenlin]
7月16日消息,福布斯刊登的一篇署名为Ian Morris的文章指出,Chrome浏览器会悄悄地增加Windows PC的耗电量,从而减短Windows笔记本电脑的电池寿命。
官方微信
weixin
精彩专题更多
存储风云榜”是由DOIT传媒主办的年度大型活动。回顾2014年,存储作为IT系统架构中最基础的元素,已经成为了推动信息产业发展的核心动力,存储产业的发展迈向成熟,数据经济的概念顺势而为的提出。
华为OceanStor V3系列存储系统是面向企业级应用的新一代统一存储产品。在功能、性能、效率、可靠性和易用性上都达到业界领先水平,很好的满足了大型数据库OLTP/OLAP、文件共享、云计算等各种应用下的数据存储需求。
联想携ThinkServer+System+七大行业解决方案惊艳第十六届高交会
 

公司简介 | 媒体优势 | 广告服务 | 客户寄语 | DOIT历程 | 诚聘英才 | 联系我们 | 会员注册 | 订阅中心

Copyright © 2013 DOIT Media, All rights Reserved. 北京楚科信息技术有限公司 版权所有.