新巴别塔:推倒语言的壁垒

2016-06-08作者:[韩]李焌桢编辑:谢爽

广阔的平原中,人们聚集在此建造了一座宏伟的城市——巴比伦,并在城市中央修建起通天巨塔。上帝看到此举心想:“看哪!他们成为一样的人民,都是一样的言语,如今既做起这事来,以后他们所要做的事,就没有做不出成就的了。我们下去,在那里变乱他们的口音,使他们的言语彼此不通。”随后上帝便打乱了人们使用的语言,原本只用一种语言的人类从此使用起了不同语言,建造巨塔的工程也随之中断。这就是著名的“巴别塔传说”。


 

世界上有各种各样的语言。据联合国统计,全世界的语言多达6800种~6900种,但其中使用人数超过百万的只有大约150种。巴布亚新几内亚拥有550万人口,使用的语言却有832种之多。据说是因为人们长期使用暗号以防邻村居民听到,从而使得字词日渐变得不同。而每种语言的使用人数一般不超过10万人。

 

封闭型社会的语言会被孤立。越是不发达的地区,使用的语言种类就越多。发达地区的人们会频繁地与邻里沟通,在此过程中,落后地区的语言就会消亡。即便是当下,在世界经济的推动下,少数民族文化不断被吸收、同化,大量语言在迅速消失。语言学家大卫•哈里森预测,到2050年,将有约90%的口语消失。


 

当今世界,数字文明正席卷全球。2009年,微软发布了展望未来10年的影像资料。第一段视频介绍的就是同声传译技术。画面中有两个分别使用英语和印度语的小朋友,他们正通过透明的窗口书写着自己的文字,这些文字被实时翻译并显示给对方。当时微软还宣称,到2019年,相当一部分语言之间的沟通将不再受限。

 

无论是Babelfish还是“谷歌翻译”,都能给我们提供非常实用的翻译服务。但众所周知,二者又都不够完美,因为它们的初始翻译都以语言学家编写的字典为基础。但现今的翻译技术并不以语言学为基础,而是使用一种类似解数学题一样的统计方法。将单词放入向量空间,比较其使用频率,并使其进行线性变化。


 

这种方式不会逐词逐句翻译字面意思,而是假定所有语言都是人们在相似语境中表达相似想法的集合。因此,可以将这些话语组成词组,并进行概念上的比较。这是将一种语言的词组与另一种语言的词组进行比较的新方式。比如人们早晨见面打招呼,英语里可能会简单地说:“早上好!”但韩国的上班族可能会说:“您吃了吗?”直译相同语境下的词组会得出完全不同的含义,但直接替换这些词组却可以表达相同的意思。如果一个英国人可以在韩国用“你吃了吗?”来问候,韩国人就会备感亲切。

 

再举个例子。假如要表达需要上卫生间的意思,西方人会说:“我想洗手。”但韩国的乡下大妈会不太好意思地问:“那个,这儿哪儿有便所?”这种情况下直译会很奇怪,但替换词组就不会听起来尴尬了。

 

即使彼此文化不同,只要系统分析相似语境下使用的单词或语句的词组,就可以发现使用频率较高的内容。这种词组替换是最近的口译方法。与直译不同,这样做可以实现更自然的跨文化沟通。


 

这种方法的特点是,人们可以不受语言或文化的局限而适应任何情况。除了表达方式不同,人们生活中进行的对话类型其实大同小异。因此,无论何种语言组合都能用词典或者翻译表细分并扩展。这种新技术并不依赖语言学家们翻译好的现有文档,而是使用对单一语言结构进行建模的数据挖掘技术,并重新与其他语言结构进行比较。这样,翻译过程就从语言学问题变成了数学问题。

 

假设集合所有单词关系的空间为整体语言空间,这个空间是从一个单词指向另一个单词的向量的集合。比如“王”-“男人” +“女人”=“女王”。这种技术不仅极为简单,而且其高效程度也令人震惊。

 

用这种方法处理语言结构相似的英语-西班牙语互译精度可达90%,甚至还曾从语言学家编写的词典中找到错误。实际上,谷歌的翻译团队就从现有的英语-捷克语词典中找到了大量错误。

 


此技术并不会对语言本身进行任何假设,所以甚至可以翻译那些字典里没有的,或与字典意思不同的“暗语”。它处理特定时代的流行语时也得心应手。这不仅适用于同为印欧语系的西班牙语和英语,也适用于语言结构完全不同的英语和韩语。甚至将英语、汉语、西班牙语、韩语混在一起也能口译/ 笔译出便于沟通的结果。

 

有人说,网上提供的谷歌翻译器翻译的内容错误较多,离实际需求相差甚远。但事实并非如此,现今的翻译技术已经达到可以对常用口语进行同声传译的水平。谷歌CEO 拉里•佩奇在2012 年5月举办的“全球热门搜索关键字”会议上宣称,5年后,谷歌翻译器可以实现64国语言的同声传译,且达到专业翻译人员的水平。佩奇的这番话绝非虚言。


 

2016年以后,只要佩戴相应的可穿戴设备,韩国人即使去俄罗斯或南美洲旅游也不必担心有语言障碍了。游客说的话会实时翻译为对方的母语。参观博物馆也是如此,当地导游讲解时,来自各国的游客可以听到各自国家的语言。当然,也不是说没必要学外语,只是外语沟通将变得更加简单。

 

语言已经不再是研究的课题,而只是沟通的工具。不久的将来,就连这工具也会由电脑帮你解决。现在我们要好好想想应该学些什么,因为巴别塔依然高耸入云。


内容来源:书问

作者[韩]李焌桢
出版人民邮电出版社
定价39元
书籍比价

分享到

扫描二维码 ×

电子纸书

新贸易壁垒及其应对

赵育琴著
西南财经大学出版社[2012] ¥25

新常态·新金融·新未来

石建勋, 著
清华大学出版社[2018] ¥39

经济新常态下破解“三农”难题新思路

陈锡文、韩 俊
清华大学出版社[2016] ¥45

C语言入门1.2.3——一个老鸟的C语言学习心得

周凌霄 等
清华大学出版社[2014] ¥39

看得见的“所指”──电影语言的义素研究

张鹂
清华大学出版社[2013] ¥47

逻各斯的技术——古希腊思想的语言哲学透视

宋继杰
清华大学出版社[2013] ¥23

新空间——办公 II

《新空间》编辑组, 编
辽宁科学技术出版社[2016] ¥27

交互设计语言——与万物对话的艺术 下册

罗涛
清华大学出版社[2018] ¥41

出版业领先的TMT平台

使用社交账号直接登陆

Copyright © 2019 BookAsk 书问   |   京ICP证160134号


注册书问

一键登录

Copyright © 2019 BookAsk 书问   |   京ICP证160134号