本篇文章2063字,读完约5分钟

长期以来,所有人类都有一个共同的夙愿:发明一台机器,实现所有人之间无障碍的自由对话。毫无疑问,在一个主张自由连接的互联网时代,自由对话可以更好地展示其价值——毕竟,我们很难找到对方,也不理解对方的语言。

事实上,与那些让生活变得复杂的“智能产品”不同,实时翻译是一项人们应该凭直觉掌握的技术。正因为如此,它一直存在于科幻作品中,如《星际迷航》、《神秘博士》和《漫游银河指南》。好消息是,人类似乎越来越接近这个夙愿。

几天前,微软的skype(听起来像是很久以前)宣布,带有实时语音翻译技术的skype翻译器的中文预览版在中国市场正式推出。事实上,不同母语的人直接交谈,让机器实时翻译。微软早在去年就已经与公众见面了,但当时它并不支持中文——你知道,即使对于机器来说,也有大约10000个常用汉字和各种语音语调的中文,这是相当具有挑战性的。但是现在,在包括微软和谷歌在内的科技巨头的努力下,地球上使用最广泛的语言可以直接开始对话。

Skype Translator:实时语音翻译神器能否解除“巴别塔魔咒” ?

然后问题来了。作为不同文化间的摆渡人,如果实时翻译真的能实现人类自由对话,这意味着什么?

翻译工件

长期以来,实时语音翻译的发展一直受到高错误率、麦克风灵敏度差异、噪声环境等因素的阻碍。但近年来,由于大数据的出现,这项技术取得了良好的进展。Skype翻译器体现了微软在语音识别、自动翻译和机器学习方面的成就。

简而言之,skype翻译器的翻译逻辑主要分为三个步骤:将你的实时语音转换成文本;将单词翻译成另一种语言的单词;把文字变成语言。其中,识别实时语音并将其转换成文字是最困难的部分。

众所周知,准确的实时语音翻译依赖于强大的机器学习,即软件学习和训练数据的能力。这些培训数据包括翻译后的网页、带字幕的视频以及事先翻译并转录成文字的一对一对话。事实上,许多人已经分享了他们过去的谈话记录。Skype翻译通过记录对话来分析文本,并训练系统更好地“学习”语言。当准备好的数据被输入系统时,机器学习软件将在这些对话和环境中涉及的单词之间建立一个统计模型。当你说话时,软件会在统计模型中寻找相似的内容,然后将其应用到预先学习的转换程序中,这样语音就可以被转换成文本,然后从文本转换成另一种语言。

Skype Translator:实时语音翻译神器能否解除“巴别塔魔咒” ?

值得一提的是,不像一般的背诵设置的程序,人们会边说话边思考,并犯错误。这类错误在口语表达中的表现是口吃、停顿、重复或经常出现语气助词,如“嗯”、“啊”、“儿”。鉴于此,skype翻译器的机器学习模型也将处理这些暂停。在预览版中,用户可以看到一些模态粒子已经被移除,而那些没有被移除的可以通过用户反馈进行重新优化。

Skype Translator:实时语音翻译神器能否解除“巴别塔魔咒” ?

但是,作为一项优化技术,无论是微软的skype翻译机还是“老对手”谷歌翻译,至少在现阶段,实时语音翻译技术应该还不完善,系统语音识别的准确性还需要提高——要知道,语言就像一只野兽,无时无刻不在变化,即使在同一个国家,也有不同的口音和俚语文化,由于地区不同(有些人非常期待机器实时翻译下面的对话:“,我会在火车站等你。”“我这就去!太远了!我不去!”).这些问题可以通过更广泛的数据来解决吗?也许吧,但这需要时间。

Skype Translator:实时语音翻译神器能否解除“巴别塔魔咒” ?

然而,无论如何,正如一位评论者所说:“(今天的语音实时翻译)整个体验就像两个电话销售员使用对讲机,但在使用过程中,这样的抱怨会被‘奇迹’所震惊。已替换。”

地球村

根据《圣经》的《创世纪》,曾经有一段时间,人类有一种共同的语言,所以有些人想在巴比伦建造一座巴别塔,以便直接与上帝交谈。为了惩罚人类的傲慢和虚荣,上帝让这些人说不同的语言,这使得人们无法交流。

那么技术能打破“巴别塔诅咒”吗?如果语言不再是人类交流的障碍,会发生什么?

让我们先来谈谈语言的意义。在世界各地的7000多种语言中(尽管许多“小语言”日益萎缩),除了词汇和语法的表面差异之外,不同的语言是否能产生不同的思维方式,如对时间和空概念的认知或对因果关系的认知,几千年来一直是学者们争论的话题。神圣罗马帝国的查理曼大帝曾在科技不发达的时代宣称:“掌握第二种语言意味着拥有第二个灵魂。”

Skype Translator:实时语音翻译神器能否解除“巴别塔魔咒” ?

当然,从科学的角度来看,斯坦福大学教授勒拉·鲍罗迪斯基曾经用诗的方式表达过语言的含义:“每种语言都包含着独特的世界观,反映了使用者几千年来的思想、倾向和认知方式。”语言就像一个完整的宇宙。人类有7000多个平行宇宙,其中一些彼此相似,而另一些则截然不同。这种巨大的多样性是人类思维的灵活性和精致性创造的奇迹。我相信,对人类认知世界的理解越深,对人性的理解就越好。”

Skype Translator:实时语音翻译神器能否解除“巴别塔魔咒” ?

如果互联网发展的基本逻辑是更好地连接全人类,形成一个巨大的村庄,那么语言可能是最后的技术障碍。在此之前,图片作为世界上的通用语言,在社会应用中发挥了巨大的作用——无论哪个国家,笑就是笑,哭就是哭。当然,表情符号也起到了类似的作用——你知道,有人真的用表情符号聊了45分钟。

因此,可以肯定的是,当人类联系在一起,打破语言障碍,更好地相互理解时,“地球村”的新篇章将会揭开。

最后,我想说的是,对于那些没有通过大学英语四级考试的学生来说,你可能真的很幸运。

来源:彭博新闻网

标题:Skype Translator:实时语音翻译神器能否解除“巴别塔魔咒” ?

地址:http://www.pks4.com/ptyxw/4494.html