羽绒服的英文翻译英语怎么说-特梅尔


2023年3月30日发(作者:reliable名词)

自然语言处理之统计派

整个20世纪80年代,自然语言处理的研究乏善可陈。在1988

年的计算语言学会议上,IBMTJWatson研究中心机器翻译小组发表

了统计机器翻译的论文,并推出法语/英语的翻译系统CANDIDE,这羽扇纶巾

标志着统计派在大数据的支诗成泣鬼神 持下又回来了。两年后,同一小组又在《计

算语言学》杂志发表论文对他们的沪深300指数 工作做了更加理论性的概括。他们

的语料是加拿大议会的会议纪要。这两篇划时代的文章虽不长,却有

8个作者之多,贾里尼克(FrederickJelinek)是这个小组的核心。贾

里尼克的学术训练是信息论,统计是他们这一派人最自然的工具。他

的金句是:“我每开除一名语言学家,我的语音识别系统的性能就提

高一点。”能让全班哄堂大笑的笑话 火药味十足。

IBM赏识的近义词 小组的成员之一柯克(JohnCocke)因为RISC架构在1987

年就得了图灵奖。也正因此,他在其他方面的贡献被忽视了,例如,

他就是著名的上下文无关文法分析算法CYK的“C”。他在图灵奖的致

辞中说,计算机性能的提升主要源于三个方面:算法、编译器和体系

结构。这三个方面是按女主美到极致娇软的古言 重要性大小排序的,但他的名声却主要来自于

他认为重要性最小的体系结构。草树知春不久归百般红紫斗芳菲的意思 毫无疑问,他对自然语言的兴趣来自

他对编程语言的关注。

其实最早提出墨梅古诗朗读 机器翻译的韦弗(WarrenW感遇张九龄拼音版 eaver)的思路就是统

计。但乔姆斯基登场后,统计方法基本就没饭吃了。乔姆斯基的理由

很简单,语言的可能性是无限的,统计不可能解决问题。乔姆斯基对

统计方法的排斥,恰似波普尔对卡尔纳普归纳法的批判。乔姆斯基不

喜欢统计派的一个理由是他们太像行为主义了:在翻译的统计方法

中,平行语料的左边就是刺激,右边就是反射。

CANDIDE虽有突破,但相较传统方法,性能优势并不明显。2004

年,已在南加州大学的信息科学研究所(ISI)干了两年博士后的德国

人欧赫(FranzJosefOch渡汉江古诗原文及翻译 )加入谷歌。他在亚琛工业大学的博士论文

就是用大量平行语料构建语言模型和翻译模型。谷歌海量的数据让欧

赫如鱼得水。谷歌翻译器迅速成为行业标杆,在NIST随后组织的机

器翻译测试中一直名列前茅。2014年欧赫在谷歌呆了十年后先后加

入两家基因测序公司。

统计方法的另一个好处是工程师根本不需要语言学知识,也不需

要懂源语言或目标语言,就可从事机器翻译。谷歌翻译团队就没什么

科班出身的语言学家。欧赫认为语言学知识对翻译没什么用处,有时

还会起反作用。

更多推荐

cyk是什么意思在线翻译读音例句