编辑: 于世美 | 2017-09-24 |
pku.edu.cn/doubtfire/
2 提纲 ?
1 机器翻译概述 ? 分类、基本方法、实现策略 ?
2 机器翻译技术 ? 2.1 基于规则的机器翻译 ? 2.2 基于实例的机器翻译 ? 2.3 基于统计的机器翻译 ?
3 机器翻译评测
3 1 机器翻译概述 ? Machine Translation (MT) 机器翻译 用计算机实现从一种自然语言文本(源语言/source language)到 另一种自然语言文本(目标语言/target language)的翻译
4 按需求分类 ? 传播信息(dissemination) ? 浏览信息(assimliation) ? 交流信息(interchange) ? 查询信息(information access) Hutchins, John, 1999, The Development and use of Machine Translation system and computer-based translation tools, In Proceeding of International Conference on MT &
Computer Language Information Processing, 1999.6.26-28. Beijing ? 出版/信息发布 ? 网页翻译 ? 实时/多语聊天室 ? 跨语言信息检索 Note: 对于不同的需求,机器翻译系统的设计应该有针对性, 同时对系统的要求也会有所不同
5 按人-机关系分类 ? Fully Automatic Machine Translation (FAMT) 全自动机译 ? Human Assisted Machine Translation (HAMT) 人助机译 ? Computer Aided Translation (CAT) 机助人译
6 按实现策略分类 ? 针对受限语言的机器翻译 ? 面向受限领域的机器翻译 ? 通用机器翻译系统 Xerox , Boeing 等大公司都使用受限英语(或simplified English)来撰写技术文档,以及 进行技术手册的机器翻译 俞士汶,1995,《关于受限的规则汉语的设想》,载王均主编《语言现代化论丛》,山 东教育出版社,1995年,pp193-205 张伟,1998,《受限汉语辅助写作系统的构想》,载《计算机世界报》1998年4月13日, 第13期D版技术专题
7 按技术方法分类 ? 直接翻译法 ? 转换法 ? 中间语言法 理性主义/基于规则 的MT方法(RBMT) 经验主义/基于语料 库、基于统计的MT 方法 ? EBMT ? Translation Memory ? Pattern-based MT ? Statistical approach to MT
8 中间语言法( Interlingua ) 语言1 语言2 语言4 语言3 语言1 语言2 语言4 语言3 中间 语言 (1) (2) 中间语言的例子:世界语,人工定义的语言等
9 转换法(Transfer)
10 RBMT的一般图示 源语言词串 源语言句 法结构 源语言语 义结构 中间语言(知识表示) 目标语言 语义结构 目标语言 句法结构 目标语言词串 语义 转换 句法 转换 词汇 转换 分析部分 生成部分
11 综合型机器翻译系统(multi-engine MT) 规则引擎 实例引擎 词汇直译引擎 源语言 片段重组 &
总体评分 目标语言 …… Christopher Hogan, Robert E. Frederking, 1998, An Evaluation of Multi-engine MT Architecture, In Machine Translation and the Information Soup, pages 113-123, Third Conference of the Association for Machine Translation in Americas (AMTA'
98), Langhorne, PA. USA, October http://www-2.cs.cmu.edu/afs/cs.cmu.edu/user/chogan/Web/Publications.html
12 2.1 基于规则的MT 她把一束花放在桌上. She put a bunch of flowers on the table. 她/r 把/p-q-v-n 一/m-d 束/q 花/n-v-a 放/v 在/p-d-v 桌/n 上/f-v ./w 她/r 把/p 一/m-d 束/q 花/n 放/v 在/p-v 桌/n 上/f-v ./w Segmenter/POS Tagger filter
13 对源语言进行句法分析 parser 她/r 把/p 一/m-d 束/q 花/n 放/v 在/p-v 桌/n 上/f-v ./w Rule Base Lexicon 她把一束花放在桌上.np mp np sp pp pp vp vp dj zj np
14 从源语言结构树到目标语言结构树 p r v 她把一束花放在桌上.np mp np sp pp pp vp vp dj zj np R/她NP/np SS/zj CS/dj VP/vp VP/vp NP/pp PP/pp V/放#/p PP/sp P/上N/桌#/p NP/np NP/mp P/# NP/np T/一N/束of N/花W/.