计算机辅助翻译实践

作 者: 王华树
英文书名: A Practical Guide to Computer Aided Translation 
出 版 社: 国防工业出版社 出版时间: 2015-08-01
ISBN: 978-7-118-10355-7 开 本: 16开
编辑推荐

该书内容紧扣时代脉搏,语言浅显易懂,讲解条分缕析,比较全面地展现了商业翻译实践中翻译技术的系统性和综合性,对于翻译院系师生来说,这无疑是一本内容丰富、专业实用的教材或教学参考书。

本书以当前语言服务行业新特点为背景,以职业译员的翻译技术能力为主线,以计算机辅助翻译(Computer Aided Translation)技术为支点,深入浅出地阐述了翻译职业化时代译员需要掌握的翻译技术相关的知识和技能。全书共十二章,涵盖了翻译实践中的主要技术:译前的文档转换、术语提取、语料对齐、预翻译等;译中的辅助拼写、术语识别、翻译记忆工具、机器翻译、电子词典、翻译搜索工具、平行语料库等;译后的翻译质量控制、本地化排版、文档管理、本地化测试等技术;最后以案例形式阐明了翻译技术在项目启动、计划、实施、监控和收尾等阶段中的应用。

……
从第四章至第六章,本书分别介绍了国际上代表性的CAT工具——SDL Trados、DéjàVuX、Wordfast的基本操作及拓展功能,并结合具体项目深入探讨了CAT工具综合应用;上述工具在译前准备、译中处理、译后管理各环节均有重要作用,对以术语库、记忆库为代表的语言资产复用、管理等成效显著。
鉴于本地化产业异军突起,本书特设第七章“本地化翻译基础”,对本地化概念、流程、参与角色与分工等做了明确界定,并围绕常见的文档、软件、网站、多媒体、游戏、移动应用六大本地化类别作了阐述;结合Alchemy Catalyst及SDL Passolo两款本地化代表软件,以某网站本地化案例为基础,详细阐述了字串抽取、格式控制、翻译、软件测试、可视化再设计等重要环节的解决方案。
……
第十一章“多语本地化项目案例分析”系统、全面地演练了项目管理及翻译流程,从项目分析/准备、工程前处理、翻译/编辑、质量保证、工程后处理、桌面排版、软件测试及缺陷修正、项目提交/验收及存档、项目总结等方面做了阐述,并对各环节可能出现的问题给出了切实可行的解决方案。
除主流的CAT工具之外,本书特设第十二章“辅助工具在翻译实践中的综合应用”,对编码转换、格式转换、文档识别、字数统计、文档修订/比较、拼写检查、语料回收、正则表达、同步/备份等常见软件及其应用做了介绍,为一般译员、自由译者、中小型语言服务企业的技术应用提供了若干思路和参考方案。
本书从不同层面介绍了翻译技术的理论和实践,希望能够对从事翻译的学生和职业人士提供参考和借鉴,也希望本书能够为翻译技术教育的推广和普及提供方便,为国内翻译技术的研究开拓一片新的视野。

【精彩书摘】

近十年来,信息技术、人工智能、自然语言处理等的发展,特别是计算机硬件承载能力持续增长,互联网技术、云计算深入发展促使翻译技术突飞猛进,翻译系统功能不断改善,翻译行业生产力不断提高,智能化、语境化、可视化、集成化、网络协作化等特征越来越明显。可以预见,传统翻译生产方式将逐步被新技术洪流淹没,以云计算为基础架构的云翻译系统将会粉墨登场。我们认为,CAT技术呈现以下发展趋势:
一、CAT工具功能日趋整合
不同业务的需求迫使翻译技术提供商逐渐整合不同的功能模块。CAT工具从最初基本的模糊匹配和编辑功能,发展到译中自动文本输入和自动拼写检查,到译后批量质量保证,再到翻译项目切分、项目打包、财务信息统计、过程监控、语言资产管理、即时通信、多引擎机器翻译等,功能越来越多,呈现出整合趋势。如当前Across、SDL Trados、XTM等CAT工具不再局限于翻译本身,其功能涵盖技术写作、术语管理、文档管理、内容管理到翻译和产品发布等环节,体现了将翻译技术同翻译流程各环节整合的趋势。
二、CAT工具可视化程度日益提高
维基百科对可视化技术的定义是“所见即所得”(What You See Is What You Get,WYSIWYG),也即人们可在屏幕上直接正确得到即将打印到纸张上的效果,也称可视化操作。以CAT标签为例,它能隐藏待译文档格式信息,但格式越复杂,预览效果越差,甚至不能预览翻译结果,从而影响译者判断、翻译速度。目前,翻译技术同计算机图形学、计算机视觉、计算机辅助设计等多领域不断融合,正朝着可视化翻译方向发展。如在Alchemy Catalyst、SDL Passolo等类似翻译工具中,译者只须关注文本本身,并可在翻译同时实时预览本地化翻译后的位图、菜单、对话框、字串表、版本信息等标准资源,及时发现可能错误(张宵军等,2013: 114)。未来,更多的技术提供商会将可视化翻译技术无缝整合到翻译流程中,从翻译过程到项目管理,本地化工程到测试过程将实现全过程无阻力可视化,为翻译人员提供各种便利,全面优化翻译环节,节省成本,增强公司竞争力。因此,可视化本地化技术已成为国际本地化软件工具的一种诉求,未来可视化技术的发展前景十分广阔。
三、开源CAT工具异军突起
鉴于市场需求变化必定导致对翻译工具需求的变化,如何在成本范围内提高效率就成为很多用户首先考虑的问题。随着开源社区蓬勃发展,人们越发关注开源CAT系统,如Anaphraseus、Okapi、OmegaT、Translate Toolkit、Transolution、Virtaal等一大批开源工具涌入翻译/本地化市场。由于其成本低、灵活可靠、安全性高,且无需许可证,自由和开放源码软件(Free and Open Source Software,简称FOSS)越来越受欢迎。此外,开源CAT系统具备商业CAT系统兼容TMX标准、模糊匹配、术语管理等基本功能,且这些功能同封闭性商用CAT系统相比优势明显(张宵军等,2013:293)。不难预见,开源工具正在超赶商用CAT系统。2010年,IBM将多年来仅供公司内部使用的TM/2开源化,并改名为Open TM2,兼容标准TMX格式,2014年8月,Heartsome工具实现开源,这进一步增强了开源翻译技术阵营,给自由译者更多选择,很大程度上打破了昂贵商业CAT工具垄断的壁垒,这将会促进翻译行业生产效率的提高。
四、CAT+MT+PE模式广泛应用
CAT+MT+PE即“计算机辅助翻译+机器翻译+译后编辑”的简称。机译在信息化时代快速发展,在商业翻译中更是广泛应用。机译虽然批量翻译速度块,但不能很好理解自然语言,所以高质量翻译仍需要人来主导,且目前越来越多的CAT工具提供商开始实现机译引擎与CAT工具的整合。当记忆库中无匹配时,CAT系统会自动调用内置机译引擎快速给出译文,译者再根据初始译文修改,确认后的内容可及时进入记忆库,供后续循环使用。如SDL Trados 2011、Wordfast Pro、DéjàVu X2、memoQ 6、Fluency Translation Suite、Wordbee等CAT工具已将Google、Bing、Systran、Microsoft MT等主流机译引擎内置系统当中,为译者提供了非常有用的参考。Google Translator Toolkit是CAT+MT+PE的典型代表,它不仅可用Google机译直接翻译,还可支持翻译记忆和术语库,译员上传的术语库可以干涉、改善机译结果。
五、语音识别技术迅猛发展
鉴于运用语音识别能根据声音指令创建、编辑、修订、保存翻译文档,未来Web3.0时代,语音识别和即时语音翻译技术将会极大发展(王华树,2013)。目前,Siri、Vocre、SayHi Translate、百度语音助手、搜狗语音助手、讯飞灵犀语音助手等智能语音翻译及应答系统如雨后春笋迅速蔓延移动应用市场,通过识别用户语音的要求、请求、命令或询问正确响应,既能克服人工键盘输入速度慢,极易出错的缺点,又有利于缩短系统反应时间,如译员利用Via Voice、Dragon Naturally Speaking、Express Dictate、FreeSpeech等语音软件翻译文本初稿的同时,TM系统可对具体词或短语进行匹配。
从商用领域看,近年来Microsoft、IBM、Philips、Motorola、Intel、L&H、DragonSystem等公司斥巨资研发相关产品,较成熟的系统有IBM的Via Voice和Microsoft的SAPI,这些都是面向非特定人、大词汇量的连续语音识别系统,如经充分训练,Via Voice识别率可达93%。2012年10月,微软研究院主席瑞克•拉希德在“21世纪的计算大会”上演示了即时英译汉口译系统,利用“深层神经网络(Deep Neural Network)”技术模拟人脑,可将英语口语译成中文口语,同时还能保留语调和节奏,翻译准确率达80-90%,不愧为智能语音翻译技术发展新方向。

王华树,北京师范大学翻译学在读博士,北京大学MTI教育中心特聘翻译技术教师,中国翻译协会语言服务能力培训与评估专家委员会成员,全国高等院校翻译专业师资培训班翻译技术讲师。曾在Lionbridge、Symbio、IGS 等国际化企业从事翻译/本地化工程、本地化测试、本地化培训与咨询等工作,具有多年的翻译/本地化项目实战经验以及翻译技术教学经验,先后受邀到北师大、北外、北航、北语、西外等三十多所高校做专题讲座,曾为德勤中国、文思海辉、华为、中航工业、中国对外翻译出版公司等二十多家企事业单位提供翻译技术培训和咨询。

近年来,在《中国翻译》、《上海翻译》、《中国科技翻译》、Journal of Translation Studies 等学术期刊发表论文三十余篇;参与“自然语言处理和语料库技术在我国高校翻译教学中的应用(10YJC740124)”、“现代语言服务行业的术语管理体系研究(14YJC740086)”、“现代语言技术体系研究(14WYB015)”等八项省部级科研课题;合著出版《翻译项目管理实务》和《计算机辅助翻译:理论与实践》。研究方向:应用翻译理论、现代翻译技术、翻译项目管理等。
第一章 新时代的语言服务及人才培养
第一节 语言服务产业链
一、产业链组成
二、产业链角色分工
第二节 语言服务行业的变化
一、语言服务需求的变化
二、翻译技术和工具的改进
三、翻译流程的改善
四、翻译模式的变化:以众包翻译为例
五、翻译标准的改变和质量要求的提高
第三节 译者能力现状及培养
一、译者素质的认识与深化
二、产业视角下的译者能力——专业与复合
三、西方高校翻译教育设置
四、中国翻译教育困局及改革思路
第四节 信息化时代的语言服务人才
一、语言能力
二、专业知识
三、项目管理能力
四、信息技术
五、职业素养
本章思考题
参考与拓展阅读文献
第二章 搜索与翻译
第一节 网络搜索与翻译
一、搜索基本概念
二、基本检索技术
三、Google搜索与翻译
第二节 语料库搜索与翻译
一、语料库概念
二、语料库在翻译中的应用
三、综合利用Google和语料库
第三节 桌面搜索与翻译
一、Everything
二、百度硬盘搜索
三、Search and Replace
第四节 译者参考资源
一、桌面电子词典
二、双语句库
三、语料库
本章思考题
参考与拓展阅读文献
第三章 计算机辅助翻译技术概论
第一节 计算机辅助翻译基本概念
一、什么是计算机辅助翻译
二、什么是机器翻译
第二节 计算机辅助翻译技术
一、基本原理及流程
二、主要技术
三、主要标准
四、CAT工具五大作用
五、对待CAT技术的正确态度
第三节 主流计算机辅助翻译工具
一、CAT工具分类
二、国外常见CAT工具
三、国内常见CAT工具
四、如何选择合适的CAT工具
第四节 计算机辅助翻译发展趋势
一、CAT工具功能日趋整合
二、CAT可视化程度日益提高
三、开源CAT工具异军突起
四、CAT+MT+PE模式广泛应用
五、语音翻译技术迅猛发展
六、云驱动技术日益强劲
本章思考题
参考与拓展阅读文献
第四章 SDL Trados基本应用
第一节 系统介绍
一、基本介绍
二、基本信息
三、常用功能
第二节 翻译案例操作
一、项目流程
二、步骤详解
本章思考题
第五章 Déjà Vu基本应用
第一节 系统介绍
一、软件特色
二、视图介绍
第二节 系统基本信息
一、翻译记忆库
二、术语库
三、词典
四、语料对齐/回收
五、质量保证
六、汇编
七、扫描
八、自动图文集
九、传播
第三节 基本操作示例
一、软件基本设置
二、创建项目
三、创建翻译记忆库
四、创建术语库
五、字数统计
六、预翻译和伪翻译
七、翻译
八、质量保证QA
九、生成译文
第四节 技术优势与不足
本章思考题
第六章 Wordfast基本应用
第一节 系统介绍
一、软件简介
二、界面概览
第二节 软件基本信息
一、支持语言
二、支持格式
三、翻译记忆库
四、术语库
五、机器翻译
六、语料对齐/回收
七、质量检查(QA)
八、其他功能
第三节 翻译案例演示
一、创建项目
二、创建翻译记忆库
三、创建术语库
四、相关设置
五、分析和预翻译
六、翻译
七、质量保证
八、生成译文
第四节 软件评价
一、业界评价
二、用户评价
三、技术展望
本章思考题
第七章 本地化翻译基础
第一节 本地化概述
一、本地化概念
二、本地化与翻译
三、一般本地化流程
四、本地化服务角色构成
第二节 本地化项目主要类型
一、文档本地化
二、软件本地化
三、网站本地化翻译
四、多媒体本地化
五、游戏本地化
六、移动应用本地化
第三节 本地化技术和工具应用
一、本地化技术概述
二、本地化工具概述
三、案例演示:Alchemy Catalyst本地化实战
四、案例演示:SDL Passolo本地化实战
五、常见的本地化类型处理方法
第四节 网站本地化翻译案例分析
一、项目概况
二、项目分析和工程处理
三、项目计划
四、项目实施
五、网站测试
六、项目总结
第五节 本地化行业发展趋势
本章思考题
参考与拓展阅读文献
第八章 字幕翻译
第一节 字幕翻译基础
一、字幕翻译的定义
二、字幕翻译的意义
三、字幕翻译的种类及特点
四、字幕翻译流程与方法
第二节 字幕处理工具
一、常见字幕翻译工具
二、字幕制作和编辑工具
三、字幕制作与翻译实例
第三节 字幕翻译困境及计算机辅助翻译解决方案
一、字幕翻译面临的主要问题
二、计算机辅助翻译技术在字幕翻译中的应用
附 字幕翻译风格指南
本章思考题
参考与拓展阅读文献
第九章 翻译质量控制
第一节 翻译质量定义
一、质量定义
二、翻译质量定义
三、翻译质量管理
第二节 影响翻译质量的相关因素
一、原文
二、时间
三、成本
四、人员
五、语言资产
六、流程
七、技术
八、客户需求
第三节 翻译(服务)标准概述
一、LISA QA Model
二、中国翻译服务规范
三、其他主要翻译服务标准
第四节 翻译项目中的质量管理
一、从项目实施过程看质量管理
二、从质量保证影响层次看质量管理
第五节 翻译质量保证工具
一、ApSIC Xbench
二、DéjàVuX中的QA模块
三、Error Spy
四、L10N Checker
五、QA Distiller
六、SDL Trados QA Checker 3.0
第六节 翻译质量检查工具评价
一、优势
二、局限
三、总结
本章思考题
参考与拓展阅读文献
第十章 语言资产管理
第一节 语言资产基本概念
一、资产和语言资产
二、语言资产范畴
三、语言资产管理现状
第二节 术语管理
一、术语库交换标准
二、翻译项目中的术语管理
三、术语管理工具
四、memoQ术语管理应用案例
第三节 记忆库管理
一、翻译项目中的记忆库
二、记忆库的主要设置
三、记忆库管理注意事项
第四节 翻译文档管理
一、文档管理的重要意义
二、翻译文档管理注意事项
三、翻译文档管理案例
四、常见的文档管理工具
第五节 语言资产的集中管理
一、分散式管理的问题
二、集中式管理的优势
三、Lionbridge Translation Workspace 语言资产管理系统
四、SDL TeamWorks管理系统
本章思考题
参考与拓展阅读文献
第十一章 多语本地化项目案例分析
第一节 项目分析、准备
一、项目特点
二、工作量估算
三、制定时间表
四、确定本地化工具
五、安排项目相关人员
第二节 工程前处理
一、分析资源文件
二、提取翻译资源
三、字数统计
四、准备相关文档及参考资料
五、准备翻译包
第三节 翻译、编辑
一、翻译
二、编辑审阅
第四节 质量保证
一、语言部分的检查
二、工程部分的检查
三、其他角度的质量控制
四、质量检验结果及对策
第五节 工程后处理
一、.lspkg文件的后处理
二、.docx文件的后处理
三、.chm文件的后处理
第六节 桌面排版
一、检查并熟悉文件
二、排版准备
三、排版
四、语言签发(LSO)检查
第七节 本地化软件测试及缺陷修正
一、常见缺陷类型
二、缺陷管理流程
三、缺陷修复辅助工具
第八节 项目提交、验收及存档
一、提交的时间点
二、项目提交标准
三、提交物
四、提交工具
五、项目存档
第九节 项目总结
一、项目特点及存在的问题
二、问题应对及解决方案
参考与拓展阅读文献
第十二章 辅助工具在翻译实践中的综合应用
第一节 编码转换
一、国际通行码
二、中文编码
三、乱码及处理
第二节 格式转换
一、Adobe Acrobat
二、Solid Converter PDF
第三节 文档识别
一、ABBYY FineReader
二、Readiris Pro
三、汉王文本王文豪7600
第四节 字数统计
一、PractiCount and Invoice
二、AnyCount
第五节 文档修订和比较
一、MS Word
二、Beyond Compare
第六节 拼写检查
一、Spell Check Anywhere
二、黑马校对
第七节 语料回收
一、SDL Trados WinAlign
二、Déjà Vu X Alignment Tool
第八节 正则表达式
一、基本概念
二、主要用途
三、在翻译工作中的应用
第九节 文档同步备份
一、FileGee
二、Second Copy
本章思考题
参考及拓展阅读文献
附录I 本地化业务基本术语
附录II 常见的CAT工具
附录III 常见的翻译管理系统
附录IV 常见HTML元素列表
附录V 常见的文件格式
分工和致谢
商品评价