Construction of a Parallel Corpus of English-Chinese Terms in Agriculture and Forestry
-
摘要: 专门用途的英汉语平行语料库目前在双语平行语料库的发展中具有很大潜力, 但是各专业领域的双语平行语料库均处于探索构建的初期阶段。对农林英汉术语平行语料库建设的背景和意义做了分析, 探讨了建库思路、语料收集及标记加工技术。希望为农林领域从业者、译员、论文写作者的相关工作提供帮助, 同时能够提高本校翻译硕士农林英汉翻译课程的质量和学生的农林英汉语翻译能力, 并为今后建设更大规模的农林英汉语平行语料库提供借鉴。Abstract: The English-Chinese parallel corpuses for special purposes are currently tendency in the construction of English-Chinese parallel corpuses, and it is still in its infancy. This study analyzes the background and significance of constructing a parallel corpus of English-Chinese terms in agriculture and forestry, and discusses the construction plan, data collection, terms' marking and searching in the corpus. It is expected that the corpus may provide assistances for practitioners, translators, and researchers in agriculture and forestry, meanwhile, may improve the quality of a MTI course English-Chinese Translation in Agriculture and Forestry as well as the translation competence of MTI students, and may offer a reference for further constructing larger English-Chinese parallel corpus in agriculture and forestry.
-
平行语料库按翻译方向的不同有单向平行语料库(uni-directional parallel corpus)、双向平行语料库(bi-directional parallel corpus)和多向平行语料库(multidirectional parallel corpus)三种形式。英汉平行语料库(parallel corpus)是由原文文本及其平行对应的译语文本构成的英汉双语语料库, 其对齐程度可有词级、句级、段级和篇级几种。根据使用目的不同, 可分为通用英汉平行语料库和专门用途英汉平行语料库。
桂诗春等[1]认为“语料库的开发正向两头快速发展和延伸”, 一头是“通用型的、基于网络的超大型语料库”, 一头是“个性化、专门化、行业化的小型语料库”。笔者统计发现, 目前国内外通用英汉平行语料库发展迅猛, 而且在“翻译普遍性、翻译文体、翻译过程、应用研究、语料库翻译方法及翻译语料库创建与应用等诸多方面取得了研究成果”[2]。目前, 国内外已有多个通用英汉平行语料库建成, 如英国伯明翰大学建立的中英对应语料库COBUILD、英国兰卡斯特大学的英汉语料库LCMC、香港城市理工大学对比语料库LIVAC、北京外国语大学中国外语教育研究中心的通用汉英对应语料库PCCE、北京大学汉语语言学研究中心的汉英双语语料库CCL、北京大学计算语言学研究所的汉英(包括汉日)双语语料库、中国译典编辑部开发的中国译典、哈尔滨工业大学的英汉双语语料库等, 很多语料库都实现了句子、短语、词汇三级双语对齐。
但相比之下, 专门用途的英汉平行语料库数量较少、规模较小, 如香港法律英汉双语对齐语料库BLIS、外研社的英汉文学作品语料库、冯友兰《中国哲学史》汉英对照语料库、国家语言文字工作委员会语言文字应用研究所计算机专业的双语语料库及柏拉图哲学名著《理想国》的双语语料库、绍兴文理学院中国法律法规汉英平行语料库等。作为专门用途英语语料库分支之一的农林英语语料库, 尤其是平行语料库更是寥寥无几, 如华中农业大学建设的农科学术英语论文语料库[3]、西北农林科技大学建立的FAO农业英语语料库[4]、王景怿主持开发的英汉-汉英双语畜牧业小型语料库[5]。研究农林英语语料库建设的学者也屈指可数, 如栗娜[6]、范晶晶等[7]。鉴于农林英汉平行语料库建设领域比较薄弱, 本文将探讨农林英汉平行语料库, 尤其是术语平行语料库的建设意义, 并介绍本农林英汉术语平行语料库的建设思路、语料收集和标记搜索过程, 以期为今后建设更大规模的农林英汉平行语料库提供借鉴。
一. 农林英汉平行语料库及术语平行语料库的建设意义
建设农林英汉平行语料库及术语平行语料库的第一要义是促进我国与世界的农业交流。中国数千年以来一直是农业大国, 农业是我国的第一产业。虽然近些年随着国民经济的发展, 农业经济的比重在不断下降, 但农业仍然是国民经济发展的重要基础, 而且日益凸显出其在整个经济系统中其他产业无法替代的作用。近年高新科技及网络技术在农业领域的应用飞速发展, 形成精准农业、基因农业、工厂化种养业、以生命科学为基础的生物产业, 一批批农业专利、大量的农业最新科研成果都需要通过英文为世界所知并进行交流。同时, 中国农业与西方发达国家的现代化农业相比还有一定差距, 也要借鉴发达国家农业种植的经营技术和理念。所以, 中国农业领域内的英汉互译内容和需求将非常庞大。然而, 精通农业知识兼英语的高尖端复合型翻译人才极为匮乏, 以至于很多最新研究成果无法及时准确地与世界交流, 无法更好地借鉴西方现代化农业技术并进行合作, 这无疑妨碍了中国农业走向世界并和世界农业进行交流接轨。在这种情况下, 建设农林英汉平行数据库就显得极为必要。涵盖领域广泛的数据库可以帮助国内农林领域学者和从业者更准确、方便地了解西方农林科技成果, 并将自己的学术成果更准确、更高速地转化成英文形式。
农林英汉术语平行数据库具备关键作用。Peter Newmark指出, 尽管术语只占全文约5% ~ 10%, 但是它们却构成了科技英语翻译与其他文体翻译的根本区别。科技术语往往指代翻译文本中最核心的内容, 是篇章中的主体, 因此应具有准确性、规范性和统一性[8]。以往的翻译经常会出现一个术语有几种不同的翻译, 或者一个翻译的术语可能指代不同的概念, 造成交流的障碍和工作的困难。农林英汉术语平行数据库的建立, 就是为统一、规范术语的翻译, 澄清以往的混乱, 避免新的问题。
上文提到精通农业知识兼英语翻译的人才匮乏问题, 农林英汉(术语)平行语料库能在翻译硕士专业学位(Master of Translation and Interpreting, 简称为MTI)人才培养中发挥很大作用。《翻译硕士专业学位设置方案》提出的培养目标为:“为适应我国改革开放和社会主义现代化建设事业发展的需要, 促进中外交流、培养高层次、应用型高级翻译专门人才。”[9]据此, 各MTI培养单位在开设具有统一性和普适性的专业课程外, 还应以本区域翻译市场的中长期预测为基础, 开设特色的专业课程。国内许多学者如王志伟[10]、祝朝伟[11]、苗亚男[12]、丁素萍等[13]对国内或国外MTI课程设置进行单独或对比研究后得出相似结论。根据这一指导方针, 北京林业大学不仅开设了核心翻译课程, 还开设了农林英汉互译课程, 以期培养具有农林院校特色、强化职业翻译能力[14]的翻译人才。值得关注的是, 王志伟在研究了美国27所高校翻译硕士的培养课程后列出了美国应用翻译研究的主要领域、笔译及口译方向的课程设置, 但其中并没有与农业相关的课程。究其原因是美国的社会经济高度工业化、服务化、信息化, 尽管其农业生产方式和生产力水平都处于世界最发达之列, 但不是支柱经济。所以美国对农业领域翻译人才的需求量小, 高校一般没有设置相关翻译课程。而中国却恰恰相反, 急需大量农林高级翻译人才, 所以各MTI培养机构, 尤其是农林院校应该考虑开设农林类相关翻译课程。这无疑非常符合市场驱动下的翻译硕士培养模式[15]。
MTI农林英汉互译课程和农林英汉(术语)平行语料库互为促进。数据库的建立可以为农林英汉翻译类词典编撰和教材编写等提供大量真实语料, 此外, 还可以促进农林类英汉课程开发高质量的授课内容, 给授课教师提供可选择的鲜活、真实、权威的教学材料。一般而言, 理想的MTI专门用途英汉翻译课程的授课教师最好既精通英汉语言及其翻译理论和技巧, 又精通该门课程所涉及的相关专业知识, 同时在该领域有大量翻译的实战经验。实际上, 目前MTI培养机构这类复合型翻译教学师资数量不尽如人意, 专门用途英汉语翻译课程一般由仅具备英语教育背景的教师承担。很多培养机构高薪外聘行业内专门用途英汉翻译的优秀教师或翻译人员授课, 以解决这一问题。专门用途英汉平行语料库的建设可以缓解目前MTI培养机构面临的行业翻译师资不足的窘境, 使得只有英语和翻译教育背景的教师得以开设, 并高质量地完成行业英汉翻译课程的教学任务。王克非[16]、吴苌弘[17]等学者的研究已充分证实了数据库对翻译教学的巨大促进和支撑作用。
在农林类翻译课堂或课下, 学生也可在教师指导下或者个人兴趣驱动下以个人或小组形式进行自主学习, 研究和讨论语料库中所选定语块的语篇、句法、词汇(如搭配、选词等)等内容。学生可从大量语料中观察、总结某一语言现象的使用和翻译规律, 同时涉猎相关专业知识, 以拓展和提高自己的专业翻译能力。早在多年前, 就有学者提出:“在经济大潮中, 绝大多数用人单位需要一专多能、富于机动应变的复合型、应用型人才”[18], 在当今快速发展和高度信息化的社会, 一专多能的复合型翻译人才更是社会需求的主流。
二. 农林英汉术语语料库的建设
本研究探讨农林英汉术语平行语料库的建设, 以期为以后建设大型的农林英汉平行语料库提供借鉴。所以, 计划建设的术语语料库是一个小型样本术语语料库。
一 整体设计
本研究设计为术语样本语料库。由于语料来源和人力的限制, 初期仅选择农林英汉翻译中最具代表性的术语, 建设一个小型术语样本平行语料库, 以期为以后建设更大规模的农林英汉平行语料库做准备。所以, 在开始阶段并没有规定语料库语料的多少, 只是制定了收集语料应遵循的系统性(systematic)、同质性(homogeneous)和专用性(specialized)原则[19]。其次, 根据《中华人民共和国学科分类与代码国家标准》 《中国图书馆分类法:农业专业分类表》[20]和《中国大百科全书:农业1 ~ 2卷》[21]对大农业(上文所述“农业”均为“大农业”概念)进行分类, 先将其在一级水平分为农业、林业、畜牧业、渔业、副业5大类, 然后再细分为二级分支及二级内容下的三级分支。随后做语料收集, 主要涉及两个问题:一是语料的质量(包括原文质量、译文质量和语料保存的规范性), 二是语料获取渠道。语料库是开放的, 有高质量的农林类英汉翻译语料可以随时添加并标记加工。然后, 对收集到的语料进行处理和标记。最后, 验证数据库术语检索的准确性。
二 语料收集与标注检索
鉴于本研究中大农业分类的层级多(三级)和科目多, 几乎涵盖了大农业的每个典型学科, 如果每个子目录里都能统计出或尽可能多地统计出专业术语, 就要求语料题材越丰富越好。为了保证语料的质量和可获得性, 选取的语料都是作者在多年教授农林英汉互译课程时收集和精选的内容, 题材涉及城市农业、无土栽培、有机农业、转基因农业、食品、农业机械、动植物、林学、林业经营管理、园林、花卉、生态旅游、碳汇、环境保护等领域, 文体涉及说明文如动植物介绍, 议论文如学术论文, 应用文如广告、公约、统计报告、通知等。英译汉语料约占2/3, 汉译英语料约占1/3, 共计13万字。所有译文语料质量的可信度高, 都是学生先个人翻译, 然后小组集体讨论修改生成小组译文, 最后任课教师再改进形成最终译文。
语料收集完毕后, 按照以下步骤完成术语的标注和检索。①先以语篇为单位将中英文语料分别放到word文档里批量分句处理, 然后在TXT文档里合成, 实现原文和译文句句平行对齐, 最后分别生成一个中文TXT语料文件和一个英文TXT语料文件。②原文和译文语料无论长短, 以语篇为单位对原文资料标题、原作者、出处、译文资料标题、译者进行标注。③利用斯坦福大学开发的多语标注软件NLP对句中术语及其对应句中的术语译文进行标注。④利用检索工具AntConc先把中文和英文TXT文件分别加载到工具里, 然后在Search Term中输入检索术语, 检索即可得中英文术语对应的译文。结果示例如表 1所示。
表 1 语料库检索结果示例如果搜索一个术语后显示有多个译文, 最高频的译文会连同所在句子一起全部出现在最前面, 接着是次高频的译文, 以此类推。本样本术语语料库会在以后农林英汉互译课程的进行和后续建设中不断扩大, 加入更多学生翻译的高质量语料和通过有效途径获得的其他语料。
三. 结论
术语翻译是行业翻译中的难点, 也是译者翻译时必须面对和处理的问题。农林英汉术语平行语料库可以将某一术语的所有译文从高频到低频以句子语境的形式展现, 给译者一个快速的参考和选择。可以为农林领域的译者、论文写作者等提供翻译和学习的便利, 也可为MTI相关课程的学习者提供翻译和学习便利, 因为“MTI培养术语能力是满足行业需求的需要”[22]。可以预期, 它也将会为更高层面的农业双语翻译提供实证性研究和理论研究的语料, 为农林英汉语料库开发和应用理论的研究提供素材。本研究以后还将进一步扩大本语料库的规模, 并在此基础上建立农林英汉语平行语料库。
-
表 1 语料库检索结果示例
-
[1] 桂诗春, 冯志伟, 杨惠中, 等.语料库语言学与中国外语教学[J].现代外语, 2010(4): 419-426. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=xdwy201004012 [2] 杨梅, 白楠.国内语料库翻译研究现状调查[J].中国翻译, 2010(6): 46-50. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=zhongguofy201006010 [3] 刘萍, 黄小倩, 刘珊.农科学术英语论文语料库的创建[J].语料库语言学, 2015 (2): 97-105. http://www.cnki.com.cn/Article/CJFDTotal-YLYY201502009.htm [4] 王敏, 李丽霞. FAO农业英语语料库的建设和应用[J].外语教学与研究考试周刊, 2014(65):83-84. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=kszk201465076 [5] 王景怿.英汉———汉英双语畜牧业小型语料库建设及相关翻译研究初探[J].语文学刊·外语教育研究, 2015(2): 51-52. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=ywxk-wy201502024 [6] 栗娜.浅谈农业学术英语语料库建设思路及设想[J].高教学刊, 2015(18): 261-262. http://www.cqvip.com/QK/87028A/201518/665575856.html [7] 范晶晶, 李丽霞.农业学术英语语料库建设构想[J].安徽农业科学, 2014(7): 2169-2170. doi: 10.3969/j.issn.0517-6611.2014.07.101 [8] NEWMARK P. A textbook of translation[M].上海:上海外语教育出版社, 2002: 160. [9] 国务院学位委员会.关于下达《翻译硕士专业学位设置方案》的通知[J].学位, 2007(11):1. doi: 10.3969/j.issn.1001-960X.2007.11.001 [10] 王志伟.美国应用型翻译人才培养及其对我国MTI教育的启示[J].外语界, 2012(4): 52-60. http://www.cnki.com.cn/Article/CJFDTotal-WYJY201204008.htm [11] 祝朝伟.基于翻译能力培养的MTI课程设置研究[J].外语界, 2015(5): 61-69. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=wyj201505008 [12] 苗亚男.理工类院校英语本科与翻译硕士(MTI)课程设置比较研究[J].上海翻译, 2016 (4): 57-60. doi: 10.3969/j.issn.1672-9358.2016.04.011 [13] 丁素萍, 吴自选, 罗宪乐, 等.理工科院校翻译专业学位(MTI)的课程设置的理论认知和实践模型[J].山东外语教学, 2012(6): 102-108. doi: 10.3969/j.issn.1002-2643.2012.06.017 [14] 冯全功, 张慧玉.以职业翻译能力为导向MTI笔译教学规划研究[J].当代外语研究, 2011(1): 33-38. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=kjyyxx201106008 [15] 曹进, 靳琰.生死场驱动下的翻译硕士培养模式———以西北师范大学为例[J].中国翻译, 2016(2):50-55. http://www.cqvip.com/QK/92822X/20162/668230805.html [16] 王克非.双语平行语料库在翻译教学上的用途[J].外语电化教学, 2004(6): 27-32. doi: 10.3969/j.issn.1001-5795.2004.06.006 [17] 吴苌弘.法律翻译教学信息化研究———基于语料库和数据库检索系统的实践探索[J].外语电化教学, 2014(11): 18-22. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=wydhjx201406003 [18] 程世禄, 张国扬. ESP教学的理论和实践[J].外语教学与研究, 1995(4): 51-54. http://qikan.cqvip.com/Qikan/Article/Detail?id=1003278358 [19] WALKER, DONALD E. The ecology of language[M]// ZAMPOLLI ed. Current issues in computational linguistics: in honour of don walker. Pisa: Giardini Editori E Stampatorie, 1994: 366-370.
[20] 《中国图书馆分类法》编委会, 中国农业科学院科技文献信息中心.中国图书馆分类法: 农业专业分类表[S].北京: 北京图书馆出版社, 1999. [21] 中国大百科全书出版社农业卷编委会.中国大百科全书: 农业1 ~ 2卷[S].北京: 中国大百科全书出版社, 1990. [22] 冷冰冰, 王华树, 梁爱林.高校MTI术语课程构建[J].中国翻译, 2013(1): 55-59. http://www.wanfangdata.com.cn/details/detail.do?_type=perio&id=zhongguofy201301008 -
期刊类型引用(7)
1. 闫胜琦,姚雪丽. 农业科技汉英双语平行语料库的建设与应用. 农机市场. 2023(04): 56-58 . 百度学术
2. 韩名利. 农学翻译教学语料库的建设与应用构想. 海外英语. 2023(08): 54-56 . 百度学术
3. 焦丹,叶胜华,赵鹏. 基于国家粮食安全的粮食专门用途多语语料库研制. 河南工业大学学报(社会科学版). 2021(04): 7-12 . 百度学术
4. 陈建明,王炤. 河西走廊红色旅游资源汉英平行语料库构建. 现代英语. 2020(03): 112-114 . 百度学术
5. 王翊,张瑞娥,韩名利. 农科学术论文摘要汉英语料库建设与应用前景. 山东农业大学学报(社会科学版). 2020(04): 149-156 . 百度学术
6. 李家元. 高职农业类专业行业英语语料库建设与应用. 河南农业. 2019(24): 31-32 . 百度学术
7. 张律. 农业学术英语语料库建设思路探索. 海外英语. 2019(22): 7-8 . 百度学术
其他类型引用(3)
计量
- 文章访问数: 1183
- HTML全文浏览量: 163
- PDF下载量: 113
- 被引次数: 10