牛津英语大辞典(以下简称OED),是牛津大学出版社(以下简称OUP)的品牌产品,自1884年出版至今已经有130多年的历史,不仅极大地增强了牛津大学出版社的品牌和学术出版影响力,也成为OUP迄今为止运转时间最长、最成功的学术项目之一。它的每次技术变革都为世界出版界和辞典使用者所瞩目,其数字化转型发展的成功实践也为业界提供了有益启示,值得认真研究借鉴。
一、OED的数字化发展历程
在130多年的时间里,OED的数字化发展经历了三个重要阶段:光盘版、在线版和智能编辑系统。随着技术变革,从书稿到出书的线性化模式被彻底颠覆,OED成为基于多任务平台、内容整合与链接,能实现网上信息接入与检索的高速数字信息传递系统。
第一阶段 :光盘版(CD-ROM)(1982~1992)
OED当时面临的主要挑战是如何为学者、用户及出版社创造更大的价值;同时,还要解决50年版权即将到期的问题。为此,它采取的主要办法是,整合增补版与第一版的内容,将增补版中的词条加入合适的位置,为读者提供便利的同时保护第一版版权。
首先是把两种文本的全部内容电子化,再利用新技术把两部分文件整合到一起进行编辑。文本标记采用当时比较创新的标准通用标示语言(SGML),由录入员输入一个约含15种主要结构标签的混合体系(如:中心词、发音、词源、词义分节、例证、例证日期、作者等)和较低水平的传统排版标记(如:以斜体标记各种不同标签或引文格式)。在这个阶段,读者可以搜索全文和一些主要元素,包括中心词、发音、词源、含义和例证等。
第二阶段: 在线版(1992~2005)
OED开始启动第三版修订计划,更新并修订每一词条,不仅收录19世纪语言的变更,同时也收录了新例证、新学术、新思想及新项目,如《中古英语辞典》(Middle English Dictionary)等。为支持这一方案,OED调整了相应的工作内容和流程,设立了一个OED在线出版发行项目,并与高线出版社(HighWire Press)开展合作。高线出版社采用Java和Perl程序语言把这些源文件保存在一个Sybase数据库中,采用定制化的Verity K2搜索引擎来搜索文章,通过“SGML至HTML”样式表和转换程序生成页面。
2000年3月,OED在线版正式上线。像许多其他采用SGML源文件的出版商一样,OUP选择以内联GIF图片来呈现这些字符,还委托制作了2,500幅手绘插图以显示1,000个左右的特殊字符;设计方面,创建了一个既易于使用又涵盖印刷版本所有特征的界面设计。
第三阶段: 辞典编辑管理系统Pasadena(2005年以后)
OED在数字化以来开发了内部编辑系统,直接保障了项目的高效顺利执行,先后经历了“整合、出版发行和更新系统”(OEDIPUS)和第二代编辑系统TESS/TED,到第三代编辑系统Pasadena的时候,逐渐成熟。
第一代OEDIPUS系统使编辑可以访问辞典数据,校对词条以实现即时核对,并且可以对文本完整性进行检查和控制,对存在明显错误的条目进行编辑变更。
第二代编辑系统适用于开放系统,如:X-windows、Unix操作系统等,此外,还创建了与TESS系统相连的新的文本编辑器TED。用户可以在辞典中检索并编辑任何词条,增强了用户与编辑的互动性。
第三代编辑系统针对用户需求,尽可能整合所有编辑功能。除数据库、搜索界面和词条编辑外,系统还包含辞典浏览器,允许向内部用户和经授权的远程用户显示词条;通过外部检索从词条中提取图书馆检索和问题请求,并在完成时把上述内容返回词条编辑。
随着新系统的出现,OUP第一次决定改变OED词条结构,使编辑可以不再必须按照字母排序进行修订,而是关注查询次数最多的词汇以及最新的资料,也可以按照词条的主题设置进行修订。这一系统的使用,极大地提高了编辑的工作效率,也使OED真正实现了为全世界用户服务,收到了良好的效果。
二、OED数字化转型成功的主要原因
1.离不开卓有成效的项目管理
项目管理是OED数字化转型成功的关键。在OED第二版项目开始时,由项目总监负责编写总体项目规划,确定项目的主要工作、相互关系、各活动需花费的时间,以及各活动所需的人力、设备和资金。这些活动具体包括:数据转换、初步校对工作、机读文本的计算机开发和自动处理、在屏幕上编辑词条、长条校样排版、最终校对工作和最终页面排版,所有工作内容都制定了详细的计划。
1984年10月,项目组起草了一份《用户需求声明》,列出项目的目标和计算机系统应执行的操作;1985年7月,计算机团队公布了一份系统设计大纲,完成计算机系统的初步设计之后,构建和运行该系统所需的时间被加入计划,并制定了规定各项工作完成时间的严格“记录计划”:出版发行期限定于1989年3月。这在OED历史上是第一次在项目运营中采用规划软件来监测项目运行的时间和费用。
为支持项目编辑,OED以史无前例的规模来编纂项目规程,每一步都撰写了详细的操作手册,包括校对手册、整合手册、发音检查手册和键盘输入手册等。在项目的后续阶段继续使用这一方法,编写了普通培训手册、计算机系统使用手册、特殊词条或词条部分编辑手册,以及最特别的书目原则手册。随着OED2辅助文本的出版发行,还特别编写了综合参考书目、初步措施和项目历史。正是由于对这些项目实施了卓有成效的科学管理,才保证了OED项目的顺利实施。
2. 离不开与技术公司的紧密合作
由于意识到自己的优势是把握内容,OUP没有再设立技术部门,而是通过项目招标,在不同阶段选择专业技术公司进行合作。例如,在20世纪80年代开始启动将纸质内容转化为电子文本时,选择了当时熟悉字典编排和标引规则的国际电脑印刷公司ICC;后来选择IBM英国公司和加拿大的滑铁卢大学共同开发相应的处理电子文本,并允许机读访问的程序;1990年,又委托荷兰软件公司AND开发具有搜索功能的OED2的光盘版。1999年,为开发OED在线版,选择与斯坦福大学图书馆的网络出版商高线出版社合作,2000年3月正式上线后主机仍然由高线出版社托管,以便处理相关技术问题。为提高编辑工作效率,更有效地修订内容,选择法国软件公司IDM来开发新的编辑出版管理系统Pasadena。 3.离不开编辑人员的快速适应
在专项培训项目结束后,Pasadena系统于2005年6月15日正式上线。OUP决定不同时使用新旧编辑系统,并按照顺序组织编辑工作:一是全面关闭旧版系统(有序暂停工作);二是开展正式的Pasadena培训项目(包括专业课堂教学、详细用户指南培训和专项培训练习);三是安排短暂的适应期,让编辑在安全的测试环境中使用新版软件;四是转移至在线系统,按预定的工作量恢复工作。
在随后几年中,这套系统保持了较高的稳定性,使编辑人员很快适应了工作流信息和辞典数据相互分离、书目引用脱离词条编辑的设计模式。几乎所有人员在经过培训后都能使用新版系统来恢复原有的编辑工作。短短3个月内,新版系统的编辑使用评分便超越了旧版系统的最高分。
三、对我国工具书数字化转型发展的启示
我国的工具书数字化转型中,行动比较早的出版机构有商务印书馆的“工具书在线”,上海世纪出版集团的“工具书在线”和中国大百科全书出版社的《中国大百科全书》网络版。这些项目由于各种原因,还在探索之中,没有独自走出一片蓝天。而同方知网作为内容集成平台,延揽大量的工具书进入平台,实现了逐年上升的赢利势头。综观我国现有的工具书产品,大多只是纸质产品的电子化或封闭的数据库化,不能实现外链和跨库检索,没有实现协同编纂,用户体验与需求之间的差距较大。与OED相比,我国的工具书数字化转型还有很长的路要走。认真总结OED的发展历程,吸取其宝贵经验是非常有意义的。
1.决策前瞻,投入持续
在OED发展的每个关键时期,OUP都能从长远角度出发进行决策。20世纪80年代初,当计算机技术处于初级阶段,很多人还不知道计算机为何物的时候,OUP就提出将OED文本电子化并进行数字化标引,从而为OED2的推出及光盘版和OED在线奠定了坚实的基础。OED2出版不久,很快又着眼于第三版,更新并修订每一词条,不仅收录19世纪语言的变更,同时收录新证据、新学术、新思想及主要新项目。1994年左右,设立OED在线出版发行项目,使用户可以在线利用第二版的完整内容。2000年3月起,每一季度在网上发行OED3的一个章节;同时为了使在线发行成为可能,OED部门进行重组,以保证OED的内容不断得到更新。2010年12月,OED在线版上线10年后,又在新平台启动了全新改版后的网站。正是这些前瞻性的决策和持续的投入,使OED经过一个多世纪的培育和完善,依然保持了蓬勃的生命力和影响力。
工具书在数字化时代依然有强大的生命力,但决不能固步自封,要增强前瞻意识,主动适应新技术的发展潮流,始终以用户需求为中心,及时进行前瞻性的决策,并能够持续不断地投入,只有这样才能保持产品的吸引力,为用户创造更大的价值。
2.兼顾社会效益和经济效益
只有始终保持产品的活力,吸引用户使用,才能拥有更多的用户群体。OUP对OED的投入是巨大的,首先是出于社会责任的考虑。虽然OED在线版的订阅收入持续增加,但这些收入并不能补偿开发运营的成本。2000年制作出版的OED第三版总成本高达5500万美元。2010年OED在线版网站做了全部更新和排版,制作成本显著增加。同时,为保证在线版每季度一次更新,还配备了大约75名全职编辑处理相关的词条、释义及例证;产品营销上也有相应的人力投入。但是,在OED建成大的语料库以后,OUP从中衍生出一系列小的独立产品,包括精编本OED等,另外开发的一些编辑软件不仅适用于OED,工具书部门的其他编辑也可以使用这些成果。这在一定程度上促进了OUP辞典、工具书的发展,带动了其他产品的销售,取得了良好的经济效益,从而实现了社会效益和经济效益的平衡。
辞书与一般出版物相比,负有更重要的社会责任,不能一味追求经济效益,但由此实现的衍生品的经济价值是不可小视的,如果运营得当,完全可以实现“两个效益”的平衡。对国内出版社来说,如何全面衡量、把握产品所能带来的社会效益和经济效益,妥善处理好二者的关系,对辞书在数字化转型发展的大背景下持续健康发展至关重要。
未来工具书的发展面临着很多挑战和机遇。一方面,互联网新进入者层出不穷,比如维基百科、谷歌、必应辞典等,国内的百度百科、互动百科、有道辞典等,他们充分利用了最新的搜索技术、大数据分析、社会化媒体推广等,实现了传统辞书无法实现的功能,满足了用户的需求。另一方面,移动互联网以及移动终端的广泛普及,为辞书的发展带来了广阔的发展空间。如何借鉴OED的发展经验,把握数字化的新机遇,围绕如何更好地满足用户智能化、个性化的使用需求,制定正确的数字化策略,是值得我国传统工具书出版者深思的问题。
参考文献:
① Simon Winchester,The meaning of Everything the story of the Oxford English Dictionary,2003,New York,Oxford University Press
② Mike Letts,the Seybold report on internet publishing,2000.5,http:// ukcatalogue.oup.com
③ 《牛津英语大辞典》将全面改为网络版,2010年8月31日,中国新闻网 http://www.chinanews.com/cul/2010/08-31/2501357.shtml
④ 牛津英语大辞典印刷版或停印http://learning.sohu.com/20101008/ n275470359.shtml,2010年10月08日,搜狐教育
⑤ 牛津大学出版社OED项目内部报告