面向跨语言知识组织的词典信息编纂与发布

面向跨语言知识组织的词典信息编纂与发布

ID:23611089

大小:72.00 KB

页数:8页

时间:2018-11-09

面向跨语言知识组织的词典信息编纂与发布_第1页
面向跨语言知识组织的词典信息编纂与发布_第2页
面向跨语言知识组织的词典信息编纂与发布_第3页
面向跨语言知识组织的词典信息编纂与发布_第4页
面向跨语言知识组织的词典信息编纂与发布_第5页
资源描述:

《面向跨语言知识组织的词典信息编纂与发布》由会员上传分享,免费在线阅读,更多相关内容在工程资料-天天文库

1、面向跨语言知识组织的词典信息编纂与发布摘要:通过统计双语词典中的编纂、出版与内容构成,本文全面分析了针对跨语言,即汉英两种语种的词典编纂流程、界面、词典数据库、词典各种呈现界面,即纸质的、网络的和手机的。通过本文提出的整个框架,在全媒体、多数据类型呈现的大数据时代,可以在一定程度上解决跨语言词典编纂的相应问题。关键词:全媒体;跨语言;词典界面;信息服务中图分类号:H319.9文献标识码:A文章编号:1001-828X(2015)005-000-02一、引言在出版业由传统向现代转型的今天,数字技术、网络技术越来

2、越广泛地被应用于出版业[1],人们逐步迈进数字化出版的时代。数字时代的出版是以“现代科技为依托的全方位出版时代,是传统出版与各种新型媒介整合出版的时代”[2]。在目前的数字出版大潮下,虽然以纸质媒体为代表的传统图书出版仍然在出版业中占据主导地位,“但是以互联网、手机、手持阅读器等移动媒体为依托的面向全媒体的出版模式己呈现良好的发展势头。”[3],全媒体是指“综合运用各种表现形式,如文、图、声、光、电,来全方位、立体地展示传播内容,同时通过文字、声像、网络、通信等传播手段来传输的一种新的传播形态。”[4]从本质

3、上来说,全媒体就是“要以不同的形式、通过不同的渠道、不同的平台,使想传达的资讯能够更有效地到传递到受众面前。”[5]。而在全媒体技术基础上的全媒体出版则是“同一种内容通过多种媒体同步出版。包括纸质媒体,也包括互联网、手机、阅读器”[6]。全媒体出版具有出版时间的同步性、出版渠道的多样性和读者覆盖的多样性等特点、双语词典的全媒体发展状况据中国互联网信息中心2009年7月发布的第24次《中国互联网络发展状况统计报告》显示:“截至2009年6月30日,中国网民规模达到3.38亿人,普及率达到25.5%。而且手机网民

4、规模也达到1.55亿人,占整体网民的45.9%”R]。这么巨大的市场需求,势必刺激并引导着数字技术创造新的数字出版运用颂域网络出版、手机出版等全媒体出版定会得到日新月异的发展。在双语词典的全媒体出版方面,国内一些大型的IT公司也做了一些有益的尝试,并取得了相对有效的成果。从技术的角度上看,国内做的比较好的在线双语辞书见表1;、面向全媒体的双语词典编纂面向全媒体的双语词典编纂由语料库、词典编纂界面和词典数据库三个主要内容组成。这三个功能模块是相互联系和紧密结合在一起的,词典编纂界面是核心,是语料库和词典数据库服

5、务的对象;语料库检索界面是基础,脱离语料库和检索界面,词典编纂过程中的例证获取、词频统计和词汇提取等语言学知识获取的功能就无从谈起;词典数据库是最终成果的载体,脱离词典数据库,不但后续开发是空中楼阁,就连词典编纂成果也成为镜中花和水中月了。词典编纂系统是一个多用户协作的软件系统,为了协调用户间操作及提供相关的功能服务,软件采用C/S(客户/服务器)结构进行组建。在构建过程中,将不同的功能模块分别安排在客户端和服务器端,并利用MVC(模块、视图、控制器)设计方式将其联系起来。1.词典编纂界面从词典数据库中根据权

6、限分配给词典编纂者、初审、二审和主编相应的词条。这些词条有下列四种:仅仅有词目;初审词条;二审词条;三审词条;词典各级别的编纂者有权对词条进行修改、增加和删除;这一部分显示在词典编纂界面的左边,为了便于词典编纂者在类似word界面里编纂,在选定好某个词条后,可以隐藏。自动显示在类似word的编纂界面中,不同的词典编纂者可以像在word中一样,任意的对这个词条进行编纂、修改、删除和添加其他语言信息。为了便于后续的词条数据抽取,可以做一个严格意义上的词条模板,这个模板包含最全面的词条组成元素,基本模板主要包括:词

7、目、音标、罗马字符、词性、【阿拉伯数字、释义例证】(黑框里面的部分是一个多个循环,这个循环值给它一个接近最大值即可);也可以不做固定模板,词典编纂者按照词条的基本框架进行编纂,然后把这个词条自动保存到词典数据库中。1.语料库及检索功能首先,常规的语料库统计功能:词频统计、词性统计、句子长度统计;其次,例句检索,主要有下面的检索,关键词检索、关键词和词性结合检索、例句长度检索、搭配检索、形态变换检索。最后,自然语言统计知识获取功能,计算词的搭配度、互信息、Z值、卡方值等。检索功能模块的放置,作为一个模块,放到类

8、似word编纂界面的工具栏里面去,展开分三部分:常规统计功能;例句检索功能;自然语言统计功能。检索结果界面可以自由的控制大小。对于数据库的查询,一定程度上可以依赖于数据库管理系统自身的查询功能,但数据库所提供的查询是原始的,基于SQL(关系型查询语言)的,实际应用中还需要对原始查询进行封装、优化、检查,在获得查询结果后,基于兼容性及开放性考虑,还需要对查询结果进行二次处理,使之表示成如XML等扩展性

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。