嵌入式全文检索引擎

嵌入式全文检索引擎

ID:28261674

大小:450.00 KB

页数:13页

时间:2018-12-09

嵌入式全文检索引擎_第1页
嵌入式全文检索引擎_第2页
嵌入式全文检索引擎_第3页
嵌入式全文检索引擎_第4页
嵌入式全文检索引擎_第5页
资源描述:

《嵌入式全文检索引擎》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、.嵌入式全文检索引擎浙江天宇信息技术有限公司-..1研发背景随着政府和企事业单位日常业务工作数字化程度的不断提高,信息技术已得到了广泛的运用和发展,各部门已从传统的纸质化办公模式逐步走向无纸化办公;信息管理系统也已成为政府部门和企事业单位日常工作的“第二大脑”,并承担起全方位的面向各个层面的信息使用者提供优质、规范、透明的管理和服务;而信息则被列为与能源、材料并举的“第三大”现代化社会发展必要资源写入了国家战略发展纲要。人们在享受信息给日常生活、工作带来的便利的同时,高速膨胀的信息资源、日益平凡的信息交换和资源共享、错综复

2、杂的信息系统也给我们的决策者和规划者带来了新的烦恼。哪么如何快速地在茫茫浩瀚的信息海洋里寻找准确的资料内容;如何整合部门中各系统的信息资源,提供专业的信息资源服务;如何建立面向各个层面的综合信息全文检索平台,已逐渐成为目前信息化建设的新热点和新趋势。嵌入式全文检索引擎正是在这样的信息化建设蓬勃发展的背景下孕育而生,为绝大多数政府和企事业单位在不改变原有系统功能和结构的基础上,通过简单的配置实现对现有信息资源的高效、准确的全文检索功能。-..1嵌入式全文检索引擎解决的问题作为国家“七·五”科技攻关项目承办单位,天宇公司早在2

3、0年前就开展了中文信息处理和全文检索技术研究,取得了一批具有国际先进水平的科研成果。同时作为国内全文存储和全文检索技术的领导者以及全文存储标准的起草者,天宇公司一直与政府机要部门保持的密切的合作,在内容管理与全文检索方面积累了丰富的行业经验和解决方案。在认真得分析了信息资源利用过程中出现的问题,归纳了众多用户的需求和建议,总结了上百个信息资源内容管理利用项目的成功经验,并结合我公司在全文存储和检索领域中的研究成果,开发了嵌入式全文检索引擎,以解决现阶段绝大多数政府和企事业单位信息资源在利用过程中出现的问题。1、信息高速膨胀

4、带来的数据检索问题由于在此之前的信息管理系统在设计和开发时受到当时的硬件、软件以及技术等因素和条件的制约,以至于在信息高速膨胀的今天在数据利用方面已经不能满足现阶段业务发展需求。主要表现在信息资料的记录将会由原先预计的几万条突增到上百万条甚至上千万条,数据存储量也由原先预计的几百MB膨胀到几百个GB甚至几个TB,导致原有的信息系统在继续提供文档和数据资料处理和业务流转的同时,无法满足各职能部门和使用者对海量信息资源的快速、高效的检索利用需求。而这些业务系统恰恰又是各单位或各部门的基础业务系统,与其上层系统有千丝万缕的联系,

5、为其提供基础数据支撑,因此如何能够不改变原有系统功能和结构的基础上,通过嵌入全文检索引擎实现原系统的全文检索利用功能,是目前政府和企事业单位在-..完善系统功能、提高系统效率、实现对外服务时亟待解决的问题。2、异构存储系统之间的资源跨库共享利用问题信息化建设的高速发展给政府部门和企事业单位日常工作带来便利的同时也对信息管理部门提出了更高的要求。各单位内部已经拥有了大量的信息系统,例如办公自动化系统、电子文献资料系统、科研成果库、档案管理系统、专家库系统等等。而这些系统本是根据各方面不同的应用而开发的,相互之间缺乏必要的关联

6、,容易形成应用系统之间的信息孤岛。随着信息化水平的不断提高,信息资源的不断丰富,决策者在分析、决策时更需要综合性的信息资源,而不是单一的没有任何关联的纯粹数据。例如信息使用者在检索专家库专家名字的同时能够关联检索到该专家的起草的文献资料内容,甚至该专家的科研成果报告等等。而实现这些需求的难点在于各个系统是相互独立的,各个系统后台所用的数据库和数据表结构各不相同,各个系统的数据之间缺乏必要的关联,各个系统的检索功能也只能服务于本系统。因此如何实现跨平台、跨系统的信息资源共享整合;如何能对多种类型数据库格式的数据(如Oracl

7、e、SQLServer、Sybase、MySql等数据库中的数据)进行抽取、整理、加工、关联,并建立跨平台、跨系统的信息资源相关性索引,实现信息资源分布式全文联合检索,业已成为政府和企事业单位实现信息资源整合时首要考虑的问题。-..1嵌入式全文检索引擎1.1嵌入式全文检索引擎应用构架嵌入式全文检索引擎利用天宇多年以来自主开发的CGRSServer作为核心应用,结合DataPipe数据接口网关模块,实现嵌入式全文检索以及对多个同构或异构系统间关联数据的跨库全文检索单系统架构设计图-..多系统多库跨库联合检索架构设计图首先需要

8、将存储在各系统各数据库中的信息资源通过DataPipe进行数据抽取、整理、关联,加载到CGRS全文数据库中,并由全文数据库实现关联关键字索引和全文索引,以实现多系统多数据库的跨库全文关联检索。嵌入式全文检索引擎采用无缝嵌入技术,能够自由、灵活且无须改变原有系统功能和结构的基础上,通过简单的配置利用Scr

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。