欢迎来到天天文库
浏览记录
ID:32468400
大小:2.24 MB
页数:81页
时间:2019-02-06
《基于特征分块的面向专业领域的网络信息搜索系统的研究与应用》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库。
1、基于特征分块的面向专业领域的网络信息搜索系统的研究与实现摘要随着产业信息化的不断推进,越来越多的企事业单位通过Intemet发布信息。因特网上蕴藏着大量的专业信息,如何克服目前网络信息搜索过程中遇到的信息过载和资源迷向的问题,高效、便捷地获取专业领域的信息已经成为当今网络信息搜索研究领域的一个新方向。面向特定领域的搜索具有很好的专业指向性,搜索对象明确,资源相对集中,在一定程度上克服了网络资源发散、复杂、多元的特点,可以较容易地跟上站点和网页增长及内容更新的速度,文档的分析、自动处理和面向领域的知识库的建立也相对较容易实现。本文结合科研项目“纺
2、织企业信息库的动态刷新和自动搜索分析系统”,研究并实现了基于特征分块的面向专业领域的网络信息搜索系统。文章首先对网络信息搜索的发展与研究现状进行了分析,指出现有的网络信息搜索系统存在的问题,并提出了网络信息搜索今后的发展方向;在对网络信息搜索技术作了大量研究的基础上,本文提出了一种基于信息分块的特征提取与分析方法,即根据传递信息的意义度的大小将网页分成不同的区块,对不同的区块根据内容和结构进行信息挖掘。文章对专业信息捕获技术进行了研究,提出基于向量空间的网络专业信息获取模型,建立以面向领域网站内容为主的索引数据库,实现专业领域信息提取的Robo
3、t爬行算法和专业搜索策略。同时本文还研究、构建了基于专业兴趣度的用户知识模型,为用户提供个性化服务,提高系统的智能性。其中包括专业兴趣度的获取、模型的建立与优化、反馈处理等方面的研究。最后,本文给出了在纺织化纤领域的一个应用实例⋯一SOKEY系统,介绍了SOKEY系统的总体架构和工作流程,并在Windows2000Server平台上使用ActiveServerPage3.0、VbScript等嵌入式编程语言和面向对象的数据库技术,完成了网页信息的动态刷新、文档信息的自动查询、结果信息的分段浏览、用户信息收发等功能模块,使用VC完成了网络信息自动
4、捕获模块。关键词:特征分块,信息搜索,专业兴趣度,用户知识模型,基于特征分块的面向专业领域的网络信息搜索系统的研究与实现StudyandImplementationofSpeciality-OrientedWebInformationSearchingSystemBasedonCharacterBlockingABSTRACTWiththecontinuousadvancementofinformationindustrymoreandmoreenterprisesandcompaniesbegintoissuetheirinformation
5、onintemet.TherearevolumnsofprofessionalinformationontheIntemetandithasbecomeanewaspectofthestudyofthewebinformationretrievingtoobtainprofessionalinformationeffiecientlyandconvientlywhileovercomingtheproblemsofdata-overloadedandinformation-lostwhichPeoplenowencounterwhentheys
6、earchWebinformation.Thespeciality·orientedwebinformationpossessesgoodspecialitydirectionwithclearsearching0bjectandrelativelyconcentrativedataSOurce.Moreover,itconquerswebinformation’Scharacteristicsofradiation,complicationandvarity.ItCaneasilykeepupwiththespaceofwebsites’in
7、creasementandwebcontent’Supdating.Andthedocuments’analysis,auto—diaposalandestablishmentofspeciality-orienteddatabasewillberealizedmoreeasilgCombinedwiththescientificresearchproject,textileenterprise’Sdatabasedynamic—renovating,auto-searchingandanalyzingsystem,speciality-ori
8、entedwebinformationsearchingsystemwhichisbasedoncharacterblockingisstudieda
此文档下载收益归作者所有