基于用户检索意图的元搜索引擎研究

基于用户检索意图的元搜索引擎研究

ID:35068030

大小:2.60 MB

页数:61页

时间:2019-03-17

基于用户检索意图的元搜索引擎研究_第1页
基于用户检索意图的元搜索引擎研究_第2页
基于用户检索意图的元搜索引擎研究_第3页
基于用户检索意图的元搜索引擎研究_第4页
基于用户检索意图的元搜索引擎研究_第5页
资源描述:

《基于用户检索意图的元搜索引擎研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、分类号:TP311单位代码:10183研究生学号:2013544072密级:公开研吉林大学硕士学位论文(专业学位)基于用户检索意图的元搜索引擎研究ResearchonMetasearchenginebasedonuser'ssearchIntention作者姓名:田蒂类别:工程硕士领域(方向):软件工程指导教师:张家晨教授培养单位:软件学院2016年5月未经本论文作者的书面授权,依法收存和保管本论文书面版本、电子版本的任何单位和个人,均不得对本论文的全部或部分内容进巧任何形式的复制、修改、发行、出租、改编等有碍作者著作权的商业性使用(但纯学术性使用不在此限)。否则,应承担

2、侵权的法律责任。吉林大学硕±学位论文原创性声明本人郑重声明:所呈交学位论文,是本人在指导教师的指导下,独立进行研究工作所取得的成果。除文中己经注明引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品成果。对本文的研究做出重要贡献的个人和集体。,均己在文中[^明确方式标明本人完全意识到本声明的法律结果由本人承担。i学位论文作者签名:Cl日期:2016年丈月30日基于用户检索意图的元搜索引擎研究ResearchonMetasearchengineBasedonuser'ssearchIntention作者姓名:田蒂领域(方向):软件工程指导

3、教师:张家晨教授类别:工程硕士答辩日期:2016年5月28日摘要基于用户检索意图的元搜索引擎研究网络数据每天都以人们所无法想象的速度衍生,网络数据的海量生产与高速传播,已使现有信息检索技术显得不尽人意。虽然信息检索水平已得到了很大的提高,然而面对网络数据的爆炸式增长,各检索工具的覆盖面、查准率逐步下滑。海量数据背景下,现有的搜索引擎已经完全不能满足用户对信息检索系统“准确性”、“高效性”的检索需求。为了获取准确的信息,用户只能通过花费大量时间,多次调用不同的检索工具。元搜索引擎的出现在一定程度上缓和了单个搜索引擎“查全率”低的矛盾,但以冗长的结果列表形式为用户呈现出各搜索引擎的检索结果,

4、使得用户再次陷入“查询结果过载”的困境。为有效地提高检索系统的“查准率”、“查全率”,将数据挖掘、机器学习、人工智能技术应用于信息检索,实现检索工具的人性化、智能化已成为解决信息获取矛盾的新方案。构建中文搜索引擎,其中一项重要的技术指标就是:查询语句的语义理解,通过对查询语句进行语义分析,明确用户实际的信息需求。基于用户查询意图提供信息查找服务可以极大程度地提高查询结果的质量。元搜索引擎的构建必须明确信息检索的工作过程和各机制的内部实现原理,了解国内外关于元搜索的研究和发展水平,同时还应把握信息检索工具今后的发展趋势。本论文的主要研究工作为:首先,基于自然语言处理技术分析用户检索意图,明

5、确用户查询目的,提取用户查询关键词;基于开放目录树,分析用户检索主题,然后依据主题相关性为用户提供搜索引擎调度策略;其次,基于投票理论计算各记录的全局相关性;然后,基于改进的后缀树算法对Web检索结果进行层次化聚类,利用特征词的共现频率和用户查询意图关键词提取类标识,依次递归生成层次化聚类结果。关键词:元搜索,用户意图识别,层次化聚类IAbstractResearchonMetasearchenginebasedonuser'ssearchIntentionEveryday,networkdataisderivedatthespeedofwhatpeoplecan'timagine,ma

6、ssproductionandhighspeedtransmissionofnetworkdata,hasmadetheexistinginformationretrievaltechnologyisnotsogood.Althoughthelevelofinformationretrievalhasbeengreatlyimproved.However,facingthenetworkdataofexplosivegrowth,thecoverageofeachretrievaltools,precisiongraduallydecline.Underthebackgroundofhu

7、geamountsofdata,theexistingsearchenginehasbeencompletelyunabletomeettheusers'retrievalrequirementsofinformationretrievalsystemthat"accuracy"and"efficiency".Inordertogetaccurateinformationusershavetospendalotoftime,repe

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。