主题搜索引擎的研究与设计

主题搜索引擎的研究与设计

ID:15393074

大小:198.00 KB

页数:26页

时间:2018-08-03

主题搜索引擎的研究与设计_第1页
主题搜索引擎的研究与设计_第2页
主题搜索引擎的研究与设计_第3页
主题搜索引擎的研究与设计_第4页
主题搜索引擎的研究与设计_第5页
资源描述:

《主题搜索引擎的研究与设计》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、主题搜索引擎的研究与设计摘要网上的信息每天都以指数量级的速度爆炸性增长,面对Internet中令人眼花缭乱的资源,如何能够迅速准确地找到所需的信息,已成为众多信息检索人员所面临的一个必须解决的问题,搜索引擎在这方面起到了举足重轻的作用。本文主要研究了主题搜索引擎技术,分析了一般的网络爬虫的工作原理,并对主题搜索引擎中所采用的主要算法进行了研究。在此基础上设计了一个面向主题的搜索引擎系统,将基于内容和基于链接相结合,给Internet用户提供了一种快速准确地搜索到符合自己需求的信息的工具。在实验系统中,用户可以根据选择的主题

2、来进行搜索,系统通过相关度分析对搜索的结果进行排序。另外还分析了研究该课题的意义及课题尚待解决的问题。最后,通过对实验结果的分析,进一步强调了研究主题搜索引擎系统的意义。关键词:互联网,搜索引擎,主题搜索ABSTRACTInformationontheInternetgrowsexplosivelyeveryday.HowtofindinformationaccuratelyandquicklyfromtheInternethasbecomeaproblem.Manypeoplewhowanttoretrieveinfor

3、mationrespecttosolvethisproblem.Inthisaspect,searchengineisapowerfultool.Atopicsearchenginesystemisproposedanddesignedinthispaper.Thetheoryofthecommon“spider”isanalyzed.Themainalgorithmaboutthetopicsearchisresearched.Onthebaseoftheresearch,atopicsearchengineisdesi

4、gned.Itcombinesthecontent-basedmethodandhyperlink-basedmethod.ItaimsathelpingtheusertogetInternetinformationaccordingtotheirowndemandsfastandaccurately.Intheresearchsystem,peoplecansearchbychoosingtheirtopic.Thenthesystemwillsorttheresultaftertherelativityanalyse.

5、Inaddition,thesignificanceoftheresearchonthissystemisanalyzed,andtheunsolvedproblemsarealsodiscussed.Finally,ateststemofTopicSearchengineisdesigned,andtheresultoftheexperimentisgiven.Keywords:Internet,SearchEngine,TopicSearch目录1引言1.1课题背景1.1.1Internet的发展历程Internet的

6、历史可追溯到30多年前,它的前身是1969年美国国防部高级研究所计划局(ARPA)[1],作为军用实验网络而建立,名为ARPANET,初期只有四台主机,其设计目的是当网络中的一部分因战争原因遭到破坏时,其余部分仍能正常运行,而这些分散的点又能通过某种形式的通讯网取得联系。为对这一构思进行验证,自从六十年代末至七十年代初,由美国国防部所资助,一个名为AdvancedResearchProjectsAgency的公司所承建,通过一个名为ARPANET的网络把美国的几个重要军事及研究所用的计算机主机联接起来,这就是Interne

7、t最早的形态。目前,几乎所有发达的国家都建设有自己国家级的教育和科研计算机网络,并且都与Internet互连在一起,中国也不例外。由于Internet上具有极丰富的资源,它突破了地理位置的限制,为广大的入网人员提供一个很好的计算机环境,大大加快了人们之间的信息交流和合作。可以说,Internet拉近了人们彼此之间的距离。随着计算机和通信事业的飞速发展,计算机网络由过去的军事和教育专用网络发展成为包罗万象的国际互联网络Internet。我们可以通过Internet来查找各种资料、做广告、发布信息、通信、发传真、在线交谈、在线

8、转播和举行会议。Internet已经成为与我们的生活和工作密切相关的一部分了。1.1.2WorldWideWeb(WWW)WWW是WorldWideWeb(环球信息网)的缩写,也可以简称为Web,中文名字为“万维网”。它起源于1989年3月,由欧洲量子物理实验室[2]CERN(theEuropeanLa

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。