优化搜索引擎的检索效果

优化搜索引擎的检索效果

ID:10848595

大小:25.50 KB

页数:9页

时间:2018-07-08

优化搜索引擎的检索效果_第1页
优化搜索引擎的检索效果_第2页
优化搜索引擎的检索效果_第3页
优化搜索引擎的检索效果_第4页
优化搜索引擎的检索效果_第5页
资源描述:

《优化搜索引擎的检索效果》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、优化搜索引擎的检索效果互联网是当今世界上规模最大,信息更新最快的知识库,在终身学习及学教并重理念日益深化的今天,它已经超越课本成为最重要的学习资料来源.为了在这个浩瀚的知识海洋中有效获取学习资料,无论是教师还是学生都应当具备熟练使用搜索引擎的能力.搜索引擎其实就是一个专门提供信息检索服务的网站.Google作为全球规模最大的搜索引擎,目前它所收录的网页已超过40亿.百度作为全球规模最大的中文搜索引擎,所收录的中文网页也已超过3亿.不可否认,搜索引擎在信息检索方面给我们带来了极大的方便,然而我们在使用搜索引擎时,却总有这样的体验:检索到的网页令人目不暇接,有用的链

2、接却往往夹杂在一大堆无效的链接中,要翻遍所有的网页才能找到真正需要的信息.这种状况严重影响了我们在互联网上获取知识的效率和热情.怎样使我们的搜索更准确和高效呢?笔者认为除了期待搜索引擎在现有技术水平上实现大幅度突破以外,更为实际的一面是锻炼我们个人的搜索技巧,在了解搜索原理的基础上充分发挥搜索引擎的检索能力.m,搜索引擎的原理搜索引擎的基本工作过程是根据用户输入的关键词进行检索,然后按照顺序将检索结果列表显示.检索过程是在文档库中完成的,也就是每一个搜索引擎都有一个独立的文档库,文档库中存储着互联网上所有被检索过的网页的一个复制品,通常称为"网页快照".文档库中

3、的网页会定期更新,一般为每30天一次.更新是通过一种称为"蜘蛛"的程序到互联网上进行检索,凡是被检索到中小学信息技术教育0L.一教学应用搜索引擎的的新网页就会以快照的形式存入文档库,相应的旧网页就会从文档库中删除.如果文档库更新不全面或者不及时,就会出现废弃网页存储在文档库中的情况.如果这些网页恰好以检索结果的形式显示给我们,就出现了所谓的"空"链接,点击这些链接浏览器就会提示"该页无法显示".搜索引擎检索文档库的过程实际上是一个关键词匹配的过程.文档库中的每一个网页都对应一个索引表,索引表中存储的是从网页中抽取出来的大量关键词.搜索引擎在检索时就是使我们输入的

4、关键词与网页索引表中的关键词进行比较,凡是达到一定匹配程度的网页都会作为检索结果返回.例如,网页的索引表为{A,B,C,D,E,F…},如果用户的检索关键词为"A"和"D",那么上述网页就是符合条件的一个检索结果.搜索引擎的检索结果是经过排序后显示的.排序的标准主要由关键词匹配程度和网页等级两个参数决定.关键词匹配程度是指用户输入的关键词能够得到匹检索效果口黄勇配的个数.网页等级是指一个网页被其他网页引用的程度(引用就是从其他网页有超链接指向这个网页).一般来说,一个网页被其他网页引用的次数越多,引用这个网页的其他网页的等级越高,那么这个网页的等级就越高.只有在

5、关键词匹配程度和网页等级都很高的情况下,网页才会排到前面,因此我们就会明白,为什么有时我们感觉最匹配的网页却排在不很匹配的网页后面,就是因为后者比前者的网页等级更高.所以,对于重要的搜索结果我们应至少查看2~3页,以免错过了对我们来说最有意义的网页.二,提炼关键词根据上面所述的原理,我们会发现,在现有搜索引擎技术的基础上提高它的检索效果,就是尽量提高关键词的匹配程度.因此,我们需要对关键词进行提炼.(1)关键词的成分搜索引擎不限制关键词的内容,因此,任何字,词,句都可以作为关键词来使用.但为了提高教学应用检索的效果,字和句应尽量少用;对于词,最好能够组合使用;不

6、要把意义模糊或太过常用的单个词(如"公式","信息技术"等)作为关键词,因为这些词极容易匹配,单独使用它们无疑会大量增加无关网页的数量.(2)使用长关键词如果被检索的问题可以用一个结构紧凑的长词组来表达,那么应首先考虑使用长词组作为关键词(如"是距离地球最近的恒星","中小学信息技术课程教案"),因为与使用多关键词相比,使用单一的长关键词更能显着提高匹配的准确率.使用长词组作关键词时需要加上中文的或者英文的引号,如一是距离地球最近的恒星….加引号可以保证长词组被作为一个完整的关键词去匹配,否则,搜索引擎会把长词组分解成一系列关键词.例如,不加引号时,"是距离地球

7、最近的恒星"会被分解为"距离","地球","最近","恒星"四个词进行检索,在Google中将返回13000项检索结果,在百度中将返回1220项检索结果,其中大部分结果都不能给出"太阳是距离地球最近的恒星"这个答案.加上引号后,检索结果则迅速缩减,Google返回75项结果,百度返回8项结果,每一项结果都能够给出我们需要的答案.(3)使用多关键词如果被检索的问题不易于用一个结构紧凑的长词组来表达,这时就应考虑通过增加关键词的个数来提高检索的效率.以检索数学排列公式为例,如果我们以"排列"或者"排列的公式"作为关键词,则会得到一大堆无关的网页.这时增加关键词的个数

8、,使用"排列组合二项式定

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。