大数据时代下的图书馆数据挖掘和情报分析研究

大数据时代下的图书馆数据挖掘和情报分析研究

ID:11674244

大小:31.00 KB

页数:9页

时间:2018-07-13

大数据时代下的图书馆数据挖掘和情报分析研究_第1页
大数据时代下的图书馆数据挖掘和情报分析研究_第2页
大数据时代下的图书馆数据挖掘和情报分析研究_第3页
大数据时代下的图书馆数据挖掘和情报分析研究_第4页
大数据时代下的图书馆数据挖掘和情报分析研究_第5页
资源描述:

《大数据时代下的图书馆数据挖掘和情报分析研究》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、大数据时代下的图书馆数据挖掘和情报分析研究大数据时代下的图书馆数据挖掘和情报分析研究大数据时代下的图书馆数据挖掘和情报分析研究大数据时代下的图书馆数据挖掘和情报分析研究大数据时代下的图书馆数据挖掘和情报分析研究大数据时代下的图书馆数据挖掘和情报分析研究  一、引言  大数据  截止到2016年,全球信息总量已经突破千万兆亿,并不断以惊人的速度膨胀变大,这意味着“大数据”时代已经降临。哈佛大学知名学者提出:“这是一场革命,庞大的数据资源使得各个领域开始了量化进程,无论学术界、商界还是政府,所有领域都将开始

2、这种进程。”针对这样的一个变化,大数据时代最大的转变就是,放弃对因果关系的渴求,取而代之的是关注相关关系。也就是说只要知道“是什么”,而不需要知道“为什么”。这就颠覆了千百年来人类的思维惯例,对人类的认知和与世界交流的方式提出了全新的挑战。  大数据下图书馆服务模式的转变  全球信息迅速膨胀带来的数字资源的快速发展,使得有效利用大量结构化、半结构化和非结构化的复杂数据逐渐成为图书馆工作的主旋律。随着数据爆炸时代的来临,以及网络数字化环境的日益成熟,读者迫切需要一个可以简捷、快速获得所有知识的理想平台。同

3、时,图书馆作为一个面向大众的知识服务机构,不仅需要了解客户需要什么服务,更需要通过图书馆—用户的服务关系去挖掘正在发生什么、预测和分析将来会发生什么,以便图书馆为读者提供更好的服务模式并积极应对未知的危机及挑战。  二、大数据时代下的数据挖掘和情报分析机理  知识挖掘  引入先进的技术手段,如知识挖掘算法、索引规则等,对各类文献资源数据进行处理和分析,使得文献的揭示由表面信息深入到各类文献之间存在的复杂关系中,继而帮助用户发现潜藏在数据背后的信息。通过知识挖掘处理,展现给读者的文献资源不再是一个点对点的

4、结果表示,而是揭示各信息资源关联关系的立体知识体系。深入分析用户需要的甚至用户潜在的知识需求,为其提供更加精准化的知识发现服务。  情报分析  基于已有的结构化和非结构化数据的知识组织和表示,综合应用数据挖掘、学习和推理技术,得出文献资源的增减变动方向和变化趋势,实现自动化、智能化的深入分析,帮助用户获取具有动态性、知识性和前沿性的情报知识。情报分析的主要作用是通过设置人机交互接口与用户进行交互。用户可以通过一定的软件环境指导学术原始数据的采集、抽取和分析处理过程及查看分析结果,并应用可联盟视化技术动态

5、直观地展现海量信息资源中潜在的规律和发展趋势。  中文发现系统  中文发现系统以各类结构化、半结构化和非结构化数据为底层基础,通过先进的数据仓储、数据挖掘及搜索引擎等技术手段,全面揭示馆藏内及馆藏以外的各种学术文献的应用、管理,并深入挖掘大量数据资源背后的信息,为用户和图书馆提供知识发现服务。  图1中文发现系统读者需要的知识往往大于图书馆或系统所能想到的范围,考虑到用户的这一实际需求,中文发现系统通过挖掘各类数据与用户行为之间的立体关系,实现以下效果:  发现知识:通过系统平台、技术手段,深入分析图书

6、馆员的工作与用户的搜索行为,对信息资源进行充分的挖掘、关联和升值,更加全面和深入地揭示资源和服务的整体性,使得信息的查找和定位更加细化和快捷,帮助读者发现所有所需资源。  洞察全局:使用户感受到的文献信息资源是一个整体,不再是一个庞大而零散割裂的“信息孤岛”。最终形成一个完整的情报分析体系,帮助读者和文献单位建立文献信息的全局概念,全面掌握研究学习的趋势与内容。  价值再生:深入挖掘各文献资源之间的立体关系,实现图书、期刊、学位论文、会议论文等资源之间互引的立体引证关系与趋势发展关系,分析挖掘大数据背后

7、的潜藏信息,从而帮助读者发现潜在的知识需求与研究信息。  三、中文发现系统功能案例分析  引文分析  系统利用各种数学及统计学的方法进行比较、归纳、抽象、概括等,对图书、期刊、论文、著者等分析对象的引用和被引用现象进行分析。使用的方法有图论、模糊集合、数理统计等数学方法和逻辑思维方法,目的在于揭示文献所蕴含的情报特征和相关关系。  引文分析可以帮助读者超越时间空间,跨学科组织文献,同传统的分类法和主题法截然不同,使文献有序化,有利于对文献由表及里地深入展开分析,更易于量化。引文分析能够帮助一些研究学者通

8、过文献引用频率的分析研究测定某一学科的重要性或某一作者的影响力。通过文献间的相互引证关系,分析某学科文献的参考文献的来源和学科特性,不仅可以了解该学科与其他学科有哪些些联系,而且还能探明其信息的来源及分布特征,从而为制定本学科的信息管理方案和发展规划提供依据。另外可以通过被引用率与引用率来研究文献老化规律。可根据某著者被别人引用的程度衡量该文献学术价值和影响。  系统通过引文分析不只实现期刊与期刊的引证,同时实现不同文献类型、不同文献信息要

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。