护理学免费资源实现研究.doc

护理学免费资源实现研究.doc

ID:61767395

大小:31.00 KB

页数:6页

时间:2021-03-19

护理学免费资源实现研究.doc_第1页
护理学免费资源实现研究.doc_第2页
护理学免费资源实现研究.doc_第3页
护理学免费资源实现研究.doc_第4页
护理学免费资源实现研究.doc_第5页
资源描述:

《护理学免费资源实现研究.doc》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、护理学免费资源实现研究1护理学免费资源知识元组织的必要性根据是否收费,Web上护理学电子资源分为收费资源和免费资源两种。收费资源如中国知网(CNKI)、万方等电子数据库,是护理学工作者获取知识的主要途径。由于其结构严谨,内容准确,为其知识组织方式由信息元过度至知识元提供了良好的基础,如CNKI数据库已经提供了知识元检索途径。在收费电子资源发展的同时,免费资源的发展也是日新月异,主要包括三类:①基于电子图书、期刊的开源资源,如道客巴巴、百度文库等。从目前资源的种类和数量上分析,开源资源的电子图书、期刊、博硕论文已经与收费数据库大体相当;②护理学电

2、子论坛如丁香园、天使之城等。电子论坛向所有护理学工作者敞开了大门,是广大护理学工作者交流工作经验、思想体会的主要阵地,在资源种类和内容上与电子数据库形成了良好互补;③护理学百科知识网站,如百度百科、搜搜百科等。百科类网站的诞生为广大互联网用户提供了新的信息获取途径,其发展理念强调用户的参与和奉献精神,内容整体详实准确。可见从资源的种类和数量上分析,护理学收费资源仅是免费资源的一个子集。然而,在知识的组织方式上后者与收费资源远远不能同日而语,整体处于无组织的状态。这是由于免费资源分布过于广泛,所有的内容没有统一的结构格式要求,尤其是电子论坛信息的

3、发布没有审核的过程,不规范用语非常常见等等,在这种条件下,显然信息元不可能成为免费资源的组织方式。为了合理组织这些资源,知识元组织方式最佳的选择。2护理学知识元的标引范围2.1限定开源资源的标引范围6学海无涯目前国内大型综合类开源资源网站主要以道客巴巴、百度文库和豆丁网为代表,笔者在3月19日以“护理学”为检索词向这三个数据库的默认检索方式进行检索,分别得到956149、901090和401445个检索结果,由于以上三者均是以电子期刊、电子图书、学术论文、电子课件等作为资源收集的内容,从资源数量可以简单的判断道客巴巴的护理学资源最为丰富。因此,

4、将开源资源的收集范围限定在道客巴巴中,其他两个数据库没有必要做重复的分析统计。2.2限定电子论坛的标引范围包括护理学在内,各种电子论坛的整体资源质量与论坛服务时间往往成正比,如丁香园论坛始建于2000年7月23日,经过多年的发展,吸引了大量高素质医学工作者的关注,内容也较为准确,信息每天都在动态更新;相比之下大量小的医学论坛不具有较强的吸引力,内容的整体质量较低,而且即使对其进行标引,这些论坛未来也非常可能被市场所淘汰,无法找到标引所对应的知识内容,显然对这样的网站内容进行深入的知识挖掘几乎没有意义。因此有必要将论坛的范围限制在2年以上,以此保

5、充分提高对电子论坛知识元标引的质量和工作效率。2.3限定百科全书类网站的标引范围主流的百科全书类网站主要有百度百科、搜搜百科、360百科、谷歌百科等等,通过名字即可发现这些网站均有一个共同的特点,即先有搜索引擎,后有百科,每个所有引擎都会首要的引用自身的百科知识,两者相互促进发展。以上百科类网站的知识内容几乎均涵盖所有的学科范围,种类和内容没有明显差别,但由于百度搜索引擎是市场占有率最大,在2012年11月占有率高达72.84%[2],可以说百度已经成为多数人检索信息的习惯。相应的使百度百科自然成为百科类知识点击率最高的网站,因此将范围限定在百

6、度百科中。3知识元标引过程3.1护理学免费资源的分词分词就是将连续的字序列按照一定的规范重新组合成词序列的过程,将没有间隔符中文词语变为机器可以理解的词语。常用的分词方法可分为三大类:基于字符串匹配的分词法、基于理解的分词方法和基于词频统计的分词方法。基于理解的分词方法模拟了人脑的理解过程,目前还处在试验阶段[3]。前文虽然对护理学免费资源的范围进行了限定,但整体仍然是海量的,为了提高分析效率,保证分词质量,本文设计了一种曲线高效的分词方法。“曲线”表示为首先不直接对免费资源进行分词,而是以CNKI中的期刊数据库、报纸数据库、博硕论文数据库、会

7、议论文等数据库,和读秀电子图书数据库为对象,采用字符串配算法进行分词方法对其内容进行分词。其原因如下:①6学海无涯电子期刊、博硕论文、会议论文等数据库是高端人才交流前沿知识的主要阵地。这决定其内容整体具有极高的含金量,任何新的理论知识、高效的工作方法必然第一时间诞生在其中或必然有所体现,保证了分词结果的全面性;②整体内容经过作者和编辑部多次审阅和校对,几乎没有错别字和奇异词,不需要对词语进行语义理解的过程,保证了分词结果的准确性;三、文献数量范围进一步缩小。笔者利用CNKI总库检索近5年发表的有关护理学方面的文献,检索表达式为:主题=护理(出版

8、年:2009年3月29日—2013年4月29日)进行跨库检索,总计得到313643个检索结果;以护理为检索词,在读秀电子图书中检索得到35859个检索

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。