基于图形数据库Neo4j的RDF数据存储研究-论文.pdf

基于图形数据库Neo4j的RDF数据存储研究-论文.pdf

ID:53029699

大小:222.05 KB

页数:3页

时间:2020-04-14

基于图形数据库Neo4j的RDF数据存储研究-论文.pdf_第1页
基于图形数据库Neo4j的RDF数据存储研究-论文.pdf_第2页
基于图形数据库Neo4j的RDF数据存储研究-论文.pdf_第3页
资源描述:

《基于图形数据库Neo4j的RDF数据存储研究-论文.pdf》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、2015年第6期文章编号:1009—2552(2015)06—0115—03DOI:10.13274/j.cnki.hdzj.2015.06.030基于图形数据库Neo4j的RDF数据存储研究康杰华,罗章璇(河海大学计算机与信息学院,南京211lOO)摘要:现有的RDF数据分布式存储方式大多将RDF数据分成多个维度,存储多份数据,这无疑大幅度地增加了数据的存储空间,同时给数据的管理带来了很大的难度。本文通过将RDF数据以图的形式存储在图形数据库Neo4j中,大幅度地减少了RDF数据存储的数量。同时,图形数

2、据库Neo4j在数据查询时建立多维索引机制,大大提高了大量复制RDF数据的处理效率。关键词:RDF图;Neo4j;图形数据库;数据存储中图分类号:TP3l1.13文献标识码:AResearchonRDFdatastoragebasedongraphdatabaseNeo4jKANGJie.hua.LU0Zhang—xuan(SchoolofComputerandInformation,HohaiUniversity,Na~mg211100,China)Abstract:ThePDFdataweresepa

3、ratedintomultipledimensionsinmostexistingstoragemode.Thedatawerestoredmuhiplecopies.Thestoragespacewasundoubtedlyincreased.Anditbringsagreatdifficultyindatamanagement.Inthispaper,thedataarestoredasPDFgraphinthegraphdatabaseNeo4j.ThenumberofRDFdatawasreduc

4、edsubstantially.Meanwhile,amultidimensionalindexwasmadeinNeo4j,whichgreatlyimprovedtheprocessingefficiencyoflargeRDFdatareplication.Keywords:RDFgraph;Neo4j;graphdatabase;datastorage0引言求。针对数据间内在关系复杂且动态变化的问题,人们再次将目光转向图形数据库,图形数据库可以看作计算机技术不断发展,伴随着技术进步而来的是节点和关

5、系的集合,能够有效地管理,存储,更新数是数据量的与日俱增。在大量数据分析时不可避免据及其内在关系,并能高效执行多层复杂操作,对于大地迎来了各种挑战。规模复杂的RDF图数据的存储和查询,用图形数据库RDF(ResourceDescriptionFramework,资源描存储无疑是一个很有效的方法。述框架)是一种用来描述万维网上的元数据的语言,独立于任何语言,适用于任何领域。语义网的快l相关工作速发展,使RDF数据格式被越来越多地采用在各种1.1RDF图数据模型简介系统当中,成为了处理元数据的基础,如互联网应

6、RDF是W3C提出的用于描述网络资源的标用、生物技术系统等。实际应用中的RDF数据集三准。采用了一种简易的描述方式,即用主体(Sub—元组数目和关系复杂程度呈爆炸式增长,数据的存ject),谓词(predicate),客体(Object)构成的三元组储面临前所未有的压力,原始的简易架构模型无可来表示资源。RDF数据通用表示形式为(S,P,0)避免地遭遇了性能瓶颈,在存储能力到查询响应性三元组,一组RDF数据可构成一个RDF有向图。能方面都不能满足日益增长的需求。RDF图可以通过带有标签的结点和带有标签的边

7、关系数据库虽然在成熟度和安全性方面有保障,收稿日期:2014—06—05但随着数据规模的膨胀及复杂性的增加,在面对大量、作者简介:康杰华(1989一),女,硕士研究生,研究方向为基于图形复杂、动态的网络数据时,已不能满足领域应用的需数据库Neo4j的RDF数据存储研究。一115—来表示,其中每一个三元组对应为图上的一个“结可抗靠性、可扩展的、完全兼容ACID的图数据库。点一边一结点”的子图,陈述了由谓语表示的在主数据以一种针对图网络进行过优化的格式保存在磁语和宾语所指的事物之间的关系。一个RDF图的盘上。

8、结点就是它包含的所有三元组的主语和宾语,而边2存储模式设计的方向总是指向宾语。通常可以把RDF图看作一2.1设计理念个有向标记图。大规模的图数据存储依赖云计算环境的分布式RDF图的含义就是其所有三元组陈述的合取。系统存储。图数据的存储模型无非两种:简单图和如图1所示,三元组集合表示的RDF图的含义如超图。下:Person是一名教授,他在Universityl工作,他是Neo4j中每个Node,Relationship,Prop

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。