不确定数据集上top-k查询与优化算法的-研究

不确定数据集上top-k查询与优化算法的-研究

ID:32606700

大小:4.70 MB

页数:75页

时间:2019-02-13

不确定数据集上top-k查询与优化算法的-研究_第1页
不确定数据集上top-k查询与优化算法的-研究_第2页
不确定数据集上top-k查询与优化算法的-研究_第3页
不确定数据集上top-k查询与优化算法的-研究_第4页
不确定数据集上top-k查询与优化算法的-研究_第5页
资源描述:

《不确定数据集上top-k查询与优化算法的-研究》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、万方数据东北大学硕士学位论文摘要APT4U—Topk算法应用到分布式环境中,提出了DAPT4UTop—k算法。DAPT4U.Topk算法避免了节点端发送全部本地元组,有效地减少分布式系统中的通信开销。但是,在某些数据集情况下,节点依然需要上传大部分数据,DAPT4U.Topk算法的通信代价和时间复杂度依然较高。针对在某些数据集上U.Topk查询需要展开全部可能世界模型,查询优化算法失效的情况,论文在最后~个部分提出了MPUTop.k查询优化算法。MPUTop.k的语义是返回概率最大的可能世界模型实例的Top.k向

2、量。因为MPUTop.k不需要计算全部可能世界模型概率,因此更具有实际应用价值。进一步,我们将MPUTop.k查询优化算法应用到分布式环境中,提出了DMPUTop.k算法。由于全局MPUTop—k算法和各个结点局部MPUTop.k算法的返回的结果相同,因此DMPUTop.k算法可应用于多跳地分布式环境中。特别地,文中证明了如果可能世界模型空间中某个实例的概率不小于0.5时,从查询结果的角度来看,MPUTop—k和U-Topk查询是等价的。这个结论为U—Topk查询处理提供了一种近似计算的方法。文中对上述工作进行了

3、详细的过程说明和算法描述,包括必要的理论证明用以说明算法的正确性,同时还使用来自于生产实际的真实数据集和部分模拟数据集对所提算法的性能进行了实验验证。关键字:不确定性数据;集中式;分布式;Top—k查询;U.Topk查询III万方数据东北大学硕士学位论文AbstractResearchonTop-·kQueriesOptimizingAlgorithmonUncertainDatasetAbstractTop·kquerytechnologyisusedwidely,whichistofindoutthehigh

4、estkresultaccordingtotheuser-definedscoringfunction.Inthetraditionaldeterministicdatabase,Top-kqueryhasitsclearsemantics,andresearchershaveproposedvariouskindofoptimizedprocessingalgorithm.However,withthedevelopmentofdataacquisitionanddataprocessingtechnology

5、,inmoreandmoreapplicationfielduncertaindataisdiscovered,suchasWirelessSensorNetworks(WSN),RFIDsystem,mobilecomputing,etc.Uncertaindataisgettingmoreandmoreattentionfromtheacademicandbecomeahotresearchissue.Intraditionaldatabase,Top—kqueryprocessingonlyconsider

6、stheorderofscoringfunctionvalue.However,Top—kqueryonuncertaindatashouldconsiderboththescoringfunctionvalueandtheuncertainty.So,Top-kquerytechnologyondeterministicdatabaseCan’tbestraightlyimmigratedtotheuncertaindatabase.Inpreviouswork,researchershaveproposeds

7、everalTOp—kquerysemanticsonuncertaindata.However,mostofthemdoesn’tconsiderqueryoptimizaitonprobleminsomespecificsemantics.Inaddition,thecurrentuncertaindatamanagementandTOp—kqueryprocessingmethodarealwaysbasedoncentralizeddatabaseordataflow.Inpractice,moreunc

8、ertaindataisderivedfromdistributedsystems.IfcentralizedmthodforTop—kqueryprocessingisadoptedtodistributeduncertaindataset,Itmeanseachnodemustreportallitsdatatothesinknode,whichwillbringgr

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。