面向数据流的差分隐私直方图发布

面向数据流的差分隐私直方图发布

ID:35102136

大小:2.90 MB

页数:66页

时间:2019-03-17

面向数据流的差分隐私直方图发布_第1页
面向数据流的差分隐私直方图发布_第2页
面向数据流的差分隐私直方图发布_第3页
面向数据流的差分隐私直方图发布_第4页
面向数据流的差分隐私直方图发布_第5页
资源描述:

《面向数据流的差分隐私直方图发布》由会员上传分享,免费在线阅读,更多相关内容在学术论文-天天文库

1、学校代码:10255学号:2131590面向数据流的差分隐私直方图发布DIFFERENTIALPRIVATEHISTOGRAMPUBLICATIONFORDATASTREAM学科专业:软件工程作者:刘慧艺指导教师:夏小玲答辩日期:2016年1月东华大学计算机科学与技术学院2016年1月东华大学学位论文原创性声明本人郑重声明:我恪守学术道德,崇尚严谨学风。所呈交的学位论文,是本人在导师的指导下,独立进行研究工作所取得的成果。除文中已明确注明和引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写过的作品及成果的内容。论文为本人亲自撰写,我对所写的内容负责,并完全意识到本声明的法律结果由本人

2、承担。学位论文作者签名:日期:年月日东华大学学位论文版权使用授权书学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅或借阅。本人授权东华大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。保密□,在年解密后适用本版权书。本学位论文属于不保密□。学位论文作者签名:指导教师签名:日期:年月日日期:年月日面向数据流的差分隐私直方图发布面向数据流的差分隐私直方图发布摘要近年来,随着信息化技术与互联网技术的快速发展,在信息共享和信息传播的过程中,用户信息泄露的案

3、例时有发生,隐私保护引起人们的重视。在大数据信息化时代,数据需要共享,才可以更充分的发挥出数据潜在的价值。因此,个人、事业单位的隐私安全保护问题显得日益重要。目前,差分隐私是一种严格的隐私保护模型,在很多领域中受到人们的关注与研究。差分隐私基于攻击者具有最大化背景知识假设的条件,通过在原始数据集上添加少量的噪声进行扰动,从而达到保护用户隐私的目的,具有添加噪声量少,信息泄露风险率低的优点。现有的差分隐私发布技术主要是基于静态数据集以及二进制流的数据集,相对于真实应用中数据以流数据形式到达,并且数据具有多样性等特点,原有方法的实际操作性和针对性均不够理想。基于此,本文提出了一种高效、面向分布不

4、均匀的数值型数据流的差分隐私直方图发布算法。本文首先对隐私与差分隐私的相关内容进行详细描述,阐述了数据流处理模型以及直方图相关技术,并探究了云平台下SparkStreaming框架的流处理与批处理技术;其次,提出了一种面向分布不均匀的数值型数据流的动态差分隐私直方图发布算法DDPA。基于滑动窗口模型,利用相邻两个时间戳的数据集分布的相似性,动态合理分配隐私预算,使得每一个窗口的总预算不超过隐私预算,并运用分组与合并策略,快速计算出局部最优直方图。通过将DDPA算法与同类算法进行对比,对其发布数据的可用性进行分析,实验结果表明,DDPA算法是有效可行的;然后,基于Spark集群,运用Spar

5、kStreaming框架,对动态差分I面向数据流的差分隐私直方图发布隐私直方图发布算法DDPA中EMD相似度方法进行改进,使其能够应用到分布式的Spark云计算平台上,满足大数据流分布式处理的需求。从大数据角度,基于Spark云平台,结合SparkStreaming的流处理以及批处理性能,实现动态差分隐私直方图发布技术。最后,通过对改进后的算法与同类算法进行对比,对其发布数据的可用性进行了分析。实验结果表明,改进后的算法是有效、可行的。从大数据应用的角度,提高了流数据的差分隐私直方图发布的实际应用价值,具有一定的参考意义。关键词:数据流;差分隐私;直方图发布;SparkStreamingII

6、面向数据流的差分隐私直方图发布DIFFERENTIALPRIVATEHISTOGRAMPUBLICATIONFORDATASTREAMABSTRACTInrecentyears,withtherapiddevelopmentofinformationtechnologyandInternettechnology,andintheprocessingofinformationsharingandinformationdissemination,thecasesofuser’sinformationleakagehaveoccurred,whichmakepeoplepayattentionto

7、privacyprotection.Intheeraofbigdata,thedataneedstobeshared,whichcanbemorefullyplayoutthedata’spotentialvalue,andthereforetheprivacyprotectionofindividuals,enterprisesandinstitutionshasbecomingincreasinglyim

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。