第1章 数据仓库的概念与体系结构

第1章 数据仓库的概念与体系结构

ID:34629026

大小:2.75 MB

页数:53页

时间:2019-03-08

第1章  数据仓库的概念与体系结构_第1页
第1章  数据仓库的概念与体系结构_第2页
第1章  数据仓库的概念与体系结构_第3页
第1章  数据仓库的概念与体系结构_第4页
第1章  数据仓库的概念与体系结构_第5页
资源描述:

《第1章 数据仓库的概念与体系结构》由会员上传分享,免费在线阅读,更多相关内容在教育资源-天天文库

1、数据仓库与数据挖掘第1章数据仓库的概念与体系结构授课教师:马楠2012/11/61前言:关于数据仓库DataWarehouse(DW)?1:数据仓库的提出?2:数据仓库的应用情况及前景?1:数据仓库的提出?:数据库(Database)的作用数据库实训?数据存储、数据安全、并发缓存控制。。。历史与实时数据的处理方式不同历史数据作用:统计分析、大规模访问实时数据:更新、小规模访问放到一个系统中的问题?数据仓库主要存放历史数据?1:数据仓库的提出?数据仓库是替代数据库的吗不是,并存数据仓库的数据主要用来做统计分析

2、、数据挖掘代价:数据冗余硬件、软件投资维护人员数据导入导出异构系统的融合。。。?1:数据仓库的提出?数据仓库就是数据库数据的简单备份吗不是数据结构不一样二维表立方体访问方式不一样SQL查询旋转、下钻、上卷、切片等?2:数据仓库的应用情况及前景20世纪90年代兴起2000年以来,在中国发展迅速,各大领域分别启动数据仓库项目中国移动、淘宝、银行、保险、旅游、气象。。。?2:数据仓库的应用情况及前景中国移动:2003年,经过激烈竞争,中国移动选中Teradata数据仓库解决方案以开发其业务分析支持系统(

3、BASS)项目,用以分析来自31个省级分支机构和总公司的业务数据,从而获得纵览企业全局的单一视图,以提高决策质量,提高竞争优势。用数据仓库来寻找潜在用户中国移动建立BASS系统比利时国家电信经纪人使用数据仓库建立的顾客信息系统,其中数据仓库拥有超过1万亿字节的数据,包括四个多月的电话通信记录。通过欺骗检测功能,能够很快发现反常电话以及欺骗性的打电话方式,并能在造成重大经济损失之前终止这种欺骗行为。?2:数据仓库的应用情况及前景淘宝:淘宝自己的数据仓库实施团队淘宝于2004开始基于Oracle产品构建企业级数据仓库(EDW),并

4、于2007年、2008年和2009年三次利用OracleRAC10g和OracleRAC11g对数据仓库系统进行了升级和扩充实现了数据处理和分析时效性的不断提升,过去需要数天才能完成的计算现在当天就能完成,部分以前属于小时级别的计算更是提高到了分钟级别。目前,淘宝数据仓库能够每天处理几亿次的用户行为,日处理的数据量接近30TB,堪称目前国内每天数据处理量最大、最忙的数据仓库。?2:数据仓库的应用情况及前景银行:2002年,招行选择了业界著名厂商Sybase的数据仓库系统。数据仓库和数据挖掘技术在国际上早已成为商业银行业快速发

5、展、科学管理的平台。根据美国META集团的调查,数据仓库技术在美国金融业、制造业、商贸业以及社会服务业等方面都得到广泛的应用,已经采用数据仓库的企业的投资回报率均在40%以上,部分企业高达每年600%。目前,华尔街62%的银行、保险、证券等机构采用数据仓库技术进行风险管理,其中包括著名的摩根·斯坦利、花旗银行、加拿大蒙特利尔银行、加皇银行等。数据仓库服务器SybaseIQ、复制服务器ReplicationServer,以及其他相关软件,帮助金融机构进行风险的评估、预测以及防范等工作,从而使风险控制到最小。?2:数据仓库的应用情况及

6、前景气象:2008年,我校与国家气象中心的预报系统开放实验室合作研究气象数据仓库的建设,目前已经4年多,系统运行并不断推广。1.1数据仓库的概念、特点与组成一、概念数据仓库就是一个面向主题的(SubjectOriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(TimeVariant)的数据集合,通常用于辅助决策支持(DDS)。2012/11/6数据仓库与数据挖掘111.1数据仓库的概念、特点与组成二、特点:面向主题:指用户使用数据仓库进行决策时所关心的重点领域。典型的主题领域:客

7、户、产品、交易、账目。集成的:数据抽取、清理、加工、汇总、整理相对稳定的:通常一起载入数据,不进行一般意义的数据更新;反映历史变化:时间维概念2012/11/6数据仓库与数据挖掘12何谓数据仓库?一种面向分析的环境;一种把相关的各种数据转换成有商业价值的信息的技术。2012/11/6数据仓库与数据挖掘13采购子系统:订单(订单号,供应商号,商品号,类别,单价。数量,总金额,日期,…)供应商(供应商号,供应商名,地址,电话,…)销售子系统:客户(客户号,姓名,地址,电话,…)销售(客户号,商品号,数量,单价,日期,…)库存子系统:

8、进库单(编号,商品号,数量,单价,日期,…)出库单(编号,商品号,数量,单价,日期,…)库存(商品号,库房号,类别,单价,库存数量,总金额,日期,…)商品主题域:商品固有信息:商品号,类别,单价,颜色,…商品采购信息:商

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。