数据仓库与数据挖掘课后习题答案.doc

数据仓库与数据挖掘课后习题答案.doc

ID:49120536

大小:24.00 KB

页数:7页

时间:2020-02-29

数据仓库与数据挖掘课后习题答案.doc_第1页
数据仓库与数据挖掘课后习题答案.doc_第2页
数据仓库与数据挖掘课后习题答案.doc_第3页
数据仓库与数据挖掘课后习题答案.doc_第4页
数据仓库与数据挖掘课后习题答案.doc_第5页
资源描述:

《数据仓库与数据挖掘课后习题答案.doc》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、数据仓库与数据挖掘第一章课后习题一:填空题1)数据库中存储的都是数据,而数据仓库中的数据都是一些历史的、存档的、归纳的、计算的数据。2)数据仓库中的数据分为四个级别:早起细节级、当前细节级、轻度综合级、高度综合级。3)数据源是数据仓库系统的基础,是整个系统的数据源泉,通常包括业务数据和历史数据。4)元数据是“关于数据的数据”。根据元数据用途的不同将数据仓库的元数据分为技术元数据和业务元数据两类。5)数据处理通常分为两大类:联机事务处理和联机事务分析6)Fayyad过程模型主要有数据准备,数据挖掘和结果分析三个主要部分组成。7)如果从整体上看数据挖掘技术,

2、可以将其分为统计分析类、知识发现类和其他类型的数据挖掘技术三大类。8)那些与数据的一般行为或模型不一致的数据对象称做孤立点。9)按照挖掘对象的不同,将Web数据挖掘分为三类:web内容挖掘、web结构挖掘和web使用挖掘。10)查询型工具、分析型工具盒挖掘型工具结合在一起构成了数据仓库系统的工具层,它们各自的侧重点不同,因此适用范围和针对的用户也不相同。二:简答题1)什么是数据仓库?数据仓库的特点主要有哪些?数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。主要特点:面向主题组织的、集成的、稳定的、随时间不断变化的、

3、数据的集合性、支持决策作用2)简述数据挖掘的技术定义。最新可编辑word文档从技术角度看,数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际数据中,提取隐含在其中的、人们不知道的、但又是潜在有用的信息和知识的过程。1)什么是业务元数据?业务元数据从业务角度描述了数据仓库中的数据,它提供了介于使用者和实际系统之间的语义层,使得不懂计算机技术的业务人员也能够读懂数据仓库中的数据2)简述数据挖掘与传统分析方法的区别。本质区别是:数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识。数据挖掘所得到的信息应具有先前未知、有效和实用三个特征。3)简述数据仓库

4、4种体系结构的异同点及其适用性。a.虚拟的数据仓库体系结构b.单独的数据仓库体系结构c.单独的数据集市体系结构d.分布式数据仓库结构第二章课后习题一:填空题1)模型是对现实世界进行抽象的工具。在信息管理中需要将现实世界的事物及其有关特征转换为信息世界的数据才能对信息进行处理与管理,这就需要依靠数据模型作为这种转换的桥梁。2)数据仓库模型设计包括概念、逻辑、物理、元数据模型设计等内容。3)现实世界是存在于现实之中的各种客观事物。概念世界是现实情况在人们头脑中的反应。逻辑世界是人们为将存在于自己头脑中的概念模型转换到计算机中的实际的物理存储过程中的一个计算机

5、逻辑表示模式。计算机世界则是指现实世界中的事物在计算机系统中的实际存储模式。最新可编辑word文档1)数据仓库设计的概念模型与业务数据处理系统的三级数据模型仍然具有一定的差距。表现在数据类型的差异、数据的历史变迁性、数据概况性2)数据仓库项目需求的收集与分析需求要从历史数据与用户需求两个方面同时着手,采用数据驱动+用户驱动的理念。3)所谓主题,是指在较高程度上将业务数据进行综合,归类和分析利用的一个抽象概念,每个主题基本对立业务的一个分析领域。4)多维数据模型较为普遍地采用星型模型、雪花模型两种模式。5)设计聚集模型时,首先需要考虑用户的使用要求,其次要

6、考虑数据仓库的粒度模型和数据的统计分析情况。6)分割是数据仓库逻辑设计中要解决的另一个重要问题,它的目的在于提高效率能为数据仓库的物理实施提供设计依据。7)元数据根据使用情况,主要有技术元数据和业务元数据两类元数据。二:简答题1)简述概念模型设计主要完成哪些工作?界定系统边界、确定主要的主题域、细化分析具体内容2)简述一个符合第三范式的关系必须具有的三个条件。A.每个属性的值唯一,不具有多义性B.每个非主属性必须完全依赖于整个主键C.每个非主属性不能依赖于其他关系中的属性。3)简述确定粒度级别的步骤A.估算DASDB.计算存储空间、确定是否划分粒度。C.

7、计划影响数据仓库的粒度划分D.使用多重粒度E.使用多种存储介质的空间量F.选择合适的粒度最新可编辑word文档G.只采用概况数据1)简述CWM五个功能层对象模型层、基础层、资源层、分析层、管理层2)数据仓库物理模型进行优化时可以考虑的解决方案有哪些?A.合并表与簇文件B.建立数据序列C.引入冗余,反规范处理D.表的物理分割分区E.生成派出数据第三章课后习题一:填空题1)ETL过程主要包括三个部分:数据抽取、数据清洗与数据转换以及数据的加载。2)ETL工作流模型包括ETL概念模型和ETL逻辑模型两部分。3)触发器方式是普遍采取的一种增量抽取机制。该方式是根

8、据抽取要求,在要被抽取的源表上建立插入、修改和删除3个触发器。4)一般情况下,在

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。