大数据中心考核草案

大数据中心考核草案

ID:46401820

大小:26.22 KB

页数:6页

时间:2019-11-23

大数据中心考核草案_第1页
大数据中心考核草案_第2页
大数据中心考核草案_第3页
大数据中心考核草案_第4页
大数据中心考核草案_第5页
资源描述:

《大数据中心考核草案》由会员上传分享,免费在线阅读,更多相关内容在行业资料-天天文库

1、金融大数据中心考核草案为了更好的推进和保证金融大数据中心建设和对外支持工作,特编写金融大数据中心考核草案,草案主要涉及到金融大数据中心数据开发部、应用开发部、数据挖掘部,各部门要明确相关部门主要的目标、策略、责任及考核最终落实到人;草案涉及到两部分,一部分是要求类,另一部分是考核类,要求类是日常设计、开发或运维等工作中需要遵守且对中心内部比较重要的指标或事项,考核类主要是影响业务正常开展的相关指标,系统的不可用、不及时、不准确等对业务部门的工作造成了一定的影响,都属于本中心考核范畴;考核草案详情如下:一、数

2、据开发部1.数据定义有逻辑模型和物理模型,并有建模说明,建模按照建模规范进行,模型标准和规范进行考核。建模规范、考核标准2.数据分类数据按照数据仓库行业标准并结合金融大数据中心实际内容指定标准分类,数据严格按照分类进行划分(例如:数据归类可划分当事人、产品、渠道、合约、机构、事件、活动、账务等)分类标准、考核标准3.元数据管理从以下几点进行考核:1)对数据仓库中的数据(包含来源以及数据仓库中产生的数据)进行描述,相关人员可以查看。2)统一记录好ETL中调度时间、依赖、抽取内容、方式、方法等。3)记录并检测系

3、统数据的一致性,并能记录执行情况。4)记录好ETL数据清洗模型、转换模型、加载模型,相关信息入库。4.数据标准主要针对指标的业务标准、技术标准。业务标准:对指标有明确的统计逻辑。技术标准:表、视图、索引、分区、文件、脚本、字段等符合规范,相同指标需要有统一的定义。业务标准、技术标准(有了,看看是否需要完善)1.数据质量1)根据不同的业务需求和规则验证数据是否被正确地转化。2)确保所有预期的数据加载到数据仓库中没有任何数据丢失和截断。3)确保数据在规定和预计的时间框架内被加载到数据仓库中,以确认改进的性能和可

4、扩展性。4)预期数据被添加到目标系统5)确认所有的数据库字段,字段数据加载没有任何截断6)记录计数匹配的数据校验7)被拒绝的数据的错误日志都有详细记录8)NULL值字段9)重复数据未加载10)数据的完整性缺少数据质量衡量标准。2.稳定性:每天ETL调度的出错率需要在总任务量的10%以内,出错要找出出错原因(例如:没有顺序执行、时间延迟、程序错误等),并上报给规划管理部进行记录备案,并纳入季度及年度部门及个人考核。3.其它1)脚本编写等需要有良好的数据库移植性,不适用特定数据库的特殊函数(使用sql9.2标准

5、),便于后期不同的平台、系统、数据的移植。2)安全性:系统的安全性要首先考虑,系统或数据仓库的设计要从网络安全、系统安全、数据安全方面充分考虑,对外数据支持需要走流程,规划管理部要进行审核。1)数据分散与集中相结合:所有数据集中存储,数据仓库根据需要对外系统(中心外或中心内的应用系统)管理分别设置权限,不同的用户维护不同数据。一、应用开发部应用开发部主要涉及到应用程序或接口服务程序的设计、开发、优化、监控、运维等(例如WEB、APP、接口程序等)工作,下面提出针对系统设计、开发或运维时需要考虑的部分指标,指

6、标有待大家进行扩充和完善。1.事务(Transaction)在web中一个事务表示一个“从用户发送请求->webserver接受到请求,进行处理->webserver向DB获取数据->生成用户的object(页面),返回给用户”的过程,一般的响应时间都是针对事务而言的。支持事物个数:?2.请求响应时间请求响应时间指的是从客户端发起的一个请求开始,到客户端接收到从服务器端返回的响应结束,这个过程所耗费的时间,在某些工具中,响应通常会称为“TTLB”,即"timetolastbyte",意思是从发起一个请求开始

7、,到客户端接收到最后一个字节的响应所耗费的时间,响应时间的单位一般为“秒”或者“毫秒”。公式为:响应时间=网络响应时间+应用程序响应时间。标准可参考国外的3/5/10原则:(1)在3秒钟之内,页面给予用户响应并有所显示,可认为是“很不错的”;(2)在3~5秒钟内,页面给予用户响应并有所显示,可认为是“好的”;(3)在5~10秒钟内,页面给予用户响应并有所显示,可认为是“勉强接受的”;(4)超过10秒就让人有点不耐烦了,用户很可能不会继续等待下去;3.事务响应时间事务可能由一系列请求组成,事务的响应时间主要是

8、针对用户而言,属于宏观上的概念,是为了向用户说明业务响应时间而提出的。各系统事物响应时间?1.并发用户数并发一般分为2种情况。一种是严格意义上的并发,即所有的用户在同一时刻做同一件事情或者操作,这种操作一般指做同一类型的业务;还有一种特例,即所有用户进行完全一样操作。各系统的并发用户数?2.吞吐量指的是在一次性能测试过程中网络上传输的数据量的总和.吞吐量/传输时间,就是吞吐率.3.TPS(transactionp

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。