1. 界说元数据策略
1.1. 元数据策略态状组织应何如料理其自身元数据,以及元数据从刻下景色到异日景色的实施清醒
1.2. 环节
1.2.1. 启动元数据策略有打算
1.2.1.1. 启动和有打算的主张是保证元数据策略团队不错界说出短期和恒久地方
1.2.1.2. 包括草拟与举座治理步骤一致的端正、边界和具体地方,然后张开相易有打算以落实治理步骤
1.2.1.3. 关键利益关系方应参与有打算制订
1.2.2. 组织关键利益关系方的访谈
1.2.2.1. 通过对业务东说念主员和技艺东说念主员的访谈,不错得到元数据策略的基础常识
1.2.3. 评估现存的元数据资源和信息架构
1.2.3.1. 评估详情处分元数据和系统问题的难度,在访谈和文档复查中识别这些问题
1.2.4. 开垦异日的元数据架构
1.2.4.1. 优化和证实异日愿景,开垦不错知足料理现阶段元数据环境恒久地方的元数据架构
1.2.5. 制订分阶段的实施有打算
1.2.5.1. 从访谈和数据分析中考据、整合、详情驱逐的优先级,发布元数据策略,并界说分阶段的、不错从刻下景色迈向异日受控的元数据环境的实施方法
2. 贯通元数据需求
2.1. 元数据需求的具体内容是:需要哪些元数据和哪种驻防级别
2.2. 构成
2.2.1. 更新频次
2.2.1.1. 元数据属性和属性集更新的频率
2.2.2. 同步情况
2.2.2.1. 数据泉源变化后的更新时辰
2.2.3. 历史信息
2.2.3.1. 是否需要保留元数据的历史版块
2.2.4. 侦察权限
2.2.4.1. 通过特定的用户界面功能,谁不错侦察元数据,何如侦察
2.2.5. 存储结构
2.2.5.1. 元数据何如通过建模来存储
2.2.6. 集成条件
2.2.6.1. 元数据从不同数据源的整合进度,整合的国法
2.2.7. 运维条件
2.2.7.1. 更新元数据的处理过程和国法(纪录日记和提交央求)
2.2.8. 料理条件
2.2.8.1. 料理元数据的变装和职责
2.2.9. 质料条件
2.2.9.1. 元数据质料需求
2.2.10. 安全条件
2.2.10.1. 一些元数据不应公开,因为会露馅某些高度守秘数据的信息
3. 界说元数据架构
3.1. 元数据料理系统必须具有从不同数据源聚集元数据的才气,联想架构时应确保不错扫描不同元数据源和如期地更新元数据存储库,系统必须因循手工更新元数据、请求元数据、查询元数据和被不同用户组查询
3.2. 受控的元数据环境应为最终用户屏蔽元数据的各类性和各别性
3.3. 元数据架构应为用户侦察元数据存储库提供长入的进口,该进口必须向用户透明地提供统共关系元数据资源,这意味着用户不错在不温顺数据源的各别的情况下侦察元数据
3.4. 减少对UDF的依赖,最终用户将愈加平直地网罗、查验和使用数据集,此时好多因循的元数据通常不错更好地公开
3.5. 创建元模子
3.5.1. 创建一个元数据存储库的数据模子,也叫元模子,是界说元数据策略和贯通业务需求后的第一个联想环节
3.6. 诈欺元数据圭臬
3.6.1. 元数据处分决接应罢黜在元数据策略中已界说的对内和对外的圭臬,数据治理作为应监督元数据的圭臬肯定情况
3.6.2. 组织对内元数据圭臬包括定名表率、自界说属性、安全、可见性和处理过程文档,组织对外元数据圭臬包括数据交换模样和应模范接口联想
3.7. 料理元数据存储
3.7.1. 实施适度作为以料理元数据环境
3.7.2. 存储库的适度作为是由元数据民众实行的元数据转移和存储库更新的适度
3.7.3. 适度作为
3.7.3.1. 功课转移和监控
3.7.3.2. 加载统计分析
3.7.3.3. 备份、复原、存档、摒弃
3.7.3.4. 设立修改
3.7.3.5. 性能调优
3.7.3.6. 查询统计分析
3.7.3.7. 查询和报表生成
3.7.3.8. 查询和报表生成
3.7.4. 质料适度作为
3.7.4.1. 质料保证,质料适度
3.7.4.2. 数据更新频率——与时辰表匹配
3.7.4.3. 缺失元数据报
3.7.4.4. 未更新的元数据论说
3.7.5. 元数据料理作为
3.7.5.1. 加载、探伤、导入和符号数据钞票
3.7.5.2. 纪录与源的映射和转移关系
3.7.5.3. 纪录版块
3.7.5.4. 用户界面料理
3.7.5.5. 集结数据集的元数据珍摄——为NOSQL提供因循
3.7.5.6. 数据与对内数据聚集建立集结——自界说集结和功课元数据
3.7.5.7. 外部数据源和订阅源的许可
3.7.5.8. 数据增强元数据,如关联GIS
3.7.6. 培训作为
3.7.6.1. 老师和培训用户和数据专员
3.7.6.2. 生成和分析料理方针
3.7.6.3. 对适度作为、查询、论说进行培训
4. 创建和珍摄元数据
4.1. 好的元数据不是有时产生的,而是厚爱有打算的驱逐
4.2. 包袱(Accountability)
4.2.1. 雄厚到元数据通常通过现存经由产生(数据建模,SDLC,业务经由界说),因此经由的实行者对元数据的质料负责
4.3. 圭臬(Standards)
4.3.1. 制定、实行和审计元数据圭臬,简化集成过程,而况适用
4.4. 改良(Improvement)
4.4.1. 建立反馈机制保险用户不错将不准确或已过期的元数据告知元数据料理团队
4.5. 整合元数据
4.5.1. 集成过程中从通盘企业边界内网罗和整合元数据,包括从企业外部获得的数据中的元数据
4.5.2. 专用接口
4.5.2.1. 接管单步方式,扫描模范从开头系统中聚集元数据,平直调用特定模样的装载模范,将元数据加载到元数据存储中
4.5.3. 半专用接口
4.5.3.1. 接管两步方式,扫描模范从开头系统中聚集元数据,并输出到特定模样的数据文献中
4.5.4. 适度文献
4.5.4.1. 包含数据模子的数据源结构信息
4.5.5. 重用文献
4.5.5.1. 包含料理装载经由的重用国法信息
4.5.6. 日记文献
4.5.6.1. 在经由的每一阶段、每次扫描或抽取操作生成的日记
4.5.7. 临时和备份文献
4.5.7.1. 在经由中使用或作念纪念佛由所使用的文献
4.5.8. 暂存区不错接管文献目次或数据库的形状
4.5.9. 数据仓库和商务智能所使用的数据整合器具通常也适用于元数据整合
4.6. 分发和传递元数据
4.6.1. 传递机制
4.6.1.1. 元数据里面网站,提供浏览、搜索、查询、论说和分析功能
4.6.1.2. 论说、术语表和其他文档
4.6.1.3. 数据仓库、数据集市和BI(商务智能)器具
4.6.1.4. 建模和软件开垦器具
4.6.1.5. 音信传送和事务
4.6.1.6. Web事业和诈欺模范接口(API)
4.6.1.7. 外部组织接口决策(如供应链处分决策)
5. 查询、论说和分析元数据
5.1. 提供给业务用户的诈欺界面和功能与提供给技艺用户和开垦东说念主员的界面和功能有所不同,ag百家乐直播后者可能会包括有助于新功能开垦(如变更影响分析)或有助于处分数据仓库和商务智能技俩中数据界说问题(如数据血统关系论说)的功能
6. 器具
6.1. 料理元数据的主要器具是元数据存储库
6.2. 元数据料理器具提供了在集结位置(存储库)料理元数据的功能
6.3. 元数据存储库还提供与其他系统交换元数据的功能
6.4. 元数据料理器具和存储库自身亦然一种元数据的数据源,至极是在羼杂型元数据架构模子或大型企业架构中
7. 方法
7.1. 数据血统和影响分析
7.1.1. 发现和纪录数据钞票的元数据的一个迫切意旨在于提供了数据如安在系统间转化的信息
7.1.2. 基于模范编码确刻下版块的血统称为“扫尾态血统(As Implemented Lineage)”
7.1.3. 映射表率文档中态状的血统称为“联想态血统(As Designed Lineage)”
7.1.4. 数据血统创建的局限性在于元数据料理系统的掩饰边界
7.1.5. 导入“扫尾态血统”,并从无法自动抽取的“联想态血统”文献中获得实施细节加以补充
7.1.6. 跟着系统中数据元的多数增多,数据血统关系的发现变得复杂且难以料理
7.1.7. 业务焦点
7.1.7.1. 字据业务优先级寻找数据元的血统关系
7.1.8. 技艺焦点
7.1.8.1. 从源系统驱动识别平直关系的数据使用者,次第识别迤逦的数据使用者,直到识别出统共系统为止
7.1.8.2. 技艺东说念主员不错从这个系统的识别策略中获益,有助于回应各类各样的数据问题
7.1.9. 纪录血统关系有助于业务和技艺东说念主员使用数据,如缺失数据血统,用户将需破耗多数时辰来查验非常喜跃、潜在的变更影响和其他未知驱逐
7.1.10. 但愿扫尾一个集成的影响和血统器具,以贯通加载过程中波及的统共挪动部分以及最终用户论说和分析
7.1.11. 影响论说详尽了哪些组件受到潜在变更的影响,加快和简化评估和珍摄任务
7.2. 诈欺于大数据聚集的元数据
7.2.1. 大部分数据料理专科东说念主员更熟谙和合乎结构化数据存储,结构化数据的每个数据项皆有明晰的界说和符号
7.2.2. 元数据标签应在聚集时诈欺于数据,然后元数据不错用来识别可侦察的数据湖中的数据内容
8. 实施指南
8.1. 使用渐进的环节竖立实施受控的元数据料理环境,可减少组织的风险,并便于用户接管
8.2. 存储库的内容在联想上应该是通用的,而不仅仅反应源系统的数据库联想
8.3. 第一个实施的是考据宗旨并学习料理元数据环境的试点技俩
8.4. 就绪评估/风险评估
8.4.1. 领有矍铄的元数据策略,有助于统共东说念主进行更高效果的决策
8.4.2. 统共东说念主应意志到不虞理元数据的风险
8.4.3. 影响
8.4.3.1. 因不正确、不完满和不对理的假定或枯竭数据内容的常识导致造作判断
8.4.3.2. 领会敏锐数据,使客户或职工面对风险,影响营业信誉和导致法律纠纷
8.4.3.3. 如若了解数据的那些限制民众们离开了,那么他们了解的常识也随之被带走了
8.4.4. 对元数据关系作为近况进行妥当的进修度评估,评估内容应包括迫切的业务数据元、可用的元数据术语表、数据血统、数据剖析和数据质料料理过程、主数据料理进修度和其他方面
8.4.5. 元数据策略是举座数据治理策略的一部分,是扫尾存效数据治理的第一步
8.5. 组织和文化变革
8.5.1. 元数据有打算频频碰到文化阻力
8.5.2. 组织准备进度是一个主要温顺点,治理和适度的方法亦然如斯
8.5.3. 元数据料理在好多组织中是一项低优先级的责任
8.5.4. 企业数据治理策略的扫尾需要高等料理层的因循和参与,条件业务东说念主员和技艺东说念主员省略以跨职能的方式艰深合作
9. 元数据治理
9.1. 组织应详情他们料理元数据人命周期的具体需求,并开展元数据治理责任以知足这些需求
9.2. 建矗立式的变装和职责并分拨专用资源,至极是在大型或业务关键限制中
9.3. 元数据治理过程自身依赖于可靠的元数据,因此负责料理元数据的团队不错在创建和使用元数据的过程中对料理原则进行考据测试
9.4. 过程适度
9.4.1. 数据料理团队应负责界说圭臬和料理元数据的景色变化(通常使用责任流或和谐软件),同期不错负责组织内的质料进步作为、培训有打算或骨子培训作为
9.4.2. 需要将元数据策略集成到软件开垦的人命周期中,确保变更过的元数据实时得到网罗,以确保元数据保抓最新
9.5. 元数据处分决策的文档
9.5.1. 元数据的主目次包括刻下作用域中的源和地方
9.5.2. 元数据料理实施景色
9.5.3. 源和地方元数据存储
9.5.4. 元数据更新的转移有打算信息
9.5.5. 留存和保抓的版块
9.5.6. 内容
9.5.7. 质料声明或劝诫(如缺失的值)
9.5.8. 纪录系统和其他数据源景色(如数据内容历史加载、删除或更新标志)
9.5.9. 关系的器具、架构和东说念主员
9.5.10. 敏锐信息和数据源的移除或脱敏策略
9.6. 元数据圭臬和指南
9.6.1. 在与业务贸易伙伴交换数据时,元数据圭臬是必弗成少的
9.6.2. 器具厂商提供XML、JSON或REST技艺因循其数据料理居品的数据交换,他们使用相通的策略将器具绑定到处分决策套件中
9.6.2.1. 数据整合、关系和多维数据库、需求料理、BI论说、数据建模和业务国法在内的技艺使用XML提供了数据和元数据导入和导出功能
9.6.3. 教导方针包括模板、关系示例、关联预期输入和更新的培训,以及“不使用术语界说术语”等国法和完满性声明
9.6.4. 元数据的ISO圭臬为器具开垦东说念主员提供了教导
10. 度量方针
10.1. 元数据存储库完满性
10.1.1. 将企业元数据(边界内的统共居品和实例)的理思掩饰率与骨子掩饰率进行比拟
10.1.2. 参照元数据料理边界界说的策略
10.2. 元数据料理进修度
10.2.1. 字据才气进修度模子(CMM-DMM)的进修度评估方法,开垦用于判断企业元数据进修度的方针
10.3. 专职东说念主员配备
10.3.1. 通过专职东说念主员的任命情况、通盘企业的专职东说念主员掩饰边界,以及职位态状中的变装界说评释,来评估的组织对元数据的原意
10.4. 元数据使用情况
10.4.1. 不错通过存储库的侦察次数忖度用户对元数据存储库的使用情况和接管进度
10.5. 业务术语作为
10.5.1. 使用、更新、界说解析、掩饰边界
10.6. 主数据事业数据肯定性
10.6.1. 自满SOA处分决策中数据的重用情况
10.7. 元数据文档质料
10.7.1. 一个质料方针是通过自动和手动两种方式评估元数据文档的质料
10.7.2. 另一个度量方针是度量具有界说的属性的百分比,以及跟着时辰的推移而发生变化的趋势
10.7.3. 质料度量标明存储库中元数据的完满性、可靠性、通用性等
10.8. 元数据存储库可用性
10.8.1. 正常运行时辰、处理时辰(批处理和查询)AG百家乐下载
着手:国防部发布AG百家乐感觉被追杀 《当那一天驾临》 这是一个晴明的清晨 鸽哨...
声明丨本文本质均援用泰斗府上攀附个东说念主不雅点进行撰写,文末已标注文件开首及截...
1. 界说元数据策略 1.1. 元数据策略态状组织应何如料理其自身元数据,以及元...
出品:公共网“环聚一堂”责任室 策动:封青、原丹、张浒泉 制图:刘军延ag百家乐...