分享好友 最新动态首页 最新动态分类 切换频道
关于大数据治理的研究与分析
2024-11-07 21:46

关于大数据治理的研究与分析

关于大数据治理的研究与分析

1数据治理的背景和现状

1.1数据治理背景

随着网络和信息技术的不断普及,人类产生的数据量正在呈指数级增长。大约每两年翻一番,根据监测,这个速度在2020 年之前会继续保持下去。这意味着人类在最近两年产生的数据量相当于之前产生的全部数据量。

大量新数据源的出现则导致了非结构化、半结构化数据爆发式的增长。信息数据的单位由TB-PB-EB-ZB的级别暴增。这些由我们创造的信息背后产生的这些数据早已经远远超越了目前人力所能处理的范畴。如何管理和使用这些数据,逐渐成为一个新的领域,于是大数据的概念应运而生。

关于大数据治理的研究与分析 物联网世界网

  图1 数据治理背景图

1.2数据治理现状

大数据的快速发展,使它成为IT领域的又一大新兴产业。据中央财经大学中国经济管理研究院博士张永力估算,国外大数据行业约有1000亿美元的市场,而且每年都以10%的速度在增长,增速是软件行业的两倍。我国2012年大数据市场规模大约4.7亿元,2013年增速将达到138%,达到11.2亿元,产业发展潜力非常巨大。我国大数据飞速发展的背后存在诸多的问题:相关利益交织,协调难;方案规划容易,落地困难;过度依赖技术工具;对于数据没有明确区分。

关于大数据治理的研究与分析 物联网世界网

  图2 数据现状分析图

2数据治理策略

2.1数据治理要素

关于大数据治理的研究与分析 物联网世界网

  图3 数据治理要素分析图

2.2数据治理策略

第一步:落实合适的人员负责治理。

任何成功的数据治理计划的第一个步骤就是,要在本企业找到CEO可以授权的人,然后让该人负责项目的具体实施。没有什么能取代强有力的领导人。

数据治理是涉及人事的一个难题,这需要在许多不同的利益相关者之间达成共识。因而,在本企业里面选定这样的领导人是一项重要工作。治理官员一旦选定下来,就要成立由企业的利益相关者组成的治理委员会,制订监管政策、向CEO及董事会报告进度。

第二步:调查清楚所处环境。

一旦选定了领导小组,就要调查当前情形,并清查不同部门在不同领域的当前最佳实践。领导小组需要越过独立系统看待问题,而企业数据治理评估方法对这项工作来说必不可少。这有助于比较本企业的数据治理计划目前处于什么状态,并且提供了一份路线图以便确定以后的目标。

第三步:制订数据治理策略。

数据治理评估之后,治理委员会就应当考虑制订远景,希望公司的数据治理实践在接下来的几年达到何种目标,根据这种需求为未来制订远景。委员会应当向后规划,并且制订切合实际的里程碑和项目计划来填补相关的缺口。具体办法就是制订关键绩效指标来跟踪进度,并且向CEO和董事会提交年度报告来证实成果。

第四步:算出数据价值。

估算数据价值。要是公司不知道数据的价值,它们就无法提高、保护或者评估数据对账本底线的价值。数据不是一种普通商品,而是像水龙头里出来的水--对生命至关重要,又往往被人们认为是理所当然的。你要是不知道某物的价格,就无法算出它的价值。

如果你想算出数据的价值,就要根据用户权限和IT服务的效用,为数据建立内部市场。当本企业的每个人都在直接付费获取IT服务和数据时,数据的价值就成了公司价目表上的一部分。

第五步:算出风险概率。

知道数据在过去是如何使用和滥用的,这有助于了解数据在将来会如何被危及和披露。每家企业都有一些原因,如一些事件和损失在独立系统、层次体系和商业报告中消失。这些数据已经可供使用,却没有被大多数企业所使用。收集这些数据,与其意义联系起来,并研究长期的损失趋势,这可以帮助任何企业把风险管理转变成基于事实的商业智能方法,从而可分析过去事件,预测未来损失,改变当前的政策要求,成为未来改善风险缓解策略。

第六步:密切关注控制措施的效果。

数据治理在很大程度上涉及企业的组织行为。企业每天在变化,因而它们的数据、价值及风险也在迅速变化。遗憾的是,大多数企业每年对自己只评估一次。要是公司无法改变组织控制措施来满足每天或者每周出现的需求,也就谈不上变化治理。

关于大数据治理的研究与分析 物联网世界网

  图4 数据治理实施建议图

3元数据管理

3.1元数据的定义

技术元数据是存储关于数据仓库系统技术细节的数据,是用于开发和管理数据仓库使用的数据,它主要包括以下信息:数据仓库结构的描述,包括仓库模式、视图、维、层次结构和导出数据的定义,以及数据集市的位置和内容;业务系统、数据仓库和数据集市的体系结构和模式;

业务元数据从业务角度描述了数据仓库中的数据,它提供了介于使用者和实际系统之间的语义层,使得不懂计算机技术的业务人员也能够“读懂”数据仓库中的数据。业务元数据主要包括以下信息:使用者的业务术语所表达的数据模型、对象名和属性名;访问数据的原则和数据的来源;系统所提供的分析方法以及公式和报表的信息;具体包括以下信息:企业概念模型:这是业务元数据所应提供的重要的信息,它表示企业数据模型的高层信息、整个企业的业务概念和相互关系。

3.2为什么要进行元数据管理

关于大数据治理的研究与分析 物联网世界网

  图5 数据管理分析图

3.3数据模型标准化

关于大数据治理的研究与分析 物联网世界网

  图6 数据模型示意图

3.4标准化体系(数据定义&模型设计)

标准化体系:一定范围内的标准按其内在联系形成的科学的有机整体。标准化体系它规定了质量方针、目标、职责和程序,并通过建立相关体系进行过程管理、质量策划、质量控制、质量保证和质量改进。

关于大数据治理的研究与分析 物联网世界网

  图7 标准化体系示意图

4主数据

4.1主数据的定义

企业主数据分散存储在企业各系统内,是对企业至关重要的核心业务实体的数据,比如客户、合作伙伴、员工等。

4.2为什么要作主数据管理

主数据管理(MDM Master Data Management)描述了一组规程、技术和解决方案,这些规程、技术和解决方案用于为所有利益相关方(如用户、应用程序、数据仓库、流程以及贸易伙伴)创建并维护业务数据的一致性、完整性、相关性和精确性。

主数据管理的关键就是“管理”。主数据管理不会创建新的数据或新的数据纵向结构。相反,它提供了一种方法,使企业能够有效地管理存储在分布系统中的数据。主数据管理使用现有的系统,它从这些系统中获取最新信息,并提供了先进的技术和流程,用于自动、准确、及时地分发和分析整个企业中的数据,并对数据进行验证。

关于大数据治理的研究与分析 物联网世界网

  图8 数据管理原因分析图

4.3如何做好主数据管理

通过单一平台上成熟的多领域MDM集中主数据的管理,从而消除点对点集成,简化您的结构,降低维护成本,改进数据治理。Informatica MDM(主数据管理)能够通过以下步骤帮助企业成功进行多领域主数据管理:

1. 建模:用灵活的数据模型定义任意类型的主数据

2. 识别:快速匹配和准确识别重复项目

3. 解决:合并以创建可靠、唯一的真实来源

4. 联系:揭示各类主数据之间的关系

5. 治理:创建、使用、管理和监控主数据

4.4主数据实施流程

关于大数据治理的研究与分析 物联网世界网

  图9 数据管理实施流程图

4.5主数据管理体系

关于大数据治理的研究与分析 物联网世界网

  图10 主数据管理体系流程图

5数据质量管理

5.1数据质量问题

·数据的值域

·数据的定义

·数据的完整性

·数据的有效性

·业务规则

·结构完整性

·数据转换

·数据流

5.2组织架构设计

关于大数据治理的研究与分析 物联网世界网

  图11 架构分析图

5.3数据质量治理流程

关于大数据治理的研究与分析 物联网世界网

  图12 数据质量治理流程图

5.4数据治理管理方法

建立合理的数据管理机构、制定数据质量管理机制、落实人员执行责任、保障组织间高效的沟通、持续监控数据应用过程和领导强有力的督促是保障企业数据质量的关键。

关于大数据治理的研究与分析 物联网世界网

最新文章
推荐三款小说生成工具:一键生成故事与的软件,轻松创作独特作品
在如今这个信息爆炸的时代文学创作不再是少数人的专利。无论是小说家、家还是业余创作者都可借助科技的力量轻松打造出属于本人的独到作品。小说生成工具的出现为广大创作者提供了无限的可能性,只需一键操作,就能生成故事大纲、人物关系甚
ChatGPT中文版网页
ChatGPT中文版网页是一款十分好用的ai聊天软件,在ChatGPT中文版网页中,软件涵盖了多种智能聊天功能,多元化的服务,满足各用户不同需求,用户可以随意提问题,流畅回复,感受智能的对话服务。软件内存很小,不会占用手机太多的内存空间,
开服即被挤爆,AI新拐点来临!
昨日,OpenAI视频生成模型Sora正式版终于发布!此次发布的Sora Turbo,为原始Sora模型的全新高端加速版本,用户不仅可以通过文字提示生成视频,还能将静态图片转化为动态视频,甚至可以对现有视频进行创意改编。作为OpenAI“王炸”产品,So
【经验分享】含多酚多糖植物材料RNA的提取方法
观察与问题笔者在2023年10月至2024年6月跟随师兄对番茄中某转录因子进行研究,研究过程中笔者提取了模式番茄(Solanum lycopersicum)多个生长阶段中各器官RNA超60组。在使用TIANGEN公司RNAprep Pure多糖多酚植物总RNA提取试剂盒(离心柱型
生成式AI新时代:OpenAI、DeepMind与端侧智能的巨变
随着生成式AI技术的不断演进,我们见证了多个重量级产品和平台的重大进展。从OpenAI发布的新模型到DeepMind的视觉语言模型,再到国内端侧智能公司的融资动态,AI领域正迎来一场竞争与创新的热潮。OpenAI的猎户座模型泄露最新消息显示,Open
SEO网站关键词排名优化,提升网站流量与转化率的秘籍解析,揭秘SEO,关键词优化秘籍,助你网站流量与转化率双提升
SEO网站关键词排名优化秘籍解析:通过深入分析关键词策略、优化网站结构和内容质量,有效提升网站在搜索引擎中的排名,从而增加流量和转化率。 *** 包括合理布局关键词、优化页面加载速度、增强用户体验等。掌握这些技巧,助力网站在竞争中
成品网站1.1.719:全流程智能建站工具,让网站优化和流量提升一步到位!
网站制作总是让人望而却步?技术门槛、设计难度、时间成本,这些问题让许多人迟迟未能实现自己的建站计划。然而,一款名为成品网站1.1.719的工具正在悄然改变这一切。它通过简洁的设计和强大的功能,为用户带来了全新的建站体验。不同于传统
谷歌浏览器苹果手机版
谷歌浏览器苹果手机版是针对苹果ios平台而推出的一款移动浏览器,其官方名称又叫做chrome手机浏览器,该软件的性能丝毫不比电脑版差,图片清晰无水印,而且信息很准确,没有其他不相关的内容;新版本更是加入了语音搜索功能、用户无需输入
第49章邪王追妻
  因为通过刚才破妄法眼的透视,王乐根本就没发现进入地下遗址空间的门户。《帝国之雪洗天下》第五卷《血色象牙塔》完。  王乐可不想把这大好时光浪费在等待上面,毕竟这个档口上还远远不是休息的时候。邪王追ࣹ
无需谷歌搜索,教你11个高级搜索技巧!
我是汤老师一个放纵不羁爱自由的人在这里我希望你们不受约束尽情嗨众所周知,谷歌搜索在中国无法使用,鉴于国内的搜索引擎搜索命中率的问题,很多用户在怀念谷歌,也有很多用户仍然在通过各种方式使用谷歌,在大多数情况下用户都是通过基本
相关文章
推荐文章
发表评论
0评