您当前的位置:首页 > 互联网百科 > 大数据

向新手解释数据治理的一个最佳方式

时间:2023-09-17 15:15:00  来源:51CTO  作者:数据驱动智能

数据管理和数据治理可能很难向新手解释。它们涵盖了复杂的数据能力领域,例如元数据管理、数据质量、数据架构、数据编目、数据隐私、数据科学和数据集成。我发现自己在为客户提供建议和向自己团队的新成员提供建议时,很难快速、明确地解释潜在的核心概念。

随着时间的推移,我发现使用类比被证明成功的机会最高。在这种情况下,数据管理可以与房地产管理进行比较,因为两者都需要有效地组织、维护和利用有价值的资产。它不仅有助于理解底层组件,还有助于想象它们如何一起运行。

让我们逐一进行比较:

  • 数据资产:数据资产相当于房地产管理中的建筑物或财产。数据资产也可以被视为数据产品或数据集。数据和房地产管理都围绕管理资产进行,这些资产在适当的治理和培育时会产生价值,但在管理不善时会导致风险和损失。
  • 数据所有权:数据管理中的一个关键概念是所有权 - 职责可以委托给其他人,但最终,一个人或一个团队应该是数据的所有者。对于建筑物来说也是如此,这可能是业主或房东。
  • 数据管理:数据管理涉及将数据资产管理的责任分配给特定的个人或团队,例如,以确保数据具有足够的质量。在房地产管理中,数据管理可以比作负责物业维护和保养的物业经理的角色。
  • 数据消费者/用户:各种个人和业务流程可能会消费组织内部和外部的数据。这可以与将建筑物用于各自目的的租户进行比较。
  • 数据货币化:数据货币化涉及利用数据资产来产生收入,例如通过向其他组织出售数据。在房地产管理中,这相当于从房产中产生收入的方法,例如将空间出租给租户或用于举办活动、出售广告空间或将其全部出售。
  • 数据契约:数据契约是数据生产者和数据消费者之间的正式协议,确认要交换的数据以及相应的格式和质量要求。这可以与租赁协议进行比较,其中描述了房东的期望以及房产将在什么状态下提供。它还概述了该财产可以用来做什么(具体来说,不能用它做什么)——数据契约可以用于类似的目的。
  • 价值量化:估计与资产相关的价值都是值得的。正如财产的价值取决于其位置、大小和状况一样,数据的价值也取决于其相关性、准确性和可访问性。
  • 数据安全和访问控制:数据安全是指保护数据资产免遭未经授权的访问、使用或泄露。在房地产管理中,数据安全可以比作使用锁、警报和安全系统来保护财产免遭盗窃或破坏。
  • 数据架构:这可以比作房产的蓝图,它定义了建筑物的布局、设计和构造。同样,数据架构涉及数据存储和检索系统的设计和结构。架构标准可以为如何构建建筑物提供指南和最佳实践,数据架构标准也可以为数据资产提供相同的指导和最佳实践。
  • 数据域:就像城市被划分为社区一样,数据也可以根据其主题划分为域。任何财产都属于单个域,并且所有域一起包含所有财产 - 这同样适用于数据资产和域。每个社区都有自己的特征,例如人口统计和房产价值,同样,每个数据域也有自己的属性和要求。可以特许像业主委员会会这样的组织(相当于数据域所有者或管理员)来监督这些要求的实施。
  • 数据政策和标准以及监管合规性:这可以与管理财产使用和开发的不同法规进行比较,例如分区法、环境法规以及建筑和消防法规。同样,数据策略和标准定义了组织中管理数据的规则,这些规则源自适用的法规,例如与数据隐私和数据保护相关的法规。
  • 元数据管理:元数据是关于数据的数据——它可以根据数据所包含的数据属性来描述数据资产,谁拥有它,谁有权访问,谁访问过它,何时访问它,它的位置,有多少记录,以及总资产的规模。它可以与有关房产及其功能的详细信息进行比较,例如总平方英尺和立方英尺、所有者、房间数量、位置以及谁拥有建筑物的钥匙。
  • 数据质量:数据质量是指按照准确性、完整性和一致性等维度衡量的数据的适用性。在房地产管理中,数据质量可以与财产的状况和维护进行比较,例如是否存在任何缺陷或安全隐患。
  • 数据修复:数据修复是指识别和纠正数据质量问题的过程。在房地产管理中,数据修复可以与识别和纠正财产缺陷(例如漏水的屋顶或有缺陷的地基)的过程进行比较,以维护财产的价值和安全。
  • 数据使用:这可以与属性使用的测量进行比较,这有助于确定其潜在价值。这包括入住率,但或许还包括更详细的日志,记录谁进入大楼、何时进入、停留多长时间。同样,数据使用测量涉及跟踪和测量组织中数据的使用方式和使用人,以及数据资产的采用程度。
  • 互操作性:这可以与一个属性与其他属性和(上游或下游)系统的兼容性及其共享公共基础设施或资源的能力进行比较。例如,建筑物连接到电网、水网和污水系统,其中每个连接都在电压、水压和管道尺寸以及污水标准方面都有精确定义的标准。类似地,数据互操作性是指资产按照通用标准交换数据并与各种其他系统和应用程序无缝协作的能力。
  • 数据存储:数据存储可以与财产的物理大小和基础结构进行比较。房产可能必须具有一定的最小尺寸,例如才能容纳工业机器或容纳一定规模的家庭。同样,数据存储是指数据库、数据仓库或数据湖中的物理或虚拟存储容量。
  • 数据生命周期:这可以比作房产的生命周期,涉及建设、维护、翻新和拆除等各个阶段。同样,数据生命周期管理涉及在创建、存储、使用、归档和处置等各个阶段管理数据。
  • 数据集成:不同的房产和社区通过道路和交通系统连接起来。特定的建筑物可以方便地到达公共交通和附近的高速公路。数据集成涉及连接来自不同领域和来源的数据,这可能涉及数据清理、数据映射和数据转换等任务,以确保来自不同系统的数据可以一起使用。如果没有集成,您将无法访问或使用数据,就像您无法进入或使用建筑物一样。

房地产类比提供了一种方法来理解数据管理的各个方面以及它们如何协同工作以支持组织的整体数据策略。



Tags:数据治理   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
向新手解释数据治理的一个最佳方式
数据管理和数据治理可能很难向新手解释。它们涵盖了复杂的数据能力领域,例如元数据管理、数据质量、数据架构、数据编目、数据隐私、数据科学和数据集成。我发现自己在为客户...【详细内容】
2023-09-17  Search: 数据治理  点击:(85)  评论:(0)  加入收藏
到底什么是数据治理?包含哪些内容?
一、数据治理的定义关于数据治理,国际数据治理研究所(DGI)给出的定义是:“数据治理是一个通过一系列信息相关的过程来实现决策权和职责分工的系统,这些过程按照达成共识的模型来...【详细内容】
2023-07-27  Search: 数据治理  点击:(80)  评论:(0)  加入收藏
框架结构:非侵入式数据治理框架
以下文章是描述非侵入式数据治理框架的三部分系列文章中的第一篇。该框架由 KIK Consulting & Educational Services ( KIKconsulting.com ) 和 The Data Administration Ne...【详细内容】
2023-07-08  Search: 数据治理  点击:(163)  评论:(0)  加入收藏
24张架构图把数据治理核心内容讲透了
前言随着信息革命和信息化的飞速发展,计算机数据量的急剧增长,数据利用和管理的重要性与日俱增,数据逐渐在信息化这个大舞台上扮演着越来越重要的角色。数据治理是企业大数据基...【详细内容】
2023-06-20  Search: 数据治理  点击:(185)  评论:(0)  加入收藏
如何轻松做数据治理?开源技术栈告诉你答案
搭建一套数据治理体系耗时耗力,但或许我们没有必要从头开始搞自己的数据血缘项目。本文分享如何用开源、现代的 DataOps、ETL、Dashboard、元数据、数据血缘管理系统构建大...【详细内容】
2022-12-27  Search: 数据治理  点击:(194)  评论:(0)  加入收藏
详解非结构化数据治理
随着互联网技术的日新月异,内容数据逐渐在各行业的业务中占据更重要的地位。日常的业务过程中,需要处理的大量电子文档、图片、音频、视频等,都属于内容数据范畴。例如,某银行的...【详细内容】
2022-08-24  Search: 数据治理  点击:(230)  评论:(0)  加入收藏
系统谈数据治理,具体案例来分析 宋懵懵的数据生活
为什么要做数据治理进入到大数据时代,数据领域里的工程师、分析师和科学家们可以很轻易的使用开源世界的各种技术(比如离线处理有MapReduce、Spark,实时处理有Flink、Spark Str...【详细内容】
2020-06-21  Search: 数据治理  点击:(283)  评论:(0)  加入收藏
基于大数据+AI体系的数据治理实践
过去十年,农业银行信息化建设积累了海量的数据。为了盘活这些数据资源,充分发挥数据价值,在大数据平台和AI建设过程中,农业银行采取“统筹规划、顶层设计、分步实施”的策略,不断...【详细内容】
2020-06-16  Search: 数据治理  点击:(342)  评论:(0)  加入收藏
▌简易百科推荐
大数据杀熟何时告别“人人喊打却无可奈何”?
2月7日郑州飞往珠海的航班,不同手机、不同账号搜索该航班显示出不同价格。图源网络有网友近日分享在某平台的购票经历,引发社会广泛关注——用3个账号买同一航班同...【详细内容】
2024-01-30    中国青年网  Tags:大数据杀熟   点击:(32)  评论:(0)  加入收藏
简易百科:到底什么是大数据?
随着互联网的快速发展,大数据已经成为了当今社会最热门的话题之一。那么,到底什么是大数据呢?首先,我们需要明确大数据的定义。大数据是指数据量极大、类型繁多、处理难度高的数...【详细内容】
2024-01-30    简易百科  Tags:大数据   点击:(40)  评论:(0)  加入收藏
数据采集新篇章:AI与大模型的融合应用
开篇在AIGC(人工智能与通用计算)应用中,大型语言模型(LLM)占据着举足轻重的地位。这些模型,如GPT和BERT系列,通过处理和分析庞大的数据集,已经极大地推动了自然语言理解和生成的边界...【详细内容】
2024-01-17  崔皓  51CTO  Tags:数据采集   点击:(50)  评论:(0)  加入收藏
挑战 Spark 和 Flink?大数据技术栈的突围和战争
十年的轮回,正如大数据的发展一般,它既是一个轮回的结束,也是崭新的起点。大数据在过去的二十年中蓬勃发展,从无到有,崛起为最具爆炸性的技术领域之一,逐渐演变成为每个企业不可或...【详细内容】
2024-01-17  InfoQ    Tags:大数据   点击:(40)  评论:(0)  加入收藏
分布式存储系统在大数据处理中扮演着怎样的角色?
如果存储节点本身可以定制,则通常会让其支持部分计算能力,以利用数据的亲和性,将部分计算下推到相关的存储节点上。如果存储是云上的 S3 等对象存储,无法定制,则通常会将数据在计...【详细内容】
2023-12-19  木鸟杂记  微信公众号  Tags:大数据   点击:(48)  评论:(0)  加入收藏
大数据如何实时拯救生命:车联网的数据分析有助预防交通事故
译者 | 李睿审校 | 重楼车联网(IoV)是汽车行业与物联网相结合的产物。预计车联网数据规模将越来越大,尤其是当电动汽车成为汽车市场新的增长引擎。问题是:用户的数据平台准备...【详细内容】
2023-12-19    51CTO  Tags:大数据   点击:(41)  评论:(0)  加入收藏
利用生成对抗网络进行匿名化数据处理
在互联网时代,数据日益成为人们的生产资料。然而,在某些情况下,我们需要分享数据,但又需要保护个人隐私。这时,匿名化技术就显得尤为重要。本文将介绍利用生成对抗网络进行匿名化...【详细内容】
2023-12-18  技巧达人小影    Tags:数据处理   点击:(57)  评论:(0)  加入收藏
盘点那些常见的数据中心类型,你知道几个?
在数字化潮流的浪潮下,数据中心如同企业的神经系统,关系到业务的稳健运转。而在这个巨大的网络中,各种数据中心类型如雨后春笋般崭露头角。从企业级的个性至云数据中心的虚拟化...【详细内容】
2023-12-07  数据中心之家  微信公众号  Tags:数据中心   点击:(65)  评论:(0)  加入收藏
数据中心的七个关键特征
随着信息技术的不断演进,数据中心的可靠性、可扩展性、高效性、安全性、灵活性、管理性和可持续性成为业界探讨的焦点。下面让我们一同深入剖析这些关键特征,了解它们是如何影...【详细内容】
2023-12-06  数据中心之家  微信公众号  Tags:数据   点击:(63)  评论:(0)  加入收藏
什么是数据解析?将数据转化为更好的决策
什么是数据解析?数据解析是一门专注于从数据中获取洞察力的学科。它包含数据分析(data analysis)和管理的流程、工具和技术,包括数据的收集、组织和存储。数据解析的主要目的是...【详细内容】
2023-12-06  计算机世界    Tags:数据解析   点击:(62)  评论:(0)  加入收藏
站内最新
站内热门
站内头条