您当前的位置:首页 > 互联网百科 > 大数据

数据中台开发流程

时间:2022-08-15 16:31:59  来源:搜狐号  作者:梯度云

数据中台主要功能是进行数据分析,担负公司产品的数据分析工作,数据中台对数据的采集、存储、打通、使用。如何进行数据中心的开发保证数据使用。数据中台的开发流程有哪些?如下图数据中台开发流程所示:一个指标从口径的确认到上线、迭代都要经历图示的这些过程:

数据中台开发流程

数据中台开发流程一共有11个步骤:业务口径梳理、技术口径梳理、原型设计和评审、模型设计、数据开发、后端开发、前端开发、联调、测试、上线、迭代。接下来我们分析这些步骤都是做什么的:

1.业务口径梳理

由数据中台产品经理来主导,产品经理提出该指标的产品/运营负责人沟通,要问清楚这个指标有什么用、给谁用、业务流程是什么,还要确定指标定义、统计周期、计算方式等。开发指标都要考虑开发这个指标的性价比:投入人力、资源是否值得。

2.技术口径梳理

由模型设计师主导,首先, 模型设计师需要理解数据指标涉及的业务逻辑,还需要理解指标定义、统计周期、计算方式等。模型设计师需要与产品线的开发人员一起梳理数据指标涉及的表结构和字段,要精确到字段级别,在确定好这些字段后,就能初步判定这个指标在技术层面能不能统计,如果不能统计,告知产品经理∶①目前这个阶段还没法计算相关指标,②做了哪些功能后才能计算这些指标。

3.原型设计和评审

由产品经理主导,基于运营的需求设计原型,在原型设计完后,要经过内部评审和外部评审。在内部评审中,产品经理要召集数据中台的架构师、模型设计师、数据开发工程师、后端开发工程师、前端开发工程师、UI设计师、测试工程师,说明整个功能的价值和详细的业务流程、操作流程,确保大家理解一致。

4.模型设计

由数据中台的模型设计师主导,一般会采用分层建模的方式对数据进行更加科学的组织与存储。模型一般分为5层,分别为ODS层(操作数据层)、DIM层(维度数据层)、DWD层(明细数据层)、DWS层(汇总数据层)、ADS层(应用数据层),这是业界对于数据分层的常用的模型。模型设计工程师要清楚地知道数据来源于哪里、要怎么存储。

5.数据开发

由数据开发工程师主导,首先,数据开发工程师要和模型设计师确定技术口径,明确计算的指标都来自哪些业务系统。接着,数据开发工程师通过数据同步工具将数据同步到ODS层,并一层层地汇总,从ODS层到DWD层,再到DWS层,直到最后把可以直接服务应用的数据填充到ADS层。另外,大数据开发工程的一个比较重要的工作就是设置调度任务—简单来讲就是配置指标在什么时候计算。

6.后端开发

后端开发主导,对产品经理的需求文档中的功能,将接口数据输出给前端工程师,对外提供服务的数据存储在ADS 层,后端开发工程师一般是基于ADS层的数据将数据封装成对外服务的接口,后端开发工程师一方面要和数据开发工程师沟通好ADS层数据的存储结构,另一方面需要和产品经理沟通产品的功能、性能方面的问题,以便为使用者提供更好的用户体验。

7.前端开发

由前端开发工程师主导,在原型设计出来后,产品经理会让UI设计师基于产品功能原型设计UI,在功能界面最终定型后,UI设计师会给前端开发工程师提供切图,前端开发工程师基于UI的切图做前端页面的开发。

8.联调

大数据开发、前端、后端一起参与,在历史数据的基础上承担数据准确性的校验,前端开发工程师和后端开发工程师负责解决用户操作的相关问题,保证不出现低级的错误。

9.测试

由测试工程师主导,在完成原型评审后,测试工程师就要开始写测试用例,哪些是开发人员自测通过后才能交上来测试的内容、哪些是开发人员要再次自测验证的内容,都需要在测试用例文档上写清楚。在最终测试没问题后,进行试用,如果在试用中发现数据准确性的问题则需要再进行一轮测试,以验证数据。

10.上线

运维工程师会配合数据中台的前端开发工程师、后端开发工程师将最新的版本更新到服务器中,重要的指标,再次进行内部验证,保证数据的准确性。

11.迭代

数据指标上线后,随着公司业务的变化,指标的口径可能也会有所变动,所以也要定期盘点已有的指标,如果指标有变化,需要不断迭代,保证指标的准确性。



Tags:数据中台   点击:()  评论:()
声明:本站部分内容及图片来自互联网,转载是出于传递更多信息之目的,内容观点仅代表作者本人,不构成投资建议。投资者据此操作,风险自担。如有任何标注错误或版权侵犯请与我们联系,我们将及时更正、删除。
▌相关推荐
上数据中台的第一步:理清数据中台5个建设步骤
为什么很多企业上了数据中台却用不起来,其中有一个容易被忽略的原因,就是在前期建设时,没有想清楚,并做好规划,后期用起来就很难“趁手”。那么数据中台建设步骤到底是怎样的?惟客...【详细内容】
2023-11-24  Search: 数据中台  点击:(239)  评论:(0)  加入收藏
高时效、低成本, Apache Doris 在文旅业态下的统一数据中台实践
作者|NearFar X Lab 团队 洪守伟、陈超、周志银、左益、武超整理|SelectDB 内容团队导读: 无锡拈花云科技服务有限公司(以下简称拈花云科)是由中国创意文旅集成商拈花湾文旅和北...【详细内容】
2023-07-03  Search: 数据中台  点击:(359)  评论:(0)  加入收藏
企业级数据中台架构
一、什么是数据中台数据中台是一种将企业沉睡的数据变成数据资产,持续使用数据、产生智能、为业务服务,从而实现数据价值变现的系统和机制。通过数据中台提供的方法和运行机制...【详细内容】
2023-02-15  Search: 数据中台  点击:(112)  评论:(0)  加入收藏
数据中台开发流程
数据中台主要功能是进行数据分析,担负公司产品的数据分析工作,数据中台对数据的采集、存储、打通、使用。如何进行数据中心的开发保证数据使用。数据中台的开发流程有哪些?如下...【详细内容】
2022-08-15  Search: 数据中台  点击:(396)  评论:(0)  加入收藏
被坑的过来人告诉你,为什么数据中台永远都搞不成?
不知几年前,数据中台这个概念开始变得很热闹,各个机构都要上中台,中台架构意味着先进,人见人爱,也冒出许多以中台为业的软件公司。然而,大概从去年中开始,听说又有好多机构开始忙着...【详细内容】
2021-08-19  Search: 数据中台  点击:(352)  评论:(0)  加入收藏
数据中台到底长什么样子?4张图带你详解数据中台架构
数据中台不是一个单纯的系统,而是一套架构、一套数据流转模式。数据中台需要采集数据作为原材料进行数据加工、数据建模,然后分门别类地储存,再根据实际的业务场景,打造各类数据...【详细内容】
2021-08-16  Search: 数据中台  点击:(591)  评论:(0)  加入收藏
谈谈数据中台的“集存通用治”
在人工智能、大数据等技术发展和企业数字化转型加速的双重驱动下,数据中台在众多赛道中脱颖而出,成为行业焦点。除了提供综合解决方案的互联网头部企业之外,专注于某一具体场景...【详细内容】
2021-07-28  Search: 数据中台  点击:(431)  评论:(0)  加入收藏
什么是理想的数据中台架构
当人们谈论数据中台时,他们在谈论什么当下,人人都在谈论数字化转型,但怎么转,做什么,中台有可能成为企业推进数字化转型的有效方法之一。“中台”早期是由美军的作战体系演...【详细内容】
2021-06-11  Search: 数据中台  点击:(437)  评论:(0)  加入收藏
数据仓库、数据集市、数据湖、数据中台这些概念,终于整明白了
这几年的数据领域出现好多的概念,例如:人工智能、物联网、边缘计算、数据治理、数据湖、数据中台……可谓是“百花齐放”!一时间大家都在提新概念,但却不是所有人都...【详细内容】
2021-02-25  Search: 数据中台  点击:(372)  评论:(0)  加入收藏
数据中台到底包括什么内容?一文详解架构设计与组成
导读:《终于有人把数据中台讲明白了》一文讲到数据中台的定义和价值,本文将介绍数据中台到底包括什么内容。企业建设数据中台的过程中哪些能力是必选项,哪些是可选的,将在本文一...【详细内容】
2020-11-10  Search: 数据中台  点击:(326)  评论:(0)  加入收藏
▌简易百科推荐
大数据杀熟何时告别“人人喊打却无可奈何”?
2月7日郑州飞往珠海的航班,不同手机、不同账号搜索该航班显示出不同价格。图源网络有网友近日分享在某平台的购票经历,引发社会广泛关注——用3个账号买同一航班同...【详细内容】
2024-01-30    中国青年网  Tags:大数据杀熟   点击:(33)  评论:(0)  加入收藏
简易百科:到底什么是大数据?
随着互联网的快速发展,大数据已经成为了当今社会最热门的话题之一。那么,到底什么是大数据呢?首先,我们需要明确大数据的定义。大数据是指数据量极大、类型繁多、处理难度高的数...【详细内容】
2024-01-30    简易百科  Tags:大数据   点击:(40)  评论:(0)  加入收藏
数据采集新篇章:AI与大模型的融合应用
开篇在AIGC(人工智能与通用计算)应用中,大型语言模型(LLM)占据着举足轻重的地位。这些模型,如GPT和BERT系列,通过处理和分析庞大的数据集,已经极大地推动了自然语言理解和生成的边界...【详细内容】
2024-01-17  崔皓  51CTO  Tags:数据采集   点击:(52)  评论:(0)  加入收藏
挑战 Spark 和 Flink?大数据技术栈的突围和战争
十年的轮回,正如大数据的发展一般,它既是一个轮回的结束,也是崭新的起点。大数据在过去的二十年中蓬勃发展,从无到有,崛起为最具爆炸性的技术领域之一,逐渐演变成为每个企业不可或...【详细内容】
2024-01-17  InfoQ    Tags:大数据   点击:(40)  评论:(0)  加入收藏
分布式存储系统在大数据处理中扮演着怎样的角色?
如果存储节点本身可以定制,则通常会让其支持部分计算能力,以利用数据的亲和性,将部分计算下推到相关的存储节点上。如果存储是云上的 S3 等对象存储,无法定制,则通常会将数据在计...【详细内容】
2023-12-19  木鸟杂记  微信公众号  Tags:大数据   点击:(48)  评论:(0)  加入收藏
大数据如何实时拯救生命:车联网的数据分析有助预防交通事故
译者 | 李睿审校 | 重楼车联网(IoV)是汽车行业与物联网相结合的产物。预计车联网数据规模将越来越大,尤其是当电动汽车成为汽车市场新的增长引擎。问题是:用户的数据平台准备...【详细内容】
2023-12-19    51CTO  Tags:大数据   点击:(41)  评论:(0)  加入收藏
利用生成对抗网络进行匿名化数据处理
在互联网时代,数据日益成为人们的生产资料。然而,在某些情况下,我们需要分享数据,但又需要保护个人隐私。这时,匿名化技术就显得尤为重要。本文将介绍利用生成对抗网络进行匿名化...【详细内容】
2023-12-18  技巧达人小影    Tags:数据处理   点击:(57)  评论:(0)  加入收藏
盘点那些常见的数据中心类型,你知道几个?
在数字化潮流的浪潮下,数据中心如同企业的神经系统,关系到业务的稳健运转。而在这个巨大的网络中,各种数据中心类型如雨后春笋般崭露头角。从企业级的个性至云数据中心的虚拟化...【详细内容】
2023-12-07  数据中心之家  微信公众号  Tags:数据中心   点击:(66)  评论:(0)  加入收藏
数据中心的七个关键特征
随着信息技术的不断演进,数据中心的可靠性、可扩展性、高效性、安全性、灵活性、管理性和可持续性成为业界探讨的焦点。下面让我们一同深入剖析这些关键特征,了解它们是如何影...【详细内容】
2023-12-06  数据中心之家  微信公众号  Tags:数据   点击:(63)  评论:(0)  加入收藏
什么是数据解析?将数据转化为更好的决策
什么是数据解析?数据解析是一门专注于从数据中获取洞察力的学科。它包含数据分析(data analysis)和管理的流程、工具和技术,包括数据的收集、组织和存储。数据解析的主要目的是...【详细内容】
2023-12-06  计算机世界    Tags:数据解析   点击:(62)  评论:(0)  加入收藏
站内最新
站内热门
站内头条