带你认识DataOps

什么是DataOps

DataOps(数据运维)是一门新兴学科,它将DevOps团队与数据工程师和数据科学家角色召集在一起,以提供工具,流程和组织结构来支持以数据为中心的企业。
DataOps(数据操作)是一种敏捷的,面向过程的方法,用于开发和交付分析。它汇集了DevOps团队,数据工程师和数据科学家,以提供工具,流程和组织结构来支持以数据为中心的企业。Forrester的副总裁兼首席分析师Michele Goetz将DataOps定义为“具有从基础设施到体验的所有技术层,实现解决方案,开发数据产品以及激活数据以实现商业价值的能力。”

DataOps目标

根据[Dataversity的]说法,[DataOps]的目标是基于数据和数据分析来简化应用程序的设计,开发和维护。它试图改善数据管理和产品创建的方式,并将这些改进与业务目标进行协调。

DataOps与DevOps

DevOps是一种软件开发方法,通过将开发团队和运营团队合并为一个负责产品或服务的单一部门,将持续交付交付到系统开发生命周期。DataOps通过增加数据专家(数据分析师,数据开发人员,数据工程师和/或数据科学家)建立在该概念的基础上,以专注于数据流的协作开发和整个组织中数据的连续使用。

“您已经有了开发运维的现代趋势,但是越来越多的人正在将某种数据科学能力注入到开发和系统中,因此,您需要在运维团队中拥有一个具有数据心态的人。” HPE MapR的CTO Ted Dunning和《[机器学习物流:现实世界中的模型管理》的]合著者。

DataOps原则

像DevOps一样,DataOps借鉴了敏捷方法。该方法重视以持续满足客户需求为主要目标的分析见解的交付。

根据《[DataOps宣言》],DataOps团队重视有效的分析,并通过其提供的见解来衡量数据分析的性能。DataOps团队还接受变化,并寻求不断了解不断变化的客户需求。他们围绕目标进行自我组织,并寻求减少“英雄主义”,而采用可持续且可扩展的团队和流程。

DataOps团队还寻求从头到尾协调数据,工具,代码和环境,以提供可重复的结果。DataOps团队倾向于将分析管道视为类似于精益生产线,并定期反映客户,团队成员和运营统计信息所提供的反馈。

适用于DataOps的地方

当今的企业越来越多地将机器学习注入到众多产品和服务中,DataOps是一种旨在满足机器学习的端到端需求的方法。

“例如,这种样式使数据科学家更容易获得软件工程的支持,以提供在部署过程中将模型移交给运营时所需的东西,” Dunning和合著者,HPE首席技术专家艾伦·弗里德曼(Ellen Friedman)写道。 。

他们补充说:“ DataOps方法不仅限于机器学习。” “这种组织风格对于任何面向数据的工作都是有用的,从而使利用全球数据结构所带来的好处变得更加容易。”

他们还指出,DataOps非常适合微服务架构。

实践中的DataOps

根据Dunning和Friedman的说法,为了充分利用DataOps,企业必须发展其数据管理策略,以大规模处理数据并响应发生的现实事件。

他们写道:“传统上孤立的角色可能过于僵化和缓慢,无法很好地适应正在进行数字化转型的大数据组织。” “这就是DataOps风格可以提供帮助的地方。”

由于DataOps建立在DevOps之上,因此跨职能团队跨越诸如运营,软件工程,体系结构和计划,产品管理,数据分析,数据开发和数据工程之类的“技能行会”是必不可少的,因此应在以下位置管理DataOps团队:确保开发人员,运营专业人员和数据专家之间加强协作和沟通的方式。

据Dunning称,数据科学家也可能是DataOps团队的重要成员。他说:“我认为,在这里要做的最重要的事情就是不要坚持传统的象牙塔组织,在该组织中数据科学家与开发团队分开居住。” “您可以采取的最重要的步骤实际上是将数据科学家纳入DevOps团队。当他们住在同一房间,吃相同的饭菜,听到相同的抱怨时,他们自然会结盟。”

但是Dunning还指出,数据科学家可能不需要永久地嵌入到DataOps团队中。

Dunning说:“通常,团队中有一段时间是一位数据科学家。” “他们的能力和敏感性开始减弱。然后,团队中的某个人担当了数据工程师和某种低预算数据科学家的角色。然后,嵌入团队中的实际数据科学家就随波逐流了。这是一个不稳定的情况。”

如何建立一个DataOps团队

弗里德曼说,大多数基于DevOps的企业已经掌握了DataOps团队的核心。一旦他们确定了需要数据密集型开发的项目,他们只需要向团队添加经过数据培训的人员即可。该人甚至可能是数据工程师,而不是专职数据科学家。

通常,团队将由技能重叠的个人组成,或者根据专业知识,个人可能在DataOps团队中担任多个角色。

Dunning和Friedman在他们的书中写道:“在大型项目中,一个特定的DataOps角色可能会由多个人担任,但是有些人会承担多个角色也很常见。” “操作和软件工程技能可能会重叠;具有软件工程经验的团队成员也可能具有数据工程师的资格。数据科学家通常具有数据工程技能。但是,很少看到数据科学与操作之间存在重叠。”

根据Forrester的Goetz所说,DataOps团队的一些专业知识关键领域包括:

  • 资料库
  • 一体化
  • 数据进行业务流程编排
  • 数据策略部署
  • 数据和模型整合
  • 数据安全和隐私控制

无论组成如何,DataOps团队都必须有一个共同的目标:他们支持的服务的数据驱动需求。

Dunning说:“有了工程团队,优秀的工程师,您需要做的是设定好目标。” “一旦有一个共同的目标,即解决问题,那么团队通常会为解决该问题而组织起来。当不同的人看到问题的不同方面时,困难就来了。运维人员将担心可靠性,您会得到一个问题。在一定时间内给出答案。数据科学人员倾向于关注答案的准确性。您已经有些分歧了,但是如果他们试图解决相同的问题并且他们愿意妥协关于如何解决这个问题,我认为这是一个非常容易建立的社会结构。”

DataOps角色

根据Goetz的说法,DataOps团队成员包括:

  • 数据专家,他们支持数据格局和开发最佳实践
  • 数据工程师,为BI,分析和业务应用程序提供临时和系统支持
  • 首席数据工程师,他们是从事产品和面向客户的交付物的开发人员

DataOps薪水

根据[PayScale的]数据,以下是与DataOps相关的一些最受欢迎的职位以及每个职位的平均工资 :

  • Analytics(分析)经理:68K- 127K
  • 助理数据科学家:6万至10.2万美元
  • 商业智能分析师:50K- 95K
  • 数据分析师:43K- 85K
  • 数据架构师:76K- 155K
  • 数据工程师:65K- 132K
  • 数据科学家:67K- 134K
  • 数据科学家,IT:6万美元至13.4万美元
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 159,569评论 4 363
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,499评论 1 294
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 109,271评论 0 244
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,087评论 0 209
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,474评论 3 287
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,670评论 1 222
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,911评论 2 313
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,636评论 0 202
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,397评论 1 246
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,607评论 2 246
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,093评论 1 261
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,418评论 2 254
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,074评论 3 237
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,092评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,865评论 0 196
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,726评论 2 276
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,627评论 2 270

推荐阅读更多精彩内容