DataOps是“数据的DevOps”吗?

在这篇文章中,我们将讨论DataOps与DevOps的区别,并探讨它们与数据管理的另一个关键方面DataSecOps的区别。

DevOps 对于应用的部署是实现方式转变的主要催化剂,它有助于使公司更加灵活,并对客户做出响应。DevOps原则在软件开发领域已被广泛采用,但被广泛地与DataOps相比较。虽然这是一个常见的误解,但DevOps和DataOps是两种截然不同的追求。

在这里,我们将看看DataOps与DevOps,以及它们之间的主要区别。我们还将探讨它们与DataSecOps的区别,DataSecOps是在数据的整个生命周期中管理数据的另一个关键移动。

什么是DataOps?

DataOps是一个相对现代的术语,由Lenny Liebmann于2014年首次提出。DataOps的核心是一种面向流程的方法,用于提高分析和数据团队使用的数据分析的质量并缩短周期。DataOps统一了数据分析和运营团队,更快速、更准确地提供分析解决方案和产品。

在当今的环境中,数据从来都是最有价值的商品,这就是为什么企业愿意采取极端措施来获取可用于提供数据驱动的解决方案和产品的数据。虽然DataOps最初是一套最佳实践,但它已经发展成为一种独特的数据处理、准备和分析方法。

为什么DataOps对数据驱动的组织很重要?

DataOps对于数据驱动型组织至关重要,因为它有助于提高数据分析的质量和速度,或数据项目的“价值实现时间”。DataOps有助于优化从数据采集到分析的整个数据管道。质量和速度的提高可以带来以下几个好处:

  • 更可靠、更及时的见解
  • 提高效率和生产力
  • 降低成本

此外,数据操作有助于提高总体数据质量。这是因为它汇集了数据管道中的所有利益相关者,包括数据科学家、工程师和其他人。通过协作,他们可以在问题引发下游问题之前尽早发现并解决问题。DataOps还旨在不断改进和更改数据模型、可视化、报告和仪表盘,以满足公司目标。
随着组织的发展和成功,它需要更多的数据来做出明智的决策。因此,数据摄取速度正日益加快。随着时间的推移,DataOps编队需要具有更高可靠性的高质量数据和分析解决方案。

DataOps vs. DevOps

虽然两者都基于旨在加快工作周期的敏捷结构,但DevOps专注于产品开发。相比之下,DataOps专注于数据管理和交付速度。此外,DevOps以应用层为中心,而DataOps则涵盖了从收购到消费的整个数据供应链。

此外,DevOps强调开发团队和运营团队之间的协作,而开发团队和运营团队通常可以孤立在一个组织中。相反,DataOps强调了所有数据使用者之间的关系,这可能意味着更多的数据涉众。这对于在产品开发的各个方面确保数据完整性至关重要。

DataOps不是针对数据的DevOps,但DevOps为DataOps奠定了基础。DevOps方法有助于实现和支持数据操作的灵活性、连续交付、专注于自动化等。因为DevOps专注于通过打破功能筒仓使其更加灵活,所以它也有助于该领域的数据操作。

DataOps和DevOps之间的相似性

更强的 DataOps的许多原则都源自DevOps中的类似原则。公司要求DevOps提供高质量、统一的软件和功能开发框架。当涉及到数据驱动时,公司依靠这些特性来进行敏捷的数据工程和分析。

由于DataOps使用相同的DevOps工具链,因此对于拥有DevOps框架的组织来说,利用它非常简单。以下是DataOps从DevOps中获得的一些主要想法:

  • 快速增长
  • 重用和自动化
  • 专注于实现市场价值
  • 自动测试和代码升级
  • 持续集成和持续交付(CI/CD)

DevOps和DataOps之间的差异

尽管DevOps和DataOps的基金会有相似之处,但有几个显著的区别。

方法:DataOps和DevOps的活动具有可比的交互特征。然而,后者有一个数据管道和一个分析开发过程,这两个过程都是实时的和交互的;前者包括软件开发和交付方法。

编排:在DevOps方法中,应用程序源代码不需要广泛的编排。在DataOps中,数据管道和分析开发编排是必需的组件。在应用程序开发和DevOps过程中,通常没有这样的管道协调,尽管编排数据流一直在发生(例如,ETL/ELT过程)。

数据管理:在DevOps中,数据模式、管理和授权更改是微不足道的。在DataOps中,它们是前提。

人性因素:DataOps和DevOps用户的个性和技能是多样的。DevOps主要与工程师打交道,而DataOps则与许多角色打交道,其中一些角色技术性较差。

工具:DevOps开创了DataOps的诞生,支持它所需的工具仍处于早期阶段。虽然DevOps中的测试主要是自动化的,但DataOps并没有同样的奢侈——大多数用户必须修改测试自动化软件或从头开发自己的软件。

DataSecOps,为什么如此重要?

如果您认为DataOps和DevOps只是为了开发和管理数据,那么您会大吃一惊。DataSecOps是数据操作和信息安全或网络安全的结合。正如您可以想象的那样,这种联合对于那些希望朝着更数据驱动的未来迈进的组织来说至关重要。

正如DataOps和DataSecOps在关注数据分析以改善安全态势方面具有可比性一样,它们在强调安全标准、理念和程序方面也有所不同。随着时间的推移,与数据相关的实践发生了巨大的变化,DataSecOps帮助企业保持领先。这是一种动态的、包罗万象的思维方式,用于将数据解决方案与快速变化的数据集成,并实现数据治理、隐私和安全。

在DataSecOps方法中,将安全性作为首要优先级,确保了所有数据项目和操作的安全。这也意味着安全性包含在流程的每个阶段,而不是通过数据项目或审计最终投入使用。这种方法旨在确保快速数据项目不会带来额外的安全风险。因此,从设计到交付,整个过程都强调安全性。

如果您看看DataOps与DataSecOps,很明显后者是前者的子集,安全性不断集成到数据操作中。由于数据安全性和完整性对于每个组织的开发过程都至关重要,因此将“Sec”组件合并到DataOps中可以帮助您在整个数据生命周期中避免任何数据安全问题。

结论

DevOps和DataOps是数据驱动组织的关键方法,但它们有很大的不同。DataOps不是针对数据的DevOps,但它是一种敏捷的方法,对于拥有许多数据消费者、数据生产者和其他数据涉众的以数据为中心的组织来说尤其重要。

作者:小猫钓鱼(一个单纯的数据爱好者)

原文链接:Is DataOps “DevOps For Data”? - DZone Big Data

编辑于 2022-06-17 13:45