neon-rods-curving-around-center

数据运营:大数据的未来

我有机会在DevOps峰会上与首席执行官创始人Alex Gorelick会面,了解他对数据和分析现状的看法。

从技术角度来看,DataOps 意味着什么?

DataOps 以敏捷的方式开发、生产并操作数据,并实现安全性和合规性。

自从四年前我们首次发言以来,数据和分析状况如何?

治理已成为GDPR、CCPA和数百项数据隐私法规的一个议题。原则是相同的:1)练习数据专注,知道你在做什么与您的数据;2) 了解您拥有的数据、数据所在的位置、数据的使用方式,并确保用户的数据受到保护;3) 保持良好的数据卫生。

质量差的数据不利于决策和客户。负责数据对业务有好处。提供自助分析、访问和使用数据的机会。为数据制定通用规则,以便使用,以避免无意中做错事。

您可能还喜欢:DataOps 反模式。

人们如何从他们拥有的数据中获得更多的价值?

有问题的人不知道如何获取数据来解决他们的问题。通过将不同的数据放在一起,我可以知道些什么 – 企业主数据的民主化?人们根据有限的数据做出决策。使用业务术语标记每个字段,以便当用户搜索时,无论使用目录调用什么数据,他们都可以找到数据。

使用数据目录,您可以搜索数据所在的任何位置,然后在有人需要时将所需数据带到位置。对所有数据进行爬网,并使用AI/ML和带有业务术语的标记 – 查看上下文和内容。帮助人们建立目录,以便他们可以在自己的组织内购物。

您目前正在帮助客户使用哪些用例?

自助服务分析。销售数据 – 按地理位置、细分市场、按时间段划分。这过去需要六个月的时间才能找到、访问,什么时候有人能到达它,这是未知的。我们使客户能够在不知道数据详细信息的情况下找到所需的数据。我们使人们能够使用业务术语来查找和请求数据。这个过程从六个月到几天。

我们帮助人们将数据集与相关数据联接在一起。我们帮助您获取所需的数据,以便您可以使用它。查看和屏蔽数据可能非常昂贵 , 一旦有人请求包含 PII 的数据,就会进行保护。

随着数据量的增加,处理起来变得十分困难,人们开始扔掉数据。我们使客户能够保留数据,而无需投入太多。通过使用数据目录,您可以了解数据何时被使用、谁请求数据以及数据的使用方式。

数据和分析发生了怎样的变化?

大数据正在消失,只是数据。数据Ops正在取代大数据。AI/ML 的不同用途以及数据和分析的民主化。企业正在围绕自己的数据进行工作,并发现数据中有更多的价值这是数据驱动型经济生存的必要条件。这导致数据的更多使用和应用。解决更多的业务问题,如减少流失。

开发人员在数据和分析方面现在需要考虑什么?

当您考虑分析时,对 ML 模型的试验比开发应用程序的实验多得多。失败是可以的。你需要能够实验和学习。专注于创造价值最小的产品,以显示价值。在构建数据之前,先查看数据是否解决了业务问题。灵活处理数据。

生产数据时,必须监视、检查漂移和调整。为此构建一个框架。如果发生某些变化,模型会发生变化,则 ML 模型会像人一样接受培训。当事情改变时,ML 模型将受到影响。检查漂移,让基础设施执行。在生产数据并实现操作时,开发人员需要创建模型漂移的框架,以便随着情况的变化来确定模型的运行情况。如果分析是产品,则需要 DataOps 来交付。

相关文章

Comments are closed.