为了了解大数据的当前和未来状况, 我们与来自28个组织的 31名 it 高管进行了交谈。我们问他们: “从您的角度来看, 大数据的接收、管理和分析的未来是什么–最大的机会在哪里?”以下是他们告诉我们的:
ai/ml
- 我们将看到从预置到云的过渡, 然后看到传统的 hadoop 进行到云的过渡。这将导致更高的采用 ai/ml。
- 只需推动公司的数字化议程。您有足够的计算能力和数据–您能做些什么?利用该功能。使用 ai/ml 对数据进行筛选。让更多的人参与进来。
- 利用大数据和 ml 异常检测, 让更多的传感器进入世界。从城市传感器的预警指示器检查安全帽、ml 模型。整个经济成为信息驱动。了解为什么会发生异常。
- 1) ai·ml 变得少了炒作, 更多的是一种趋势。ml 需要大数据才能工作。任何 ml 都需要大数据。大数据本身并不有用。能够有一个引擎自动看到趋势, 并提出建议, 看什么是有价值的。2) 期待更多的工具用于大数据的可视化和报告。销售力量有爱因斯坦。tableau 有一个工具。期待我们还有成千上万的人还没有看到。aiml 将变得更加普遍。
- ai 保护的系统。维护和保持数据更安全。为人类制造伦理和道德困境。保护数据, 因为在某个时候, 它将被移交给机器, 这是可怕的, 因为你不知道机器可能会做什么, 你无法恢复。
- 使用 ai 和 ml 技术 (如 tensorflow) 为大数据应用程序提供了未来可能的最大机会。有了 ai, 计算机就会发现人类看不到的模式。
- 我们将在组织中遇到人才问题。使数据的价值对不是数据科学家的人可见的能力是一个需要处理的重要因素。aiml 将专注于了解数据, 为人们提供答案。语境也很重要–我们如何创造语境, 让它从人们的头脑中消失?
- 成熟于 hadoop 数据湖世界。hadoop 是一个对某些事情有好处的工作量, 对一切都不好。每个人都在深呼吸。哈多普对这些东西有好处。数据湖也是如此。你必须经历成长的痛苦才能弄明白。随着我们更多地进入 ai 世界, 机会也在增加, 系统正在寻找未来的东西, 这就是现实, 我们将作为一个行业实现这一目标。跨数据和工作负载的巨大机会。你必须对此进行研究。某些用例和工作负载。
工具
- 对数据多样性的识别。跨所有不同类型的数据合理化。变量的聚合–信用局、核心银行系统、hadoop 数据。随着可以将大量工具交给数据分析人员或业务用户, 而不是依赖于数据治理或 dba, 因此有机会。允许用户访问数据和操作工具。
- 更成熟, 更多的工具, 具有解释能力。1) 更多的数据, 更多的类型, 流更快。2) 用于处理数据的分析方法。3) 洞察自动化。
- 通过 api 使跨系统的公分母更加以 sql 为中心的趋势。sql 是开发人员在不同系统之间与数据交互的方式。作为可视化步骤, 移动到更开放的源代码和更低成本的工具。power bi 和 tableau 之间的差异正在缩小。数据即服务使得可视化工具变得不那么重要。在分析师和数据使用者之间, 数据管理员的作用越来越大, 以实现更加自给自足。
- 数据摄取标准化的动力持续存在, 许多公司都希望卡夫卡能够获得本地云或私有云, 也可以将 kinesis 用于 aws 云。然后, 数据管理和分析工具就会成为这些数据移动框架的数据接收器和源, 从而为这些公司创建一种数据实用程序网格, 类似于房子中的电气系统。如果你需要电, 你只需要一个带有标准插头的电器, 你就可以插上电源了。数据访问也是如此, 有些公司已经这样做了–如果您需要使用数据或向其他人提供数据, 只需使用其标准 “插件” (或接口) 将应用程序插入数据网格即可。这也将允许使用更多的 “最佳” 组件, 如最佳 bi 或分析工具或特定工作负载的最佳数据库, 而不必在劣质的一体机产品上妥协, 因为数据集成将比标准更标准自 定义。数据本地化也是一个很好的机会。也就是说, 将数据放在需要它的世界中, 而不是需要遍历长网络以检索、处理、更改或分析它。这意味着更多的主控型、主动主动体系结构可以为任何企业带来应用程序挑战, 因此正确选择组件将非常重要。
- 领先的公司正在越来越多地标准化成熟的开源技术, 如 apache 卡卡、阿帕奇点火和 apache spark, 以获取、管理和分析他们的大数据。在过去几年中, 所有这些项目都经历了大幅的采用增长, 在可预见的未来, 这种情况似乎有可能继续下去。随着这些技术的成熟, 越来越容易安装和使用, 它们将为那些知道如何在日益实时的世界中使用和实施分布式计算技术的人创造机会
2;颜色: rgb(34, 38, 53);保证金: 20px 0px 5px;字体大小: 30px;清楚的: 两者;字母间距:-0.5 px;字体样式: 正常;字体-变种连字: 正常;字体变量帽: 正常;孤儿: 2;文本对齐: 开始;文本缩进: 0px;文本转换: 无;空白: 正常;寡妇: 2;字间距: 0px;-webkit-text-宽度: 0px;文本装饰风格: 初始;文本装饰颜色: 初始;背景颜色: rgb(255, 255, 255); “> 其他
- 看标签, 得到正确的元数据模型, 确保信息的上下文。标记和元数据绘制上下文。确保正确的元数据被包装在周围。具有可靠性的可追溯性。
- 专注于由持续出现的流式始终在线技术所驱动的操作。完全了解正在发生的事情。云驱动着这个家, 基于云的应用程序体系结构始终处于打开和更新之中。自动化的数据体系结构也需要如此。客户会看到自己正在沿着数据操作路径前进。
- 大数据的所有三个部分都可以在投资回报率和数据治理方面带来一个相当成功的项目。我会按等级排序。首先, 我们需要能够从许多不同的来源收集大量数据。一旦数据可用, 适当的管理 (如正确创建信息性 kpi) 可能已经导致一些意外的发现。最后, 在数据如此转型之后, 他们的分析产生了对公司业务至关重要的进一步见解。因此, 正如您所看到的, 您已经从步骤1中获得了信息。但您可以在未首先完成步骤1的情况下获得步骤2。
- 这一切都会变得更容易。今天具有挑战性的事情将成为第二天性, 并在未来实现自动化。查看访问大数据的难易程度, 就像我们在计算机上所做的任何事情一样简单。处理、移动、连接将有更少的摩擦。 使用大数据来识别数据中的价值主张, 是每个企业的机会所在。
- 增强分析将自然语言、数据和分析结合在一起, 以推动答案。我们如何根据识别您不知道要查询的内容进行分析?
- 数据分析师和科学家并不关心数据在哪里, 他们只想要数据和分析数据所需的工具。目录, 并知道数据的位置。下一步只是想要我想要的数据。生成虚拟目录以访问传递。我们正在做的事情是有逻辑上的进展的。
- 无论是在预置还是云上, 公司都需要确保发动机持续工作, 这样你就能获得价值。作为一种服务模型, 并不能自动解决问题。需要了解和管理性能问题。带来性能透明度。从端到端考虑安全性。
- 未来是大数据分析平台, 它以速度和规模提供了经过验证的接收、管理和分析功能, 使企业能够竞争并获胜。最大的机会是让企业不再受到企业想象力的限制, 以获得准确的洞察力, 从而能够对所有机会采取行动–准确地了解哪些客户可能会流失和发展您的业务,基于数据的创收能力建立全新的业务模式 (以按需付费保险为例)。每个行业都可以根据对数据的宝贵洞察来区分自己。投资于一个久经考验的数据分析平台, 该平台不提供任何妥协, 并为您在部署模型 (云、本地、hadoop 等) 方面的未来表现做好准备
以下是我们与谁交谈:
- cheryl martin, v. p. 研究首席数据科学家, areion
- 亚当·斯密, 首席运营官,自动化洞察
- amy o ‘ connor, cloudera首席数据和信息官
- colin britton, devo首席战略官
- oj ngo, 首席技术官, dh2i 联合创始人
- alan Weintraub, 首席技术官办公室, docauthority
- kelly stirman,cmo 和战略副总裁, dremio
- dennis duckworth,动物区产品营销总监
com/nivanovov/”target =” _ black “> nikita ivanov,创始人兼 cto, grid展系统
“目标 =” _ 空白 “> 水线数据