数据筒仓是组织中与组织的其他部分隔离且无法访问的信息集合。删除数据孤岛可以帮助您在正确的时间获得正确的信息, 以便您可以做出正确的决策。而且, 您可以通过降低重复信息的存储成本来节省成本。
数据孤岛是如何发生的?
数据孤岛的发生有三个常见原因:
- 公司文化: 部门往往是相互孤立的, 尤其是在大公司。有时会出现这种情况, 因为存在内部竞争, 但经常会出现这种情况, 因为一个部门认为自己与另一个部门是分开的, 不考虑信息应该在哪里共享。
- 组织结构: 除非组织专门致力于整合不同的部门, 否则很容易建立层次结构和管理层, 以阻止部门共享信息。
- 技术领域:不同部门使用不同技术的情况并不少见, 这使得各部门难以共享共同的信息。例如, 销售团队可能使用 salesforce, 但市场营销团队没有此工具。然而, 它可能包含营销团队可以使用的有价值的信息。一项 it 调查显示, 大多数公司为不同部门提供1-200份申请。想想, 当你有这么多不同的来源时, 找到信息是多么的麻烦。
为什么数据孤岛是一个问题?
数据孤岛是一个问题, 主要有三个原因:
- 无法获得全面的数据视图。如果您的数据是孤立的, 孤立数据之间的相关连接很容易被错过。例如, 假设市场营销团队有很好的数据, 这些数据在特定的地理位置下吸引了很多注意力, 而市场营销团队则有关于同一地理区域中的销售信息。如果你能把这些信息汇集在一起呢?想象一下, 营销活动和销售之间的关系会有多清晰。
- 浪费的资源.考虑如果您有一个包含市场营销团队客户信息的数据库, 以及一个单独的销售团队数据库, 会发生什么情况。许多数据在这些部门之间重复。存储所有这些数据需要花费金钱, 公司存储的数据越多, 组织在其他需求上的支出就越少。
- 数据不一致.在数据孤岛中, 通常会将相同的信息存储在不同的位置。发生这种情况时, 很有可能会引入数据不一致。您可以在一个地方更新客户地址, 而不是在另一个地方更新客户地址。或者, 您可以在一组信息中引入拼写错误。当数据位于一个位置时, 您有更好的机会维护正确的信息。
处理孤立数据的挑战
虽然许多公司认识到数据孤岛是一个问题, 但撤销数据孤岛可能是一个挑战。一旦你有了一种根深蒂固的数据分离文化, 改变员工的心态是一个挑战。此外, 由于使用各种权限和层次结构设置系统的方式, 可能很难撤消某些孤岛。例如, 权限通常是按组设置的, 因此, 一旦数据为组进行了隔离, 就很难更改所有必要的权限。如果数据在不同的系统中被隔离 (例如, 安全操作组的数据存储在 oracle 数据库中, 但销售信息存储在 salesforce 中), 则要协调孤岛就更加困难。为了简化这一过程, 大多数公司将其数据从各种系统转移到数据仓库中数据仓库针对访问和分析而不是事务处理进行了优化, 旨在帮助管理层对其公司的数据进行360度查看。
分解数据孤岛的方法
删除数据孤岛的最佳方法是将数据合并到数据仓库中。以下是公司可以使用的几种不同方法将数据输入数据仓库:
- 脚本编写.一些公司使用脚本 (用 sql 或 python 等编写) 编写代码来提取数据并将其移动到中心位置。然而, 这可能很耗时, 也需要大量的专门知识。
- 本地 etl 工具。etl (提取、转换、加载) 工具可以通过自动化流程来减轻移动数据的大部分痛苦。它们从源中提取数据, 执行转换, 然后将数据加载到目标数据仓库。这些工具通常托管在公司的网站上。
- 基于云的 etl 工具。这些 etl 工具托管在云中, 您可以在云中利用供应商的专业知识和基础架构。当公司决定将孤立的数据移动到云数据仓库时, 通常会使用它们。