这是我们系列的第四篇 “如何成为一个由数据驱动的组织”,我们将专注于数据平台。
在这一点上,大多数人开始深入研究Data Lakes vs Data Warehouse的技术方面,但是我们希望使我们回到一个更高的水平,并问“我们需要什么平台来为业务服务?” 。
关键是术语“平台”。它将负责收集,迁移,转换和分析数据。对于整个企业中的许多人来说,这将是很多事情。认为平台的最佳方法是服务。结果,该服务的用户就是客户。在开始构建任何东西之前,我们需要听取他们及其需求。用户可以包括整个业务范围内的人员,每个业务人员都可以。给分析师数据科学家,他们都将需要以不同的方式访问数据。
这是为了什么
在平台上收集和整理的数据将分为两个主要类别。它将用于商业智能或产品丰富。商业智能将通过分析和报告为企业提供洞察力,并可被视为平台的统计输出。产品丰富性可以包括产品的功能个性化,推荐和定制增强–这是我们希望实现数据科学,人工智能和机器学习之类的领域,以丰富和发展用户体验的领域。
使其可扩展
无论您选择从哪里开始,请确保留有扩展的空间。这包括规模和能力。虽然没有过度架构平台的价值,但绝对值得考虑业务的雄心壮志,并且知道虽然您现在可能不需要太字节的存储空间–您将来可能会需要它。数据的存储方式和存储位置也是如此,诸如每日目标用户和企业的地域扩张之类的因素可能会影响这些决策。
自动化一切
我们不是将“无聊的东西自动化”,而是设定“自动化所有东西”的目标。尤其是在数据中,将有很多重复并且经常按计划进行。确保将自动化构建到数据平台的核心中。不仅是报告和分析都是如此–而且还有数据流本身。我们遇到的一个反复出现的问题是手工传输和转换数据所花费的手动时间。通过使整个系统中的这些工作自动化,您可以腾出团队来做他们被雇用的宝贵工作。
吸引用户
确保平台的用户参与从计划到执行的整个过程。甚至那些会消耗任何报告的人。默认位置似乎是“收集所有信息并稍后处理”–但这会产生大量浪费,用户很少会得到他们想要的东西。如果您着眼于特定的业务目标或可交付的OKR,这将使平台的早期迭代更加容易,并且用户将获得切实的结果。
但是,如果我们已经有了东西怎么办?
大多数组织将拥有某种形式的数据。有些人一开始就会做对,但这很少见。如果数据不被视为头等公民,它将很快变得不可维护或无法使用,并且用户将变得不高兴。大多数公司在某个时候都会遇到这种情况。此时,您可以选择创建新的东西,替换或改善现有平台。
我该如何选择?
设计数据平台时没有万灵药,因为它们通常是工具和功能的组合。每个组织’需求将有所不同,并且复杂度也将有所不同。有更简单需求的组织可以选择使用现成的产品,而不是可以从多个级别提取数据的更复杂的数据生态系统。取决于组织中的技能和经验–聘请专家帮助定义平台以满足用户不断变化的需求通常是有利的。