如今,围绕数据科学家角色的宣传非常多,以至于当公司需要专家从数据中获得一些见解时,他们首先倾向于寻找数据科学家。但是这真的是最好的选择吗?让我们看看数据科学家和数据分析师的角色有何不同,以及为什么在任何其他角色之前,您可能要雇用一名分析师。
你也可能喜欢:五个必须阅读书籍,成为一个成功的数据分析员。
数据科学家或数据分析师
那么,数据科学家和数据分析师之间有什么区别呢?这些角色的定义可能有所不同,但通常认为数据科学家结合了三个关键学科——数据分析、统计和机器学习。机器学习涉及数据分析过程,以学习和生成分析模型,这些模型可在最少的人工干预下对看不见的数据执行智能操作。有了这样的期望,很明显,三位一体比一对一更好,数据科学家更渴望公司。
但是等一下…某人有可能在这三个角色中完美无缺吗?更有说,所有这些角色都需要类似的技能吗?或者,假设数据分析师和机器学习工程师所使用的技能和方法完全不同?
事实上,这些专家的方法确实有很大不同。谷歌首席决策科学家卡西·科日尔科夫(CassieKozyrkov)对这种差异给出了一个精辟的解释。她声称,数据分析师在公司中提供快速结果,例如,分析数据中有趣的相关性。
为了满足决策者对快速和简短答案的期望,数据分析师使用相应的编码样式 – 使用更少的代码行,并为经理生成易于解释的相关矩阵。机器学习工程师的编码风格完全不同,他们的目标是构建一个”完美”模型,这通常需要很多、很多和大量的时间。
统计学家也无法提供快速结果,他们会说:”等等,等等!我们不能从这些数据中得出任何因果关系。我们甚至不知道结果是否具有统计显著性!是的,有时你需要统计学家或数据科学家,善于统计回答这类问题。但是,你真的需要这些答案只是为了了解数据中的关联性吗?
事实上,没有。从数据分析人员获得初步结果后,您应该聘请一位领域专家,他们可以确定哪些已识别的模式对业务确实很重要,值得进一步调查。因此,正如您所看到的,最好在初步数据分析和深入的假设测试之前,听取领域专家的意见,这是在同一个人执行数据分析和深入测试显示的模式时很难安排的。
您可能已经可以看到,在某些情况下,数据分析人员甚至比数据科学家更需要。但是,现在让我们澄清一下,数据分析人员应该具备何种技能来满足决策者的需求,并成为组织的资产简而言之,如果领域专家认为这些领域很重要,数据分析人员会确定可能需要统计人员和机器学习工程师注意的领域。
因此,下面是您希望在数据分析人员中看到的品质:
-
数据故事:一个好的数据分析员可以阅读数据,并讲述令人兴奋的故事。数据专家从不超越数据,总是允许多种可能的解释。
例如,他们可以说:”在我们介绍 Facebook 上一次广告活动后,我们似乎获得了更多的线索。这可能是有关此活动有效性的信号,但潜在顾客数量的增长也可能由于季节性变化。需要更深入的分析。
-
数据可视化技能:创建视觉吸引力、有意义且易于解释的图形的能力对于数据分析人员也非常重要。故事总是受益于伟大的可视化效果,这使得决策者的生活更加轻松。
-
技术专长:专业数据分析员可以使用电子表格为您提供隐藏在数据中的见解。但是,为了提供快速结果并创建专业可视化效果,数据分析人员通常需要电子表格以外的技术专业知识。
因此,如今,您可以期望数据分析师熟悉 Python 的编程语言,并精通 Tableau 或 Microsoft Power BI 等工具。
-
针对速度优化的编码风格:您不需要数据分析员具备与软件工程师或机器学习工程师相同的编程技能。数据分析师应知道如何使用 Python 清理数据,如何执行数据分析,以及如何使用清晰的可视化效果和表来显示信息。
有一些非常好的课程可以在网上教授正是这些技能。此外,数据分析人员应熟悉为数据分析创建的最流行的包,并使用这些包以最有效的方式分析数据。
-
领域专业知识:并非所有公司都需要数据分析师提供域专业知识,但这绝对是一项技能,可成为专业数据分析师的关键优势。换句话说,如果有人想加入最优秀的数据分析师行列,他们应该熟悉一个域。此技能将帮助他们区分对业务真正重要的模式和不值得数据专家和决策者花时间的发现。
现在,我们知道什么样的数据分析师可以成为公司的宝贵资产,让我们总结一下,我们可以期望从优秀的数据分析人员那里获得什么,以及为什么每个组织都需要这样的专家。
每个公司都需要一位数据分析员
如果组织的管理者做出数据驱动的决策,则该组织肯定需要一位数据分析员。有幸找到具有上述技能的一位优秀专家的公司将有一位专家:
- 收集正确的数据。
- 清理数据。
- 执行数据分析。
- 以美观且有意义的可视化效果呈现信息。
- 发现数据中的有趣模式,并提供可能需要统计人员和机器学习工程师进一步关注的见解。
- 执行分析时,确定对业务更重要的领域的优先次序