本文是2018 DZone 指南对大数据的主要研究结果的一部分: 流处理、统计和可伸缩性

介绍

对于 2018 DZone 的大数据指南, 我们调查了540软件和数据专业人员, 以获得他们对围绕大数据领域和数据科学实践的各种主题的思考。在这篇文章中, 我们关注的是 Python 语言在这个领域的极度流行。

Python

多年来, Python 一直对 “最流行的数据科学语言” 的标题进行缓慢的移动, 而被击败的语言已经是 r. 在一段时间内, 对于数据重编程来说, r 一直是非常流行的, 一种语言专门为统计分析而设计的。虽然 R 仍然保持人气 (在 TIOBE 指数, 它从第十六位排名2017年1月到第八位排名在 2018年), Python 在数据科学和数据挖掘项目的使用已经稳步增加。去年, 受访者对 DZone 的大数据调查显示, Python 已经克服了 r 作为数据科学的主要语言, 尽管它在 r 上的领先地位没有统计学意义, 因此并没有完全成为 “冠军身份”。去年的研究结果中提到, 这与其他现有的 Python 和 R 在数据科学中的应用的趋势是一致的: r 仍然受数据/统计分析的欢迎, 但 Python 一直在追赶。

今年, DZone 的大数据调查显示, 对数据科学项目使用 r 和 Python 有很大的区别: 在去年的调查对象中, r 的使用率下降了 10%, 从60% 增加到 50%, 而 Python 的增长 6%, 从64% 到70%。这意味着今年有20% 的受访者使用 Python 进行数据科学, 而不是使用 R 的应答者。虽然 Python 不是专门为数据分析而创建的, 但它的动态类型、易于学习的语法以及不断增加的库基础使它成为开发人员开始深入研究数据科学和分析的理想人选, 而不是可能已经能够在过去。

结论

这些发现如何对抗更广泛的发展社区?如果我们在2018中查阅堆栈溢出的 “最爱、最可怕和最需要的语言” 列表, 那么这些趋势实际上似乎是存在的。在本报告中, 68% (第三大百分比) 报告 python 为最受喜爱的语言, 25% (最大百分比) 报告 python 为最需要的语言。相反, 只有49% 的人报告 r 为 “最需要的” 语言, 50% 报告 r 为 “最可怕的语言” 之一。因此, 在大数据和更大的开发者社区中, Python 似乎都在上升, 而 R 在不受欢迎的情况下停滞不前。

你对这两种强大而流行的语言有什么想法?

本文是2018 DZone 指南对大数据的主要研究结果的一部分: 流处理、统计和可伸缩性

Comments are closed.