由于大众的需求和许多要求,我决定为那些开始作为数据科学家的旅程的人创建一个独特的数据科学项目列表。可视化项目、探索性数据分析项目和预测建模混合在一起。我希望你喜欢这篇文章,并祝你在努力中好运!


印度的降雨量

项目类型:可视化
在此处链接到数据集。


此数据集包含印度 36 个分区的每月降雨量详细信息。以下是您可以自己尝试的一些可视化想法:

  • 您可以创建条形图或饼图,以按区域比较降雨量
  • 您可以创建线图来比较随时间的降雨量
  • 您可以创建动画乔罗普列斯地图,以显示随着时间的推移下雨的地方!如果你想学习如何建立一个巧克力可视化,看看我的教程在这里

全球自杀率

项目类型:探索性数据分析
在此处链接到数据集。


这是一个综合数据集,详细介绍自杀率、人类发展指数 (HDI) 数字、国内生产总值和人口统计数据。此数据集的目的是查看是否有任何指标与自杀率上升相关。

浏览数据,了解哪些国家和各大洲的自杀率最高。您注意到哪些趋势?自杀率是整体上升还是下降?男女自杀人数的比例是多少?查看您是否可以找到与自杀率相关的任何变量

kaggle.com/divyansh22/summer-olympics-medals”href”https://www.kaggle.com/divyansh22/夏季奥运-奖牌”rel=”不跟随”目标\”_blank”\在这里。


从不那么病态的音符,这里有一个数据集,其中包含所有奖牌获得者在1976年蒙特利尔到2008年北京夏季奥运会。浏览数据,看看哪些国家获得奖牌总数最多。是否有国家/地区随着时间的推移表现更好?随着时间推移,情况会更糟呢?

世界幸福报告

项目类型:探索性数据分析
在此处链接到数据集。


幸福分数是衡量一个国家平均”幸福”的可量化指标。这基于六个因素:经济生产、社会支持、预期寿命、自由、没有腐败和慷慨大方。

此数据集包含 155 个国家/地区及其相关的幸福评分和 2015 年至 2019 年的 6 个因素。我们全球每年是否越来越快乐?最幸福的大陆是什么大陆?最不开心的?六个因素中哪一个因素对幸福的影响最大?影响最小的呢?

美国的污染

项目类型:可视化
在此处链接到数据集。


此数据集包含有关 2000 年至 2016 年美国每天四种主要污染物(二氧化氮、二氧化硫、一氧化碳和臭氧)的信息。

下面是一些可视化创意:

  • 最大的污染者是什么州?至少?
  • 随着时间推移,美国污染了多少?它们污染是否超过10年前或更少?
  • 看看你能否创建一个巧克力地图,以在地理上显示随时间的一切污染程度!

麦当劳菜单的营养概况

项目类型:探索性数据分析
在此处链接到数据集。


该数据集提供美国麦当劳菜单上每个菜单项的营养分析,包括早餐、牛肉汉堡、鸡肉和鱼三明治、薯条、沙拉、苏打水、咖啡和茶、奶昔和甜点。

麦当劳的平均价值餐含有多少卡路里?点烤鸡而不是脆鸡真的更健康吗?为了得到日常营养需求,你必须吃的最健康的物品组合是什么?

红葡萄酒质量

项目类型:预测建模
链接到数据集


此数据集包含有关各种葡萄酒、其成分和葡萄酒质量的数据。这可能是一个回归或分类问题,具体取决于您如何构建它。查看您能否预测红酒的质量给定11个输入(固定酸度,挥发酸度,柠檬酸,残留糖,氯化物,自由二氧化硫,总二氧化硫,密度,pH,硫酸盐和酒精。

感谢您的阅读!

Comments are closed.