机器学习是当今最热门的技术主题之一,它正被越来越多的应用。有时它是工作的最佳工具,有时是一个流行语,主要用作使产品看起来更酷的一种方式。然而,不知道什么是ML,它是如何在幕后工作,这是很容易迷路。但是这本书在指导您从非常简单的数学概念到一些复杂的机器学习技术方面做得很好。

今天,在Python生态系统中,我们提供了大量强大的数据科学和机器学习相关软件包,如Numpy、熊猫、Scikit-学习等,这有助于简化其固有的复杂性。如果你想知道,在Python包方面,这本书中的伟大英雄是Scikit学习,通常缩写为 sklearn 。当然,使用Numpy和Pandas,数据争论要容易得多,也更快,所以这两个包总是覆盖sklearn的背部。SeabornMatplotlib是 Python 的两个最标准的数据可视化包,也在这里使用。在第10章中,patsy做了一个简短的外观,在第15章中,pymc3用于概率图形模型的背景。

有了这些工具,您需要选择正确的模型(在此之前,您需要知道模型是什么以及如何使用它),并能够测试其结果。那么,您如何确定您确实选择了更适合您的数据并给出最准确预测的模型?您需要验证它并将其与其他算法进行比较,甚至与一组不同的超参数进行比较。它很快开始变得复杂…

书籍结构和内容

这本书分为四个部分,每一部分分为三或四章。除了前两个介绍性章节外,所有其他章节最终都提出了一些练习建议,您可以使用这些建议将知识应用于不同的数据集或解决不同的问题。

Machine Learning with Python for Everyone - Chapter 7第 2 章确保为您提供一些有用的数学词汇,这些词汇对于理解本书的其余部分至关重要。在第 3 章中,您将找到第一个分类算法,k-最近邻域 (kNN) 和 Naive Bayes (NB),以及对这两个分类器的简单评估。第 4 章对回归执行相同的操作,将 kNN 回归和线性回归应用于简单数据集,然后演示如何根据结果的准确性和资源利用率来评估结果。

第二部分(”评估”)就像一个停止点,可以更深入地讨论评估和比较学习者的重要性以及如何做到这一点。这包括在开发学习系统时经历培训、选择和评估阶段。

Machine Learning with Python for Everyone - Chapter 5

再次,您将被引入一些新的概念,如列车测试拆分、保持测试 (HOT)、验证、交叉验证、过度拟合、不合合、损耗、成本、偏差、方差

Machine Learning with Python for Everyone - Chapter 5

在第 7 章中,您还可以简要讨论数据标准化和管道作为培训和测试步骤序列。

停止点之后,第三部分继续教你一些其他分类方法(决策树、支持矢量分类器、逻辑回归和几种区分分析风格)和回归(支持矢量回归、逐条常数回归、回归树)。第 10 章介绍功能工程,它是用于添加、删除、合并和转换学习系统中正在考虑的功能的一些技术(包括缩放、离散化和分类编码)的奇名。

第 11 章结束第三部分,显示几个方法可用于查找模型的最佳超参数(如 k k-最近邻居),这样您就不必猜测它们,也不会冒创建不必要的不准确或过于复杂的学习系统的风险。它还演示如何使用管道来简化由多个步骤组成的学习任务。

本书中的其余四章(第四部分)涵盖了更高级或更复杂的技术,如结合学习者(投票组合、随机林和提升)、功能选择、功能构造和内核和主要组件分析 (PCA)。

Machine Learning with Python for Everyone - Chapter 12

第 14 章特别有趣,因为它涵盖了在某些特定领域(如处理文本或图像时)执行特征工程的一些方法。在这里,您还将了解聚类,这与 PCA 一样,是一种无监督学习技术(无监督意味着系统从以前未标记的数据中学习)jpg”数据-新=”假”数据大小=”281424″数据大小格式化=”281.4 kB”数据类型=”临时”数据-url=”/存储/临时/13209767-机器学习-与 python-ch– 15.jpg”src=”http://www.cheeli.com.cn/wp-内容/上传/2020/04/13209767-机器学习-带python-ch-15.jpg”样式=”宽度:545px;”/>

最后一章(第 15 章)提供了一些提示,包括您可能感兴趣的其他一些重要主题,但也包括高级主题,例如优化、SVM、原材料的线性和逻辑回归、神经网络和概率图形模型。

结论

我喜欢这本书的方式是作者介绍每个主题的方式,从基础数学概念的基础知识开始,通常有一个有趣的小故事,然后一直成长为更高级的机器学习概念或过程。

Machine Learning with Python for Everyone - Decision Trees

即使像我一样,你觉得你的数学课早已被遗忘,这本书也会帮助你在你需要的时候选择。例如,第 2 章介绍概率、分布、加权总和、点积以及几何图形刷新(2D/3D 图形、多项式)。它将帮助您能够阅读整个书的方程式。作者非常小心,确实包括简单的数学公式,就像需要,总是解释他们一步一步,一点一点,所以你不需要研究研究生水平线性代数,以便能够理解大部分的书。

Machine Learning with Python for Everyone - Equations

我必须承认,在某些时候,我感觉自己回到了学校,学习一点数学,但这次,只是我需要这些零碎的。天啊!那时我有一些很棒的数学老师,但我希望我能有这种上下文化和娱乐的解释当然,有些部分你可能仍然难以把握,但老实说,在这方面,我们能做的不多。

机器学习使计算机能够在许多不同的环境中实现令人惊讶和非凡的结果。然而,硬币的另一面是,它可以是压倒性的,需要巨大的计算能力或强大的数学背景,甚至两者兼而有之。这本书是一个惊人的指南,展示了机器学习是如何工作的,使它非常平易近人,甚至对于那些没有数学学术背景的人。所有你需要的是一些基本的Python知识和一点好奇心,让你开始通过前几页。

披露通知:对于此审查,我从出版商收到了该书的免费副本。我个人不认识作者或出版商,也没有获得任何其他报酬。

Comments are closed.