波浪和曲线

数据科学、人工智能 (AI) 和机器学习 (ML) 自过去五到六年以来,这些短语在 Gartner 的炒作周期曲线中已经处于领先地位。渐渐地,他们越过了顶峰,向高原移动。该曲线也很少有相关的术语,如深度神经网络,认知自动ML等。这表明,围绕AI/ML的新兴技术趋势将在未来几年内在软件行业盛行。他们的前辈,如商业智能,数据挖掘和数据仓库,甚至在这些年之前就在那里。

在丛林中寻找水晶球

预测和预测是我最喜欢的话题,我早在2019年初就开始寻找一种进入数据和算法世界的方法。学习人工智能/ML 的另一个驱动力是我对神经网络的迷恋,自从我开始学习计算机科学以来,神经网络一直困扰着我。我收集了几本书,学会了一些蛇的技巧,潜入水晶球。

当我浏览在线文章、视频和书籍时,我发现许多现成的工具、库和 AI/ML API。这就像有人试图学习骑自行车,并给了一辆车开车。由于我对神经网络的兴趣,我被大多数最有趣的AI/ML子集,深度学习所吸引,它处理深度神经网络。我不能阻止自己直接进入谷歌Tensorflow(一个免费的谷歌ML工具),并不堪重负的API的巨大集合。我可以按照文档,编写代码,甚至使其工作。但有一个问题,我不明白为什么我做我正在做的事情。我完全淹没了诸如生物、方差、参数、功能选择、特征缩放、退出等术语。那时我休息了一下,倒带并了解了 AI/ML 的内部,而不仅仅是盲目使用 API 和 Libs。所以,我走的很努力。

文章中正确地指出了原因。

然而,有些非常有用,例如麻省理工学院OpenCourseWare的格里姆森教授的机器学习导论。虽然它有点长,但有帮助。

学习AI的四大支柱

逐渐认识到学习AI/ML的四大支柱

  • 数据:人工智能一直是计算机科学研究的一部分。但是,由于无法对模型进行培训的数据,人们将其搁置一边。然而,在过去5至6年中,许多组织,包括政府组织,都分享了用于人工智能和机器学习实验的数据。这里很少。

1)卡格尔数据集
2)微软研究开放数据
3) 美国政府的公开数据
4)欧洲数据门户
5)英国开放数据
6 )
7)索克拉塔开放数据
8) AWS 公共数据集
9) UCI 机器学习存储库
10)昆德尔
11)世界银行
12) /r/数据集
13)14)开放政府数据平台印度
15)沃尔夫拉姆数据存储库
16)真棒公共数据集

 

  • 数学和算法:我进入人工智能根部的旅程把我拖到了一些关于矩阵、线性代数、数值分析、微积分和统计学等的教材。数学的一些领域在理解算法、微调算法或根据需要修改算法方面非常方便。它们如下。
    1. 线性代数
    2. 微积分
    3. 概率理论与统计

机器学习算法的海洋。流行的可以在

  1. 机器学习算法
  2. 吴教授的机器学习

对于那些谁想要回到算法的基础知识可以找到下面的。

  1. 蒂姆·鲁格登教授的算法专业化:第1部分
  2. 蒂姆·鲁格登教授的算法专业化:第2部分
  • 编码平台:AI/ML 代码通常需要相当大的内存大小和 CPU 速度,在个人计算机上不可能安排类似的资源。然而,有一些公司提供他们的在线编码平台支持的资源以低廉的价格或根本没有成本,例如。
    1. 谷歌实验室
    2. 卡格尔内核
    3. Azure 笔记本
    4. IBM 数据平台笔记本
    5. 朱皮特笔记本
    6. 教育:虽然现在一天有很多课程,包括像著名大学提供的课程
      1. 伦敦帝国学院的帝国机器学习
      2. 斯坦福大学人工智能项目
      3. 数据科学:哈佛大学的机器学习
      4. MXNet 加州大学伯克利分校深度学习课程
    7. 除上述许多服务外,许多是由在线教育组织提供的,例如:

      1. 吴教授深度学习专业
      2. 来自哈佛、麻省理工学院和更多世界领先大学的几门真正的大学课程由 EDX提供,作为机器学习课程的集合
      3. Udacity 对人工智能的介绍
      4. 由 UpGrad 获得数据科学的 PG 文凭,获得班加罗尔 IIIT 认证

      通往 AI 的路线图

      在花了两到三个月的时间寻找水晶球的正确路径后,我可以在核心术语(如人工智能 (AI)、机器学习 (ML)、数据科学 (DS)、深度学习 (DL) 等)之间绘制出一张地图。我发现了关于这些条款的快速说明

      “在外行的语言, 当我们有一个目标系统(不是软件系统)或环境,例如一个社区的人,天气,健康,客户,公民,企业,动物任何我们想要监测,服务,影响或控制(作为个人利益,国家利益或商业利益),我们收集(或继续收集)数据,以捕获事件,事实和数字定期,并存储在一个位置,最终需要大量的或空间(数据湖,数据仓库或大数据))并通过应用一些算法(机器学习算法)来查找企业(国家、个人或团体等)感兴趣的具体事实、数字、趋势或模式(机器学习模型)。一旦学习和事实调查结束,并生成机器学习模型,模型就用于预测事件的结果(预测过程)。根据这些预测决定采取进一步行动。操作可用于使用软件(例如自动通知、安全检查等)、设备(例如 IoT 或机器人)控制目标(系统或环境),以及人员(例如促销或向客户提供的产品)。整个过程从数据收集开始,以决定的操作结束,可以称为人工智能。然而,美国计算机科学家约翰·麦卡锡早在1956年就将人工智能一词称为“制造智能机器,特别是智能计算机程序的科学和工程”。另一方面,数据科学拥有与数据相关的所有所有内容,这意味着它与 AI、ML 或 DL 具有横切区域。数据科学解决了所有这些问题,即如何以及应该收集、存储、读取、传输和处理所有数据。用于自动化生产和交付产品和服务的重复和日常任务的操作类别是自动化的一部分。除了从机器学习或深度学习知识中获得的决策和行动外,自动化还有其他几个领域,如机器人、机械和电气设备等。

      加快

      现在,我有地图,我加速与一个目标在我的脑海 – 建立自己的神经网络。

      在路上,我找到了一个很受欢迎的人,一个快速学习新事物和制作酷视频的专家。他是西拉杰·拉瓦尔他的视频真的令人耳目一新,并缓解了咬硬螺母的努力。他提出了一些激进的课程,以更快地学习AI,ML和DS,对于那些真正着急的人。如

      根据我从学习中可以得出的概念图,课程可以得出14个主要里程碑,指向水晶球。完成整个旅程所需的时间(最后一个里程碑除外,即持续练习),我可以估计,对于重新开始的人来说,时间大约是一年。拥有数学和编码前等技能的人肯定能提前完成png” 数据-新=”false”数据大小=”98107″数据大小格式化=”98.1 kB”数据类型=”临时”数据 url=”/存储/临时/13435123-15892929844423 1.png”src=”http://www.cheeli.com.cn/wp-内容/上传/2020/05/13435123-158929844231.png”样式=”宽度:500px;”/>

      十四个里程碑

      在十四个里程碑中,四个里程碑属于数学,三个属于纯编码,七个属于与编码实践一起学习课程,最后一个是连续实践,没有它,数据和算法的世界可能很快就会从实践者那里消失。对于每个里程碑,我们可以单独进行在线正式培训。然而,它似乎更容易,我通过视频和练习的基础上,我自己的速度和时间的可用性。

      里程碑1:线性代数

      汗学院提供的线性代数课程视频通过短片覆盖所有主题。吉尔伯特·斯特朗教授从麻省理工学院的线性代数课程带我们到更详细的部分,视频和解释相对较长。

      里程碑2:统计

      汗学院提供的统计学课程通过简洁的视频讲座帮助很大。麻省理工学院还有关于统计基础知识的另一门课程。

      里程碑3:概率理论:

      我喜欢西拉杰·拉瓦尔对概率理论提出的小乐趣填充方法。在YouTube上,还有哈佛大学关于概率理论的详细课程。

      里程碑4:数值计算

      伊恩·古德费洛(IanGoodfellow)的数值计算讲座简明扼要,《深度学习书》的合著者之一,可以在YouTube上找到。

      除了上面列出的课程外,麻省理工学院还开设一门以机器学习为重点的数学简明课程,称为机器学习数学。本课程涵盖机器学习的大部分重要数学概念youtube.com/watch?v=YzfdL58virc”rel=”不跟随”目标=”_blank”,视频激发了很多灵感。

      里程碑5:Python

      虽然R 语言是为统计计算和数据图形表示而构建的,但它缺乏从成熟的多用途编程语言预期的其他功能,这就是Python 语言接管竞争的原因。此外,Python 为机器学习和数据处理提供了一系列预构建的库,这有助于它成为机器学习和 AI 最受欢迎的编程语言选项。然而,学习R有助于理解数学和统计概念。特别是当需要快速原型或验证机器学习算法时,R 非常方便。与Python并行学习 R是最佳主意。最后,Julia 语言是块中的新孩子,它比 Python具有更强的功能,并且它是 Python 的潜在挑战者。

      Kaggle 提供以机器学习为重点的学习 Python课程。很少有 Python 包是要开始的基本包,例如

Comments are closed.