在许多行业领域,神经网络的性能优于许多机器学习算法。他们不断学习,直到它拿出最好的一组功能,以获得令人满意的预测性能。但是,神经网络会将变量扩展为一系列数字,一旦神经网络完成学习阶段,这些功能对我们来说就变得无法区分。

如果我们只关心预测,神经网络将是一直使用的事实上的算法。但在行业环境中,我们需要一个模型,可以为要素/变量赋予利益干系人意义。这些利益相关者可能是除了具有深度学习或机器学习知识的人之外的任何人。

随机林和神经网络的主要区别是什么?

随机林和神经网络都是不同的技术,学习方式不同,但可用于类似的域。随机林是机器学习的一种技术,而神经网络是深度学习的独有技术。

什么是神经网络?

神经网络是一种基于人类大脑皮层功能的计算模型,它复制了相同的思维和感知风格。神经网络由包含计算网络输出的激活函数的互连节点组成的层组织。

神经网络是机器学习的另一种方法,计算机通过分析训练示例来学习执行任务。由于神经网络松散地基于人脑,它将由数千或数百万个相互连接的节点组成。节点可以连接到其下层中的多个节点,从该节点接收数据,并在其上方多个节点接收数据。每个传入数据点接收权重,并倍增并添加。如果加权总和等于零,然后传递给激活函数,则添加偏置。

神经网络的体系结构

神经网络有 3 个基本体系结构:

  1. 单层馈送网络
  • 它是最简单的网络,是感知器的扩展版本。它在输入层和输出层之间具有其他隐藏节点

多层馈送网络

  • 这种类型的网络具有一个或多个隐藏层,但输入和输出除外。它的作用是干预输入层和输出层之间的数据传输。

3. 经常性网络

什么是随机林?

随机林是决策树的一个整体,通过它,最终/叶节点要么是分类问题的多数类,要么是回归问题的平均值。

随机林将种植许多分类树,对于该树的每个输出,我们说该树‘投票’该类。树的生长使用以下步骤:

  1. 将为每个树从训练数据中随机抽取行。
  2. 从步骤 (1) 中抽取的示例中,将采用要素子集来拆分每棵树。
  3. 每个树都增长到参数指定的最大范围,直到它达到对类的投票。

为什么要使用随机林?

使用随机林而不是决策树的根本原因是将许多决策树的预测合并到单个模型中。其逻辑是,即使由许多平庸的模型组成的单个模型仍然会比一个好的模型更好。鉴于随机林的主流表现,这是事实。因此,随机林不太容易过度拟合。

过度拟合可能发生与灵活的模型,如决策树,其中模型记住训练数据,并学习数据中的任何噪音。这将使它无法预测测试数据。

随机林通过将许多树合并到一个集合模型中,可以减少灵活模型(如决策树)的高方差。

何时应该使用随机林与神经网络?

随机林的计算成本较低,不需要 GPU 即可完成培训。随机林可以为您提供对决策树的不同解释,但性能更好。神经网络需要的数据比日常人员可能拥有的数据多得多,才能真正有效。神经网络将简单地将要素的可解释性化为无意义,以便性能

如果目标是创建一个预测模型,而不关心正在起作用的变量,则使用神经网络,但您需要资源来执行此操作。如果需要了解变量,那么无论我们是否喜欢它,在这种情况下通常发生的情况是,性能必须受到轻微打击,以确保我们仍然能够了解每个变量如何对预测模型产生影响。

Comments are closed.