机器学习算法种类

来自牛奶河Wiki
Admin讨论 | 贡献2022年12月27日 (二) 15:15的版本
跳到导航 跳到搜索
机器学习算法种类
  • 监督机器学习算法用于进行预测。此外,该算法搜索分配给数据点的值标签内的模式。
  • 无监督机器学习算法:没有标签与数据点相关联。这些ML算法将数据组织成一组簇。此外,它需要描述其结构,使复杂的数据看起来简单,有条理,便于分析。
  • 增强机器学习算法:我们使用这些算法来选择动作。此外,我们可以看到它基于每个数据点。一段时间后,算法改变其策略以更好地学习。

Find-S算法

  最简单的机器学习算法。机器可以从概念中学习,通过处理旧数据/训练数据,找出对象是否属于特定类别,最终找出与训练实例拟合度最高的假设。

  概念学习的最终目标是确定一个与目标概念 C 在实例集 X 上相同的假设 H,并且唯一可用的信息是 C 在 X 上的值。我们的算法可以确保它与训练数据相匹配。

  训练数据集 -> 机器学习算法 -fit-> 模型 输入样例 -> 模型 -predict-> 输出结果

  • 训练数据(通过过去的经验来训练我们的模型)
  • 目标概念(通过假设来辨别数据对象)
  • 实际数据对象(用于测试模型)

  Find-S 算法的第一步是从最具体的假设开始,通过观察数据实例(训练),更新/调整当前的假设。

  不足和缺点:

  • 没有办法确定最终假设(Find-S 找出的)是否是唯一一个与数据一致 (consistent) 的假设。
  • 不一致 (inconsistent) 的训练实例会误导 Find-S 算法,因为它忽略了 “负” 数据实例。一个能检测训练数据不一致的算法是更好的选择。
  • 一个好的概念学习算法应该能够回溯对找到的假设的选择,以便能够逐步改进所得到的假设。但不幸的是,Find-S 不能提供这样的方法。

  一些局限性可以通过候选删除算法 (candidate elimination algorithm)克服。

决策树算法(Decision trees)

随机森林算法(Random forests)

人工神经网络