机器学习算法种类:修订间差异
跳到导航
跳到搜索
无编辑摘要 |
无编辑摘要 |
||
第1行: | 第1行: | ||
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。 | |||
机器学习研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。 | |||
机器学习是人工智能核心,是使计算机具有智能的根本途径。 | |||
====== 机器学习算法种类 ====== | ====== 机器学习算法种类 ====== | ||
* 监督机器学习算法用于进行预测。此外,该算法搜索分配给数据点的值标签内的模式。 | * 监督机器学习算法用于进行预测。此外,该算法搜索分配给数据点的值标签内的模式。 |
2022年12月29日 (四) 16:31的最新版本
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。
机器学习研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。
机器学习是人工智能核心,是使计算机具有智能的根本途径。
机器学习算法种类
- 监督机器学习算法用于进行预测。此外,该算法搜索分配给数据点的值标签内的模式。
- 无监督机器学习算法:没有标签与数据点相关联。这些ML算法将数据组织成一组簇。此外,它需要描述其结构,使复杂的数据看起来简单,有条理,便于分析。
- 增强机器学习算法:我们使用这些算法来选择动作。此外,我们可以看到它基于每个数据点。一段时间后,算法改变其策略以更好地学习。
Find-S算法
最简单的机器学习算法。机器可以从概念中学习,通过处理旧数据/训练数据,找出对象是否属于特定类别,最终找出与训练实例拟合度最高的假设。
概念学习的最终目标是确定一个与目标概念 C 在实例集 X 上相同的假设 H,并且唯一可用的信息是 C 在 X 上的值。我们的算法可以确保它与训练数据相匹配。
训练数据集 -> 机器学习算法 -fit-> 模型 输入样例 -> 模型 -predict-> 输出结果
- 训练数据(通过过去的经验来训练我们的模型)
- 目标概念(通过假设来辨别数据对象)
- 实际数据对象(用于测试模型)
Find-S 算法的第一步是从最具体的假设开始,通过观察数据实例(训练),更新/调整当前的假设。
不足和缺点:
- 没有办法确定最终假设(Find-S 找出的)是否是唯一一个与数据一致 (consistent) 的假设。
- 不一致 (inconsistent) 的训练实例会误导 Find-S 算法,因为它忽略了 “负” 数据实例。一个能检测训练数据不一致的算法是更好的选择。
- 一个好的概念学习算法应该能够回溯对找到的假设的选择,以便能够逐步改进所得到的假设。但不幸的是,Find-S 不能提供这样的方法。
一些局限性可以通过候选删除算法 (candidate elimination algorithm)克服。