• QQ空间
  • 回复
  • 收藏

机器学习:关于学习模型形式

东方头条 2019-10-16 13:58:34 科技

在日常生活中,个人实际上正面临着一些选择。对于要解决这些决策的机器,自动途径是显示数字表达中面临的问题。数学表达可以从问题基础合理地构成。机器学习是一种正式的学习模型。

通常存在三种依赖于连续问题的机器学习。这些也基于信息索引。

您很快就会发现,对于要尝试使用的机器学习的许多要素之间的特殊关系。但是,机器学习本身将是一种绝佳的方法,可以在您试图利用自己的业务来定位各部分之间的主要关联。

图片来自网络

取决于连续问题的三种机器学习也基于信息索引。这些索引包括在以下内容中:

监督学习:

给定的学习准备集是命名数据集。托管学习尝试发现功能列表和名称集之间的联系。我们可以从标记的数据集中获得哪些信息和属性。在每个分量向量x与标记1 2 {{}} cyl(c通常从2到100)相比较的偶然机会上,学习问题被视为一个分组。

然后,如果每个分量向量x都可与真正有价值的R相比较,则将学习问题表征为复发问题。从规范学习中提取的信息经常用于期望和确认。

无监督学习:

未标记的数据集同样具有未标记的数据集的特征。无助学习目标分组,总而言之,无助的计算可能会始终适应上面记录的多个属性,并且单独学习的结果可以另外用于托管学习。当您自己学习或私下学习时,也会使用无监督学习。

强化学习:

强化学习用于照顾基本领导力的问题(通常是选择的安排,例如,机器人观察和开发,编程的国际象棋棋手和编程的车辆驾驶。

图片来自网络

监督学习策略

监督学习通常使用两种分类器方法。一击式(区分)和二击式(概率)技术。一次性(判别式)方法学目标已经建立了将分量向量合法映射到名称的能力。

该名称通常是通过ERM的可能性及其近似的改编而得名的。再者,两种安排的技术滥用了概率策略,并且可以另外分为两个组:判别模型和生成模型。

该判别模型试图表明分类器所给出的成分矢量限制性可能性输送(CPD)。虽然生成模型使用了包罗万象的变体,但在给定每个标记的情况下,分类器显示为几个CPD,就像名称的更早使用可能性一样。

我们渴望找到可以删除大量信息,与过度拟合和不足拟合保持战略距离的模型,并为不断发展的问题提供最佳的学习表现。在选择模型之前,我们必须意识到如何完成各种模型,就像各种模型的复杂性一样。通常有三种技术可以达到此目的:

投机集分类和目标能力(类型I):不同的理论集类型(例如KNN,选择树和直接分类器)带来了各种模型。

模型参数(类型II):即使在类似的推测集下进行排序和目标工作。仍有一些免费参数可以修改理论集。例如,在KNN(K最接近的邻居)中,K的各种选择可能带来大量的学习展览。SVM和多层感知器的利用还期望客户端在执行之前设置一些参数。在大多数情况下,这些参数与模型复杂度和VC d有关联。

高光变化(类型III):但是,最后但并非最不重要的是,更改高光向量的尺寸将带来模型的各种VC d。有很多策略可以改善分量矢量的维数,前提条件可以定义总体结构。

图片来自网络

选型

进行模型选择以找到最佳模型,该模型可以提取大量信息,避免过度拟合和拟合不足,并为进行中的问题提供最佳的学习展示。

正则化:执行正则化以调整Em(g)和模型复杂度。

批准:批准不是从正规化而是从各种理论集和独特的目标能力中选择一个模型。随着不同模型的认可,我们可以看到具有多个模型参数的推测集。

三项学习原则

在过去的两个小节中,研究了如何创建几个模型并从中选择最佳模型,并且在本小节中,提出了AI客户端应记住的三个规则:

奥卡姆剃刀原则:最容易想到的就是适合信息的模型,这意味着如果两个模型都可以实现等效的期望Em(g),那么更简单的一个就是合理的模型。

考试倾向:如果单方面检查考试信息,那么学习将产生部分比较结果。例如,如果对“互联网如何影响您的生活?”进行在线评估,则实际结果可能会危及互联网的完整性,因为那些不愿使用互联网的人可能会会错过这个测试。

图片来自网络

信息监听:如果信息收集影响了学习过程的任何进展,则不能完全依靠调查结果。