网络营销推广策划的步骤厦门关键词优化软件
2026/4/4 0:50:14 网站建设 项目流程
网络营销推广策划的步骤,厦门关键词优化软件,网站建设实验总结百科,南京网站设计外包从数据中学习 神经网络的特征就是可以从数据中学习。所谓“从数据中学习”#xff0c;是指 可以由数据自动决定权重参数的值。这是非常了不起的事情#xff01;因为如果所有 的参数都需要人工决定的话#xff0c;工作量就太大了。在第2 章介绍的感知机的例 子中#xff0c;…从数据中学习神经网络的特征就是可以从数据中学习。所谓“从数据中学习”是指可以由数据自动决定权重参数的值。这是非常了不起的事情因为如果所有的参数都需要人工决定的话工作量就太大了。在第2 章介绍的感知机的例子中我们对照着真值表人工设定了参数的值但是那时的参数只有3 个。而在实际的神经网络中参数的数量成千上万在层数更深的深度学习中参数的数量甚至可以上亿想要人工决定这些参数的值是不可能的。本章将介绍神经网络的学习即利用数据决定参数值的方法并用Python 实现对MNIST手写数字数据集的学习。对于线性可分问题第2 章的感知机是可以利用数据自动学习的。根据“感知机收敛定理”通过有限次数的学习线性可分问题是可解的。但是非线性可分问题则无法通过自动学习来解决。数据驱动数据是机器学习的命根子。从数据中寻找答案、从数据中发现模式、根据数据讲故事……这些机器学习所做的事情如果没有数据的话就无从谈起。因此数据是机器学习的核心。这种数据驱动的方法也可以说脱离了过往以人为中心的方法。通常要解决某个问题特别是需要发现某种模式时人们一般会综合考虑各种因素后再给出回答。“这个问题好像有这样的规律性”“不对可能原因在别的地方。”——类似这样人们以自己的经验和直觉为线索通过反复试验推进工作。而机器学习的方法则极力避免人为介入尝试从收集到的数据中发现答案模式。神经网络或深度学习则比以往的机器学习方法更能避免人为介入。现在我们来思考一个具体的问题比如如何实现数字“5”的识别。数字5 是图4-1 所示的手写图像我们的目标是实现能区别是否是5 的程序。这个问题看起来很简单大家能想到什么样的算法呢如果让我们自己来设计一个能将5 正确分类的程序就会意外地发现这是一个很难的问题。人可以简单地识别出5但却很难明确说出是基于何种规律而识别出了5。此外从图4-1 中也可以看到每个人都有不同的写字习惯要发现其中的规律是一件非常难的工作。因此与其绞尽脑汁从零开始想出一个可以识别5 的算法不如考虑通过有效利用数据来解决这个问题。一种方案是先从图像中提取特征量再用机器学习技术学习这些特征量的模式。这里所说的“特征量”是指可以从输入数据输入图像中准确地提取本质数据重要的数据的转换器。图像的特征量通常表示为向量的形式。在计算机视觉领域常用的特征量包括SIFT、SURF和HOG等。使用这些特征量将图像数据转换为向量然后对转换后的向量使用机器学习中的SVM、KNN等分类器进行学习。机器学习的方法中由机器从收集到的数据中找出规律性。与从零开始想出算法相比这种方法可以更高效地解决问题也能减轻人的负担。但是需要注意的是将图像转换为向量时使用的特征量仍是由人设计的。对于不同的问题必须使用合适的特征量必须设计专门的特征量才能得到好的结果。比如为了区分狗的脸部人们需要考虑与用于识别5 的特征量不同的其他特征量。也就是说即使使用特征量和机器学习的方法也需要针对不同的问题人工考虑合适的特征量。到这里我们介绍了两种针对机器学习任务的方法。将这两种方法用图来表示如图4-2 所示。图中还展示了神经网络深度学习的方法可以看出该方法不存在人为介入。如图4-2 所示神经网络直接学习图像本身。在第2 个方法即利用特征量和机器学习的方法中特征量仍是由人工设计的而在神经网络中连图像中包含的重要特征量也都是由机器来学习的。深度学习有时也称为端到端机器学习end-to-end machinelearning。这里所说的端到端是指从一端到另一端的意思也就是从原始数据输入中获得目标结果输出的意思。神经网络的优点是对所有的问题都可以用同样的流程来解决。比如不管要求解的问题是识别5还是识别狗抑或是识别人脸神经网络都是通过不断地学习所提供的数据尝试发现待求解的问题的模式。也就是说与待处理的问题无关神经网络可以将数据直接作为原始数据进行“端对端”的学习。训练数据和测试数据本章主要介绍神经网络的学习不过在这之前我们先来介绍一下机器学习中有关数据处理的一些注意事项。机器学习中一般将数据分为训练数据和测试数据两部分来进行学习和实验等。首先使用训练数据进行学习寻找最优的参数然后使用测试数据评价训练得到的模型的实际能力。为什么需要将数据分为训练数据和测试数据呢因为我们追求的是模型的泛化能力。为了正确评价模型的泛化能力就必须划分训练数据和测试数据。另外训练数据也可以称为监督数据。泛化能力是指处理未被观察过的数据不包含在训练数据中的数据的能力。获得泛化能力是机器学习的最终目标。比如在识别手写数字的问题中泛化能力可能会被用在自动读取明信片的邮政编码的系统上。此时手写数字识别就必须具备较高的识别“某个人”写的字的能力。注意这里不是“特定的某个人写的特定的文字”而是“任意一个人写的任意文字”。如果系统只能正确识别已有的训练数据那有可能是只学习到了训练数据中的个人的习惯写法。因此仅仅用一个数据集去学习和评价参数是无法进行正确评价的。这样会导致可以顺利地处理某个数据集但无法处理其他数据集的情况。顺便说一下只对某个数据集过度拟合的状态称为过拟合over fitting。避免过拟合也是机器学习的一个重要课题。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询