2026/3/29 3:44:42
网站建设
项目流程
网站如何转做app,摄影公司网站,小程序开发难不难,网站策划书文章系统介绍机器学习的四大范式#xff1a;监督学习依赖标注数据训练模型#xff1b;无监督学习挖掘数据内在特征完成任务#xff1b;半监督学习结合少量标注和大量无标签数据提升性能#xff1b;自监督学习通过设计辅助任务从无标签数据中生成监督信号。这些方法各有特点…文章系统介绍机器学习的四大范式监督学习依赖标注数据训练模型无监督学习挖掘数据内在特征完成任务半监督学习结合少量标注和大量无标签数据提升性能自监督学习通过设计辅助任务从无标签数据中生成监督信号。这些方法各有特点和应用场景其中自监督学习在大模型预训练中表现尤为突出能学习到泛化性强的特征表示为下游任务提供有力支持。监督学习监督学习利用大量的标注数据来训练模型对模型的预测值和数据的真实标签计算损失然后将误差进行反向传播(计算梯度、更新参数)通过不断的学习最终可以获得识别新样本的能力。**特点**每个样本都有明确标签如图片分类中的“猫/狗”**典型应用**图像分类、语音识别、垃圾邮件过滤。**局限性**标注成本高数据标注耗时且依赖人工无监督学习无监督学习完全无需人工标注通过对数据内在特征的挖掘找到样本间的关系。**特点**数据本身蕴含结构如客户分群、文本主题提取与有监督学习的最主要差别是否需要人工标注的标签信息。真正的无监督学习应该不需要任何标注信息通过挖掘数据本身蕴含的结构或特征来完成相关任务大体可以包含三类聚类k-means谱聚类等降维线性降维PCA、ICA、LDA、CCA等非线性降维ISOMAP、KernelPCA等2D降维2D-PCA离散点检测如基于高斯分布或多元高斯分布的异常检测算法无监督学习最主要采用的是自动编码器的方式。其核心机制是通过编码器-解码器结构实现数据压缩与重构**编码阶段**编码器将输入数据如图像、文本压缩为低维隐层向量保留关键特征解码阶段解码器基于隐层向量重建原始数据理论上能无损还原输入。由于隐层维度远低于输入维度例如将784维图像压缩至20维这个过程本质是非线性降维。学习到的隐层向量可作为数据的紧凑表征直接替代原始数据用于聚类、分类等任务降低计算复杂度。例如MNIST手写体识别中150维隐层即可有效区分数字类别**表征/表示学习(Representation Learning)**则是对如何学习隐藏向量的研究。核心是让机器自动从数据中提取有用特征比如把图片压缩成几串数字。传统方法如自动编码器虽然能压缩数据但存在两个关键问题1、只看像素忽略结构传统方法按像素逐个重建比如把猫的每根毛都单独处理导致模型学不到“猫耳朵”和“猫脸”的关联只能记住零散的像素点。2、语义信息缺失比如判断两张图是否都是“猫”传统方法可能只关注颜色深浅而无法识别“胡须方向”等关键特征。自监督学习通过设计辅助任务如预测图片旋转角度、拼图还原迫使模型理解数据背后的逻辑最终学到“猫有四条腿”这样的语义知识。半监督学习**半监督学习**让学习器不依赖外界交互自动的利用未标记样本来提升学习性能。**核心思想**结合少量标注数据和大量无标签数据提升模型性能。半监督学习可进一步划分为纯(pure)半监督学习和直推学习(transductive learning)纯(pure)半监督学习假定训练数据中的未标记样本并非待测的数据直推学习(transductive learning)假定学习过程中所考虑的未标记样本是待预测数据学习的目的就是在这些未标记样本上获得最优泛化性能。半监督深度学习算法可以总结为三类1. 无标签数据预训练网络后有标签数据微调(fine-tune)**无监督打地基**用所有数据逐层重构预训练对网络的每一层都做重构自编码保留核心特征然后把自编码网络的参数作为初始参数用有标签数据微调。**伪有监督预训练**通过某种方式/算法(如半监督算法聚类算法等)用少量标记数据微调模型提升分类能力然后在用有标签数据来微调。例子先用10万张无标签图片训练特征提取器再用1万张带标签图片优化细节2. 利用从网络得到的深度特征来做半监督算法先用有标签数据训练网络从网络中提取数据特征以这些特征用某种分类算法对无标签数据进行分类挑选认为分类正确的无标签数据加入到训练集再训练网络如此循环。**特点**筛选高置信度预测结果 → 加入训练集循环优化**效果**像滚雪球正确分类的无标签数据越多模型越强3. 半监督网络结构就神经网络本身而言其实还是运行在一种有监督的方式上。2015年诞生半监督ladderNet效果非常好达到了当时的state-of-the-art性能。文章(Rasmus,A.,Valpola,H.,Honkala,M.,Berglund,M.Raiko,T. Semi-Supervised Learning with Ladder Network.)ladderNet是有监督算法和无监督算法的有机结合。很多半监督深度学习算法是用无监督预训练这种方式对无标签数据进行利用的但事实上这种把无监督学习强加在有监督学习上的方式有缺点**传统问题**自监督预训练学特征和监督微调学分类目标冲突ladderNet通过skip connection解决这个问题通过在每层的编码器和解码器之间添加跳跃连接(skip connection)减轻模型较高层表示细节的压力使得无监督学习和有监督学习能结合在一起并在最高层添加分类器ladderNet就变身成一个半监督模型。**优势**同时利用标记数据分类未标记数据重建提升泛化能力自监督学习相比于上述方法自监督学习实现了用更少的样本或更少的实验来学习更多。核心思想通过设计辅助任务如预测图像旋转角度从无标签数据中生成监督信号。自监督学习在很多地方被定义为无监督学习问题但是它常常被构造为监督学习问题的求解形式典型的例如word2vecautoencoder这类明明没标签却能够造出目标函数使用凸优化方法求解无中生有这和kmeansdbscan之类的无监督学习的范式是完全不同的判断一个工作是否属于自监督学习除了无需人工标注这个标准之外还有一个重要标准就是是否学到了新的知识。对于自监督学习能够学到新信息的原理解释数据的丰富性和多样性自监督学习通常利用大规模的未标记数据进行训练这些数据往往具有丰富的内容和多样的特征。任务的设计和构造通过设计具有挑战性和信息丰富度的预测任务可以促使模型更好地学习数据的表示。例如可以设计预测图像的旋转角度、颜色变换、上下文信息等任务。迁移学习和泛化能力通过对比学习、时序建模等方法提取跨领域通用特征如物体轮廓、语义关联实现小样本场景下的快速适应与持续学习。自适应和增量学习可以通过不断更新模型参数来适应新的数据和环境。特征提取和表示学习自监督学习通过预测数据的属性或结构推动模型学习数据的特征表示。些特征表示可以用于解决各种任务。自监督学习通过设计数据增强和任务构造从无标签数据中自动生成监督信号**数据增强**对图片翻转、裁剪等操作生成新样本迫使模型学习不变特征如识别旋转后的猫。图像任务像素预测遮挡部分图像让模型补全如MAE颜色化将灰度图恢复彩色学习语义关联如天空蓝色**3.对比学习**对同一图片生成不同增强视图如裁剪调色拉近相似视图的特征距离推开不相似视图**4.生成式任务**用GAN生成假图与原图对比学习特征如StyleGAN实际上自监督学习的应用有很多但是其最核心的目标还是在**“为下游的有监督任务学习良好的representation”**通过自监督学习能够学习到泛化性能很强的representation(也即nn里的一些layer输出的features是比较generalized这个generalized的features反应了数据本身的一些隐藏的pattern最好这些pattern可以在许多的下游任务中shared(transfer learning and pretrained model))例如nlp中的许多预训练任务都可以视为自监督学习从transformer pretrained model的表现也可以看到自监督学习的强大。优势无需人工标注数据利用率高。学习的特征泛化性强适合小样本场景。典型应用大语言模型预训练如GPT、BERT图像自监督表征学习如ResNet多模态任务如CLIP跨模态对齐如何学习AI大模型如果你对AI大模型入门感兴趣那么你需要的话可以点击这里大模型重磅福利入门进阶全套104G学习资源包免费分享这份完整版的大模型 AI 学习和面试资料已经上传CSDN朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】这是一份大模型从零基础到进阶的学习路线大纲全览小伙伴们记得点个收藏第一阶段从大模型系统设计入手讲解大模型的主要方法第二阶段在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用第三阶段大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统第四阶段大模型知识库应用开发以LangChain框架为例构建物流行业咨询智能问答系统第五阶段大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型第六阶段以SD多模态大模型为主搭建了文生图小程序案例第七阶段以大模型平台应用与开发为主通过星火大模型文心大模型等成熟大模型构建大模型行业应用。100套AI大模型商业化落地方案大模型全套视频教程200本大模型PDF书籍学会后的收获• 基于大模型全栈工程实现前端、后端、产品经理、设计、数据分析等通过这门课可获得不同能力• 能够利用大模型解决相关实际项目需求 大数据时代越来越多的企业和机构需要处理海量数据利用大模型技术可以更好地处理这些数据提高数据分析和决策的准确性。因此掌握大模型应用开发技能可以让程序员更好地应对实际项目需求• 基于大模型和企业数据AI应用开发实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能 学会Fine-tuning垂直训练大模型数据准备、数据蒸馏、大模型部署一站式掌握• 能够完成时下热门大模型垂直领域模型训练能力提高程序员的编码能力 大模型应用开发需要掌握机器学习算法、深度学习框架等技术这些技术的掌握可以提高程序员的编码能力和分析能力让程序员更加熟练地编写高质量的代码。LLM面试题合集大模型产品经理资源合集大模型项目实战合集获取方式有需要的小伙伴可以保存图片到wx扫描二v码免费领取【保证100%免费】