2026/1/15 11:20:24
网站建设
项目流程
杭州定制网站公司,安卓系统软件开发培训,做视频发哪个网站赚钱,有哪些做壁纸的网站好本文全面介绍大模型技术#xff0c;涵盖AI概念、应用场景、企业落地方法、技术原理与架构及本地部署。强调大模型是提升企业效率的工具#xff0c;通过业务流程解构可找到落地场景。同时指出大模型存在的短板和多种技术架构选择#xff0c;为读者提供从理论到实践的完整学习…本文全面介绍大模型技术涵盖AI概念、应用场景、企业落地方法、技术原理与架构及本地部署。强调大模型是提升企业效率的工具通过业务流程解构可找到落地场景。同时指出大模型存在的短板和多种技术架构选择为读者提供从理论到实践的完整学习路径。什么是 AI「AI is bullshit。深蓝没用任何 AI 算法就是硬件穷举棋步。」思考「智能冰箱」是 AI 吗一种观点基于机器学习、神经网络的是 AI基于规则、搜索的不是 AI。AI大模型能干什么大模型全称「大语言模型」英文「Large Language Model」缩写「LLM」。现在已经不需要再演示了。每人应该都至少和下面一个基于大模型的对话产品对话过至少 1000 次。国家公司对话产品旗舰大模型网址美国OpenAIChatGPTGPThttps://chatgpt.com/美国MicrosoftCopilotGPT 和未知https://copilot.microsoft.com/美国GoogleGeminiGeminihttps://gemini.google.com/美国AnthropicClaudeClaudehttps://claude.ai/ 公认不输甚至超过 GPT 的中国百度文心一言文心https://yiyan.baidu.com/中国阿里云通义千问通义千问https://tongyi.aliyun.com/qianwen中国智谱 AI智谱清言GLMhttps://chatglm.cn/中国月之暗面Kimi ChatMoonshothttps://kimi.moonshot.cn/中国MiniMax星野ababhttps://www.xingyeai.com/中国深度探索deepseekDeepSeekhttps://chat.deepseek.com/本课第一个专业要求分清对话产品和大模型。但是千万别以为大模型只是聊天机器人。它的能量远不止于此。按格式输出分类聚类持续互动技术相关问题可能一切问题都能解决所以是通用人工智能 AGI用 AI要用「用人思维」机器思维研发了什么功能就有什么功能。用人思维给 ta 一个任务总会有些反馈或好或坏惊喜或惊吓。划重点大模型就是一个函数给输入生成输出任何可以用语言描述的问题都可以输入文本给大模型就能生成问题的结果文本进而任意数据都可以输入给大模型生成任意数据英伟达 CEO 黄仁勋 2024 年 6 月 2 日在 Computex 上的演讲提到各种模态数据的统一支持大模型GPT时代一切皆为向量AI驱动干行百业效率升级大量行业场景应用价值仍待深挖大模型现阶段落地情况综述Killer App 没有影AI 原生待证明。手握场景不着急内部提效暗暗行。Killer App 没有影AI 没有创造新的使用场景只是旧场景的增强所以没有 Killer App 的土壤可以乐观期待 Killer App但别苦苦追求请忽略一切张嘴就是 Killer App 的人AI 原生待证明AI 原生是指产品的核心功能是 AI而不是 AI 作为辅助功能。典型特点是有 AI 后才出现。助手类打不过 Siri 们ChatGPTKimi Chat文心一言通义千问智谱清言……搜索类谷歌百度不会袖手旁观Perplexity秘塔 AIDevv情感陪伴类社交巨头正谨慎观察Character.AI已被 Google 人才收购星野Replika定制 Agent商业模式探索中ChatGPT GPTs扣子DifyAI编程 目前最成功的AI应用CursorWindsurfInsCodemarscode手握场景不着急大玩家毫不落后AI 带来的市场格局变化不大。拍照答题GauthQuestion AI英语学习多邻国有道 Hi Echo图像处理美图秀秀Adobe Firefly办公WPS AICopilot for Microsoft 365钉钉魔法棒飞书智能伙伴腾讯会议智能助手编程GitHub Copilot全家桶GoogleMicrosoft字节跳动内部提效暗暗行很多企业将大模型和业务相结合取得了或大或小的效果营销AI 做营销创意人再加工AI 批量生产营销素材多语言翻译客服/销售全 AI适合本来没人做AI 来补位半 AI适合本来有人做AI 来提效办公公文撰写/总结/翻译知识库内部客服辅助决策情报分析BI产品研发创意、头脑风暴IT 研发提效怎样寻找企业中大模型落地场景1. 业务流程解构明确目标 确定解构的目标是什么是否是提升效率、降低成本还是增强产品或服务的质量。分析现有流程 通过与相关部门和团队沟通了解当前的业务流程使用流程图、价值流图等工具。收集数据 收集与流程相关的数据包括时间、资源、瓶颈等识别出目前流程中的问题和改进点。识别关键环节确定每个环节对业务结果的影响识别哪些环节最能推动价值产生哪些是浪费或低效的环节。2. 绘制企业价值流图识别关键流程将企业流程分为不同的关键环节如供应链管理、生产流程、销售等。标记价值增值活动明确哪些环节增加了实际价值哪些是纯粹的支持性或非增值活动。流程中的浪费识别流程中出现的浪费如等待、过度处理、运输、库存、动作等。时间与资源标注每个环节的时间、资源消耗以及这些消耗如何影响最终的交付。改进方案通过价值流图找到需要优化的环节提出改善措施。3. 识别大模型应用场景数据驱动的决策大模型可以帮助企业分析大量数据提供更精确的决策支持示例通过AI分析客户数据优化市场营销策略。自动化与智能化大模型可以应用于自动化任务如智能客服、语音识别、图像识别等减少人工成本并提升效率。个性化服务通过大模型实现个性化推荐系统基于用户历史行为或偏好为其推荐个性化的产品或服务提高客户满意度和转化率。预测与优化利用大模型对历史数据进行分析预测未来趋势优化生产计划、库存管理等业务环节。业务流程改进利用大模型分析当前业务流程中的瓶颈和效率低下的环节提出改进措施优化资源配置。实际应用案例业务流程解构与企业大模型应用案例 1智能客服系统优化1.业务流程分析现有流程客户通过电话或在线渠道联系客服人工客服接听后处理问题。高峰时段客服人员处理请求的速度较慢且重复性问题占比高。问题分析客服响应时间长客户体验差。高重复性问题人工客服效率低。客服人员压力大缺乏足够的资源。2.价值流图绘制关键流程客户请求 - 人工客服接听 - 问题解决 - 客户反馈问题识别高峰期间等待时间长人工客服需要处理大量重复问题缺乏自动化支持。改进点引入自动化工具如智能客服减少人工干预提升响应速度。3.应用大模型自然语言处理NLP使用大语言模型如GPT构建智能客服系统支持自然语言理解和生成自动回答常见问题。工作流使用NLP识别客户请求意图并进行分类。常见问题通过智能问答系统自动解答。将复杂或不常见问题转接给人工客服。结果客服响应时间减少50%客户满意度提高。人工客服压力减轻更多精力投入到复杂问题处理上。案例 2智能供应链与需求预测优化1.业务流程分析现有流程企业生产与库存管理依赖传统的预测模型按月或季度调整生产计划库存管理不精确容易造成库存积压或缺货。问题分析生产计划与实际需求不匹配导致产能浪费或供应短缺。库存管理不精准影响现金流和运营成本。2.价值流图绘制关键流程需求预测 - 生产计划 - 原材料采购 - 产品生产 - 仓库管理 - 客户交付问题识别传统需求预测精度低库存管理滞后无法快速响应市场变化。3.应用大模型机器学习模型利用历史销售数据、市场趋势和季节性变化等因素应用大模型提高需求预测精度。工作流使用AI进行数据分析和需求预测。自动调整生产排程和采购计划。基于预测结果动态调整库存管理策略。结果需求预测准确率提高20%库存积压减少30%。生产和采购计划更加精准运营成本降低。案例 3智能生产线质量控制1.业务流程分析现有流程生产线上的产品质量由人工检测人工检测存在判断失误和效率低的问题特别是在高产量情况下无法及时发现质量问题。问题分析质量检测依赖人工容易漏检或误判。高生产速度下无法保证每个产品都得到充分检查导致次品流入市场。2.价值流图绘制关键流程原材料入库 - 生产加工 - 质量检查 - 产品包装 - 交付问题识别人工检查的准确性和效率无法满足生产需求生产质量无法稳定控制。3.应用大模型计算机视觉使用视觉大模型进行产品质量检测自动识别产品缺陷。工作流使用大模型对生产线上每个产品进行图像识别实时监控产品表面缺陷。对有缺陷的产品进行标记及时移出生产线避免流入市场。AI实时反馈生产数据给生产线控制系统优化生产流程。结果质量检测精度提升至99%次品率减少80%。整体生产效率提升30%减少了人工检测的误差和漏检问题。总结这三个案例展示了如何通过大模型优化企业业务流程。智能客服、供应链优化和生产线质量控制是大模型应用的重要领域通过自动化、预测和优化企业能够提高效率、降低成本并提供更好的客户体验。通过结合大模型的强大能力企业可以快速应对变化提升竞争力。成功落地大模型五要素成功落地大模型五要素业务人员的积极对 AI 能力的认知业务团队自带编程能力小处着手老板的耐心如何找到落地场景找落地场景的思路从最熟悉的领域入手尽量找能用语言描述的任务别求大而全。将任务拆解先解决小任务、小场景让 AI 学最厉害员工的能力再让 ta 辅助其他员工实现降本增效**思考**你的业务中有哪些问题可能 AI 能解决工作机会在哪里首先要知道纯大模型岗位几乎是不存在的。可选独立开发者/创业有科技属性的公司几乎所有岗位传统企业跑通 AI 工作流找全栈工程师定制化开发大模型是怎样工作的通俗原理其实它只是根据上文猜下一个词的概率……OpenAI 的接口名就叫「completion」也证明了其只会「生成」的本质。下面用程序演示「生成下一个字」。你可以自己修改 prompt 试试。还可以使用相同的 prompt 运行多次。from openai import OpenAI from dotenv import load_dotenv, find_dotenv _ load_dotenv(find_dotenv()) client OpenAI() #prompt 今天我很 # 改我试试 prompt 下班了今天我很 #prompt 放学了今天我很 #prompt AGI 实现了今天我很 response client.chat.completions.create( modelgpt-4o-mini, messages[{role: user, content: prompt}], streamTrue ) # 处理并打印流式响应内容 for chunk in response: print(f\033[34m{chunk.choices[0].delta.content or }\033[0m, end)略深一点的通俗原理训练和推理是大模型工作的两个核心过程。用人类比训练就是学推理就是用。学以致用如是也。例如有下面训练数据AI 正在改变我们的生活方式。AI 技术在医疗领域有广泛应用。AI 可以提高企业的生产效率。AI 算法能够预测市场趋势。AI 在自动驾驶汽车中扮演重要角色。AI 有助于个性化教育的发展。AI 机器人可以执行复杂的任务。AI 技术正在推动智能家居的普及。AI 在金融分析中发挥着关键作用。AI 技术正逐步应用于艺术创作。「AI」之后出现「技」的概率大于其它字。这些字之间的概率关系就是大模型训练时学到的。用不严密但通俗的语言描述原理训练大模型阅读了人类说过的所有的话。这就是「机器学习」训练过程会把不同 token 同时出现的概率存入「神经网络」文件。保存的数据就是「参数」也叫「权重」推理我们给推理程序若干 token程序会加载大模型权重算出概率最高的下一个 token 是什么用生成的 token再加上上文就能继续生成下一个 token。以此类推生成更多文字Token 是什么可能是一个英文单词也可能是半个三分之一个可能是一个中文词或者一个汉字也可能是半个汉字甚至三分之一个汉字大模型在开训前需要先训练一个 tokenizer 模型。它能把所有的文本切成 token1 个英文字符 ≈ 0.3 个 token。 1 个中文字符 ≈ 0.6 个 token。思考AI 做对的事怎么用这个原理解释AI 的幻觉一本正经地胡说八道怎么用这个原理解释再深一点点这套生成机制的内核叫「Transformer 架构」Transformer 是目前人工智能领域最广泛流行的架构被用在各个领域机器学习 ≈ 机器自动找一个函数函数的参数找出函数的三步骤Transformer在做一个什么事情标量、向量、矩阵、张量的关系点——标量scalar线——向量vector面——矩阵matrix体——张量tensorEmbedding是什么假设我们有一个句子“The cat sat”Transformer核心注意力机制注意力机制中的Q、K、V用好 AI 的核心心法OpenAI 首席科学家 Ilya Sutskever 说过数字神经网络和人脑的生物神经网络在数学原理上是一样的。所以我们要把 AI 当人看把 AI 当人看把 AI 当人看凯文·凯利说了类似的观点「和人怎么相处就和 AI 怎么相处。」用「当人看」来理解 AI用「当人看」来控制 AI用「当人看」来说服别人正确看待 AI 的不足当什么人呢学习时当老师工作时当助手休闲时当朋友这是贯彻整门课的心法乃至我们与 AI 相伴的人生的心法。使用大模型的好习惯- 使用大模型不同的话题要开启新的会话 - 明确指令和问题尽量使问题或指令简洁明确避免多重含义或复杂结构帮助模型更好理解和响应。 - 分步进行如果问题复杂可以将问题拆解成几个小问题逐步处理。这不仅能提高准确度还能避免模型处理过于庞大的信息。 - 上下文保留在多个会话中如果需要参考之前的对话可以适当提及或复述关键点避免丢失上下文。 - 分配优先级针对多个任务或问题可以为每个话题分配优先级先处理最重要或最紧急的内容。 - 适应模型的限制了解模型的处理能力和上下文长度限制避免在同一会话中输入过长的文本尤其是如果涉及大量信息时分割问题会更有效。 - 反馈循环在与模型交互时如果模型的回答不完全或不符合预期可以及时提供反馈和补充说明让模型逐步优化回答。 - 使用特定的格式或模板如果是处理特定类型的任务或问题如代码、数学问题、写作任务可以为输入提供特定的格式或模板以帮助模型更准确地理解任务需求。**课堂实验**你提个 AI 相关问题我来用人类比大模型技术的短板对时效性内容的处理由于大型模型通常在某个时间点之前的数据上训练它们可能无法处理最新的事件或信息。例如对于最近发生的新闻事件或新兴的流行文化现象模型可能缺乏理解GPT4最近最新2023年4月。幻觉、不准确性和滥用风险大型模型可能产生“幻觉”即提供错误但看似合理的文本。这可能导致误信息的传播甚至被用于非法或不道德目的。例如恶意使用者可能利用模型生成看似来自可信出版物的文章作为假新闻传播。泛化能力的局限性泛化能力指的是一个模型在处理新的、未见过的数据时的表现能力虽然大型模型在多个任务上表现出色但在处理特定、罕见或新颖的情况时可能表现不佳难以解释和透明性差大型模型通常是“黑箱”即使是模型的开发者也无法完全理解模型是如何配置自身以产生文本的。这导致了解释或解释AI/ML算法的新框架的发展但由于模型规模的增大解释性AI/ML方法变得日益复杂。大模型应用产品架构Agent 模式还太超前Copilot 是当前主流。实现 Copilot 的主流架构是多 Agent 工作流模仿人做事将业务拆成工作流workflow、SOP、pipeline每个 Agent 负责一个工作流节点大模型应用技术架构大模型应用技术特点门槛低天花板高。纯 PromptPrompt 是操作大模型的唯一接口当人看你说一句ta 回一句你再说一句ta 再回一句……Agent Function CallingAgentAI 主动提要求Function CallingAI 要求执行某个函数当人看你问 ta「我明天去杭州出差要带伞吗」ta 让你先看天气预报你看了告诉 tata 再告诉你要不要带伞RAGRetrieval-Augmented GenerationEmbeddings把文字转换为更易于相似度计算的编码。这种编码叫向量向量数据库把向量存起来方便查找向量搜索根据输入向量找到最相似的向量当人看考试答题时到书上找相关内容再结合题目组成答案然后就都忘了Fine-tuning精调/微调当人看努力学习考试内容长期记住活学活用。如何选择技术路线面对一个需求如何开始如何选择技术方案下面是个不严谨但常用思路。其中最容易被忽略的是准备测试数据值得尝试 Fine-tuning 的情况提高模型输出的稳定性用户量大降低推理成本的意义很大提高大模型的生成速度需要私有部署如何选择基础模型凡是问「哪个大模型最好」的都是不懂的。不妨反问「有无论做什么都表现最好的员工吗」**划重点**没有最好的大模型只有最适合的大模型基础模型选型合规和安全是首要考量因素。需求国外闭源大模型国产闭源大模型开源大模型国内 2C✅✅国内 2G✅✅国内 2B✅✅✅出海✅✅✅数据安全特别重要✅然后用测试数据在可以选择的模型里做测试找出最合适的。为什么不要依赖榜单榜单已被应试教育污染。唯一还算值得相信的榜单LMSYS Chatbot Arena Leaderboard榜单体现的是整体能力。放到一件具体事情上排名低的可能反倒更好榜单体现不出成本差异本课程主打语言是 Python因为Python 和 AI 是天生一对Python 是最容易学习的编程语言安装 OpenAI Python 库在命令行执行pip install --upgrade openai发一条消息体验给大模型注入新知识的代码竟如此简单。from openai import OpenAI # 加载 .env 文件到环境变量 from dotenv import load_dotenv, find_dotenv _ load_dotenv(find_dotenv()) # 初始化 OpenAI 服务。会自动从环境变量加载 OPENAI_API_KEY 和 OPENAI_BASE_URL client OpenAI() # 消息 messages [ { role: system, content: 你是AI助手小瓜是 AGIClass.ai 的助教。这门课每周二、四上课。 # 注入新知识 }, { role: user, content: 周末上课吗 # 问问题。可以改改试试 }, ] # 调用 GPT-4o-mini 模型 chat_completion client.chat.completions.create( modelgpt-4o-mini, messagesmessages ) # 输出回复 print(chat_completion.choices[0].message.content)DeepSeek本地部署和应用ollamadocker 桌面版open-webui 版本dyrnq/open-webui:latestDeepSeek本地部署实战演示未来展望大模型竞争的过程继续白热化第一将会不断轮流切换多模态大模型将更加成熟大模型的价格将不断走低大模型应用开发才是未来最值的关注的方向应用为王如何学习大模型 AI 由于新岗位的生产效率要优于被取代岗位的生产效率所以实际上整个社会的生产效率是提升的。但是具体到个人只能说是“最先掌握AI的人将会比较晚掌握AI的人有竞争优势”。这句话放在计算机、互联网、移动互联网的开局时期都是一样的道理。我在一线科技企业深耕十二载见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事早已在效率与薪资上形成代际优势我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套AI 大模型突围资料包✅ 从零到一的 AI 学习路径图✅ 大模型调优实战手册附医疗/金融等大厂真实案例✅ 百度/阿里专家闭门录播课✅ 大模型当下最新行业报告✅ 真实大厂面试真题✅ 2025 最新岗位需求图谱所有资料 ⚡️ 朋友们如果有需要《AI大模型入门进阶学习资源包》下方扫码获取~① 全套AI大模型应用开发视频教程包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点② 大模型系统化学习路线作为学习AI大模型技术的新手方向至关重要。 正确的学习路线可以为你节省时间少走弯路方向不对努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划带你从零基础入门到精通③ 大模型学习书籍文档学习AI大模型离不开书籍文档我精选了一系列大模型技术的书籍和学习文档电子版它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。④ AI大模型最新行业报告2025最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。⑤ 大模型项目实战配套源码学以致用在项目实战中检验和巩固你所学到的知识同时为你找工作就业和职业发展打下坚实的基础。⑥ 大模型大厂面试真题面试不仅是技术的较量更需要充分的准备。在你已经掌握了大模型技术之后就需要开始准备面试我精心整理了一份大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。以上资料如何领取为什么大家都在学大模型最近科技巨头英特尔宣布裁员2万人传统岗位不断缩减但AI相关技术岗疯狂扩招有3-5年经验大厂薪资就能给到50K*20薪不出1年“有AI项目经验”将成为投递简历的门槛。风口之下与其像“温水煮青蛙”一样坐等被行业淘汰不如先人一步掌握AI大模型原理应用技术项目实操经验“顺风”翻盘这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。以上全套大模型资料如何领取