网站建设标题怎么写网页传奇游戏源码
2026/3/11 8:33:42 网站建设 项目流程
网站建设标题怎么写,网页传奇游戏源码,asp.net网站开发实例教程pdf,wordpress怎么添加悬浮宠物前沿重器 栏目主要给大家分享各种大厂、顶会的论文和分享#xff0c;从中抽取关键精华的部分和大家分享#xff0c;和大家一起把握前沿技术。 量子位在前几天将2025称为Agent元年#xff0c;我是认可的#xff0c;2025的从技术发展到落地雏形#xff0c;我们有目共睹。 要…前沿重器栏目主要给大家分享各种大厂、顶会的论文和分享从中抽取关键精华的部分和大家分享和大家一起把握前沿技术。量子位在前几天将2025称为Agent元年我是认可的2025的从技术发展到落地雏形我们有目共睹。要聊整体情况就离不开一些关键的论文和博客我先把一些我做了重点参考的文章放出来。一篇比较早的Agent综述博客 https://lilianweng.github.io/posts/2023-06-23-agent/以及他的翻译 https://zhuanlan.zhihu.com/p/704093024今年3月份的Agent综述论文 https://arxiv.org/abs/2503.21460以及他的翻译 http://zhuanlan.zhihu.com/p/1974120693932238820最新版来到今年10月份的一篇长综述论文 https://arxiv.org/abs/2508.17281可惜他没有看到翻译博客。之所以要穿插是因为第一篇能以最直白的方式讲明白Agent的格式但还是太早了Agent的模式还没收敛第二篇比第一篇更系统和完善但他讲的内容可能覆盖范围不如第三篇但是第三篇的面有过于广Agent有些内容好像没必要覆盖这么多所以我就综合3篇文章综合地讲讲。这里只是大概以这些论文的信息作为参考很多我们可能平时关心没那么多的模块我没有讲想了解整个研究生态还是建议大家看看原论文。目录Agent的概念和研究课题Agent基本框架Memory记忆Planning规划Action行动Tool工具回顾一下我的视角的Agent我们该怎么做展望一、Agent的概念和研究课题挺尴尬的在这3篇论文里都没有用严谨而直白的话来定义何为Agent什么样的一个系统或者模式能被称为Agent而是很直接地开始去讲Agent这一个话题包括他有关的研究工作。通过这几篇文章的阅读我是想这么定义的可能并不要紧但大家在讲Agent的时候普遍是这么个事。An LLM-based agent is an autonomous system that combines language model reasoning with memory, planning, external tool use, and (optionally) multi-agent collaboration to perform complex tasks in dynamic environments.说白了说白了就是一个能借助大模型来完成复杂任务的系统这个概念很广也很模糊似乎把大模型所有的应用都归纳进了这个范围里面来这在研究层面做起来会有一些难度但好处是大模型应用的范式和思路我们都能从里面找到了这个海纳百川的概念里很可能有我们日常工作可能会用到的大模型使用技巧。尽管如此我们还是可以整理出Agent的生态围绕Agent我们主要有4个大的研究方向。Agent内的主要技术方案包括其核心模块与架构、模块协作模式以及自我演化的能力。评估和工具。这里包括Agent的benchmark和数据集以及工具的触发应用、构建以及实际开发。Agent的现实问题。如安全、隐私、社会影响等。应用。Agent在多个场景的应用。二、Agent基本框架早期的Agent基本就被定义成这个结构即工具、记忆、规划、Action这个模块如下图所示。imgMemory是一个记录整个推理流程、多轮对话流程的工具通过记忆能让大模型在多次交互中仍然能够不忘记任务本身以及其他关键信息。Planning是规划器他更多是用来做后续的任务规划对复杂任务他能规划具体的行动路径毕竟复杂任务可能并非一步就能完成还能在任务执行出现异常时考虑到补救措施逐步引导最终完成任务。Action是基于Planning来执行的行动器他能在Planning模块的指令下去调用必要的工具完成实际任务。Tool是工具能完成一些特定任务例如一些数值的计算、某个数据库的搜索等。后续有了更丰富的概念并且也有很多玩法我分别举几个例子。早年的Memory是多轮对话系统中的记忆模块而在Agent中已经形成一个知识库的概念里面可以是对话记忆在销售Agent内可以是商品知识库在旅游Agent内则可以是旅游笔记库在陪伴聊天Agent中可以是用户画像记录等等这不单纯是个记忆而是一个数据库、信息库的代称了。PS所以RAG并没有消失只是以新的形态出现在这里Planning和Action的概念倒是没怎么拓展。Tool的拓展就变得很广了在多Agent的平台里Tool可以是一个子Agent能嵌套如此一来就和大领导发布任务一样从上往下层层拆解各自完成最终汇总。三、Memory首先我们来讲一下Memory记忆模块。记忆模块因为从多轮对话开始所以历史比较悠久内容也会更加更丰富。这里给两篇最近的综述。From Human Memory to AI Memory: A Survey on Memory Mechanisms in the Era of LLMsMemory in the Age of AI Agents在笼统概念中会把记忆划分为短期记忆、长期记忆和RAG记忆有的论文叫Knowledge Retrieval as Memory一个意思我先按照这个来讲吧。首先是短期记忆他更关注于短期、即时的对话信息在Agent内除了多轮对话历史还有对话上下文包括大模型调度的各种指令及其返回信息、中间的推理步骤等比较典型的是ReAct这里我用大模型生成的一个例子参考这个流程。假设问题是“谁是现任法国总统”Thought: 我需要知道当前法国总统是谁可能需要查询最新信息。Action: 调用搜索引擎工具查询 “current president of France”。Observation: 搜索结果返回 “Emmanuel Macron is the current president of France (as of 2024).”Thought: 信息已确认可以回答问题。Action: 回答用户“现任法国总统是埃马纽埃尔·马克龙。”这个流程里例如走到了第四步我们其实应该记录1/2/3/4步内的所有大模型分析、请求、结果返回的所有内容这里的边思考边行动的模式就要求我们必须有一个模块去存储这一大堆内容。从实现上我们可能可以简单地存在内存里由变量一直待下去但在复杂场景信息太多我们可能就要开始考虑数据库构造一个session_id来存储这些内容了。一般情况这种短期记忆基本是用后即焚也依赖于大模型的上下文窗口推理长了很多早期的信息也会失效。第二便是长期记忆这是跨对话、跨时间的所以必须有个比较复杂的模块来记住这些复杂的东西在Agent里可以是自动生成的新工具、新技能、新经验更广泛的可以理解为整个对话、处理过程的所有内容及其二次甚至多次加工产物。举个例子对话过程中的反思经过收集整理是可以形成经验存到记忆中的再举个例子对话过程中用户透露的信息被记忆下来就可以形成用户偏好去做一些商品方面的推荐这个在一些销售类的产品中就很常见。MemoryOS聚焦多轮对话的记忆把对话内容分为3层短期记忆专注最近几轮聊的内容确保流畅性中期记忆定期把局部片段对话进行摘要后入库在后续的对话中被提及时才会召回用更炫酷的方法说就是“记忆唤醒”更长期的关注用户的偏好、观点等重要记忆点进行针对性记忆在回复风格、情绪价值等方面有更多的能力MIRIX亮点在于把记忆从多轮的视角进行了拓展让其更适配于Agent这种灵活的模式作者设计了一套由六大记忆组件构成的综合架构核心记忆构造出来的智能体的人设和用户的长期事实如用户的姓名偏好等、情景记忆捕捉带时间戳的事件与时间定位的交互反映用户的行为、经历或活动、语义记忆保存与具体时间或事件脱钩的抽象知识与事实信息充当关于世界或用户社交图谱的概念、程序记忆存放结构化、目标导向的流程如操作指南、业务工作流与可执行脚本、资源记忆保存用户正在阅读或编辑、但又不适合归入其他类别的完整或部分文档、转录文本或多模态文件与知识保险柜存储逐字敏感信息的安全仓库涵盖凭证、地址、联系方式、API 密钥。第三便是RAG记忆。在这里我的理解并非是把RAG从短期和长期的记忆中脱离出来而是记忆这个模式逐步发展形成了RAG这个模式各种记忆都需要被记录到数据库里下一步便是要有触发手段把他给查出来了查出来便是应用于是一个RAG的模式很自然地就出来了。而在后续记忆功能承载了一个新的能力——进化的储备池。在Agent运行过程中系统总能发现一些行不通的路径或者工具而又能在流程中获得反馈并完成此时这些信息能够存下来便能让整个系统得到优化这便是自我进化的流程类似MIRIX的程序记忆能记录流程这些流程就是在执行过程中得到优化的结果。因此总结下来我的理解下记忆模块的发展路径大概是这样的。记录最近对话的内容形成短期记忆。记录更长、更久远甚至围绕用户或者AI的记忆系统。长期、个性化记忆信息的更深入处理划分多种实用的记忆类型。MIRIX模式形成反馈机制通过总结、反思反哺Agent系统成为提升Agent的一部分。四、PlanningPlanning是贯穿整个Agent最重要的部分他需要对给定的query进行合理的拆解再逐步分配任务逐步完成复杂的可能还需要反思重新优化流程甚至可能要多条路径进行尝试收集多个内容然后再安排整合最终逐步把事情推向完成。Planning这个任务的综述我找到的是一篇Understanding the planning of LLM agents: A survey他的拆解就会比较细了有兴趣大家看可以去详细读一读。我后面写的更多是目前的核心思路以及工业界常见的一种方法。一般的拆解的思路主要是简单地静态链式规划、树结构多路径规划这个挺好理解就是看一条路走到黑还是分多个来走罢了。具体选哪个更多还是取决于问题本身是否需要以及目前的系统是否支持。至于伴随拆解的反馈思路则比较朴素就是基于多个反馈来源的信息来动态调整自己的思路这个反馈的来源会比较多环境反馈代码报错、人类反馈人主动提出代码有问题、模型审查模型自己查出来的问题、多智能体之间的反馈多个智能体互相批评。如此一来形成整个planning的体系规划、执行、反馈/反思、更新规划最终逐步完成任务。不过在实际应用中大家通常会发现在一些垂类的任务中大模型做Planning的效果也不尽人意。大家整体的思考路径基本都是这样的。发现大模型对一些子任务的拆解并不合理也跟下游的Action、Tools不适配要想做得更好训练几乎是必然的。planner训练的数据并不好弄人工编辑流程显然也不好做SFT这条路困难重重。RL似乎是一个不错的路径虽然我们无法或者无法大量地总结出一个好的路径是啥样的但是我们知道什么样的路径是好的路径。RL的一大重点工作就变成了构造reward比较合适路径就是llm-as-judger之前写过一篇综述文章的总结[前沿重器[65] | 大模型评判能力综述]模块让大模型给方案打分从业务层面拆解评分标注如红线、工具支持度、流程合理性等。这种方式构造起来更方便也具有很强的业务可解释性。这种构造reward的模式就非常适合GRPO之类的训练方法一拍即合对标注数据要求没那么高而是需要一个合理的reward。我的视角看目前大量的应用都是通过这套推导思路设计出了合适的训练方案并在这个思路下做了很多延伸。知乎里看到“是念”大佬的一篇对Planning的强化学习总结的文章就对RL的有关技术做了总结https://zhuanlan.zhihu.com/p/1902381952998281700。五、ActionAction很多时候会和Planning一起也有些时候会分开Planning聚焦做什么Action聚焦怎么做具体的思路便是从工具库里选择合适的工具完成实际任务。简而言之就是选择工具。但是如果数量足够多简单的模型识别分类完不成时大模型的上下文吃不下的时候就需要专门的模块来完成了有些地方叫路由早年的搜索或者对话系统会叫做意图识别在一些Agent结构不完善的系统里会把这玩意和planning放一起。说白了就是分类对一个任务A要用哪个工具来完成最好。插件系统有如下模块。插件召排。改写query输入进行搜索召回TOP K再用Rank简化列表。外部知识引入。为FCFunction Call提供外部知识提升槽位提取精度。这也算是一种RAG思想的应用了FCFunction Call。提取插件API所需槽位信息。API调用。质量控制。更笼统地说对API调用结果做后处理。六、Tools工具是整个Agent的关键执行模块。前面的记忆也好规划也罢还是选择工具都可以说是准备最终的执行还是得看Tool。Tool作为底层能力其广度和深度/可靠性直接决定了整个系统的可靠性因此他的建设很重要在项目的初期他是雏形建立的关键而在项目后期前面模块逐渐收敛的情况下Tool的拓展更新也会是一个重点。那么Tool可以是什么样的。大模型能帮你回答一个问题大模型往定制地走精心设计一个模板通过拼接prompt然后请求大模型完成一个任务也可以是一个Tool。例如一个文章摘要Tool内部可能就是一个prompt模板拼接你的输入后请求大模型拿回的结果。数据库查询甚至RAG接口。例如一个做商品销售的Agent当需要做商品推荐时需要了解用户画像此时就需要做数据库的查询查完了可能还要用大模型筛除无效信息此时说不定就是个小的RAG了甚至换个角度这就是调用Memory能力了。API接口。例如调天文台接口查天气。另一个Agent。换个角度Tool是一个功能模块那这个功能为什么不能是另一个Agent做的呢。另一个Agent可以通过API接口接入也可以通过函数内化成自己的内部代码使用都行但实际上Multi-Agent的本质就可以是这个模式的运作。七、回顾一下我的视角的Agent我提到了Agent是大模型落地的殊途同归从大家的分析推演逐步把大模型的整个应用推进到了一个共识层面即Agent的这个模式虽然这个概念并未形成完整意义的边界大家也多少能感受上面的很多东西都存在“换个说法”、“换个视角”之类的描述但是这个应用模式已然形成现在来回顾一下2025年我的视角下的一些关键性工作吧。RAG——功成身不退首先是RAG还是从我自己比较熟悉的RAG模式开始在24年的总结我是对RAG这个模式进行了总结[心法利器[125] | 24年算法思考-小模型的生存空间]这里提到了RAG已经从初步范式的建立毕竟这个模式的结构还比较简单到各个模块的定制拓展现在视角看那个时候已经一定程度有了收敛的迹象开始往定制和专长的方式发展顶多是Agentic RAG的模式基本真的就是真的收敛了到了DeepSearch那篇文章看[前沿重器[69] | 源码拆解deepSearcher动态子查询循环搜索优化RAG流程]Agent的味道真的就很浓了有collection router也有reflection。至此真的可以说RAG已经算是完成自己的阶段使命大模型的应用要跳出RAG的模式寻找新的模式。当然这里值得强调的是不是说RAG就没用了RAG会成为后续系统的一部分继续发展所以我这里用的词是“跳出”而并非抛弃。毕竟要抛弃一个技术真的很难。多轮对话——开枝散叶对话一直是我接触的领域各个历史形态以及他的变迁我都算是看在眼里了真的挺有感情[前沿重器[21-25] | 合集两万字聊对话系统]。在2025年作为大模型应用的排头兵开始开枝散叶各个模块在大模型应用都有了长足的进步他能串联系统内部多次大模型调度的协调对外作为产品成为用户交互的窗口System、User、Agent3个角色真的可以生动形象地描述这个格局。首先是Memory模块的升级和拓展大模型之前的多轮可能局限在上下文的对齐以确保连贯性和长期记忆性在大模型极具包容性的支持下简单地上下文连贯早已不成问题长期记忆也可以借助后处理和数据库的模式完成甚至有了更多的升级。如前文所言MemoryOS之类的工作开始融合更为长期的兴趣偏好而MIRIX则带来了更丰富的记忆体系甚至甚至能反思作为系统自升级的养料。其次便是个性化的大幅升级。从普通的问题解决机器人能逐步引入个性化今年给大家分享过sigir25的一篇个性化机器人[前沿重器[63] | SIGIR25-个性化实时检索增强机器人主动对话能力]也有一些有关的个性化文文章分享[前沿重器[73] | 深入技术深水区RAG与Agent如何实现精准个性化]、[心法利器[138] | 大模型如何避免“千人一面”个性化开发的破局之道]让对话系统能“更懂你”。在这基于多轮对话在下半年多了新的概念——上下文工程Andrej Karpathy也对这个概念进行过分享至此多轮对话确定成为了Agent这个系统的土壤真的要开始开枝散叶了。然而尴尬的是目前生成式的这套模式可能很难独立在一个系统中生存这个问题曾经写过一篇文章来讨论因此Agentic化可能也是大势所趋至少一些AI客服销售已经开始做类似的尝试了这套商业化的模式仍然能继续走。最近也有听到一些消息有一些AI公司可能要在大模型里面加入广告以获得盈利这将会是一个非常实用的应用场景这个也算是初步印证了这个猜测吧。自优化的闭环这应该是今年年末我自己发现的最大的惊喜那就是自优化让整个模型迭代形成闭环。早在半年前我就分享过一篇综述[前沿重器[65] | 大模型评判能力综述]详细讲解了大模型作为评估器的有关研究。众所周知一旦一个工作能形成综述意味着这个方向形成了一股合力有了足够多的铺垫了这个评价的模式一出整个自优化的过程很大程度就完成了闭环。来看一个月前我分享的美团的WOWService[前沿重器[77] | 美团WOWService上四阶段训练打造高质量可维护的对话模型]、[前沿重器[78] | 美团WowService下多智能体和评估实现闭环]美团便成功完成了这个闭环内部构造了自我检测回流迭代机制主动发现问题、分析问题、解决问题最终反馈到定时训练中完成了优化实现用户满意度提升与成本降低的双重目标。再者我自己也简单写了一个自动化标注的模式大家通过阅读应该能直观理解这个模式的运作机制[心法利器[142] | 大模型自动化标注实战代码分享]当然要想实现自动化光靠这里面的简单代码肯定不够需要结合实际进行大幅度调整最终才能真正把流程走通。我们该怎么做在[心法利器[147] | Agent是大模型落地的殊途同归]文章内我曾讲过一次我们该怎么做总结了下面3点讲的是宏观的发展方向。Agent的整套模式和方法论值得学习和应用的在新项目开发的时候直接按照这个范式走会更简单。Agent产品尤其是垂类产品目前仍需打磨未来仍有巨大空间会在26年有长足发展。以NLP为出发点带动多模态领域。然而微观层面学习和操作层面在自己的总结分析下有新的启示。大模型的有关技术已然成为基操而且是不能不会的基操后续大量的应用都需要围绕这个来进行不会真的连活都干不了很残酷。通用的是最快的但定制的才是最好的。尽管目前基于通用的大模型已经能做出很多不错的Agent框架或者应用但要想好离不开各个模块的精心设计和训练包括但不限于Planning模型、Memory模块构造、Tool的精细化定制以及合理的调度与维护。算法重新从算法模型设计转移向算法工程的配合设计在Agent模式下工程的调度将会变得复杂对于算法而言工程能力的重要性会初见增加能手撸服务或者框架的算法在某种程度上会很抢手而另一方面工程在这里也会是新的介入机会可能比infra更加吃香。如何学习大模型 AI 由于新岗位的生产效率要优于被取代岗位的生产效率所以实际上整个社会的生产效率是提升的。但是具体到个人只能说是“最先掌握AI的人将会比较晚掌握AI的人有竞争优势”。这句话放在计算机、互联网、移动互联网的开局时期都是一样的道理。我在一线科技企业深耕十二载见证过太多因技术卡位而跃迁的案例。那些率先拥抱 AI 的同事早已在效率与薪资上形成代际优势我意识到有很多经验和知识值得分享给大家也可以通过我们的能力和经验解答大家在大模型的学习中的很多困惑。我们整理出这套AI 大模型突围资料包✅ 从零到一的 AI 学习路径图✅ 大模型调优实战手册附医疗/金融等大厂真实案例✅ 百度/阿里专家闭门录播课✅ 大模型当下最新行业报告✅ 真实大厂面试真题✅ 2025 最新岗位需求图谱所有资料 ⚡️ 朋友们如果有需要《AI大模型入门进阶学习资源包》下方扫码获取~① 全套AI大模型应用开发视频教程包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点② 大模型系统化学习路线作为学习AI大模型技术的新手方向至关重要。 正确的学习路线可以为你节省时间少走弯路方向不对努力白费。这里我给大家准备了一份最科学最系统的学习成长路线图和学习规划带你从零基础入门到精通③ 大模型学习书籍文档学习AI大模型离不开书籍文档我精选了一系列大模型技术的书籍和学习文档电子版它们由领域内的顶尖专家撰写内容全面、深入、详尽为你学习大模型提供坚实的理论基础。④ AI大模型最新行业报告2025最新行业报告针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估以了解哪些行业更适合引入大模型的技术和应用以及在哪些方面可以发挥大模型的优势。⑤ 大模型项目实战配套源码学以致用在项目实战中检验和巩固你所学到的知识同时为你找工作就业和职业发展打下坚实的基础。⑥ 大模型大厂面试真题面试不仅是技术的较量更需要充分的准备。在你已经掌握了大模型技术之后就需要开始准备面试我精心整理了一份大模型面试题库涵盖当前面试中可能遇到的各种技术问题让你在面试中游刃有余。以上资料如何领取为什么大家都在学大模型最近科技巨头英特尔宣布裁员2万人传统岗位不断缩减但AI相关技术岗疯狂扩招有3-5年经验大厂薪资就能给到50K*20薪不出1年“有AI项目经验”将成为投递简历的门槛。风口之下与其像“温水煮青蛙”一样坐等被行业淘汰不如先人一步掌握AI大模型原理应用技术项目实操经验“顺风”翻盘这些资料真的有用吗这份资料由我和鲁为民博士(北京清华大学学士和美国加州理工学院博士)共同整理现任上海殷泊信息科技CEO其创立的MoPaaS云平台获Forrester全球’强劲表现者’认证服务航天科工、国家电网等1000企业以第一作者在IEEE Transactions发表论文50篇获NASA JPL火星探测系统强化学习专利等35项中美专利。本套AI大模型课程由清华大学-加州理工双料博士、吴文俊人工智能奖得主鲁为民教授领衔研发。资料内容涵盖了从入门到进阶的各类视频教程和实战项目无论你是小白还是有些技术基础的技术人员这份资料都绝对能帮助你提升薪资待遇转行大模型岗位。以上全套大模型资料如何领取

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询