电子商务网站版面布局wordpress 添加版权信息
2026/1/13 12:37:09 网站建设 项目流程
电子商务网站版面布局,wordpress 添加版权信息,北美跨境电商平台有哪些,做新媒体应该关注什么网站Datawhale干货 嘉宾#xff1a;蔡佳人、鲁浩男#xff0c;MiniMax M2.1团队上周#xff0c;MiniMax开发者社区负责人、大模型后训练工程师蔡佳人、MiniMax大模型后训练工程师鲁浩男在 Datawhale 社区带来了 MiniMax M2.1发布之后的首场官方技术分享。这是MiniMax技术团队关于…Datawhale干货嘉宾蔡佳人、鲁浩男MiniMax M2.1团队上周MiniMax开发者社区负责人、大模型后训练工程师蔡佳人、MiniMax大模型后训练工程师鲁浩男在 Datawhale 社区带来了 MiniMax M2.1发布之后的首场官方技术分享。这是MiniMax技术团队关于“大模型如何从单纯的代码生成进化到真实产品落地”的一次深度思考复盘。我们将24000字的直播原文进行了深度梳理保留了主创团队在对话中的原汁原味。视频链接1. https://www.bilibili.com/video/BV1U9BhBcESf/目前MiniMax M2.1已开源1. https://huggingface.co/MiniMaxAI/MiniMax-M2.12. https://github.com/MiniMax-AI/MiniMax-M2.1在不改变原意的情况下Datawhale 进行了如下微调和整理。一、蔡佳人我们为何要在这个时间点发布M2.1“M2才发了一个月为什么M2.1这就来了”蔡佳人其实M2发布后我们收到了很多反馈。大家会觉得M2在某些代码工具上表现不错但在另一部分工具上表现得不够好。M2.1这次升级核心逻辑是不再只讲“M2”而是基于M2架构做了一次针对“真实开发任务”的全面能力跃迁。我们这次就不讲参数架构那些重复的东西直接聊聊它强在哪里。第一是为了解决“偏科”问题。之前有用户反馈M2在原生移动端开发AppDev上是有短板的。所以M2.1显著增强了这一块特别是Web复杂交互、2D/3D渲染和模拟建模任务。现在的M2.1在编程语言上覆盖了TS/JS、Java、Golang、Rust、C、Kotlin、Swift等从底层的系统级开发到上层的应用层开发我们希望它没有短板。第二思考不仅仅要“长”更要“精”。在M2时期我们推出了Interleaved Thinking。到了M2.1一些内测小伙伴可能会发现哎Token消耗怎么变少了是不是推理变弱了其实不是。我们认为思考多不一定是好事模型如果在那里“内心纠结”了很久最后什么都没产出那是没意义的。M2.1的改进在于响应速度更快、Token消耗下降、思维链更精炼。我们希望工作流是流畅的而不是为了思考而思考。第三为什么我们要自研一个叫“VIBE”的基准这也是我们这次最想分享的思考。大家熟知的SWE-bench测软件工程或Terminal-bench测命令行当然很好但我们发现放眼全球没有一个基准能衡量“模型生成的应用是否真的满足用户需求”。用户说“给我做一个网页”模型生成了一堆代码。代码也许能跑但按钮能点吗交互逻辑对吗长得是丑还是美传统的基准只看静态代码不看运行效果。为了解决这个问题我们提出了 VIBE (Visual Interactive Benchmark)。这是一个全栈应用评估基准覆盖Web、Simulation2D/3D、Android、iOS、Backend五大场景。在这个基准里我们引入了一个新范式叫 AaaV (Agent-as-a-Verifier)。简单说就是用一个具备视觉能力的Agent去当“QA测试员”。它先把模型生成的代码在沙盒里跑起来执行层。这就是一条及格线首先模型生成的项目能不能成功编译、能不能构建、启动后会不会崩溃用户肯定不希望生成一个“死”的应用这是最基础的门槛。然后像真人一样去点击按钮、跳转页面看业务逻辑通不通交互层。这是测试的核心层——会在真实的沙盒环境里模拟真人的操作去点击按钮、去跳转页面、去输入数据。期间重点验证弹窗是否响应、流程是否走通。如果用户点不进去代码写得再好也没用。最后它还要看这个界面是不是现代化的、布局是否专业视觉层。这是 M2.1 非常在意的点。代码逻辑对了但界面丑怎么办 用户不希望生成的界面看起来很怪、设计糟糕。他们希望看到的是酷炫的、现代化的UI布局要专业视觉要连贯。 所以我们在评估中量化了“视觉美学”指标。我们不仅仅是让模型写代码更是在训练中加入了美学Reward奖励机制。如果模型生成的页面符合人类定义的高级美学标准比如配色和谐、布局专业我们会给它更好的反馈。慢慢地模型就学会了“哦原来这样做才是好看的” 。以前大家只看代码对不对现在我们要看“产品”能不能用、好不好看。这就是M2.1从“能生成”到“能落地”的核心差异。二、鲁浩男真实Show Case演示代码不只是代码鲁浩男刚才蔡老师讲了很多干货我直接带大家看实操。我们不跑分直接跑真实任务。场景一极简主义网页设计审美与规划Prompt “开发极简且前卫的网站采用高对比度的黑、白、红配色方案与非对称布局。通过将沉浸式影像与粗犷主义字体相结合最终呈现出一种冲击力极强的视觉体验。”大家看M2.1接收到这个指令后它没有上来就瞎写。它先做了一个Plan结构规划创建HTML结构包含非对称布局。样式设计设计CSS实现黑白红配色。视觉增强增加粗犷主义字体和沉浸式影像。交互实现实现响应式设计和动画。最终生成的结果不仅是一个Landing Page它的配色、布局完全符合Prompt里那种“前卫”的要求甚至还兼容了响应式设计。这就证明了模型不仅仅懂代码语法它懂“设计语言”。场景二Web复古游戏逻辑与体验这是一个基于Android技术地牢探险的复古游戏。M2.1不仅实现了卡牌选择的Roguelike逻辑最细节的是它在代码里增加了震动效果。这是我们在后训练阶段特地处理过的模型知道在一个“地牢探险”的游戏里震动反馈是提升体验的关键。这不是简单的代码补全这是对游戏体验的理解。场景三Android iOS 原生开发全栈能力Android流体模拟这个Case里模型调用了Kotlin和Jetpack Compose还调用了手机的重力传感器来驱动物理引擎。你晃动手机屏幕里的流体粒子会跟着动。iOS 3D太阳系这是我们内部同学用SwiftUI SceneKit做的展示了一个交互式的3D太阳系。这就回应了我们最开始说的M2.1在移动端原生开发上不再是短板而是强项。大家如果想体验可以在我们的MiniMax Agent或者通过API接入VSCode、Cursor等工具直接使用。现在MiniMax Coding Plan首月9.9返场限时体验。三、MiniMax M2.1主创团队精选QA实录Q1M2.1的知识库截止到什么时间蔡佳人 截止到2025年6月。Q2目前支持多模态上传图片识别吗蔡佳人 非常好的问题。M2.1本身还是一个纯文本模型。但是我们理解大家对视觉能力的迫切需求。目前的解决方案是在Agent场景下比如我们的MiniMax Coding Plan我们通过外挂 MCP (Model Context Protocol) 工具来支持。比如挂一个视觉理解的工具或者挂一个Web Search工具去搜图。至于原生模型的视觉理解能力这是我们的长期计划会在下一代模型中支持。Q3刚才演示用的PPT是M2.1生成的吗怎么做的鲁浩男对这个PPT完全是MiniMax Agent做的。其实思路很简单我把直播的大纲、主题、风格告诉Agent它先生成一版然后我进行多轮微调。蔡佳人补充一下在这个过程中我们甚至直接把 VIBE 开源框架的 Hugging Face 链接丢给了它。它自己去链接里提取了相关信息然后生成了那几页介绍VIBE的PPT。背后依靠的就是M2.1的信息提取和生成能力 。Q4M2.1的思维链Token变少了是不是深度推理能力弱化了蔡佳人这是一个误区。我们认为思考多不一定是好事。模型如果在那里“内心纠结”了很久输出了很长的思考过程但最后结果不对或者还在原地打转那这种“长Token”是无效的。M2.1的优化方向是思考要精要准。它包括前期的计划、执行、验证最后产出一个好结果。Token量减少意味着给用户省钱了响应速度变快了但这不代表能力变弱反而是效率的提升 。Q5演示里的网页设计很有审美这是怎么训练出来的蔡佳人很简单得让模型知道什么是“好看”。我们在训练和评估过程中加入了美学维度的Reward奖励。如果模型生成的页面符合人类定义的美学标准比如布局专业、配色和谐我们会给它更好的反馈。模型就像学生你告诉它“做成这样是高分”它就会努力往这个方向学。所以它现在知道当用户说“前卫”时不仅仅是改个颜色而是需要非对称布局和特定的字体。Q6对于复杂的业务系统开发如何与M2.1协作鲁浩男我们把能力分为“0到1”和“1到100”。你可以先描述需求补充技术栈让M2.1生成一个初版的框架0到1然后在此基础上通过不断的Prompt指令进行细节更新1到100。你描述得越详细它生成得越好 。蔡佳人在复杂任务中比如你想让模型不只是编程还要像数字员工一样操作办公软件你可以给它配置MCP工具比如操作聊天软件、Excel的工具。模型理解了这些工具后就能在长程任务中去编排和使用它们。Q7大型项目的依赖关系问题如何解决蔡佳人这属于我们定义的“从10到100”的能力。解决这个问题有两个关键第一模型本身的能力要够强能理解复杂上下文。我们通过SWE-bench等基准在观测模型在大型仓库代码重构上的表现。第二工具要给到位。如果是超大型项目怎么做Memory记忆管理是依靠像Kilo Code那样做Memory Bank还是依靠Claude Code那样的斜杠命令做上下文压缩这些工程侧的辅助配合模型能力才能解决大型依赖问题。Q8如果是多轮对话很长什么时候该新开一个对话蔡佳人两点建议如果你想聊的话题跟前面完全没关系了直接新开别让旧信息干扰。如果是同一个任务聊很久上下文太长了这时候需要用到具备 Memory压缩能力 的工具。比如刚才提到的Kilo Code或Claude Code它们有机制能把前面的关键信息“记住”并压缩让你可以继续在同一个Context里聊下去。Q9现在Agent框架那么多LangChain, LangGraph还建议学习吗蔡佳人我觉得可以学LangChain和LangGraph把很多概念如工作流、Graph形式定义得很清楚适合入门。但是作为进阶玩家我个人感觉它们有时候“管得太宽了”定义了太多细节导致你想做一些自定义个性化开发时会受限。大家上手后其实更建议去尝试一些更轻量、更开放的框架比如我们开源的 Mini-Agent或者直接上手写代码去探索最SOTA的模型在实际场景里怎么用更好。Q10M2.1会开源吗本地部署要求高吗蔡佳人会开源很快就会在Hugging Face上线。M2.1的总参数量是230B激活参数是10B。本地部署的话支持vLLM、SGLang等主流框架4卡或8卡都可以具体看你的并发需求。大家可以关注我们的Hugging Face主页获取最新的部署文档。编者注目前已开源开源地址1. https://huggingface.co/MiniMaxAI/MiniMax-M2.12. https://github.com/MiniMax-AI/MiniMax-M2.1Q11最后问一个MiniMax现在还招人吗蔡佳人 招特别招不仅仅是博士硕士、本科我们都欢迎。只要你能力强、对AI有热情。我们有社招、校招、实习岗位。大家想知道最先进的AI Native公司内部是怎么用Agent提效的吗欢迎加入我们来体验。一起“点赞”三连↓

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询