2026/4/6 11:33:44
网站建设
项目流程
福州网站制作公司名字,优化网站性能监测,如何给网站2做推广,新开元电销系统大家好#xff0c;我是独孤风。我们继续AI工程化之旅#xff0c;在《Ollama入门宝典》中#xff0c;我们解决了怎么在本地跑大模型的问题。但问题又来了#xff1a;模型跑起来了#xff0c;怎么让它变成一个真正的企业级AI产品#xff1f;这时候…大家好我是独孤风。我们继续AI工程化之旅在《Ollama入门宝典》中我们解决了怎么在本地跑大模型的问题。但问题又来了模型跑起来了怎么让它变成一个真正的企业级AI产品这时候你需要一个强大的AI应用平台。在开源生态中有Dify、MaxKB等多个选择。今天我要介绍一个特别为企业设计的开源平台——MaxKB。在这篇文章中大家可以对MaxKB有一个初步的认识也可以与Dify做一个对比选一个更适合企业的AI应用平台。它凭什么脱颖而出GitHub 2万 Star为什么这么多人选它如果你是数据工程师、想快速落地AI、不想被云服务绑定、需要完整的知识库管理能力——MaxKB就是为你设计的。本文会按照是什么 → 为什么 → 怎么装 → 怎么用的路线这是一篇实战宝典不讲虚的。 我会手把手带你从零开始用MaxKB搭建一个数据治理知识库AI助手。本文约4000字建议收藏点赞后阅读文章结构如下本文档版权归大数据流动所有作者独孤风。文末联系作者加入AI工程化学习社群一、MaxKB是什么MaxKB是一个开源企业级AI知识库平台。它的英文名叫Max Knowledge Brain——字面意思就是最大知识大脑。核心作用是帮助企业快速构建私有化的知识库、RAG问答系统、以及AI应用。从企业应用的角度MaxKB提供了三个层级的能力【第一层基础——知识库RAG问答】你上传公司文档 → MaxKB自动分段、向量化、建索引用户提问 → MaxKB从知识库检索、生成答案这是最核心的能力也是最常用的。【第二层中级——工作流编排】可以编排复杂的流程比如用户问一个问题 → 自动查数据库 → 生成报告 → 发邮件【第三层高级——智能体Agent】Agent会自主决策。MaxKB有什么特别之处✅ 开箱即用不用懂代码5分钟搭建企业级AI助手✅ 企业级RAG专为知识库问答设计召回效果业界领先✅ 模型中立支持Ollama、DeepSeek、Qwen等所有主流模型✅ 渐进式升级从基础RAG → 工作流 → Agent与企业共同成长✅ 零编码集成直接嵌入钉钉、飞书、企业网站无需改代码✅ 开源透明2万 Star完全私有化部署数据100%自主可控MaxKB秉承的设计理念是开箱即用伴随成长。这句话的意思是第一阶段小团队快速搭建一个知识库AI几分钟就能上线第二阶段业务成长需要更复杂的工作流和AgentMaxKB也支持第三阶段企业级规模需要多租户、权限管理、审计日志MaxKB也能满足从初创到大企业MaxKB都能陪你走。目前MaxKB在GitHub上已经有2万Star。这不是偶然。我认为有三个原因极低的使用门槛不用懂代码UI就能配置。这对非技术背景的产品、运营人员很友好。企业级的完整性知识库管理、文档版本控制、权限管理、API开放——该有的都有。真正的私有化开源代码支持完全本地部署。对于金融、医疗、政府这样的敏感行业数据不出域是刚需。二、为什么是MaxKB你在网上搜LLM应用框架会看到LangChain、LlamaIndex这些名字。但它们有个致命的问题开发难度大。你如果用LangChain从零搭建一个知识库RAG系统需要写Python代码来处理文档手工调用embedding模型配置向量数据库Milvus/Weaviate/Pinecone编写提示词管理逻辑开发Web界面或用Streamlit部署和维护整套系统这一套流程下来少说也要2-4周还要Python前端两个角色。MaxKB的核心价值把AI工程化的所有痛点都打包解决了。它就像LLM应用界的WordPress——不用代码也能快速搭建一个企业级的AI产品。Dify也是很好的开源平台但定位不同我的建议如果你是企业需要快速搭建知识库 → MaxKB如果你是团队需要复杂的AI工作流 → Dify如果你想两个都学 → 没问题持续关注大数据流动我们都会一至保持研究三、MaxKB快速安装5分钟启动在安装MaxKB之前确认你有Docker已安装并正常运行docker --version # 输出类似Docker version 24.x.x 就说明OK网络能访问Docker Hub拉取镜像用硬件建议至少4GB内存、10GB硬盘空间打开终端执行docker run -d --namemaxkb --restartalways -p 8080:8080 -v ~/.maxkb:/opt/maxkb 1panel/maxkb参数详解等待30-60秒然后执行docker ps | grep maxkb如果能看到类似的输出说明MaxKB已成功启动CONTAINER ID IMAGE STATUS PORTS abc123def456 1panel/maxkb Up 2 minutes 0.0.0.0:8080-8080/tcp离线安装如果网络有问题的话更建议使用离线安装。以 root 用户通过 ssh 协议登录到部署服务器, 对安装包进行解压tar -zxvf maxkb-v2.0.0-x86_64-offline-installer.tar.gzMaxKB 安装目录、服务运行端口、数据库配置等信息可在安装包解压后中的 install.conf 文件进行配置。# 基础配置 ## 安装目录 MAXKB_BASE/opt ## 服务端口 MAXKB_PORT8080 ## docker 网段设置 MAXKB_DOCKER_SUBNET172.31.250.192/26 # 数据库配置 ## 是否使用外部数据库 MAXKB_EXTERNAL_PGSQLfalse ## 数据库地址 MAXKB_PGSQL_HOSTpgsql ## 数据库端口 MAXKB_PGSQL_PORT5432 ## 数据库库名 MAXKB_PGSQL_DBmaxkb ## 数据库用户名 MAXKB_PGSQL_USERroot ## 数据库密码 MAXKB_PGSQL_PASSWORDPassword123postgres # Redis配置 ## 是否使用外部Redis MAXKB_EXTERNAL_REDISfalse ## Redis地址 REDIS_HOSTredis ## Redis端口 REDIS_PORT6379 ## Redis数据库 REDIS_DB0 ## Redis密码 REDIS_PASSWORDPassword123redis # 镜像配置 ## 镜像仓库 MAXKB_IMAGE_REPOSITORYregistry.fit2cloud.com/maxkb ## 镜像名称 MAXKB_IMAGEmaxkb ## 版本号 MAXKB_VERSIONv2.0.0注意首次安装之前可以在 install.conf文件中的修改参数安装时则根据修改后的参数执行安装。安装后如需再次修改配置参数则需要在 ${MAXKB_BASE}/maxkb/.env默认是 /opt/maxkb/.env文件中进行修改并且在修改完后需执行 mkctl reload 命令重新加载配置文件。MAXKB_PGSQL_PORT、REDIS_PORT 仅针对使用外部数据库时有效如果是使用内置的数据库请不要做修改。# 进入安装包解压缩后目录 cd maxkb-v2.0.0-x86_64-offline-installer # 执行安装命令 bash install.sh待所有容器状态显示为healthy后即可通过浏览器访问地址 http://目标服务器 IP 地址:8080并使用默认的管理员用户和密码登录 MaxKB。用户名admin 默认密码MaxKB123..四、快速搭建知识库10分钟实战现在开始干活。我们的目标是搭建一个数据治理知识库AI助手用真实的文档来做RAG问答。进入 MaxKB 主界面后可以看到界面上方导航栏包含智能体、知识库、工具、模型四大模块。模型支持对接本地、国内、国外主流大模型涵盖文本生成、语音识别、视觉识别等多种类型满足多场景需求。工具提供内置及自定义函数用于数据获取、逻辑判断、信息提取等操作创建后的工具可在智能体编排中调用。知识库创建和管理知识库包括上传离线文档、Web 站点、飞书文档等为问答对话提供知识来源对知识进行统一管理并助力智能问答。智能体提供预配置模板和组件可快速创建基础问答智能体或对复杂业务流程进行高级智能体编排打造专属 AI 助手。添加模型登录 MaxKB 系统后 打开【模型】页面在供应商列表中选择【阿里云百炼】然后点击【添加模型】进入模型配置表单配置参数如下模型名称MaxKB 中自定义的模型名称。模型类型大语言模型。基础模型下拉选项是常用的一些大语言模型名称支持自定义输入。API Key去模型服务 API Key管理中创建和查看。我们这里添加一下DeepSeek的模型。创建知识库打开【知识库】页面点击【创建知识库】输入知识库名称、知识库描述、选择向量模型并设置知识库类型为通用型然后将离线文档通过拖拽方式或选择文件上传方式进行上传。上传文档要求文本文件Markdown、TXT、PDF、DOCX、HTML、XLS、XLSX、CSV、ZIP表格格式Excel、CSVQA 问答对Excel、CSV默认每次最多上传 50 个文件每个文件不超过 100 MB可配置上传文件数量最多为 1000单个文档最大 1000 MB支持选择文件夹上传文件夹下符合格式要求的文件。文档规范建议规范分段标识离线文档的分段标识要有一定规范否则拆分出来的段落不规整。段落要完整一个分段中最好能描述一个完整的内容。MaxKB 支持智能分段和高级分段两种分段方式。智能分段按照 Markdown 格式进行逐级下钻式分段最多支持 6 级标题每段最大字符数为 4096 个高级分段支持自定义设置分段标识符、分段长度及自动清洗。分段标识还支持使用正则表达式处理复杂结构文档。导入时添加分段标题为关联问题勾选后会把所有分段的标题设置为分段的关联问题。点击【创建并导入】后系统后台会对文档进行自动分段 、存储、向量化处理操作执行完成后在知识库文档列表中各个文件状态显示为【成功】。这样一个基本的知识库就搭建完成可以在这里继续做一些测试反复调整分段等设置直到满足你的要求。创建AI助手点击上方的智能体按钮点击【创建】选择智能体类型输入智能体名称后点击【创建】。简易智能体提供基础的功能和设置选项可满足大多数基本的问答需求适用于需要快速上线智能体应用。高级智能体通过基础组件、工具以及智能体嵌套进行功能和逻辑的编排设计工作流程满足各类复杂业务场景的需求。智能体创建完成进入配置智能体的设置页面左侧为智能体信息右侧为调试预览界面。名称用户提问时对话框的标题和名字。比如数据治理AI助手。描述对智能体场景及用途的描述。AI 模型在【系统设置】-【模型管理】中添加的大语言模型。我们添加刚刚的DeepSeek。系统提示词大语言模型回答的角色或身份设定。用户提示词引导模型生成特定输出的详细描述。提示词可以引用前置节点的参数输出如可以引用前置知识库检索的检索结果和开始节点的问题变量。历史聊天记录大模型提交当前会话中最后 N 条对话内容如果为 0则仅向大模型提交当前问题。知识库关联刚刚的知识库用户提示词引导模型生成特定输出的详细描述。提示词可以引用前置节点的参数输出如可以引用前置知识库检索的检索结果和开始节点的问题变量。关联知识库用户提问后将在关联的知识库中检索分段。后面还有一些其他的设置。技能支持调用MCP、工具、智能体。开场白用户打开对话时系统弹出的问候语。支持 Markdown 格式[-]后的内容为快捷问题一行一个。输出思考对大语言模型的思考过程是否输出进行配置。语音输入开启后将支持语音方式进行提问需要语音识别模型支持。语音播放开启后可以通过语音进行播放回答可以通过浏览器播放也可以通选择语音合成模型。智能体信息设置完成后可以在右侧调试预览中进行测试验证调试预览中的提问内容不计入对话日志。回到智能体管理页面可以看到一些更详细的设置。保存设置并发布后在智能体列表页面的概览页面点击【去对话】或在浏览器中复制公开访问链接进入问答页面进行提问。总结MaxKB入门完成了我们掌握了如下内容。是什么 - MaxKB的定义、核心作用、三层级能力、五大特点为什么选它 - 与LangChain和Dify的对比、2万 Star的原因怎么装 - Docker快速启动、离线安装、系统要求怎么用 - 添加模型、创建知识库、创建AI助手、功能配置但是MaxKB还有更多的功能值得我们去研究而我们的AI工程化之路也才刚刚开始。一起折腾AI工程化如果你已经在用 DifyMaxKBlangchain等工具活框架做知识库、RAG 等Agent 应用或者正准备学习AI工程化相关知识肯定还会遇到一堆非常具体的工程问题。我这边在搭一个「AI工程化学习群」主要会做三件事一起建立全网最全面的AI工程化知识库。交流AI工程化的使用与运维经验。拆解多模态知识库、RAG 工作流在真实业务里的架构设计。不定期更新我在实际工作中沉淀的工作流模板和记录避免大家踩坑。过去我做了10年的数据工程化。未来我准备再做10年的AI工程化想进群的同学可以在公众号「大数据流动」后台回复【AI】两个字自动获取进群方式。也欢迎在评论区简单介绍一下你现在用AI工程化做什么场景我会优先拉一些典型案例进群一起对着实际业务做优化。我是独孤风我们下期见。 戳左下角「阅读原文」访问我们的开源仓库点个小星星吧 ⭐️