2026/3/24 22:41:37
网站建设
项目流程
建设自己的淘宝优惠券网站,网站关键字优化合同,素材下载网站源码,医院网站建设医生需要做什么目录
引言
核心工具优势解析
蓝耘 MaaS 平台#xff1a;高性能 LLM 的可靠承载底座
TextIn 插件#xff1a;多格式文档的高效解析利器
一、工作流核心目标与成果预览
成果展示
二、前期准备#xff1a;核心工具与配置说明
配置 LLM 模型#xff1a;蓝耘 MaaS 平台 …目录引言核心工具优势解析蓝耘 MaaS 平台高性能 LLM 的可靠承载底座TextIn 插件多格式文档的高效解析利器一、工作流核心目标与成果预览成果展示二、前期准备核心工具与配置说明配置 LLM 模型蓝耘 MaaS 平台 DeepSeek-V3.2配置 TextIn 文档解析插件三、五步搭建完整工作流第一步设置输入变量支持双重上传方式第二步添加文档提取器提取原始销量数据第三步配置 LLM 模型数据格式转换第四步添加参数提取器分离 x 轴与 y 轴数据第五步配置柱状图与直接回复可视化呈现四、工作流优势与注意事项核心优势注意事项五、总结引言在数据驱动决策的时代新能源汽车行业的销量数据分析成为市场研判、竞品对比的核心需求。但传统数据分析往往面临 “文档格式繁杂、数据提取低效、可视化步骤繁琐” 的痛点 —— 图片、PDF 等多格式文档难以快速解析销量数据需手动整理格式柱状图生成需专业技能。为此我们基于 Dify 平台整合蓝耘 MaaS 平台的 DeepSeek-V3.2大模型与TextIn 文档解析插件搭建了一套 “文档上传 - 数据提取 - 格式转换 - 图表生成” 全自动化工作流无需复杂编程即可快速输出中国大陆新能源汽车品牌销量柱状图彻底解决传统数据分析的效率与门槛难题。核心工具优势解析蓝耘 MaaS 平台高性能 LLM 的可靠承载底座蓝耘 MaaS 是蓝耘的模型云服务已经把 DeepSeek-V3.2 系列等模型上了平台支持长上下文推理不同部署的最大上下文差异大部分变体可达数万 tokens 级别适合处理跨页、带表格的销量报告。平台提供 OpenAI-兼容接口和控制台化的 API Key 管理创建/停用/删除便于在 Dify 等工作流中直接接入。TextIn 插件多格式文档的高效解析利器TextInxParse负责把各种文档PDF、图片、Office 等抽成结构化数据调用时用x-ti-app-id/x-ti-secret-code做鉴权。它能识别复杂表格、跨页合并和图表要点适合作为把“脏”报告变成干净表格/JSON 的前置工具。抽取后建议做一遍数值/格式校验再交给 LLM。一、工作流核心目标与成果预览本工作流旨在通过 Dify 平台实现新能源汽车销量数据的自动化处理与可视化支持上传图片、PDF 等格式的文档含本地文件上传与在线链接两种方式经文档解析、数据提取、格式转换后自动生成标准柱状图直观呈现中国大陆新能源汽车品牌的销量对比情况。成果展示最终将输出标题为 “中国大陆新能源汽车品牌销量情况” 的柱状图涵盖比亚迪、特斯拉中国、理想汽车等主流品牌销量数据范围从 0 至 300 万 辆如比亚迪 2,863,876 辆、某品牌 2,518,181.78 辆等图表可直接用于数据汇报、行业分析等场景无需手动调整格式。二、前期准备核心工具与配置说明搭建工作流前需完成两项关键配置LLM 模型DeepSeek-V3.2与 TextIn 文档解析插件两者为数据处理的核心支撑。配置 LLM 模型蓝耘 MaaS 平台 DeepSeek-V3.2模型选择依据DeepSeek-V3.2 模型具备强大的中文处理能力、4096 字的上下文长度可精准解析 CSV 格式数据并转换为 ECharts 所需的 JSON 结构适配新能源汽车销量数据的格式转换需求如去除千位分隔符、处理缺失值。详细配置步骤1.登录 Dify 平台点击右上角头像在下拉菜单中选择 “设置”2.进入设置页面后找到 “模型供应商” 模块选中 “OpenAI-API-compatible” 并保存3.登录蓝耘 MaaS 平台进入 “API KEY 管理” 页面复制已创建的有效 API Key4.返回 Dify 模型配置页面点击 “编辑模型凭据”按以下要求填写参数凭据名称DeepSeek-V3.2自定义便于识别模型显示名称DeepSeek-V3.2API Key粘贴从蓝耘 MaaS 平台获取的 API KeyAPI endpoint URLhttps://maas-api.lanyun.net/v1蓝耘 MaaS 平台固定接口地址对话类型选择 “对话”模型上下文长度 / 最大 token 上限均设置为 4096匹配模型原生支持的长度5.填写完成后保存完成 LLM 模型接入。配置 TextIn 文档解析插件TextIn 插件支持解析图片、PDF 等多种格式的文档可从上传的文件中提取新能源汽车销量数据如 CSV 格式的品牌、销量信息为后续 LLM 处理提供原始数据。详细配置步骤1.进入 Dify 平台 “插件” 模块搜索 “TextIn”选择对应官方插件并点击 “安装”2.登录TextIn工作台需提前注册账号进入 “账号与开发者信息” 页面获取核心凭证x-ti-app-id账号专属应用 IDx-ti-secret-code账号安全密钥与 API Key 同理需保密3.返回 Dify 插件配置页面找到已安装的 TextIn 插件将获取的 x-ti-app-id 和 x-ti-secret-code 填入对应字段4.补充其他参数支持传入图片、PDF 等文件的在线链接地址或直接关联本地文件上传入口5.保存配置完成 TextIn 插件激活可通过 “测试连接” 验证插件是否正常工作。三、五步搭建完整工作流第一步设置输入变量支持双重上传方式配置目的为满足不同用户的使用场景支持 “本地文件上传” 和 “在线链接上传” 两种方式需在 “开始” 节点定义对应的输入变量。具体操作进入 Dify 工作流编辑页面选中 “开始” 节点在输入变量设置中添加两项核心参数变量 1(x) mdata File接收本地文件上传类型选择 “Array [File]”变量 2(x) mdata接收在线链接类型选择 “字符串”标记两项变量为 “必填”确保用户提交数据时无遗漏。示意图说明该步骤对应的示意图展示了 “开始” 节点的变量配置界面明确了文件和链接两种输入方式的变量名称及类型便于用户按提示上传数据。第二步添加文档提取器提取原始销量数据配置目的通过 TextIn 插件解析用户上传的文档文件或链接提取其中的新能源汽车销量数据如 CSV 格式的 “品牌”“累计销量辆” 字段转化为 LLM 可识别的文本格式。具体操作在 “开始” 节点后添加 “文档提取器” 节点选择已配置的 TextIn 插件输入变量关联将 “开始” 节点的(x) mdata File和(x) mdata变量关联至文档提取器的 “输入变量” 字段配置输出变量设置输出变量为(x) text用于存储提取后的文本格式数据如 CSV 字符串开启 “失败时重试” 功能设置重试次数为 2 次提升数据提取的稳定性。示意图说明示意图展示了文档提取器的配置界面清晰呈现了输入变量与 “开始” 节点的关联关系以及输出变量的定义确保提取后的数据能准确传递至下一节点。第三步配置 LLM 模型数据格式转换配置目的通过 DeepSeek-V3.2 模型将文档提取器输出的原始数据如 CSV 格式转换为 ECharts 柱状图所需的标准 JSON 结构明确 x 轴品牌和 y 轴销量的数据规则。具体操作1.在 “文档提取器” 节点后添加 “LLM” 节点选择已配置的 “DeepSeek-V3.2 CHAT” 模型2.输入变量关联将文档提取器的(x) text变量作为输入即文档提取器/(x) text3.编写精准提示词核心配置请将以下CSV格式的新能源汽车销量数据{{#1758518441631.text#}}转换为指定格式的JSON结构用于柱状图可视化。具体要求如下 1. 提取“品牌”字段作为横坐标xAxis.data按原顺序排列 2. 提取“累计销量辆”字段作为纵坐标数据series.data注意 - 销量数据中包含逗号分隔符如2,863,876请先去除逗号再转换为数字 - 如遇数据缺失如哪吒汽车、小米汽车使用 null 值 3. 生成如下标准ECharts配置格式 json { xAxis: { type: category, data: [品牌1, 品牌2, ...] }, yAxis: { type: value }, series: [{ data: [数值1, 数值2, ...], type: bar }]4.配置输出变量设置输出变量为(x) echardata存储转换后的 JSON 格式数据。示意图说明示意图展示了 LLM 节点的配置界面包括模型选择、输入变量关联、提示词编辑框等核心区域明确了提示词的格式和要求确保模型能精准输出 ECharts 所需数据。第四步添加参数提取器分离 x 轴与 y 轴数据配置目的将 LLM 输出的 JSON 数据拆分为 x 轴品牌名称和 y 轴销量数值两类独立数据便于柱状图节点直接调用避免数据格式混淆。具体操作并行添加两个 “参数提取器” 节点分别命名为 “参数提取器 - 圆柱数据”处理 y 轴和 “参数提取器 - X 轴数据”处理 x 轴两个节点的输入变量均关联 LLM 的(x) echardata变量分别编写提取指令圆柱数据提取器y 轴任务1提取JSON格式数据中的series.data数据值返回float类型数据多个数值之间用“;”分隔格式数值1;数值2;... 任务2若数据中存在null值自动转换为0 任务3确保输出仅包含数值和分隔符无其他多余字符。X 轴数据提取器x 轴提取JSON格式数据中的xAxis.data值返回字符串类型多个品牌名称之间用“;”分隔格式品牌1;品牌2;... 要求保留品牌名称的原始字符不得修改或简化。配置输出变量圆柱数据提取器输出(x) seriesDataX 轴数据提取器输出(x) xAxisData示意图说明示意图展示了两个参数提取器的配置界面包括提取指令编辑框、输入变量关联、输出变量定义等明确了数据提取的格式要求确保拆分后的数据可直接用于柱状图生成。第五步配置柱状图与直接回复可视化呈现配置目的将拆分后的 x 轴和 y 轴数据整合生成标准柱状图并通过 “直接回复” 功能向用户展示可视化结果。具体操作在两个参数提取器节点后添加 “柱状图” 节点输入变量关联标题填写 “中国大陆新能源汽车品牌销量情况”可自定义修改数据y 轴关联 “参数提取器 - 圆柱数据” 的(x) seriesData变量数值之间用 “;” 分隔x 轴关联 “参数提取器 - X 轴数据” 的(x) xAxisData变量品牌名称之间用 “;” 分隔开启 “直接回复” 功能设置回复格式为 “图表 文字说明”文字说明可自定义如 “以下为中国大陆新能源汽车品牌销量柱状图数据来源于您上传的文档”配置异常处理选择 “无”若前面节点已配置重试机制此处可简化处理。示意图说明示意图展示了柱状图节点的配置界面清晰呈现了标题、x 轴、y 轴数据的关联来源以及直接回复功能的开启状态确保最终能向用户输出直观的可视化图表。四、工作流优势与注意事项核心优势多格式兼容支持图片、PDF 等文档的本地上传和在线链接上传适配多种数据存储场景自动化程度高从数据提取、格式转换到图表生成全程无需手动干预大幅提升数据处理效率数据精准性强通过 LLM 提示词约束和参数提取器规则确保销量数据格式统一去除逗号、处理缺失值图表生成无误差易上手操作所有配置步骤均基于可视化界面无需编写复杂代码适合非技术人员使用。注意事项安全保密API Key、x-ti-app-id、x-ti-secret-code 等凭证具有账号完全权限需妥善保存严禁公开分享或上传至公共平台文档格式要求上传的文档需包含 “品牌” 和 “累计销量辆” 字段数据格式建议为 CSV 或表格类结构避免无规则文本导致提取失败数据范围提示销量数据若超过 4096 字符模型上下文长度建议拆分文档上传确保 LLM 能完整处理异常排查若图表生成失败可依次检查文档提取是否成功、LLM 输出的 JSON 格式是否标准、参数提取器指令是否正确或通过 “查看缓存” 功能定位问题。五、总结本工作流通过 Dify 平台整合 TextIn 文档解析插件与 DeepSeek-V3.2 LLM 模型构建了一套 “上传 - 提取 - 转换 - 可视化” 的全流程自动化方案可快速处理新能源汽车销量数据并生成专业柱状图。无论是汽车行业从业者进行市场分析还是数据分析师整理汇报材料都能通过该工作流大幅节省手动处理数据的时间提升工作效率。后续可根据需求扩展功能如支持更多数据格式Excel、Word 表格、添加数据筛选条件、生成多维度图表折线图、饼图。