做推广又能做网站百度竞价排名点击软件
2026/2/21 9:36:55 网站建设 项目流程
做推广又能做网站,百度竞价排名点击软件,搭建视频服务器,被跨境电商骗了怎么投诉如何导出Fun-ASR识别结果#xff1f;CSV/JSON格式教程 你刚用 Fun-ASR 完成了一次会议录音转写#xff0c;屏幕上整齐地列出了几十段文字——但接下来呢#xff1f; 想把结果发给同事做纪要整理#xff1f;需要导入 Excel 做关键词统计#xff1f;或者要喂给另一个 NLP 工…如何导出Fun-ASR识别结果CSV/JSON格式教程你刚用 Fun-ASR 完成了一次会议录音转写屏幕上整齐地列出了几十段文字——但接下来呢想把结果发给同事做纪要整理需要导入 Excel 做关键词统计或者要喂给另一个 NLP 工具做后续分析别急着截图、复制粘贴、手动整理。Fun-ASR WebUI 其实早已内置了原生导出能力只需一次点击就能将识别结果保存为结构清晰的 CSV 或 JSON 文件。这不是隐藏功能也不是需要改代码的“高级操作”而是批量处理模块中一个被很多人忽略的实用按钮。本文将带你从零开始完整走通「导出识别结果」的全流程——不讲原理、不堆参数只聚焦一件事怎么把识别好的文字干净、准确、带时间戳、带原始与规整双版本一次性导出成你真正能用的文件。1. 导出功能在哪先确认你的使用场景Fun-ASR 的导出能力并非处处可用它只在两个明确场景下生效批量处理完成后的结果页最常用、最推荐识别历史页面中的单条记录详情页适合补导、查漏而以下场景不支持直接导出单次语音识别即“语音识别”主面板的即时结果实时流式识别的滚动文本VAD 检测结果页这个设计很合理单次识别是临时交互而批量处理和历史记录代表的是已确认、需归档、有长期价值的数据资产。所以导出入口也只出现在这些“资产沉淀区”。提示如果你正在看单次识别结果想立刻导出请先点击右上角“保存到历史”按钮图标为 再进入“识别历史”页面操作。这是唯一合规路径。2. 批量处理导出高效、完整、开箱即用这是绝大多数用户的核心需求场景——比如你上传了 20 个客服通话 MP3系统自动识别完毕现在要交付给质检团队。下面就是标准操作流2.1 确保已完成批量处理进入 Fun-ASR WebUI → 点击顶部导航栏【批量处理】上传多个音频文件支持拖拽、多选配置好语言、ITN、热词等参数后点击【开始批量处理】等待进度条走完状态变为“ 全部完成”此时页面会显示一个清晰的结果汇总表包含每条音频的文件名、识别状态、耗时、以及“查看结果”按钮。2.2 找到导出入口就在结果表格下方不要急着点“查看结果”。先往下拉——你会看到一组功能按钮其中最醒目的就是[导出全部为 CSV] [导出全部为 JSON]这两个按钮并排居中背景色为蓝色默认主题字体加粗位置固定在结果表格正下方无需滚动查找。小技巧如果页面过长导致按钮被遮挡可按Ctrl EndWindows或Cmd ↓Mac快速跳转到底部。2.3 CSV 导出详解Excel 用户的首选格式点击【导出全部为 CSV】后浏览器会立即下载一个名为funasr_batch_export_YYYYMMDD_HHMMSS.csv的文件时间戳精确到秒。打开它你会发现结构极其友好完全适配 Excel、WPS、Numbers 等所有主流表格软件idfilenametimestamplanguageresult_textitn_textduration_secmodel_name1call_001.mp31745678901zh您好欢迎致电客服中心...您好欢迎致电客服中心……128.4Fun-ASR-Nano-25122call_002.mp31745678922zh请问您的订单号是多少请问您的订单号是多少89.1Fun-ASR-Nano-2512字段说明全是大白话idFun-ASR 内部记录编号用于追溯filename你上传时的原始文件名含扩展名timestamp识别完成时间Unix 时间戳Excel 中可用公式A1/86400DATE(1970,1,1)转为可读日期language识别所用语言代码zh 中文en 英文ja 日文result_text模型原始输出保留口语化表达如“啊”、“嗯”、“那个”itn_text启用 ITN 后的规整文本如“二零二五年三月”→“2025年3月”“一千二百三十四”→“1234”duration_sec音频总时长秒精度到小数点后一位model_name当前运行的模型名称方便后期回溯版本实用建议如果你只需要“规整后文本”做汇报直接筛选itn_text列即可若需统计各通话时长分布用duration_sec列做数据透视表timestamp字段配合 Excel 排序可轻松还原识别任务执行顺序。2.4 JSON 导出详解开发者与自动化流程的黄金格式点击【导出全部为 JSON】下载的文件名为funasr_batch_export_YYYYMMDD_HHMMSS.json。内容为标准 JSON 数组每项对应一个识别任务结构清晰、层级分明、无歧义可直接被 Python、Node.js、Shell 脚本等任何现代编程环境解析[ { id: 1, filename: call_001.mp3, timestamp: 1745678901, language: zh, result_text: 您好欢迎致电客服中心..., itn_text: 您好欢迎致电客服中心……, duration_sec: 128.4, model_name: Fun-ASR-Nano-2512 }, { id: 2, filename: call_002.mp3, timestamp: 1745678922, language: zh, result_text: 请问您的订单号是多少, itn_text: 请问您的订单号是多少, duration_sec: 89.1, model_name: Fun-ASR-Nano-2512 } ]为什么 JSON 更适合技术场景字段名与 CSV 完全一致无缝对接已有数据管道支持嵌套未来若扩展时间戳对齐、分句结果JSON 可自然升级CSV 则需重构表头无编码兼容问题CSV 常因中文乱码让新手抓狂JSON 默认 UTF-8可直接用jq命令行工具做快速过滤例如提取所有中文结果jq map(select(.language zh)) funasr_batch_export_20250425_143022.json3. 识别历史导出精准补救单条也能导有时你发现某次关键识别没进批量队列或是批量导出后想单独核对某一条——这时“识别历史”就是你的数据保险箱。3.1 进入历史页面并定位目标记录点击顶部导航栏【识别历史】页面默认展示最近 100 条按时间倒序使用右上角搜索框输入文件名关键词如weekly_meeting或识别内容片段如Q3目标快速定位找到目标记录后不要点“查看详情”按钮——那是弹窗预览。你要做的是直接点击该行最右侧的“导出”图标一个向下的箭头 悬停提示“导出此条记录”3.2 单条导出的两种格式选择点击后会弹出一个极简对话框仅含两个选项导出为 CSV生成单行 CSV含所有字段逗号分隔导出为 JSON生成单对象 JSON格式同批量导出的数组内单元素选择任一格式浏览器即刻下载对应文件。文件名含 ID 和时间戳例如funasr_history_id37_20250425_143511.csv注意单条导出不会包含“批次信息”如批次ID、总文件数因为它本质是独立记录。这正是它的优势——纯粹、无冗余、拿来即用。4. 导出文件能做什么三个真实工作流示例光会导出还不够关键是要知道这些文件如何融入你的实际工作。以下是三个高频、零门槛的落地用法4.1 用 Excel 做客服通话质检非技术人员适用下载 CSV 文件用 Excel 打开新增一列“是否解决客户问题”手动打勾/叉新增一列“关键词命中”用IF(ISNUMBER(SEARCH(退款,D2)),是,否)快速标记含“退款”的通话插入数据透视表行“客服工号”需提前在文件名中约定命名规则如zhangsan_call_001.mp3列“是否解决”值计数5 分钟生成一份可汇报的质检周报4.2 用 Python 做会议纪要自动摘要开发者适用import pandas as pd from transformers import pipeline # 读取导出的 CSV df pd.read_csv(funasr_batch_export_20250425_143022.csv) # 提取所有规整文本 texts df[itn_text].tolist() # 加载本地轻量摘要模型示例实际可换 Fun-ASR 自带小模型 summarizer pipeline(summarization, modelsshleifer/distilbart-cnn-12-6) # 批量生成摘要注意长度限制 summaries [] for text in texts: if len(text) 50: # 避免空文本 try: summary summarizer(text[:1024], max_length120, min_length30, do_sampleFalse) summaries.append(summary[0][summary_text]) except: summaries.append(摘要生成失败) else: summaries.append(文本过短无需摘要) # 写回 CSV 新增一列 df[summary] summaries df.to_csv(with_summaries.csv, indexFalse, encodingutf-8-sig)4.3 用 Obsidian 建立个人语音知识库知识工作者适用将 JSON 文件放入 Obsidian 的vault/ASR-Exports/文件夹创建一个模板ASR-Template.md--- created: {{date}} tags: [asr, meeting, {{language}}] --- ## {{filename}} **原始识别** {{result_text}} **规整文本** {{itn_text}} **元数据** - 时长{{duration_sec}} 秒 - 模型{{model_name}} - 时间{{timestamp | date: %Y-%m-%d %H:%M}}用 Dataview 插件自动索引所有 JSON 文件生成动态看板“本周识别了多少分钟”、“哪些会议提到了‘AI’”5. 常见问题与避坑指南即使流程简单实践中仍有几个高频卡点提前了解可省去 80% 的调试时间Q1导出的 CSV 在 Excel 里中文显示为乱码A这是 Windows Excel 的经典顽疾。正确打开方式① Excel → 数据 → 从文本/CSV → 浏览选择文件 → 编码选UTF-8→ 加载② 或用 WPS / Numbers / Google Sheets它们默认正确识别 UTF-8Q2导出的 JSON 文件里result_text字段有换行导致解析失败AFun-ASR 的识别结果本身不含换行符\n但若原始音频中有明显停顿模型可能输出。或后跟空格视觉上像换行。JSON 标准允许字符串内含\n只要用标准 JSON 解析器如 Pythonjson.load()就不会出错。若手动编辑过文件请勿用记事本——改用 VS Code 等支持 UTF-8 的编辑器。Q3批量导出后发现某几条的itn_text是空的A检查该条记录的“系统设置”中 ITN 是否被关闭。Fun-ASR 的 ITN 开关是按任务独立配置的。在批量处理时若未勾选“启用文本规整”则对应itn_text字段为空字符串。解决方案重新提交该文件确保勾选 ITN。Q4导出文件里没有时间戳对齐逐句起止时间A当前 Fun-ASR WebUI 的导出功能不包含分句级时间戳仅提供整段音频的duration_sec。如需精确到秒的说话人切分需调用 Fun-ASR 的底层 API 并开启output_word_timestampsTrue参数这属于进阶用法不在 WebUI 范围内。Q5导出按钮是灰色的无法点击A两个原因① 批量处理尚未完成状态不是“ 全部完成”可能是“ 部分失败”或“⏳ 处理中”② 当前处于“语音识别”或“实时流式识别”等非批量/非历史页面——请务必切换到【批量处理】结果页或【识别历史】详情页。6. 总结导出不是终点而是数据价值的起点回顾整个流程你会发现 Fun-ASR 的导出设计非常务实位置明确——只在数据已沉淀的页面提供避免误操作格式精简——CSV 为业务人员而生JSON 为工程师而设不堆砌无用字段字段实用——result_text与itn_text并存兼顾原始性与可用性命名规范——文件名自带时间戳杜绝覆盖风险零依赖——无需安装插件、无需配置环境浏览器点一下就完成。但请记住导出文件本身只是载体。真正的价值在于你用它做了什么——是生成了一份让领导眼前一亮的分析报告是训练出了更懂业务的定制化模型还是构建了一个只属于你自己的语音知识图谱Fun-ASR 给了你高质量的“原材料”而下一步的“深加工”永远由你定义。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询