2026/1/12 9:49:54
网站建设
项目流程
网站建设1選宙斯站长,wordpress 统计代码,平面设计所需要的软件,作弊的网站文章#xff1a;Task-Gated Multi-Expert Collaboration Network for Degraded Multi-Modal Image Fusion代码#xff1a;https://github.com/LeeX54946/TG-ECNet单位#xff1a;东南大学一、问题背景多模态图像融合是安防监控、应急救援等场景的核心支撑技术#xff0c;通…文章Task-Gated Multi-Expert Collaboration Network for Degraded Multi-Modal Image Fusion代码https://github.com/LeeX54946/TG-ECNet单位东南大学一、问题背景多模态图像融合是安防监控、应急救援等场景的核心支撑技术通过融合可见光与红外图像的互补信息能显著提升复杂环境下的视觉感知能力。但实际应用中成像设备易受外界干扰可见光图像常面临噪声、模糊、雾霭等混合退化红外图像因传感器特性易产生明暗交替的条纹噪声传统“先修复后融合”方案成本高、信息损耗大现有一体化模型应对复杂退化能力不足导致融合图像质量差、下游任务鲁棒性低。二、方法创新针对上述痛点研究团队提出任务门控多专家协作网络TG-ECNet以“一体化框架智能适配”思路实现退化图像的修复与融合核心创新包括三点1. 统一任务框架首次将多模态图像修复与融合任务整合到单一端到端模型中避免传统串联方案的信息断裂问题实现“一次输入、双重优化”的高效处理。2. 任务感知门控与多专家协作退化感知门控自动识别输入图像的退化类型噪声、模糊、条纹等动态选择最优专家组进行针对性修复融合感知门控通过多专家协作智能权衡不同模态的特征贡献精准聚合互补信息兼顾修复效果与融合质量。3. 两阶段训练策略第一阶段聚焦修复任务优化模型对各类退化的处理能力第二阶段专注融合任务在不干扰修复效果的前提下提升多模态特征整合精度实现双任务的平衡优化。4. 大规模基准数据集构建含3万余组数据的DeMMI-RF数据集覆盖6种退化类型高/中/低高斯噪声、雾霭、散焦模糊、条纹噪声包含无人机、驾驶等多视角场景为相关研究提供可靠基准。三、实验结果在DeMMI-RF和EMS两大数据集上TG-ECNet全面超越DRMF、Text-IF等主流模型表现亮眼1. 定量指标领先在CC相关性、PSNR峰值信噪比、MS-SSIM结构相似度等核心指标上均排名第一其中PSNR达30.58显著高于传统模型的29.5左右说明图像质量与结构完整性更优。2. 复杂场景表现突出极端噪声场景能有效降噪并保留细节而其他模型易出现模糊或噪声残留雾霭模糊混合退化平衡去雾与去模糊效果避免颜色失真红外条纹噪声精准抑制条纹同时完整保留热目标信息融合图像更清晰自然。3. 下游任务鲁棒性强将融合结果输入YOLOv5目标检测和Grounded-SAM分割模型mAP50达0.969分割准确率显著优于其他方法能精准识别目标轮廓避免误分、漏分。四、优势与局限核心优势适配性强无需提前定义退化类型自动适配多种单一及混合退化场景效率更高端到端框架减少中间环节模型参数160.86M兼顾性能与部署可行性实用性广覆盖无人机、驾驶等多视角数据适配安防、救援等实际应用场景。现存局限模型对超极端混合退化如强噪声厚雾重度模糊的处理效果仍有提升空间相比部分轻量模型推理速度虽满足实用需求但在实时性要求极高的场景如高速移动目标监控需进一步优化。五、一句话总结TG-ECNet通过任务门控与多专家协作机制构建了退化多模态图像修复与融合的一体化框架在复杂场景下实现了融合质量与下游任务鲁棒性的双重突破为安防、救援等领域的高可靠视觉感知提供了新方案。