2026/4/15 9:28:23
网站建设
项目流程
景安网站备案查询,163企业邮箱登陆,开发工具在excel里如何找到,建站公司网站论坛点击下方卡片#xff0c;关注“CVer”公众号 AI/CV重磅干货#xff0c;第一时间送达 点击进入—【顶会/顶刊】投稿交流群 添加微信号#xff1a;CVer2233#xff0c;小助手拉你进群#xff01; 扫描下方二维码#xff0c;加入CVer学术星球#xff01;可以获得最新顶…点击下方卡片关注“CVer”公众号AI/CV重磅干货第一时间送达点击进入—【顶会/顶刊】投稿交流群添加微信号CVer2233小助手拉你进群扫描下方二维码加入CVer学术星球可以获得最新顶会/顶刊上的论文idea和CV从入门到精通资料及应用发论文/搞科研/涨薪强烈推荐转载自新智元 编辑KingHZ 好困【导读】AAAI 2026「七龙珠」华人团队强势霸榜从视觉重建到因果发现再到知识嵌入传承新一代AI基石正在新加坡闪耀。万众期待的AAAI 2026开奖了今年共有5篇论文摘下杰出论文桂冠2篇论文获得经典论文奖。其中图灵奖得主Yoshua Bengio达成AI领域首个百万被引作者成就之后凭借在2011年参与的一篇论文获经典论文奖。AAAI 2026是第40届AAAI年会本月20日至27日在新加坡博览中心举行。杰出论文奖AAAI人工智能会议杰出论文奖旨在表彰在技术贡献和论述方面树立了最高标准的优秀论文。在双盲评审过程中程序委员会成员会推荐论文以供评选主技术赛道及各特别赛道的「杰出论文奖」 Outstanding Paper Award。今年有5篇论文获得杰出论文其中华人作者参与了其中3篇论文。此外会议于2021年增设了「优秀论文」Distinguished Papers这一类别以给予特别表彰。论文ReconVLA: Reconstructive Vision-Language-Action Model as Effective Robot Perceiver作者Wenxuan Song、Ziyang Zhou、Han Zhao、Jiayi Chen、Pengxiang Ding、Haodong Yan、Yuxin Huang、Feilong Tang、Donglin Wang、Haoang Li机构香港科技大学广州、西湖大学、浙江大学、莫纳什大学论文地址https://arxiv.org/abs/2508.10333视觉-语言-动作模型的最新进展使机器人能够融合多模态理解与动作执行。然而实证分析表明当前VLA模型难以将视觉注意力分配到目标区域其视觉注意力始终处于分散状态。为引导视觉注意力正确锚定目标研究人员提出了隐式锚定范式的重建式VLA模型。该方法以模型视觉输出为条件通过扩散变换器重建图像中对应于操作目标的注视区域。这一过程促使VLA模型学习细粒度表征并精准分配视觉注意力从而有效利用任务相关的视觉信息并执行精确操作。此外他们从开源机器人数据集中构建了包含逾10万条轨迹、200万数据样本的大规模预训练数据集进一步提升了模型在视觉重建任务中的泛化能力。在仿真环境与现实场景中的大量实验验证了隐式锚定方法的优越性展现了其在精确操作与泛化能力方面的杰出性能。论文LLM2CLIP: Powerful Language Model Unlocks Richer Cross-Modality Representation作者Weiquan Huang、Aoqi Wu、Yifan Yang、Xufang Luo、Yuqing Yang、Usman Naseem、Chunyu Wang、Qi Dai、Xiyang Dai、Dongdong Chen、Chong Luo、Lili Qiu、Liang Hu机构同济大学、微软、麦考瑞大学论文地址https://arxiv.org/abs/2411.04997这篇论文主要目的是利用LLM的能力来进一步提升多模态表征学习。将LLM融入CLIP的潜在益处显而易见。然而要做到这一点很难。实验表明直接将LLM集成到CLIP中会导致性能出现灾难性的下降。他们提出了新方法LLM2CLIP利用LLM的力量来释放了CLIP潜力。通过在描述空间caption space利用对比学习对LLM进行微调fine-tuning文本能力被提取到输出嵌入中显著提高了输出层的文本区分度。接着研究人员设计了一种高效的训练流程让微调后的LLM充当CLIP视觉编码器的强力教师。得益于LLM的加入大家现在可以纳入更长、更复杂的图像描述而不再受限于原版CLIP文本编码器的上下文窗口和能力限制。实验证明该方法在跨模态任务中带来了实质性的提升。新方法直接将此前SOTA的EVA02模型在长文本和短文本检索任务上的性能提升了16.5%将一个仅在英语数据上训练的CLIP模型转变为业界领先的跨语言模型。此外当集成到像Llava 1.5这样的模型进行多模态训练时它在几乎所有基准测试中都持续优于CLIP展现了全面的性能提升。论文High-Pass Matters: Theoretical Insights and Sheaflet-Based Design for Hypergraph Neural Networks作者Ming Li、Yujie Fang、Dongrui Shen、Han Feng、Xiaosheng Zhuang、Kelin Xia、Pietro Lio在建模多元实体间高阶关系方面超图神经网络潜力巨大。然而现有方法主要侧重低通滤波普遍忽视高频信息的作用。本研究通过理论分析揭示了HGNN的频谱特性并证明结合低频与高频分量能构建更具表达力与效能的学习模型。特别值得注意的是我们的分析表明高频信号对于捕捉超图内部局部判别性结构具有关键作用。基于此发现研究人员创新性地提出层化框架超图神经网络HyperSheaflets该模型融合胞腔层论与小框架变换在保持高阶依赖关系的同时实现多尺度频谱分解。该框架显式强调高频分量与理论分析形成呼应。在基准数据集上的大量实验表明新方法优于现有技术验证了高频信息在超图学习中的重要性。论文Model Change for Description Logic Concepts作者Ana Ozaki、Jandson S Ribeiro机构奥斯陆大学、卡迪夫大学他们研究这样一个问题在以「带指向的解释」pointed interpretations所表示的模型背景下如何修改一个描述逻辑概念。我们将这一设定称为模型变更model change并区分三类主要的变更方式驱逐eviction仅通过移除元素来实现变更接纳reception将元素纳入其中修订revision在一次操作中同时包含元素的移除与纳入。他们引入了修订的形式化概念并论证修订并不能直觉上似乎可以简化为「驱逐接纳」的简单组合。研究人员还针对EL与ALC描述逻辑概念中驱逐与接纳的相容性给出了正反两方面的结果并进一步给出关于ALC概念修订相容性的结果。论文Causal Structure Learning for Dynamical Systems with Theoretical Score Analysis作者Nicholas Tagliapietra、Katharina Ensinger、Christoph Zimmer、Osman Mian机构博世人工智能中心达姆施塔特工业大学巴登-符腾堡双元制大学德国医学人工智能研究所IKIM论文地址https://arxiv.org/abs/2512.14361现实世界系统依据其内在因果关系在连续时间中演进但这类动力学常不可知。现有动力学学习方法通常需对时间离散化导致在非均匀采样数据上表现欠佳或忽略底层因果关系。研究人员提出CADYT一种解决这些挑战的动态系统因果发现新方法。与当前采用离散时间动态贝叶斯网络建模的先进因果发现方法不同CADYT框架基于差分因果模型能以更温和的假设建模系统的连续性。CADYT利用精确的高斯过程推理来模拟连续时间动力学从而更贴合底层动态过程。他们提出一种实用实现方案通过算法马尔可夫条件和最小描述长度原则指导的贪心搜索来识别因果结构。实验表明CADYT在均匀与非均匀采样数据上均优于当前最优方法所发现的因果网络更接近真实的底层动力学。经典论文奖AAAI经典论文奖旨在表彰从特定年份的会议中选出的一篇或多篇最具影响力的论文。2026年的奖项将颁发给第二十五届人工智能会议上最具影响力的论文。论文的评选标准主要基于其影响力例如开创了一个新的研究子领域催生了重要的应用回答了一个长期悬而未决的问题或厘清了此前晦涩不明的概念取得了在该子领域历史上具有里程碑意义的重大进展被人工智能内部或外部的其他领域所重视并广泛采用被大量引用今年有两篇入选论文Learning Structured Embeddings of Knowledge Bases作者Antoine Bordes、Jason Weston、Ronan Collobert、Yoshua Bengio机构CNRS、谷歌、IDIAP、蒙特利尔大学论文地址https://ojs.aaai.org/index.php/AAAI/article/view/7917这篇2011年的论文通过将符号事实表示为连续向量戏剧性地改变了AI系统使用知识的方式首次使结构化知识能够被神经网络所访问。这一突破在后续模型的推动下得到完善确立了通往现代大语言模型LLM的直系脉络。作者Antoine Bordes将发表「AAAI-26经典论文奖」主题演讲展示该论文的核心概念如今如何成为当代AI的基石尤其是为检索增强生成RAG提供了动力——因为该技术将LLM与外部知识库连接起来将其建立在事实数据之上使得该论文的最初愿景对于构建当今准确、可靠的AI系统变得至关重要。Antoine Bordes博士是Helsing的首席科学此前为FAIR的联合管理总监。论文Understanding Natural Language Commands for Robotic Navigation and Mobile Manipulation作者Stefanie Tellex、Thomas Kollar、Steven Dickerson、Matthew Walter、Ashis Banerjee、Seth Teller、Nicholas Roy机构MIT论文地址https://ojs.aaai.org/index.php/AAAI/article/view/7979这篇论文与2011年第25届AAAI会议上作者当时的工作单位均为MIT。本文提出了一种新型模型用于理解半结构化环境中自主导航与移动操纵系统所接收自然语言指令。传统方法采用固定结构模型依据环境与指令推断动作序列的可能性。与之相对他们提出的「广义接地图框架」Generalized Grounding Graphs能根据自然语言指令的层次化组合语义结构动态实例化特定指令的概率图模型。该系统通过模型推理成功生成并执行与自然语言指令相对应的规划例如「将轮胎托盘放到卡车上」。该模型采用众包收集的指令语料库进行训练通过将每条指令与机器人动作配对来学习模型参数。通过从自然语言指令推断规划、在仿真环境中执行规划、并邀请用户评估系统表现等方式研究人员验证了机器人性能。实验表明该系统能成功执行语料库中多数自然语言指令。参考资料https://aaai.org/conference/aaai/aaai-26/award-talks/https://aaai.org/about-aaai/aaai-awards/aaai-conference-paper-awards-and-recognition/https://jandsonribeiro.github.io/home/https://sites.google.com/view/dravcaphttps://personal.cityu.edu.hk/xzhuang7/pubs/2026-LFSFZXL-AAAI-Sheaflets.pdf本文系学术转载如有侵权请联系CVer小助手删文何恺明在MIT授课的课件PPT下载在CVer公众号后台回复何恺明即可下载本课程的所有566页课件PPT赶紧学起来ICCV 2025 论文和代码下载在CVer公众号后台回复ICCV2025即可下载ICCV 2025论文和代码开源的论文合CVPR 2025 论文和代码下载在CVer公众号后台回复CVPR2025即可下载CVPR 2025论文和代码开源的论文合集CV垂直方向和论文投稿交流群成立扫描下方二维码或者添加微信号CVer2233即可添加CVer小助手微信便可申请加入CVer-垂直方向和论文投稿微信交流群。另外其他垂直方向已涵盖目标检测、图像分割、目标跟踪、人脸检测识别、OCR、姿态估计、超分辨率、SLAM、医疗影像、Re-ID、GAN、NAS、深度估计、自动驾驶、强化学习、车道线检测、模型剪枝压缩、去噪、去雾、去雨、风格迁移、遥感图像、行为识别、视频理解、图像融合、图像检索、论文投稿交流、PyTorch、TensorFlow和Transformer、NeRF、3DGS、Mamba等。 一定要备注研究方向地点学校/公司昵称如Mamba、多模态学习或者论文投稿上海上交卡卡根据格式备注可更快被通过且邀请进群▲扫码或加微信号: CVer2233进交流群 CVer计算机视觉知识星球人数破万如果你想要了解最新最快最好的CV/DL/AI论文、实战项目、行业前沿、从入门到精通学习教程等资料一定要扫描下方二维码加入CVer知识星球最强助力你的科研和工作 ▲扫码加入星球学习▲点击上方卡片关注CVer公众号 整理不易请点赞和在看