2026/3/24 12:26:00
网站建设
项目流程
做笔记的网站,张家港网站建设模板,小程序api的使用,网站建设 甲方欠款 如何处理今天是 2025 年 12 月 31 日#xff0c;又到了一年一度回顾与思考的时刻。回望 2025 年#xff0c;人工智能正在以前所未有的速度重塑人类社会结构#xff0c;而具身智能#xff08;Embodied Intelligence#xff09;正逐渐成为这一轮技术浪潮中的核心焦点。所谓具身智能又到了一年一度回顾与思考的时刻。回望 2025 年人工智能正在以前所未有的速度重塑人类社会结构而具身智能Embodied Intelligence正逐渐成为这一轮技术浪潮中的核心焦点。所谓具身智能是指赋予机器人感知世界、理解世界并主动改变世界的能力。与大语言模型不同后者主要依赖抽象的符号语料其训练数据可以通过互联网、书籍和数字媒体大规模获取具身智能的训练则必须依托真实的物理世界交互。机器人在与环境互动过程中会产生复杂的静力学、动力学、热力学乃至电磁学反馈信息这些多物理场信号构成了具身智能学习的基础。传统的数据获取方式主要包括视频采集、三维扫描、动作捕捉以及人工实操示教等。然而这类方法普遍面临成本高昂、物理场信息缺失、数据规模有限等问题远远无法满足具身智能对大规模、高质量训练数据的需求。因此具身智能发展的核心瓶颈集中体现在如何低成本地获取海量、真实且物理信息完备的训练数据——即业界普遍所称的“数据荒”问题。针对这一挑战工业界与学术界正在从多个方向积极探索解决路径。一方面人们持续研发新型传感器与数据采集系统例如可穿戴式动作捕捉设备、光学或电容式触觉传感器、多视角多模态视频系统以及动态三维扫描装置等其核心目标在于提升采集精度与效率的同时显著降低成本。另一方面研究者也在尝试通过人工合成数据来补充真实数据的不足。其中一类方法是借助生成式 AI 模型合成以第一视角egocentric为主的训练数据例如短视频或机器人运动轨迹的时间序列表示包括每一时刻的身体姿态、关节角度、速度、加速度以及各类传感器力学反馈等。该方向的关键挑战在于如何确保生成数据符合真实物理分布避免“幻觉”问题。另一类重要方法是依托工业级高精度仿真系统通过数值计算精确模拟机器人及环境中的多物理场过程即所谓的Sim-to-Real路径。在上述所有方向中微分几何与计算几何方法都发挥着不可替代的基础性作用。无论是物理场建模、几何约束表达、连续—离散系统的统一还是仿真与现实之间的映射几何理论都为具身智能提供了坚实的数学支撑也为突破“数据荒”瓶颈指明了关键路径。2025年笔者团队和学术界与工业界的多个团队进行了并肩合作沿着这些方向进行了深度探索。微分同胚群与3D扫描图1. 基于相位平移的3维扫描方法高翔、王鑫穆、赵洲。传统的三维扫描技术主要基于几何光学如双目立体视觉和波动光学如相位平移两大类方法。在几何重建精度方面基于波动光学的技术通常具有更高的测量精度。图1展示了经典的相位平移法通过将激光干涉条纹投射到人脸曲面上获取左帧图像进而求解相对相位得到中帧结果并在曲面连续性假设下恢复绝对相位如右帧所示。该绝对相位编码了从光源到物体表面的几何距离信息从而可重建带有真实纹理颜色的三维点云如图2所示。与其他传统三维重建方法相比该方法在空间分辨率与深度精度方面均达到领先水平同时其高速采集能力使其能够支持实时、动态三维扫描满足高精度与高帧率并存的应用需求。图2. 由图1左帧得到的带有纹理的3D点云从不同视角得到的投影图像。几乎所有基于相位的三维扫描方法都不可避免地涉及由相对相位恢复绝对相位的问题即所谓的相位展开phase unwrapping。从本质上看该问题可归结为一个离散的全局优化问题其核心挑战在于如何避免陷入局部最优解从而获得全局一致的相位结果。围绕这一难题学术界已提出了上百种算法。传统的质量引导路径法通常从某一像素出发逐步向邻域传播相位但该类方法对传播路径高度敏感一旦中途某个像素发生错误误差便会沿路径持续累积并扩散。另一类基于马尔可夫随机场的优化方法尽管在形式上更为全局但在实际求解过程中同样容易陷入局部极小值。因此相位展开问题至今仍是基于相位三维扫描领域中的核心难题之一也是制约高精度、高鲁棒性几何重建的关键瓶颈。图3. 应用微分同胚群求取最优相位展开高翔、王鑫穆、赵洲。我们团队基于微分几何的视角提出了一种新颖且鲁棒的相位展开方法。微分同胚描述了光滑曲面之间的可逆光滑映射而定义在曲面上的绝对相位函数在微分同胚群的作用下保持不变。如图 3所示利用这一相位的内在几何对称性我们首先对采集到的原始图像施加一组微分同胚变换随后在变换后的图像域上采用传统算法求解相位展开最后将得到的绝对相位结果通过逆微分同胚变换映射回原始坐标系并通过投票机制与加权平均进行融合得到最终一致的绝对相位估计。实验结果表明该方法显著提升了相位展开的整体鲁棒性有效规避了传统算法中常见的局部最优陷阱。在具身智能应用场景中机器人需要实时、精确地感知操作对象的绝对几何信息。传统双目视觉方法在面对弱纹理或强反光物体如金属工具、玻璃制品时往往性能退化甚至失效。相比之下基于波动光学的相位平移扫描技术能够在亚毫米级精度下稳定重建复杂物体的表面几何与曲率分布。通过对曲面曲率的实时计算机器人视觉系统可以进一步自动分割出最适合手指接触的“抓取流形”区域从而实现从视觉几何感知到物理交互执行的关键跨越为高精度操作与灵巧抓取提供可靠支撑。蒙日-安培方程正则性与AI幻觉在生成式AI中Generative AI某类数据集合被抽象嵌入在高维背景空间中的低维数据流形上的概率分布。训练的目的有两个一个是得到编码解码映射它们实现数据流形到隐空间的同胚映射即学习流形的拓扑结构另一个是得到传输映射将数据分布映射到高斯分布这个传输映射如果极大化概率分布的熵那么它就是热力学中的扩散过程所得模型就是扩散模型如果这个传输映射极小化传输代价那么它就是最优传输映射。根据Kolmogrov-Arnold定理深度神经网格可以逼近任何连续映射因此编解码映射与传输映射最后都由深度神经网络来表示。生成模型的推理过程就是在数据流形的分布上采样具体而言就是先从高斯分布中采样再通过传输映射的逆映射将高斯采样点映射回隐空间然后通过解码映射回射到数据流形上得到一个数据采样。在生成式人工智能Generative AI中数据通常被建模为嵌入于高维环境空间中的低维数据流形上的概率分布。模型训练的核心目标可概括为两个方面。其一是学习一对编码—解码映射实现数据流形与隐空间之间的近似同胚映射从而捕捉数据流形的内在几何与拓扑结构其二是学习一个传输映射将数据分布逐步变换为标准高斯分布。若该传输过程以最大化分布熵为目标则对应于热力学意义下的扩散过程由此得到扩散模型Diffusion Models若以最小化传输代价为准则则该映射对应于最优传输Optimal Transport框架。依据Kolmogorov–Arnold 表示定理深度神经网络可以逼近任意连续映射因此上述编码—解码映射与传输映射在实践中均由深度神经网络参数化表示。在推理阶段生成模型的本质是在数据流形诱导的概率分布上进行采样具体而言首先从高斯分布中采样得到随机变量然后通过传输映射的逆过程将其映射回隐空间最终经由解码映射回射至数据流形从而生成一个新的数据样本。图4. 带纹理的3D人脸模型的几何图像表示。我们与浙江大学章敏教授团队合作开发了一种三维人脸生成模型。如图 4所示首先将带纹理的人脸曲面左通过共形映射展开至平面区域并进一步复合最优传输映射将曲面的几何信息统一表示为三幅二维图像几何图像第二帧、法向贴图第三帧以及纹理图像右。通过这一表示方式一张三维人脸曲面被等价编码为三幅二维图像共同构成一个训练样本。图5. 生成的带纹理的3D人脸模型刘缘朋。基于该表示我们能够高效构建大规模训练数据集并生成丰富多样的三维人脸曲面如图 5所示。进一步地通过在三维人脸生成模型的隐空间与大语言模型的语义空间之间建立映射关系实现了文本到三维模型Text-to-3D的生成。如图 6所示该模型可根据用户的自然语言提示自动生成具有不同表情、性别与年龄特征的三维人脸模型。图6. 生成的不同性别、年龄与表情的3D人脸章敏。生成模型最关键的性能指标在于其生成样本的概率分布是否与训练数据的真实分布一致。在图像与视频生成任务中落在真实分布支撑之外的样本通常被称为“幻觉hallucination”。从理论上看这一现象可以借助蒙日–安培方程Monge–Ampère equation的正则性理论加以解释。在生成模型中数据分布通常需要通过某种传输映射变换为高斯分布。尽管满足该条件的传输映射在形式上有无穷多个但根据最优传输理论这些映射彼此之间仅相差一个关于保勒贝格测度的微分同胚。因此研究最优传输映射的正则性即可刻画一般传输映射的行为。根据 Brenier 定理最优传输映射可表示为某个凸函数的梯度映射该凸函数称为Brenier 势能函数。该势能函数由蒙日–安培方程刻画并满足自然的边界条件。图7. 源与目标区域以及最优传输映射的奇异集合。以图 7为例源分布的支撑集为单位圆盘目标分布的支撑集为非凸的海马形区域对应的 Brenier 势能函数满足的 Monge–Ampère 方程为其边界条件要求梯度映射将源区域的支撑集完全映射至目标区域的支撑集。如图 8所示我们采用几何变分方法求解该方程的弱解Alexandrov 解。此时Brenier 势能函数的图像表现为一个凸多面体曲面其在源区域上的投影诱导出一个胞腔分解每个胞腔被映射到目标区域中的一个顶点且胞腔面积等于对应顶点的权重。在所有可能的胞腔分解中该分解方式使总传输代价达到最小。需要注意的是Brenier 势能函数在图中红色曲线处不可微其梯度发生跳变。该红色曲线在源区域中的投影构成了最优传输映射的奇异集合在该集合上最优传输映射是不连续的。进一步地可将梯度映射推广为次梯度映射subgradient mapping即将源区域中的一点映射为所有支撑该点的切平面的梯度集合。在此意义下次梯度映射将奇异集合映射到目标分布支撑之外的区域。此外最优传输映射的逆映射仍然是最优传输映射次梯度映射的逆亦保持次梯度结构。因此逆最优传输映射会将目标分布支撑之外的区域映射回源分布中的奇异集合。该性质为判断生成样本是否偏离真实数据分布、即是否属于“幻觉样本”提供了一个严格的几何与测度理论判据。图8. Brenier势能函数在红色曲线处不可微。我们与Cadence 的顾鑫、吕传林团队以及大连理工大学罗钟铉、雷娜教授团队开展合作尝试将蒙日–安培方程的正则性理论引入生成模型以系统性地解决生成式 AI 中的“幻觉hallucination”问题。如前所述从理论上可以看出一般生成模型中隐含的传输映射并非整体连续映射。然而Kolmogorov–Arnold 表示定理仅能保证深度神经网络对连续映射的逼近能力对于存在不连续性或奇异结构的映射神经网络无法实现精确表达。因此基于扩散或类似机制的生成模型在学习真实数据分布时不可避免地会产生偏离真实分布支撑的样本从而导致幻觉现象。进一步地若通过最优传输理论显式计算传输映射并获得对应的Brenier 势能函数的几何表示则可以精确刻画最优传输映射的奇异集合。在此基础上对于任意给定的生成样本我们可以通过逆最优传输映射判断其原像是否落在该奇异集合上若原像位于奇异集合之中则该样本不属于真实数据分布的支撑集可严格判定为幻觉样本。通过这一基于几何与测度理论的方法可以从原理上保证生成数据与真实分布的一致性从而有效抑制乃至杜绝幻觉现象。如图 9所示我们利用几何最优传输方法学习自然生物图像的分布结构识别不同物种分布之间的奇异集合并在奇异集合附近进行采样以验证幻觉产生的几何机制。图中上排为真实自然界图像而下排为落在奇异集合邻域内的生成样本从左到右分别展示了介于猫与狗、豹与狗、狮子与狗之间的“幻觉生物”图像。这些结果直观地揭示了生成模型幻觉现象的几何根源也验证了所提出方法在幻觉判定与抑制方面的有效性。图 9. 用几何最优传输方法来验证幻觉产生的机制 汪展鹏。具身智能面临的核心瓶颈在于高质量物理交互数据的稀缺性。传统生成模型由于缺乏对物理约束的内在表达能力难以生成严格遵循物理定律的新样本。基于最优传输理论我们在数据流形的隐空间中沿测地线方向进行插值与外推从而能够系统性地生成覆盖不同物理参数如摩擦系数、物体质量、接触刚度等的多样化训练数据。更为关键的是通过精确计算蒙日–安培方程的奇异集合我们能够在隐空间中明确刻画“物理可行性”与“物理不可行性”之间的几何边界。这一边界不仅为生成过程提供了严格约束也使我们能够有针对性地在边界附近合成大量高难度样本。借助这些样本机器人可以在仿真环境中系统性地经历现实世界中极为罕见、但在安全性与鲁棒性上至关重要的极端工况从而在不依赖昂贵真实采集的前提下显著扩展训练数据分布并实质性突破具身智能的数据瓶颈。里奇流与物理仿真物理定律最终可归结为偏微分方程PDE而多物理场仿真问题本质上是在给定几何体上求解相应的偏微分方程组。目前最成熟、最通用的数值仿真框架是有限元方法Finite Element Method, FEM。在工业设计与工程分析中几何模型通常以样条曲面形式表示而有限元方法则通过对几何实体进行网格剖分来建立计算基础。有限元方法的核心思想是将连续几何域划分为有限数量的单元在每个单元上引入满足边界一致性条件的低阶多项式基函数用分片多项式函数空间来近似整体物理场随后将偏微分方程转化为某种能量泛函的极值问题并通过变分法在有限维函数空间中进行优化最终将微分方程求解问题转化为代数方程组从而得到偏微分方程的弱解。从数学角度看基于泛函分析的有限元理论体系已经相当成熟从工程实现角度看大规模稀疏代数方程的求解方法也较为完善。然而网格生成本身的理论基础仍然相对薄弱。在实际工程应用中仿真精度、稳定性与效率往往受制于网格质量因此真正的核心难点依然集中在高质量网格的自动生成上。围绕这一关键问题我们与Cadence 的顾鑫、吕传林、余武荣团队以及大连理工大学罗钟铉、雷娜教授团队开展深入合作尝试引入现代微分几何与低维拓扑理论为网格生成建立更加系统和坚实的理论基础从而推动工业级仿真软件在精度、鲁棒性与自动化水平上的根本提升。曲面的非结构网格生成经典有限元理论表明数值解的插值误差同时依赖于网格密度与三角剖分的最小内角而计算过程中刚度矩阵的条件数同样受最小角控制。因此为提高计算精度与数值稳定性Delaunay 三角剖分因其“极大化最小角”的最优性质成为有限元计算中的首选网格类型。在 20 世纪 70 年代计算几何领域已对平面区域的三角剖分开展了系统研究例如 Chew 与 Ruppert 提出的Delaunay 细化算法能够严格保证最小角下界。然而曲面三角剖分的理论问题长期悬而未决成为几何建模与数值计算中的关键瓶颈。直到 2010 年前后在丘成桐先生的领导下笔者团队与罗峰教授等合作系统建立了离散曲面里奇流Discrete Surface Ricci Flow理论才从根本上解决了这一问题。里奇流通过按照高斯曲率对曲面的黎曼度量进行演化最终得到常高斯曲率度量更重要的是在整个演化过程中度量变化始终保持共形保角从而给出了曲面的单值化定理任何带度量的紧曲面在共形意义下等价于球面、欧氏平面或双曲平面之一。由于保角变换将无穷小圆映射为无穷小圆Delaunay 三角剖分在共形映射下保持不变性。借助单值化定理我们可以将曲面区域共形映射到平面区域在平面上施行成熟的 Delaunay 细化算法再将结果拉回曲面从而自然获得高质量的曲面三角剖分。如图 10所示该方法成功应用于大卫雕塑曲面的三角网格生成验证了其几何一致性与工程实用性。图10. 应用里奇流得到的曲面三角剖分。实体的非结构网格生成理论基础同样经历了长期发展。Edelsbrunner 于 1990 年证明任意维空间中的Delaunay 三角剖分所诱导的胞腔遮挡关系必然是非循环的从而为高维 Delaunay 剖分的组合一致性奠定了基础。随后Shewchuk 于 1998 年在此理论框架下进一步证明若给定几何实体的边界曲面三角网格满足边的 Delaunay 条件则该曲面三角剖分可以拓广为实体内部带约束的 Delaunay 四面体剖分。基于这一结果几何实体 Delaunay 四面体剖分的存在性问题可归结为其边界曲面上Delaunay 三角剖分的存在性问题。结合前述离散曲面里奇流理论我们能够系统性地构造满足 Delaunay 条件的曲面三角剖分从而从理论上保证实体Delaunay 四面体剖分的可行性与一致性。在这一理论体系的支撑下斯杭教授开发了著名的TetGen四面体网格生成系统。该系统以其高质量、强鲁棒性与工程可扩展性著称已在全球范围内被广泛应用于计算机辅助工程、计算几何、科学计算与工业仿真等领域成为实体非结构网格生成的事实标准之一。图11显示了TetGen生成的航空发动机实体的四面体网格。图 11. TetGen生成的Rolls-Royce 罗-罗发动机四面体网格剖分。斯杭曲面的结构化网格生成 其重要性在CAD/CAM 工业体系中尤为突出。在计算机辅助设计CAD中几乎所有工业几何体均以样条曲面形式表示而在计算机辅助制造CAM中数控加工同样依赖样条曲面作为统一的几何描述。样条曲面的构建本质上建立在曲面的四边形网格剖分之上因此高质量曲面结构化网格的生成构成了工业几何建模的基础问题。结构化四边形网格生成的核心难点在于奇异点构型的设计与控制。所谓四边形网格的奇异点是指拓扑度不等于 4 的顶点。数十年来学术界与工程界一直致力于揭示这些奇异点背后所遵循的内在控制方程但始终未能形成统一而系统的理论框架。图12. 黎曼-罗赫空间的基底孙嗣权朱一鸣。基于代数几何的思想我们团队与合作者首次给出了这一控制方程的严格刻画。具体而言若将四边形网格的每一个面视为单位正方形则整个网格可视为在曲面上诱导出一个带锥奇异点的平直黎曼度量其总曲率满足高斯–博内定理。该度量具有特殊的和乐群holonomy group结构并进一步诱导出曲面上的一个共形结构从而使曲面自然成为一张黎曼面。在这一几何框架下四边形网格还对应于黎曼面上的一个亚纯四次微分即某个全纯线丛的整体亚纯截影。网格中的奇异点则与该线丛的示性类一一对应并需满足特定的阿贝尔型约束方程。当对奇异点的数量、位置或阶数施加进一步限制时所有满足条件的四边形网格所构成的空间恰由经典的黎曼–罗赫定理精确刻画。如图 12所示我们展示了在给定奇异点约束条件下对应的黎曼–罗赫空间的一组基底而图 13则给出了基于该理论方法生成的汽车白车身曲面四边形网格剖分实例验证了该理论在复杂工业几何建模中的有效性与工程实用价值。图13. 汽车白体的四边形网格剖分。几何实体的结构化网格 3维几何实体的六面体网格剖分需要用到3-流形拓扑的理论特别是近些年来发展起来的几何群论和立方复形理论的方法。从拓扑角度来看实体的六面体网格剖分非常宽泛早在1980年代瑟斯顿就证明了如果实体边界曲面的四边形网格剖分满足非常简单的拓扑条件零调那么边界曲面的四边形网格可以向内拓展成实体的六面体剖分。其证明思想与立方复形理论相一致都是考察六面体网格的对偶胞腔分解特别是实体内部的曲面相交和自相交的模式。如何构造几何实体内部彼此横截相交的曲面族叶状结构使得其相交模式和自相交模式尽量简化成为问题的关键。虚拟哈肯定理将3-流形提升至其有限重复叠空间使得浸入子流形成为嵌入子流形从而简化自相交模式。丘成桐先生和Meeks的早期工作将子流形同痕变换成极小曲面从而简化相交模式。我们基于这些思想和方法来构造边界曲面的特殊立方复形再应用双曲几何的叶状结构理论来构造实体内部的对偶复形优化子流形的相交模式得到实体的六面体网格。图14显示了曲柄零件的六面体网格的对偶复形以及一张自相交的子曲面图15显示了曲柄零件的六面体网格。几何实体的结构化网格生成三维实体的六面体网格剖分本质上依赖于三维流形拓扑的深层理论尤其是近年来迅速发展的几何群论与立方复形cube complex理论。从拓扑角度看实体六面体网格的存在性具有相当的普适性。早在 20 世纪 80 年代Thurston即证明若实体边界曲面的四边形网格满足一组极为简单的拓扑条件零调条件则该边界四边形网格可以自然地向实体内部拓展为六面体网格剖分。其证明思想与现代立方复形理论高度一致核心在于考察六面体网格的对偶胞腔分解特别是实体内部三族曲面之间的相交与自相交模式。因此六面体网格生成的关键问题可归结为如何在实体内部构造三族彼此横截相交的曲面叶状结构并尽可能简化其相交与自相交结构。近年来虚拟 Haken 定理提供了重要工具通过将三维流形提升到其有限覆盖空间可以将原本的浸入子流形转化为嵌入子流形从而显著降低自相交的复杂性。与此同时Yau–Meeks等人的早期工作表明可通过同伦变形将子流形演化为极小曲面进一步简化其相交结构。这些结果为六面体网格的构造提供了坚实的几何与拓扑基础。基于上述理论我们首先在边界曲面上构造具有特殊结构的立方复形随后引入双曲几何中的叶状结构理论在实体内部生成其对偶复形并系统性地优化子曲面的相交模式最终得到高质量的实体六面体网格剖分。如图 14所示展示了某曲柄零件六面体网格的对偶复形及一张自相交子曲面而图 15则给出了该曲柄零件最终生成的六面体网格结果验证了该方法在复杂工业零件建模中的有效性与可行性。图14. 机械零件的六面体网格的对偶及一张自相交的二维子曲面。图15. 机械零件的六面体网格 朱一鸣齐志辉。高质量网格剖分不仅是几何表达的基础更是具身智能中触觉与力反馈仿真的关键支撑。在Sim-to-Real训练框架下需要高保真地模拟软体手指与刚性物体接触时所产生的非线性形变与多物理场耦合效应。基于里奇流理论构造的无奇异点网格具有良好的角度质量能够有效极大化最小角从而避免有限元计算中常见的刚度矩阵病态或奇异问题。这使得我们能够在仿真环境中稳定且精确地计算接触界面上的切向量场摩擦力分布与法向量场压力分布。进一步地借助黎曼几何中的平行移动理论机器人系统可以对手指沿物体表面滑动过程中触觉信息的演化进行预测实现触觉向量场在曲面上的一致传输。由此机器人在尚未发生真实物理接触之前便可在内部模型中对可能产生的触觉反馈进行前瞻性“预演”为精细操控与自主决策提供可靠的几何与物理依据。小结综上所述我们看到微分几何不再仅仅是数学家的抽象游戏它是连接具身智能‘感知’与‘行动’的桥梁。共形几何提高了3D视觉的稳定性里奇流网格生成理论支撑了高保真的触觉力学仿真而最优传输理论则为我们提供了近乎无限的物理一致性多样化数据。我们将在2026年进一步推进这些方面的研究。我们坚信微分几何在具身智能的发展中发挥更加基本更加广泛的作用。感谢陈士魁教授生成的封面图像和提出的修改意见感谢顾鑫、斯杭提出的修改意见。请长按下方二维码选择“识别图中二维码”即可关注。【老顾谈几何】邀请国内国际著名纯粹数学家应用数学家理论物理学家和计算机科学家讲授现代拓扑和几何的理论算法和应用。