2026/1/24 0:16:10
网站建设
项目流程
网站开发招聘简历模板,金融网站策划,外包公司名单,工业和信息化部装备工业发展中心文章目录 一、直觉理解#xff1a;二、连续形式#xff08;SDE 视角#xff09;三、为什么它能「采样」#xff1f;四、离散形式#xff08;算法角度#xff09;五、和机器学习的对应关系5.1 Langevin MCMC5.2 SGLD#xff08;Stochastic Gradient Langevin Dynamics二、连续形式SDE 视角三、为什么它能「采样」四、离散形式算法角度五、和机器学习的对应关系5.1 Langevin MCMC5.2 SGLDStochastic Gradient Langevin Dynamics六、和 Diffusion Model 的关系6.1 反向扩散 Langevin-like dynamics5.2 Score matching 学梯度七、和 Tweedie Estimator[^1] 的桥梁八、总结参考一、直觉理解Langevin dynamics 「有噪声的梯度下降」想象一个小球在能量地形U ( x U(xU(x) 上滚动梯度项小球会沿着「能量下降最快的方向」滚⇒ \Rightarrow⇒普通梯度下降随机噪声项环境温度导致的小抖动⇒ \Rightarrow⇒帮助跳出局部极小值 所以Langevin dynamics 梯度下降 随机热噪声朗之万动力学通过两个关键力的博弈实现系统调控摩擦力像水中的阻力让粒子减速随机力模拟分子碰撞带来的无规则扰动。当这两种力达到平衡时系统会自然趋向玻尔兹曼分布——这正是复杂概率采样的物理基础。二、连续形式SDE 视角标准的过阻尼 Langevin SDEd x t − ∇ U ( x t ) d t 2 T d W t \boxed{ \mathrm{d}x_t - \nabla U(x_t)\mathrm{d}t \sqrt{2T}\mathrm{d}W_t }dxt−∇U(xt)dt2TdWt各项含义项含义x t x_txt系统状态参数、样本、粒子位置U ( x U(xU(x)势能函数能量− ∇ U ( x -\nabla U(x−∇U(x)确定性“往低能走”W t W_tWtWiener 过程布朗运动T TT温度噪声强度三、为什么它能「采样」这是Langevin dynamics 的核心魔法。如果你让上面的 SDE 跑足够久它的稳态分布是p ( x ) ∝ e − U ( x ) / T \boxed{ p(x) \propto e^{-U(x)/T} }p(x)∝e−U(x)/T这就是Boltzmann 分布。换句话说你不需要知道如何直接采样p ( x p(xp(x)只要能算∇ U ( x \nabla U(x∇U(x)就可以用 Langevin dynamics 从p ( x p(xp(x) 中采样四、离散形式算法角度Euler–Maruyama 离散化x k 1 x k η ∇ U ( x k ) − 2 T η ϵ k , ϵ k ∼ N ( 0 , I ) \boxed{ x_{k1} x_k \eta \nabla U(x_k) - \sqrt{2T\eta}\epsilon_k, \quad \epsilon_k \sim \mathcal{N}(0,I) }xk1xkη∇U(xk)−2Tηϵk,ϵk∼N(0,I)这看起来是不是非常眼熟SGD Gaussian noise五、和机器学习的对应关系5.1 Langevin MCMC令U ( x ) − log p ( x ) U(x) - \log p(x)U(x)−logp(x)则更新变成x k 1 x k η ∇ log p ( x k ) − 2 η ϵ k x_{k1} x_k \eta \nabla \log p(x_k) - \sqrt{2\eta}\epsilon_kxk1xkη∇logp(xk)−2ηϵk用梯度信息做 MCMC5.2 SGLDStochastic Gradient Langevin Dynamics在大数据场景中用 mini-batch 估计∇ log p ( x \nabla \log p(x∇logp(x)噪声天然存在 SGD ≈退化版 Langevin dynamics六、和 Diffusion Model 的关系6.1 反向扩散 Langevin-like dynamics扩散模型的反向 SDEd x [ f ( x , t ) − g ( t ) 2 ∇ x log p t ( x ) ] d t g ( t ) d W ˉ t \mathrm{d}x \big[ f(x,t) - g(t)^2 \nabla_x \log p_t(x) \big] \mathrm{d}t g(t)\mathrm{d}\bar W_tdx[f(x,t)−g(t)2∇xlogpt(x)]dtg(t)dWˉt其中∇ x log p t ( x \nabla_x \log p_t(x∇xlogpt(x)score噪声 score 驱动采样 本质上是时间变化版 Langevin dynamics5.2 Score matching 学梯度Langevin dynamics已知∇ log p ( x \nabla \log p(x∇logp(x)→ 采样Diffusion model先学 score→ 再用 Langevin/SDE 采样七、和 Tweedie Estimator1的桥梁在高斯噪声下E [ x 0 ∣ x t ] x t σ t 2 ∇ log p t ( x t ) \boxed{ \mathbb{E}[x_0 \mid x_t] x_t \sigma_t^2 \nabla \log p_t(x_t) }E[x0∣xt]xtσt2∇logpt(xt)这意味着score denoising directionLangevin 的 drift 项 ≈一步去噪 反向扩散 连续去噪版 Langevin dynamics八、总结Langevin dynamics 是数学上一个带噪声的 SDE算法上加噪声的梯度下降统计上一种 MCMC 采样方法Diffusion 中反向过程的原型参考怎么理解随机微分方程SDE一文解释 经验贝叶斯估计, Tweedie’s formula ↩︎