2026/3/30 4:21:04
网站建设
项目流程
长沙推广网站,安卓优化大师旧版本,中秋节网页设计代码,工作时做网站使用软件文章目录介绍代码参考介绍
空间转录组学通过提供有关组织内基因表达的高分辨率信息#xff0c;推动了分子生物学的发展。这种情境对于识别空间区域至关重要#xff0c;有助于理解微环境的组织结构及其对组织功能和疾病进展的影响。为了改善当前在多张切片上的模型局限性推动了分子生物学的发展。这种情境对于识别空间区域至关重要有助于理解微环境的组织结构及其对组织功能和疾病进展的影响。为了改善当前在多张切片上的模型局限性我们设计了 Novae这是一个基于图的基础模型能够提取细胞在其空间情境中的表示。我们的模型基于近 3000 万个细胞的数据集涵盖 18 种组织能够在多个基因面板、组织和技术之间进行零样本域推断。与其他模型不同它还能够原生地纠正批次效应并构建空间区域的嵌套层次结构。此外Novae 支持各种下游任务包括空间变量基因或通路分析以及空间区域轨迹分析。总体而言Novae 提供了一种强大的、多功能的工具用于推进空间转录组学及其在生物医学研究中的应用。空间转录组学1、2 数据为细胞在其微环境中的相互作用以及组织结构的复杂性提供了宝贵的见解。与当前的单细胞 RNA 测序scRNA-seq3 相比空间转录组学的一个关键优势在于它能够保持细胞的空间位置信息从而能够更深入地理解细胞在其自然环境中的相互作用方式。空间转录组学的技术大致可分为两类1基于下一代测序NGS的方法可提供全转录组测序2基于成像的技术如 Xenium5、MERSCOPE6 或 CosMX7这些技术能提供亚细胞分辨率。前者能够进行全面的基因分析但缺乏精细的空间细节而后者则提供了详细的空间分辨率但基因面板的规模有限。随着成像技术的不断发展它们的基因面板能力也在不断扩大能够在研究中纳入更大的面板或替换低质量的基因然而这种灵活性往往会导致实验在不同的机器上进行或使用不同的面板从而带来了新的挑战。在更普遍的情况下当对多个空间转录组学切片无论是基于下一代测序技术还是基于成像技术进行分析时通常会观察到明显的批次效应因此在不仔细考虑批次效应的情况下很难在多个切片之间识别出共有的空间模式。空间转录组学的一个关键重点在于识别和分类空间微环境这些微环境通常被称为空间区域或生态位。为此目的已经开发出了多种方法如 STAGATE8、GraphST9、SpaceFlow10 和 SEDR11。尽管这些方法显示出良好的效果尤其是在具有斑点分辨率的 NGS 技术如 Visium 的情况下但它们受到以下限制1依赖于预先定义的基因面板2对批次效应的敏感性以及3对外部工具如 Harmony12 用于批次效应校正Leiden13 或 Mclust14 用于聚类的依赖。这些依赖关系可能会减慢处理速度并降低稳健性因为需要为每次新的分析或调整空间区域分辨率选择不同的空间区域数量重新运行外部工具。此外由于它们依赖于特定的基因集这些方法通常需要在基因集的交集上进行训练这会显著减少可用的基因数量从而影响性能。值得注意的是即便应用于具有共用面板的幻灯片中这些模型也往往主要识别出的是与单个幻灯片相关的特定领域这限制了在更广泛的研究中对不同领域进行比较的可能性并降低了发现新的空间生物标志物的潜力。为解决这些局限性我们引入了 Novae这是一种自监督的 15 节点注意力网络 16 它将局部环境编码为空间表示。与现有方法不同的是同一个 Novae 模型可以与多个基因面板协同工作从而能够在各种技术和组织中得到应用。它包括原生的批次效应校正方法直接纠正差异并增强鲁棒性和可扩展性。因此Novae 的设计使其能够无缝地整合来自不同平台和基因面板的数据而不会影响性能。我们在一个包含 78 张切片的大型数据集上训练了 Novae这些切片涵盖了 18 种组织和三种不同的亚细胞分辨率技术Xenium5、MERSCOPE6 和 CosMX7近 3000 万个细胞。这种广泛的训练使 Novae 能够通过零样本 17 或在来自不同组织的新切片上进行微调来计算相关表示。这些表示可以直接用于空间域识别无需使用外部聚类工具。除了空间域识别之外这些表示形式还可应用于各种后续任务包括1空间域轨迹分析2空间变量基因SVG分析以及3空间通路分析。Novae 的多功能性、稳健性和易用性使其成为科学界推进空间转录组学研究的强大工具。代码https://github.com/MICS-Lab/novae参考Novae: a graph-based foundation model for spatial transcriptomics datahttps://github.com/MICS-Lab/novae