新型去噪算法助力获取高质量时空转录组数据
新型去噪算法助力获取高质量时空转录组数据
记者从华大生命科学研究院获悉,10月16日,北京华大生命科学研究院团队最新成果以封面文章形式发表于《细胞—系统》。该成果介绍了时空转录组去噪算法SpotGF,阐释了这套算法如何识别并过滤噪声基因,有效降低时空组数据中的噪声,并避免新的假阳性信号。
理想情况下,基因表达应在其原位被捕获。华大自主研发的时空组学技术(Stereo-seq)就是一种结合了基因表达信息与细胞空间位置的空间转录组技术,能够帮助科研人员探究基因表达在组织和器官中的空间分布。
但在实际操作中,不同细胞类型的差异、实验环境中难以预测的分子热运动、建库过程中的反转录和扩增步骤、数据分析中参数和算法的不当使用等情况都有可能增加噪声或假阳性的信号。
因此,开发高效的去噪算法来获取准确的空间转录组数据,对于后续生物学问题的解读至关重要。
为此,研究团队开发了SpotGF去噪算法,算法基于最优传输理论,定量分析了每个基因表达的扩散程度,从而准确识别并过滤那些因扩散而变得无效的基因,这些无效基因通常无法为生物信息学分析提供价值。
与以往依赖数学统计模型来调整原始基因表达量的去噪方法不同,SpotGF在去除无效基因的同时,保留了有效基因的原始表达,从而避免引入新的假阳性信号,提高了分析的准确性。
SpotGF适用于多种生物信息学框架,研究人员还将其与目前广泛使用的去噪算法如Magic、SpotClean、Sprod等进行了比较。结果表明,在各项指标上SpotGF均展现出了更优越的性能,并显著提升了包括时空组学技术在内的一系列空间转录组数据的聚类效果,更准确地鉴定出了细胞类型的特征基因。
如何获取高质量的空间转录组数据一直是研究人员面临的挑战。SpotGF算法通过精准去除数据中的噪声,显著提高了空间转录组数据的信噪比,使得细胞聚类、细胞类型注释和差异表达等分析结果更加精确。这为理解复杂生物系统中的基因调控网络、信号传导途径,以及细胞间的相互作用提供了强有力的工具。
据了解,该研究依托深圳国家基因库完成全部生物信息学数据分析,原始测序数据存储于国家基因库序列归档系统CNSA。
相关论文信息:https://www.cell.com/cell-systems/abstract/S2405-4712(24)00269-2
论文封面截图 研究团队供图?