Role of mitochondrial autophagy-related genes in colorectal cancer based on spatial transcriptomics and single-cell sequencing analysis
-
摘要:目的
运用机器学习算法分析单细胞测序数据和空间转录组数据, 探讨线粒体自噬相关基因在结肠癌中的作用。
方法采用支持向量机递归特征消除(SVM-RFE)和随机森林算法筛选关键的线粒体自噬相关基因,结合单细胞测序数据和空间转录组数据,对细胞间相互作用、拟时序分析及基因空间定位进行综合评估。对筛选出的核心基因进行敲低实验,验证其对结肠癌细胞增殖、迁移和侵袭能力的影响。
结果RPS5是结肠癌进展的核心基因; RPS5阳性上皮细胞主要位于肿瘤核心区域,并与成纤维细胞相互作用; 免疫组织化学实验表明, RPS5在结肠癌组织中的表达显著高于癌旁组织; 功能实验表明,敲低RPS5可显著抑制结肠癌细胞的增殖、迁移和侵袭能力。
结论RPS5是促进结肠癌进展的关键分子,这一发现为结肠癌的精准治疗提供了新的潜在靶点。
Abstract:ObjectiveTo investigate the role of mitochondrial autophagy-related genes in colorectal cancer using machine learning algorithms to analyze single-cell sequencing data and spatial transcriptomics data.
MethodsKey mitochondrial autophagy-related genes were screened using Support Vector Machine-Recursive Feature Elimination (SVM-RFE) and Random Forest algorithms. Comprehensive assessments of cell-cell interactions, pseudo-time analysis, and gene spatial localization were conducted by integrating single-cell sequencing data and spatial transcriptomics data. Knockdown experiments were performed on the identified core genes to verify their effects on the proliferation, migration, and invasion capabilities of colorectal cancer cells.
ResultsRPS5 was identified as a core gene in the progression of colorectal cancer. RPS5-positive epithelial cells were primarily located in the tumor core region and interacted with fibroblasts. Immunohistochemical experiments demonstrated that RPS5 expression was significantly higher in colorectal cancer tissues compared to adjacent tissues. Functional experiments showed that knockdown of RPS5 significantly inhibited the proliferation, migration, and invasion capabilities of colorectal cancer cells.
ConclusionRPS5 is a key molecule promoting the progression of colorectal cancer, which provides a new potential target for precision therapy in colorectal cancer.
-
心血管疾病(CVD)已成为一个日益严重的全球健康问题[1], 20~44岁成人CVD发病率也显著上升[2]。左心室射血分数(LVEF)是评估CVD严重程度的重要指标, LVEF越低, CVD预后越差[3]。超声心动图是心血管成像领域应用最广泛的方法,具有便携、无电离辐射成像等特点。目前超声心动图医师基于Simpson双平面标准化技术测量方法,跟踪连续心动周期中的舒张末期帧(EDF)和收缩末期帧(ESF), 手动描记心内膜边界以计算LVEF, 上述过程耗时繁琐、重复性差[4], 因此有必要通过医工交叉融合方法促进超声心动图扫描和自动测量。目前,人工智能(AI)已被广泛应用于医学成像多个领域[5-7], 深度学习在超声心动图领域也显示出巨大优势和潜力[8]。本研究构建一种参考Simpson双平面标准化技术测量方法的二维超声心动图视图的深度学习全自动分析模型。首先,构建标准心尖四腔心切面(A4C)、心尖二腔心切面(A2C)以及心尖三腔心切面(A3C)视图数据集; 然后,在U-Net网络基础上优化视图分割网络,使用卷积神经网络叠加self-attention模块作为特征提取器,构建左心室分割模型并验证模型诊断效能; 最后,自动识别左心室舒张末期容积(EDV)和左心室收缩末期容积(ESV)以计算LVEF, 实现LVEF的自动计算。本研究旨在通过多切面、标准化Simpson双平面方法构建二维超声心动图视图的深度学习全自动分析模型,为LVEF自动精准测量提供一种新的研究方法。
1. 资料与方法
1.1 数据集
收集2020年10月—2021年4月上海市胸科医院、上海市第九人民医院和上海市第八人民医院2 193例患者的超声心动图。清洗数据过程中,排除年龄 < 18岁、图像质量差或胸部畸形影响视图观察者(291例),最终纳入1 902例。记录患者年龄、性别、体表面积(BSA)等基本临床参数及超声心动图参数,包括LVEF、EDV和ESV。
使用飞利浦Epiq7C (Philips, Netherlands)、飞利浦iE33 (Philips, USA)、GE Vivid E95 (GE, USA) 等超声设备进行测量。临床测量由经过心脏超声规范化培训超声医师获得。根据中国成年人超声心动图检查测量指南[9]和美国超声心动图学会指南[10], 受试者选择左侧卧位,检查透声窗包含胸骨左缘检测区、左侧心尖检测区,选择经胸探头,频率3.5 MHz, 深度15~17 cm, 帧频≥50帧/s, 调整探头,选择左心室最大长轴内径切面,依次采集标准A4C、A2C和A3C视图[包括舒张末期和收缩末期未描记心内膜视图各1张(共6张),舒张末期和收缩末期描记心内膜边界视图各1张(共6张),每例患者12张标准视图],并带有相应的标记、测量值及左心室心内膜边界的人类专家标注视图,以具有15年以上心脏超声诊断经验的主任医师级别超声专家标注视图作为参考标准。
数据集构建分为开发集[1 610例,其中1 252例(15 024张视图)来自上海市胸科医院,用于训练深度学习模型, 358例(4 296张视图)用于模型优化和调整]、内部测试集[177例(2 124张视图)用于内部验证]和外部测试集[115例(1 380张视图)用于外部验证和泛化性检测,其中65例(780张视图)来自上海市第九人民医院, 50例(600张视图)来自上海市第八人民医院,用于模型外部验证]。使用杏脉科技鉴影标注平台进行视图标注。
1.2 模型开发
本研究AI系统提出的端到端AI模型包括图像切面分类和切面标准性判断功能,在此基础上实现自动测量LVEF, 其中,图像切面分类模型通过全监督分类算法训练获得,而切面标准性判断模型通过对比学习和度量学习算法获得。本研究中心动周期时相自动定位功能是通过对左心室自动分割,对应分割面积最大(舒张末期)和分割面积最小(收缩末期)来实现。
通过比较标记视图和原始视图差异,对纳入训练集的视图进行左心室边界标注的自动提取。以超声专家标注为参考标准,在杏脉科技鉴影科研平台(图像处理系统,上海杏脉信息技术有限公司)中进一步手动定位标注的3个关键点位置(左心室顶点和二尖瓣环的左半部分和右半部分),标注信息用于左心室分割和关键点检测模型的训练和测试。模型的构建和训练在PyTorch(1.7.0版)深度学习框架和Python(3.6.8版,美国Python软件基金会)编程平台上进行。
1.3 左心室分割以及自动量化左心室容积和LVEF
左心室分割和关键点检测涉及以下深度学习模型: ①左心室区域检测模型; ②左心室分割和关键点检测模型。检测模型对超声视图进行预处理,粗略提取左心室区域,然后通过分割模型从提取的左心室区域中识别细化的左心室内膜边界和关键点。
左心室分割与关键点检测模型整体网络架构,见图 1。首先,将超声图像输入到YOLOv5[11]网络以检测左心室区域,并将左心室边界注释转换为边界框,用于左心室区域检测;其次,对左心室分割和关键点检测进行优化。左侧卷积块Conv1~5对应ResNeXt-50Stages1~5, 而右侧卷积块Conv1~5是指U-Net卷积块,将左右两边的卷积块以self-attention模块连接,以突出特定局部区域的显著特征;最后,输出左心室分割结果和关键点位置。该模型输入图像尺寸为224像素×224像素,每个像素的颜色是由3个原色通道上对应的色块混合而成。训练总损失函数是分割任务的Dice损失和关键点检测任务MSE损失的平均值,公式为: $L_{Dice }=\frac{2 \times \mid G t \cap Pred \mid}{|G t|+\mid Pred \mid}$, $L_{M S E}=\frac{1}{N}\sum_{i=1}^N(\overset\smallfrown{y}-y)^2$, $L_{total }=\frac{1}{2}\left(L_{Dice }+L_{M S E}\right)$。
自动量化左心室容积和LVEF: 基于左心室分割和关键点检测结果以计算左心室容积。根据美国超声心动图学会和欧洲心血管成像协会制定的指南[10], 使用Simpson双平面方法计算左心室容积,左心室被划分为20个相等厚度的椭圆形圆盘,将每个圆盘容积相加估算左心室容积。
左心室长轴是连接二尖瓣环两个关键点的中点和顶点的连线,在此基础上分割为20个等分对应的圆盘,形成19个分割点。穿过19个分割点画出垂直长轴的平行线,每条平行线穿过左心室内膜边界相交处形成2个点,这2个点之间距离即椭圆形圆盘短轴,使用$V=\frac{{\rm{ \mathsf{ π} }}}{4} {\sum}_{i=1}^{20} \mathrm{a}_i \mathrm{c}_i \frac{L}{20}$公式计算左心室容积[左心室舒张末期直径(LVEDV)和左心室收缩末期容积(LVESV)]。左心室容积可以通过A2C视图和A3C视图组合计算,也可以通过A3C视图和A4C视图组合计算。计算LVEDV和LVESV后, LVEF由公式LVEF= $\frac{\text { LVEDV - LVESV }}{\text { LVEDV }} \times 100 \%$计算生成。使用U-Net[12-13]提取图上比例尺,将距离映射单位像素转为物理距离单位cm。
1.4 模型评估
Dice相似性系数是一种集合相似度度量指标,是医学图像中使用频率较高的度量指标,本研究使用Dice系数来评估左心室分割模型性能。计算公式Dice= $\frac{2 \times \mid G t \cap Pred \mid}{|G t|+\mid Pred \mid}$。为了评估自动测量左心室容积和LVEF与参考标准的相关性和一致性,首先计算Pearson相关系数和组内相关系数(ICC)。
1.5 统计学分析
使用R软件(4.0.0版,奥地利统计计算R基金会)进行数据统计。比较开发数据集和内部测试数据集的差异,进行双尾t检验(针对定量基线特征)或卡方检验(针对分类基线特征)。采用模型预测左心室容积和LVEF与参考标准的相关性和一致性,计算Pearson相关系数和ICC。置信区间(CI)采用R的irr软件包计算。
2. 结果
2.1 人群基线特征
纳入患者的临床基线特征见表 1。开发集与内部测试集的LVEDV比较,差异有统计学意义(P < 0.05)。
表 1 入组人群临床基线资料特征比较(x±s)[n(%)]基线资料 开发集(n=1 610) 内部测试集(n=177) 外部测试集(n=115) 男 838(52.05) 102(57.62) 43(37.39) 女 772(47.95) 75(42.37) 72(62.61) 年龄/岁 59.33±19.60 59.32±12.94 56.37±24.85 体表面积/m2 1.76±0.27 1.75±0.19 1.56±0.44 左心室舒张末期容积/mL 97.54±30.46 98.88±33.19 71.29±30.31 左心室收缩末期容积/mL 35.15±18.73 35.24±18.80 29.35±14.31 左心室射血分数/% 64.80±5.86 65.36±6.44 81.86±20.45 左心室舒张末期直径/mm 45.63±6.27* 46.76±5.94 41.36±7.79 与内部测试集比较, * P < 0.05。 2.2 左心室分割表现
内部测试集和外部测试集中,模型在EDF和ESF 3个不同切面左心室分割任务Dice均≥0.90, 如表 2所示。内部测试集中, EDF 3个不同切面的Dice为0.94~0.96; ESF 3个不同切面的Dice为0.91~0.93; 外部测试集中, EDF 3个不同切面Dice为0.91~0.94, ESF 3个不同切面的Dice为0.90~0.91。
表 2 分割任务Dice相似系数(x±s)Dice相似系数 心尖2腔心切面 心尖3腔心切面 心尖4腔心切面 内部测试集 外部测试集 内部测试集 外部测试集 内部测试集 外部测试集 舒张末期帧 0.94±0.04 0.93±0.04 0.94±0.03 0.91±0.03 0.96±0.02 0.94±0.03 收缩末期帧 0.92±0.03 0.90±0.06 0.91±0.06 0.90±0.05 0.93±0.03 0.91±0.04 舒张末期帧+收缩末期帧 0.93±0.04 0.92±0.05 0.94±0.03 0.91±0.04 0.94±0.03 0.93±0.04 2.3 左心室容积和自动量化左心室收缩功能
根据3种不同组合方案(Simpson方法、A2C+A3C方法和A3C+A4C方法)的分割结果将自动计算的左心室容积与参考标准进行比较。AI模型计算左心室容积与参考标准之间的Pearson相关系数和ICC见表 3。Pearson相关系数分析显示,内部测试集中, 3种组合方案在收缩末期时相均与参考标准强相关(Pearson相关系数为0.64~0.77), 在舒张末期时相与参考标准中等程度相关(Pearson相关系数为0.51~0.58); 外部测试集, 3种组合方案在收缩末期时相与参考标准呈弱相关(Pearson相关系数为0.36~0.39), 在舒张末期时相与参考标准呈极弱至弱相关(Pearson相关系数为0.19~0.30)。
表 3 模型自动测量左心室与参考标准Pearson相关系数和ICC相关系数 数据集 心尖2腔心+心尖4腔心切面 心尖2腔心+心尖3腔心切面 心尖3腔心+心尖4腔心切面 收缩末期帧 舒张末期帧 收缩末期帧 舒张末期帧 收缩末期帧 舒张末期帧 Pearson相关系数 内部测试集 0.77 0.58 0.68 0.51 0.64 0.53 外部测试集 0.39 0.19 0.38 0.30 0.36 0.23 内部测试集+外部测试集 0.54 0.25 0.49 0.30 0.42 0.25 组内相关系数 内部测试集 0.73(0.58, 0.82) 0.47(0.13, 0.67) 0.59(0.27, 0.76) 0.33(-0.04, 0.47) 0.56(0.70, 0.31) 0.41(0.08, 0.62) 外部测试集 0.32(0.13, 0.48) 0.15(-0.02, 0.32) 0.35(0.18, 0.51) 0.29(0.11, 0.45) 0.31(0.14, 0.47) 0.20(0.03, 0.37) 内部测试集+外部测试集 0.53(0.44, 0.61) 0.25(0.14, 0.36) 0.47(0.37, 0.56) 0.27(0.15, 0.39) 0.42(0.31, 0.51) 0.25(0.14, 0.36) ICC也显示出相似趋势: 内部测试集中,收缩末期时相与参考标准呈中等至较强一致性(ICC为0.56~0.73), 舒张末期时相与参考标准显示一般至中等一致性(ICC为0.33~0.47); 独立外部测试集中,在收缩末期时表现出与参考标准一般一致性(ICC为0.31~0.35), 在舒张末期时相表现出与参考标准较差至一般的一致性(ICC为0.15~0.29)。
3. 讨论
本研究基于二维超声心动图的静态视图数据集,成功构建了一个能够识别左心室内膜边界,分割左心室并自动量化LVEF的算法模型。这一算法的核心在于利用卷积神经网络结合self-attention模块提取图像特征,通过精确的左室分割和关键点检测来更好地捕捉心内膜边界特征,并根据模型输出结果自动计算EDV和ESV, 从而实现LVEF的自动量化。这一方法的提出为LVEF的临床计算提供了一个新的、可解释的自动量化途径。
LVEF是评估心脏泵血功能的关键指标[14], 对于心脏病的诊断和治疗具有重大意义。目前,尽管已有许多关于利用AI技术量化LVEF的研究,但大多基于国外数据或单一任务模型[15-16]。MORADI S等[17]提出采用MFP-Unet网络对左心室进行分割,并提出一种采用最小外接三角形寻找心室长轴和面积以预测LVEF的技术解决方案,该研究预测LVEF以左心室长轴切面为研究基础。OUYANG D等[18]推出迄今为止最大的超声心动图视频数据库Echo-Net Dynamic, 共有10 030个视频,在左心室分割和LVEF评估等关键任务中具有良好性能,但该数据库只有A4C切面视图。REYNAUD H等[19]提出一种基于Transformer结构的残差自动编码器网络,用于直接预测LVEF,平均绝对误差为5.95%,该研究算法过程中间结果不具备很强的可解释性,端到端的预测方式比较缺乏透明性,且Transformer网络本身在移动端部署效率低于卷积神经网络。鉴于不同人种间在解剖结构和生理参数上的差异,开发适合中国人群的AI模型显得尤为重要。
本研究的数据集包含来自上海3家医院的1 902例患者共22 824个超声心动图视图,其样本量超过现有文献报道[17, 20], 有助于提高研究结果的普适性。此外,本研究还额外采集A3C切面视图,以弥补A2C切面显示的不足[21], 确保在各种情况下都能准确获取双平面LVEF。临床实践中,双平面Simpson法测量LVEF需要医生在A4C和A2C视图的关键帧中手动追踪左心室心内膜边界,这一过程容易受到成像原理的限制和散斑噪声的影响,导致边界模糊或伪影,从而引入显著的测量误差。本研究模型采用卷积神经网络和self-attention模块组合,能够有效降低误差,尤其是EDF和ESF的Dice系数均超过0.9, 显示出良好的分割性能。
本研究局限性主要在于缺乏与患者相对应的心脏磁共振成像检查结果,因此缺少金标准验证。此外,尽管左心室自动分割模型的性能良好,但自动量化LVEF的外部验证一致性较低(Pearson相关系数为0.19~0.30), 可能与不同医院间的数据、采集医师技术差异以及模型训练的泛化性不足有关。后续研究中需要在优化左心室自动分割模型的基础上,增加多中心样本量,提高模型的泛化性和准确性,并完善金标准的验证,同时需要通过算法优化、多中心模型训练等方式平衡不同医院、不同人群、不同操作医师的差异性。
综上所述,本研究初步构建了一个能够识别左心室心内膜边界和关键点检测的AI模型,实现了LVEF的自动测量,为二维超声心动图左心室自动分割和精准量化LVEF提供了一种新的研究参考。此外,时序大模型展现出利用跨场景超大规模数据构建大规模参数模型的能力,在心电图等医疗领域已有突破,未来研究中将继续优化算法,探索更多不同模型算法在超声心动图AI领域的应用价值。
-
表 1 荧光定量PCR引物序列
基因 引物序列(5′→3′) RPS5-正向 CAGGCTGTGTTCTCAGGATGA RPS5-反向 CACATCATCGGTGCTCCACT GAPDH-正向 TCATTTCCTGGTATGACAACGA GAPDH-反向 GTCTTACTCCTTGGAGGCC 表 2 shRNA序列
shRNA序列 正向寡核苷酸(5′→3′) 反向寡核苷酸(5′→3′) RPS5 shRNA#1 CCGGGCAGGATTACATTGCAGTGAACTCGAGT
TCACTGCAATGTAATCCTGCTTTTTGAATTCAAAAAGCAGGATTACATTGCAGTGAACTCG
AGTTCACTGCAATGTAATCCTGCRPS5 shRNA#2 CCGGACCGATGATGTGCAGATCAATCTCGAGA
TTGATCTGCACATCATCGGTTTTTTGAATTCAAAAAACCGATGATGTGCAGATCAATCTCG
AGATTGATCTGCACATCATCGGT -
[1] ARGILÉS G, TABERNERO J, LABIANCA R, et al. Localised colon cancer: ESMO Clinical Practice Guidelines for diagnosis, treatment and follow-up[J]. Ann Oncol, 2020, 31(10): 1291-1305. doi: 10.1016/j.annonc.2020.06.022
[2] AUDISIO A, FAZIO R, DAPR V, et al. Neoadjuvant chemotherapy for early-stage colon cancer[J]. Cancer Treat Rev, 2024, 123: 102676. doi: 10.1016/j.ctrv.2023.102676
[3] 邓立春, 沈伟生, 张瑶, 等. 化疗对晚期结直肠癌患者血清VEGF水平的影响[J]. 实用临床医药杂志, 2010, 14(5): 90-91, 93. doi: 10.3969/j.issn.1672-2353.2010.05.029 [4] RAO A, BARKLEY D, FRANCA G S, et al. Exploring tissue architecture using spatial transcriptomics[J]. Nature, 2021, 596(7871): 211-220. doi: 10.1038/s41586-021-03634-9
[5] LU Y Y, LI Z J, ZHANG S Q, et al. Cellular mitophagy: Mechanism, roles in diseases and small molecule pharmacological regulation[J]. Theranostics, 2023, 13(2): 736-766. doi: 10.7150/thno.79876
[6] 李腊梅, 杨晶, 刘苑莹, 等. 基于三叉神经节神经元电生理特征的单细胞转录组测序技术方法构建[J]. 空军军医大学学报, 2022, 13(9): 939-945, 951. [7] 陈志南, 边惠洁, 杨向民. 肿瘤微环境稳态重塑可阻抑肿瘤进展[J]. 空军军医大学学报, 2024, 15(7): 723-731. [8] 张文静, 李晓峰, 孙明明, 等. 线粒体自噬在心肌梗死中的作用及研究进展[J]. 中华全科医学, 2022, 20(7): 1194-1198. [9] 白璐. 基于PINK1/Parkin通路探讨和胃理气方调控线粒体自噬对功能性消化不良胃肠动力障碍的作用机制[J]. 空军军医大学学报, 2023, 14(6): 529-535. [10] QIU L, CHAO W, ZHONG S, et al. Eukaryotic ribosomal protein S5 of the 40S subunit: structure and function[J]. Int J Mol Sci, 2023, 24(4): 3386. doi: 10.3390/ijms24043386
[11] BHAT P, SHWETHA S, SHARMA D K, et al. The beta hairpin structure within ribosomal protein S5 mediates interplay between domains Ⅱ and Ⅳ and regulates HCV IRES function[J]. Nucleic Acids Res, 2015, 43(5): 2888-2901. doi: 10.1093/nar/gkv110
[12] LUMSDEN T, BENTLEY A A, BEUTLER W, et al. Yeast strains with N-terminally truncated ribosomal protein S5: implications for the evolution, structure and function of the Rps5/Rps7 proteins[J]. Nucleic Acids Res, 2010, 38(4): 1261-1272. doi: 10.1093/nar/gkp1113
[13] GALKIN O, BENTLEY A A, GUPTA S, et al. Roles of the negatively charged N-terminal extension of Saccharomyces cerevisiae ribosomal protein S5 revealed by characterization of a yeast strain containing human ribosomal protein S5[J]. RNA, 2007, 13(12): 2116-2128. doi: 10.1261/rna.688207
[14] ZHOU C Y, WU Q M, ZHAO H B, et al. Unraveling the role of RNA-binding proteins, with a focus on RPS5, in the malignant progression of hepatocellular carcinoma[J]. Int J Mol Sci, 2024, 25(2): 773. doi: 10.3390/ijms25020773
[15] PING Q R, WANG C H, CHENG X, et al. TGF-β1 dominates stromal fibroblast-mediated EMT via the FAP/VCAN axis in bladder cancer cells[J]. J Transl Med, 2023, 21(1): 475. doi: 10.1186/s12967-023-04303-3
[16] GUINN S, KINNY-KÖSTER B, TANDURELLA J A, et al. Transfer learning reveals cancer-associated fibroblasts are associated with epithelial-mesenchymal transition and inflammation in cancer cells in pancreatic ductal adenocarcinoma[J]. Cancer Res, 2024, 84(9): 1517-1533. doi: 10.1158/0008-5472.CAN-23-1660
[17] MORTEZAPOUR M, TAPAK L, BAHREINI F, et al. Identification of key genes in colorectal cancer diagnosis by co-expression analysis weighted gene co-expression network analysis[J]. Comput Biol Med, 2023, 157: 106779. doi: 10.1016/j.compbiomed.2023.106779
-
期刊类型引用(2)
1. 张存莉, 张瑛, 吴进, 刘昌奎. 全身奥硝唑给药及局部盐酸米诺环素给药用于牙种植术后的临床效果. 临床医学研究与实践. 2019(13): 18-19 . 百度学术
2. 叶波阳, 汤自明, 廖仕芬. 牙龈与牙槽嵴修整手术对牙齿修复的影响分析. 中国当代医药. 2018(17): 116-118 . 百度学术
其他类型引用(1)