Cell 2019 | 深度学习揭示全身癌症转移和治疗性抗体靶向
🗒️Cell 2019 | 深度学习揭示全身癌症转移和治疗性抗体靶向
type
status
date
slug
summary
tags
category
icon
password
comment
😀
这篇论文介绍了一种名为DeepMACT的深度学习管道,用于全面分析癌症转移和治疗性抗体靶向
Cell 2019 | Deep Learning Reveals Cancer Metastasis and Therapeutic Antibody Targeting in the Entire Body
作者单位是德国Institute for Tissue Engineering and Regenerative Medicine (iTERM), 下面作者对文章的贡献相同: Chenchen Pan, Oliver Schoppe, Arnaldo Parra-Damas.
notion image
  • 论文标题:Learning Reveals Cancer Metastasis and Therapeutic Antibody Targeting in the Entire Body
 

📝Introduction|深度学习揭示全身癌症转移和治疗性抗体靶向

研究背景(Background):

癌症的转移过程极其复杂,几乎涉及全身各器官。大多数癌症患者死于远端转移灶,这些灶由具有原发或获得性耐药性的播散癌细胞发展而来。 要更深入理解转移机制以及药物靶向效果,必须能在整体动物模型中全面、无偏差地检测癌细胞及治疗药物

研究问题和动机(Gap & Motivation):

当前缺乏可可靠检测小范围甚至单个癌细胞的全身成像技术,主要因为传统荧光蛋白(GFP/YFP/mCherry)在组织高自发荧光下信噪比低。人工标注高分辨率全身图像成本极高(数月/只小鼠),传统基于滤波器的3D检测器存在高误报与漏报问题,尤其因不同组织对比度差异显著。亟需一种高灵敏、高通量、低人为干预的成像与分析手段,来大规模研究肿瘤转移及靶向治疗的效果。

研究内容与贡献(Objective & Contribution):

  1. 为了解决上述问题,研究构建了一套基于深度学习和vDISCO成像的全自动分析流程——DeepMACT。(做了什么工作)
  1. 具体而言DeepMACT是一个深度学习模型集合,vDISCO 技术可将荧光信号放大100倍以上,有效提升成像灵敏度。结合 CNN 的图像分析算法,,用于自动量化转移,提升自动识别转移灶的准确性与效率。。(方法效果怎么样,解决了什么问题)
  1. 通过 DeepMACT 在包括乳腺癌、肺癌和胰腺癌在内的5种不同转移性癌症模型中进行量化,这些癌症具有不同的器官趋向性。并成功评估了抗 CA XII 抗体的转移灶靶向效率。(有什么结果,发现重要吗)
notion image
 

🗺️方法

小鼠模型

  • Spontaneous breast cancer metastasis model
  • Estrogen positive breast cancer model and brain metastatic lung cancer model
  • Pancreatic cancer model
Model Type
中文名称
小鼠品系
关键特征
Spontaneous breast cancer metastasis model
自发性乳腺癌转移模型
NSG (NOD/SCID/IL2Rγ KO) mice(NSG免疫缺陷小鼠)
- 高度免疫缺陷(T/B/NK细胞缺失)- 适用于人源肿瘤异种移植(PDX)- 采用原位乳腺脂肪垫注射(MDA-MB-231细胞)或心内注射研究转移
Estrogen positive breast cancer model and brain metastatic lung cancer model
雌激素阳性乳腺癌模型 & 脑转移性肺癌模型
NMRI nu/nu mice(NMRI无胸腺裸鼠)
- T细胞缺陷,B/NK细胞部分保留- 心内注射MCF-7(雌激素依赖)H2030-BrM3(肺癌脑转移)- 需监测生物发光信号
Pancreatic cancer model
胰腺癌模型
Wild-type C57BL/6 mice(野生型C57BL/6小鼠)
- 免疫系统完整- 原位胰腺注射(KPC来源的R254细胞)- 适合研究肿瘤微环境与免疫互作
 

数据标注

数据注释分为自动标注和人工修正两个阶段,自动标注使用自定义滤波器和3D卷积进行初步标注,随后专家通过开发的交互式工具进行快速修正。为了提高标注一致性,数据集的部分内容进行了多次标注和人工复核,重点修正漏标的转移瘤(假阴性)。最终,结合深度学习和人工修正,生成了高质量的标注数据。通过开发工具将注释时间从几个月缩短至150个工时。
 

基于深度学习的转移检测

DeepMACT 模型架构

该模型灵感来源于U-Net,采用7层的编码-解码结构。每一层包含跳跃连接、卷积操作、批归一化(Batch Normalization)和ReLU激活函数。编码单元通过最大池化操作将分辨率减半,解码单元通过空间上采样和与相应编码单元的特征拼接进行处理。最终解码器将输出映射为二维空间的logits。
 
notion image
 
 

自定义3D U-Net的实现

为了与DeepMACT进行比较,采用了3D U-net版本,将2D卷积替换为3D卷积。最佳表现的模型使用3层编码-解码单元,最大特征通道数为48,此外还有不同参数的其他变种
 

训练集、验证集和测试集(划分)

采用k折交叉验证(k=5)方法,将数据集划分为训练/验证集(80%)和测试集(20%)。训练和验证集用于优化模型超参数,以避免过拟合。数据仅限于小鼠躯干内的子体积,排除了主肿瘤、辅助淋巴结和受污染的数据,占总扫描体积不到1%。数据划分在子体积级别进行,以避免信息泄漏。
 

训练过程

  • 训练流程
    • 初步训练:通过k折交叉验证(k=5)训练多个模型,测试不同超参数,进行10个epoch的训练。
    • 优化超参数:选择表现最佳的超参数,继续训练剩余epoch,直到40个epoch。
  • 数据增强:使用随机垂直和水平翻转来增强数据多样性。
  • 输入归一化:根据局部子体积峰值归一化效果最好。
  • 损失函数:采用加权二进制交叉熵,前景(FG)像素权重较大,以应对类别不平衡。
  • 训练数据优化:仅使用包含前景的90%训练数据,提升验证集表现。
  • 优化器和学习率
    • 使用Adam优化器,初始学习率为10^-4。
    • 每2个epoch损失不下降时,学习率降低10倍,最小至10^-7。
  • 训练时间:40个epoch训练时间约为20-30分钟,使用NVIDIA Titan XP GPU的工作站。

测试和过程推理模式

  • 研究采用了k折交叉验证,k=5
  • 训练好的算法用于生成来自三个投影视角(PXY、PYZ、PZX)的概率掩膜,每个像素值表示网络对该像素是否为转移的信心。通过将三个二维概率掩膜组合成三维空间,得到了最终的分割掩膜。默认的置信度阈值设置为50%
  • 使用连通组件分析找出并分割出转移区域。
 
notion image
 
 

性能评估

  • 采用F1分数进行性能评估,F1分数结合了精准度(预测为正的正确比例)和召回率(实际为正的正确预测比例),等同于Sørensen–Dice系数,常用于图像分割任务
  • 性能评估使用全体测试集,并通过自助法(n=1000次重采样)估算结果的变异性。通过与人工标注者绘制的三维轮廓比较,验证了转移癌的三维分割的准确性,最差分割的重叠精度为90%,90%的转移癌的分割精度达到97.5%以上。
 

转移灶分析

器官配准 | 手动分割感兴趣的区域

  • 使用Fiji软件手动分割感兴趣器官(肺、脑、肾、心脏、肝脏)的3D轮廓。
  • 采用自定义Python脚本检测转移灶质心是否位于这些器官的3D分割中,未归属的转移灶标记为“躯干其他部分”。
  • 计算肺部体积,并评估肿瘤密度,作为转移灶在肺部的比例。
 

药物靶向分析

  • 通过分析转移灶内与周围区域的荧光信号分布,评估6A10抗体的靶向效果。
  • 计算转移灶内外信号强度的比值(抗体信号比率),若比率大于1,表示靶向效果显著。
  • 使用Welch t检验评估转移灶与周围区域信号强度差异。
 

荧光信号特征分析

  • 研究不同激发波长下的荧光信号轮廓(470 nm, 561 nm, 647 nm)。
  • 对肺部转移灶使用uDISCO和vDISCO清除后进行图像采集,分析信号与背景的信号比(SBR)。
  • 标准化后的信号轮廓进行比较,绘制代表性图表。
 

转移灶直径与血管距离

  • 手动验证转移灶的直径。
  • 随机选择转移灶边界的10个点,测量到最近血管的距离,计算平均值,生成转移灶与血管的距离散点图。
 

🍎结果

notion image

光学透明化小鼠癌症转移的 vDISCO 成像 | 成像效果

通过移植表达荧光标记的肿瘤细胞,结合 vDISCO 荧光增强技术光片显微镜成像,研究者在全身水平上可视化了单个微转移灶。随后,利用深度学习算法对整个小鼠的3D图像堆栈进行分析,自动检测和分割癌细胞信号,显著提升了微小病灶识别的灵敏度和空间分辨率,优于传统生物发光成像方法。

深度学习用于检测和量化转移 | 分割性能对比

  • DeepMACT使用类似U-net的CNN架构,通过编码和解码单元提取癌症特征并进行像素级分割
  • 通过与传统滤波器检测方法和人工标注员进行对比,DeepMACT在转移检测上表现优异,F1分数达到80%,接近人类专家的表现,并显著提高了检测速度。
  • DeepMACT能够在几个小时内完成通常需要几个月的工作,大大提高了工作效率。该方法支持调整精度与召回率的平衡,适应不同需求,提高了检测的灵活性和实用性。
 
 
notion image
 
notion image
 
 

DeepMACT在不同肿瘤模型中可靠检测微转移灶 | 不同组织、时间点及多种肿瘤模型中的表现

DeepMACT 技术在整鼠体内高灵敏度检测微转移瘤(micrometastases)的能力,涵盖其在不同组织、时间点及多种肿瘤模型中的表现。DeepMACT 不仅可定量分析微转移灶的空间分布、大小及细胞数,还能胜任传统成像方法难以实现的器官区域(如脑、骨)的检测,提升了对肿瘤转移过程的理解和追踪能力。
  • 研究者使用该方法对整只小鼠进行分析,发现 520 个微转移瘤,其中 306 个在肺部。大部分微转移瘤位于 深层组织,距离表面约 1 cm,这使得传统方法难以检测。
  • 肺部的微转移瘤在 所有肺叶 中均匀分布,且与 大小无关,表明这些微转移瘤是由多个独立转移事件所形成。此外,微转移瘤的大小差异较大,虽然大部分彼此距离较近(<1 mm),但也存在 最大距离达 9.3 mm 的孤立病灶
  • 进一步分析发现,很多微转移瘤的 细胞数仅为几百个或更少,直径 小于 50–100 μm,这些微转移瘤非常难以通过传统方法被检测到。同时,肺部转移灶的负荷远大于躯干,且 肺部微转移瘤平均比躯干大 30%,细胞数是躯干的 2 倍以上
  • 为验证 DeepMACT 的准确性,研究者首先进行了负对照实验,发现肿瘤细胞在未形成转移前,透明化过程不会导致伪阳性。
  • DeepMACT 可在不同鼠种、肿瘤类型中有效检测转移灶,包括免疫缺陷和免疫正常小鼠。测试了三种不同肿瘤模型:
    • MCF-7 模型:肺、肝、肾、骨、脑均有转移
    • R254 模型:主要在肺、肝和腹膜
    • H2030-BrM3 模型:脑为主要转移位点(31 个灶)
  • 研究者进一步研究了转移过程在不同时间点的演变,使用 MDA-MB-231 乳腺癌细胞注射到小鼠心腔后,分别在 2天、6天和14天 时分析,结果显示,转移灶数量随着时间的推移持续增加,且肺部始终是转移最集中的器官。
 
notion image
 

DeepMACT 揭示单个微转移灶水平的治疗性抗体靶向情况 | 抗体分布全身定量分析结果

  • 研究对象为靶向人类碳酸酐酶 XII(CA12)的单克隆抗体 6A10,已知具有抑制肿瘤生长及增强化疗敏感性的作用。实验中,研究者在移植 MDA-MB-231 乳腺癌细胞 9 周后,通过静脉注射给予 20 μg Alexa-568 标记的 6A10,并于 2 天后取材分析其分布。
  • 抗体 6A10 可有效聚集于原发肿瘤和某些转移灶(如腋下淋巴结和肺部)。
  • 但不是所有微转移灶都能被抗体靶向,存在异质性(例如肺内部分靶向成功,部分没有)。肺部微转移灶中,85% 被成功靶向;而其他部位66%;抗体信号在肺部灶中更集中,分布也更均匀。
  • 大小相关性:大尺寸微转移灶更可能被抗体靶向(88%);小尺寸灶的靶向率则为 67%。
  • 非特异性结合:尽管抗体不与小鼠 CA12 结合,但仍观察到一些 off-target 结合,推测是非特异性结合造成的。
notion image
notion image
 
 

抗体药物未能完全靶向微转移灶(micrometastases)的潜在机制

  • 抗体药物在某些情况下未能靶向多达 23% 的微转移灶。研究的目标是理解这种“漏靶”现象的可能机制。
  • 研究者考虑是否因为某些微转移灶没有邻近的血管,导致药物无法输送到位。他们使用 lectin 染色对肺部组织进行标记分析,发现所有的微转移灶都靠近血管,距离仅为 1–6 μm,远小于一个细胞直径(~10 μm)。因此,药物输送路径不足不是主要问题
  • 研究者转向分析肿瘤微环境是否影响抗体药物的靶向能力。利用深度学习方法(DeepMACT)研究靶向灶与未靶向灶在空间上的分布关系。结果表明,靶向成功的灶更容易聚集在一起(平均距离 ~0.8 mm),而未靶向灶则分布更分散(距离 ~1.7–2.0 mm)。这种非随机分布提示,某些局部微环境可能会影响抗体的识别或渗透。
 

🐿️结论

 

🤗心得体会

  1. 不是分割完了就完事了,分析其实占了工作量的大多数。
  1. mouse whole body的分析结果才是我们最应该关注的,但是限制于存储和计算成本,只能先把大图打伞,在小的图上做,最后拼接,这些都是时间成本。
  1. 也需要注意不同方法处理时间开销的比较,不要偷懒。
  1. 结果部分至少应该是4~5小段,在写的时候可以是预期的结果。
 

引用

 
 

下期预告

💡
下期预告:
Chen, Y., Al-Maskari, R., Horvath, I., Ali, M., Hoher, L., Yang, K., ... & Erturk, A. (2025). SELMA3D challenge: Self-supervised learning for 3D light-sheet microscopy image segmentation. arXiv preprint arXiv:2501.03880.
 
bioRxiv 2024|深度学习与三维成像揭示肥胖对全身的影响使用NotionNext搭建博客网站
Loading...