【喜报】同济大学附属同济医院眼科学科交叉团队成果发表于计算机科学领域旗舰期刊《Information Fusion》
2024-06-20
人工智能技术在眼底病识别中已展现出巨大应用潜力和良好的实践应用效果,尤以糖尿病视网膜病变(DR)的特征性AI识别为代表。2019年,中国医药教育协会智能医学专委会智能眼科学组在《中华实验眼科杂志》发布《基于眼底照相的糖尿病视网膜病变人工智能筛查系统应用指南》,指南指出眼底AI筛查对DR可做到早期发现、定性评估和分析、及时干预,对于保留患者视功能、提高患者生活质量、降低DR医疗负担具有重要意义。
以糖尿病视网膜病变为例,其基于眼底图像能表现出显著的特征性病变(例如:微血管瘤、硬性渗出等),能够使得AI快速学习,而其他基于视神经乳头变化的疾病(例如青光眼、视神经炎等),其眼底图像变化相对欠显著。许多现有的视神经乳头检测方法也难以在新数据集上取得令人满意的效果,使其成为了人工智能眼底图像疾病识别中的难点。此外,不同眼底图像设备(例如:手持式眼底照相机、台式眼底照相机等)产生的眼底图像质量参差不齐,使得疾病诊断存在客观上的“盲区”,尤以视神经乳头部位的变化难以清晰辨识。因此,兼容质量较差的眼底图像同时能够精确检测视神经乳头的人工智能算法是实现以视神经乳头为代表眼病AI识别的首要目标,对于完善基层基于彩色眼底照相的AI辅助诊断系统在眼底病变中的筛查具有重要意义。
为了解决上述痛点,团队首先发布了一个大规模的眼底图像数据集TongjiU-DROD,该数据集包含由两种眼底照相机拍摄的不同分辨率的眼底照片(手持式眼底照相机和蔡司眼底照相机),并附有手动标注的像素级真值。其次,提出了ODFormer,一种基于Swin Transformer的新型语义分割网络。该网络首先利用多尺度上下文聚合器提取丰富的多维度语义特征,随后通过集成附加卷积层提取的相对位置偏差图来改进自注意力计算中的位置编码。最后,基于UPerNet设计的解码器引入了轻量级双向特征校准器,有效减少了上采样和特征图融合过程中可能导致的高维度空间信息丢失。本研究分别在TongjiU-DROD、DRIONS-DB、DRISHTI-GS1三个眼底图像数据集上对ODFormer的性能进行了综合评测。实验结果表明,ODFormer的性能,尤其是泛化能力,优于其他现有的语义分割网络。与上述工作相关的源代码和数据集在《ODFormer: Semantic Fundus Image Segmentation Using Transformer for Optic Nerve Head Detection》文章中公开。
本论文通讯作者为同济大学附属同济医院眼科毕燕龙教授和同济大学电信学院范睿教授。第一作者为2024届人工智能专业本科毕业生王佳艺同学,同济大学2023届眼科学毕业生马晓宇作为第三作者参与该项合作课题。