摘 要: 提出一种基于均值漂移和层次聚类的二次聚类图像分割算法(MSHC),在CIE(LUV)颜色空间,首先运用均值漂移算法实现图像的平滑及初步聚类,然后将结果中每个区域的均值作为第二次聚类的初始值,对图像进行层次聚类处理至满足预定效果为止.最后,将图像中主动脉所在类的均值作为区域生长的种子点,完成目标提取.该MSHC算法分割效果良好,易于重建主动脉弓三维模型,且模型立体感强,可清晰展现其空间三维结构.
关键词: 均值漂移; 层次聚类; 二次聚类; 主动脉弓; 三维重建
体内流场的监测与评估对于观测动脉粥样硬化、主动脉夹层、动脉瘤等心血管疾病具有重要作用,而建立人体主动脉弓三维模型对于血液动力学研究有指导意义,但就目前的医学测量手段而言,由于人体胸主动脉几何形状的复杂性,仅依靠医疗器械来实现三维模型建立较为困难,只有通过图像处理的方法来得以实现.
基于彩色空间特性的分割一般采取区域分割和聚类的方法来实现[1].其中,模糊聚类法对彩色图像的色相饱和度进行处理,能够快速实现聚类中心的初始化[2];均值漂移法在图像平滑、分割及物体跟踪处理中都得到了较好的结果[3];基于小波分析的k-means聚类分割对骨髓细胞图像的分割效果良好,改善了传统算法误分割、过分割等问题[4];分水岭与区域生长算法结合起来用于彩色图像分割,该算法能够充分利用分水岭和区域生长算法的优势[5].然而模糊聚类算法需要预先定义模糊隶属度函数且处理图像复杂噪声较多的图像时,边缘多呈现出毛刺状,易产生大量孤立点[6];均值漂移算法的准确性易受图像中目标区域大小的影响;分水岭算法中目标的标记提取会影响图像分割效果;k-means算法中聚类数的设定需要先验知识,若选取不当分割效果会很差;区域生长法种子点的选取决定了目标物能否完整分割.
笔者针对彩色人体切片图像,提出了一种基于二次聚类的图像分割方法,通过均值漂移和层次聚类算法完成图像分割处理,以期获得良好的分割效果,建立精确的主动脉弓三维模型.
均值漂移算法(meanshift)本质上是一个自适应的梯度上升搜索峰值的方法,不需要任何先验知识,数据集中的每一点都可作为初始值,对任意形状分布的数据都有效,运用它进行图像分割时,能在保留图像基本特性的基础上将图像分割成一些子区域,减少图像中基本的实体数目[7-8].均值漂移算法目标函数表示为:
M(x)≡,
(1)
式中:G(x)表示任意一个单位核函数,核函数决定了采样点xi与核中心点x之间的相似性度量;w(xi)≥0表示相应样本点xi的权重值;均值漂移算法的收敛点为局部密度极大值点.
假设每个区域用Ci(i=1,2,…)表示,每个区域对应点的颜色向量表示为,,,则区域间的色差为d(Ci,Cj)=‖XCi-XCj‖2.
层次聚类法(hierarchical clustering)是将每一个区域的特征看作是一个类,不同类之间的距离可以有不同的计算方式,根据计算得到的类间距参数合并两个最接近的类,重复此过程,直到结果满足条件为止.根据不同类间距的计算方法不同,分为最小距离法、最大距离法、组平均聚类法和ward法[9-10].
随机选取20个二维点的样本数据,如图1所示,运用最小距离法、最大距离法、组平均法以及ward法对样本数据进行处理,如表1所示.采用欧氏距离计算方法,获得不同的处理结果,如图2所示.
图1 样点数据
Fig.1 Sample data
表1 样本数据和层次聚类算法
Tab.1 Sample data and hierarchical clustering method
样本数据算法P1(023,042)P2(020,045)P3(035,033)P4(033,053)P5(045,030)……P18(030,021)P19(034,016)P20(027,012)dmin(Ci,Cj)=minx∈Ci,y∈Cj‖x-y‖dmax(Ci,Cj)=maxx∈Ci,y∈Cj‖x-y‖davg(Ci,Cj)=1ninj∑x∈Ci∑x∈Cj‖x-y‖dward(Ci,Cj)=ninjni+nj‖ui-uj‖
表1中,类Ci、Cj表示meanshift算法聚类后得到的两个区域,其颜色向量分别为XCi、XCj,大小和均值分别为ni、ui、nj、uj.
最小距离法和最大距离法会因为两个区域中的极端点而使聚类结果出现错误;组平均法和ward法是对整个区域中的所有点进行数据处理,得到的结果能反映两类之间的相似度.笔者采用组平均法对图像进行第二次聚类处理.
图2 不同算法的结果
Fig.2 Result of different methods
笔者提出基于均值漂移算法和层次聚类算法的二次聚类算法(MSHC),最后利用种子区域生长法实现对主动脉弓的分割提取,具体算法步骤,如图3所示.
所用的人体数据来源于美国国立医学图书馆可视人计划男性数据集,共1 878人体切片图像,如图4所示.每张图像像素2 048×1 216,体元大小0.33 mm×0.33 mm×1.00 mm.重建主动脉弓所需要的图像为胸腔部分的161张图像并将其按顺序编号0~160.
考虑到某些外在因素,比如成像设备晃动,会造成图像的偏移,在进行切片成像时,会预先设定一个定位杆,在重建血管前需要对选取的图像参照定位杆进行配准.用Matlab记录每张图像定位杆的偏移量并绘出偏移曲线,如图5所示.对定位杆进行配准,配准前后定位杆对比效果,如图6所示.
图3 算法流程图
Fig.3 Flowchart of the proposed method
图4 人体切片图像样本
Fig.4 Image of human slice
图5 定位杆偏移曲线
Fig.5 The curve of locating rod offset
图6 配准前后
Fig.6 Before registration and after registration
由于RGB颜色空间将色调、亮度、饱和度3个量放在一起表示,通过欧氏距离计算得到的与同一点色差值相同点的颜色很可能不同,在进行颜色分离时容易造成误分离.L*U*V*是一种均匀颜色空间,如果用一个三维向量Xi=(x1i,x2i,x3i)表示彩色图像中的一个像素点,则像素点的色差为dik=‖Xi-Xk‖2.因此可用于测量小的色差,以提高图像分割的效果.
将RGB颜色空间先转换为XYZ颜色空间,如公式(2)所示,再由XYZ颜色空间转换为L*U*V*颜色空间,如公式(3)所示[11]:
(2)
(3)
其中:U′,V′.
式中:R、G、B、X、Y、Z、L*、U*、V*分别为RGB、XYZ、L*U*V*颜色空间的颜色矩阵.
为了验证本文算法的有效性,选取部分组织结构复杂的图像进行不同分割算法处理.在MATLAB环境中对34#、42#、49#、66#的图像分别进行模糊聚类算法(FCM)、k-means聚类算法(k=4)以及本文聚类算法(MSHC)分割处理,如图7所示.算法效果判断依据是能否获得完整主动脉轮廓以及是否利于进一步的后续处理.其中图(b)FCM算法结果中存在大量孤立点,不便于区域生长法的进行;图(c)k-means算法结果不理想,主动脉弓部分存在过分割现象,且图像中存在大量孤立点;图(d)MSHC算法结果较满意,主动脉部分分割完整,且边缘平滑.综合分析这3种聚类算法结果,可以发现FCM算法和k-means算法分割结果中的组织整体性差,而本文提出的算法分割结果较为满意.
对原图像进行剪裁,截取主要部分进行分割处理.图像处理结果如图8所示,其中图8(a)为meanshift算法结果,图8(b)为hierarchical clustering算法结果,图8(c)为区域生长处理结果,图8(d)为特定区域填充结果.
将最终结果导入医学软件3D-DOCTOR中,进行阈值分割,并对其进行表面重建,获取原始的主动脉弓三维模型.用Geomagic软件对模型进行网格优化,如图9所示.
图7 不同算法处理结果
Fig.7 Result of different methods
图8 算法每步的处理结果
Fig.8 Each step of method processing result
图9 三维重建效果图
Fig.9 Effect of 3D reconstruction
笔者通过对彩色图像分割及主动脉弓三维重建的研究,完成了应用二次聚类算法(MSHC)对人体切片图像的分割处理,并建立了主动脉弓三维模型.该模型立体感强,三维效果逼真,可清晰展现其空间三维结构,对于血液动力学的直观研究具有重要意义:一方面在微创介入手术中帮助医生选择合理的导管介入路径与方式,为医生提供介入手术训练平台,提高介入手术的安全与效率;另一方面,血液动力学的研究为血管狭窄等血管疾病的预测及诊断提供了一定的研究基础.
参考文献:
[1] 林开颜,吴军辉,徐立鸿.彩色图像分割方法综述[J].中国图像图形学报,2005,10(1):1-10.
[2] RAJABY E,AHADI M,AGHAEINAIS H,et al. Robust color image segmentation using fuzzy c-means with weighted hue and intensity[J].Digital signal processing, 2016, 5(1):170-183.
[3] COMANICIU D,MEER P.Meanshift:A robust approach toward feature space analysis[J].IEEE trans actions on pattern analysis & machine intelligence,2002,24(24):603-619.
[4] 苏士美,吕雪扬.骨髓细胞图像的小波变换与k-means聚类分割算法[J].郑州大学学报(工学版), 2015,36(4):15-18.
[5] 杨家红,刘杰,钟坚成,等.结合分水岭与自动种子区域生长的彩色图像分割算法[J].中国图象图形学报, 2010,15(1):63-68.
[6] LIU L X,TAN G Z,SOLOMAN M S,et al. Color image segmentation using meanshift and improved ant clustering[J].Journal of central south university,2012,19 (4): 1040-1048.
[7] WANG Ping,LEE D,GRAY AG,et al.Fast meanshift with accurate and stable convergence[J].Journal of machine learning research proceedings track,2007,2(2):604-611.
[8] 周晨曦,梁循,齐金山.基于约束动态更新的半监督层次聚类算法[J].自动化学报,2015,41(7):1253-1263.
[9] 许晓丽.基于聚类分析的图像分割算法研究[D].哈尔滨:哈尔滨工程大学机械工程学院,2012.
[10] OHKURA K,NISHIZAWA H,OBI T,et al.Unsupervised image segmentation using hierarchical clustering[J]. Optical review,2000,7(3):193-198.
[11] 陈中中,张建飞,杨亚茹,等.建立反映心脏内部各腔室结构的数字化三维模型[J].中国组织工程研究, 2014,49(18):7967-7973.
Abstract: A twice clustering method(MSHC) was proposed based on meanshift and hierarchical. Firstly, in the CIE(LUV)color space, meanshift method is used for the first clustering to realize image smoothing and initial clustering. Then,the mean of each region was used as the initial value for the second clustering. And hierarchy clustering was used for the second clustering, which would be stopped until the clustering effect reached the expected effect. Finally, the mean of the aorta region was used as the seed point in the region growing, and the image segmentation was finished. The MSHC method could improve the efficiency and effect of image segmentation, and the aortic arch model had a strong visualizing and realistic sense, which could clearly show the three-dimensional structure.
Key words: meanshift; hierarchical clustering; twice clustering; aortic arch; 3D reconstruction
文章编号:1671-6833(2018)03-0040-05
收稿日期:2017-04-02;
修订日期:2017-07-10
基金项目:国家科技支撑计划项目(2014BAI11BO8-2-02)
中图分类号: TP399
文献标志码:A
doi:10.13705/j.issn.1671-6833.2017.06.025