基于Kmean的乳腺腫塊檢測方法
乳腺分割
本文引用地址:http://www.j9360.com/article/184614.htm在對圖像進行了去除背景、胸肌、標記以及噪聲后,為了更好的提取乳腺區域的特征,我們需要將乳腺區域提取出來。
本文提取乳腺區域的方法是:首先,將圖像在垂直方向上等間隔分成11份;其次,在水平方向上的每一個間隔內每隔50個像素從背景區域向乳腺區域進行搜索,直到找到離乳腺區域最近的點;然后,將每個間隔內得到的點按照三次樣條插值連接起來,這樣就將乳腺區域的邊界找出來了;最后,根據一定的閾值將邊界外的背景區域去除,以此完成乳腺區域的分割。
提取感興趣區域
為了得到感興趣區域(ROI),本文采用了無監督聚類方法Kmean。起初我們對每幅圖像應用Kmean時采用的K值是不同的,是根據經驗值得到的。通過這些經驗值得到的結論是:如果腫塊的面積比較大且灰度值比較大,則采用的K值較小,反之,如果腫塊的面積比較小,則采用的K值比較大。為此,我們采用的是一種自適應K值的Kmean聚類方法。
傳統Kmean算法
Kmeans算法[7]的工作過程如下:首先從n個數據對象任意選擇K個對象作為初始聚類中心,而對所剩下的其他對象,則根據他們與這些聚類中心的相似度,分別將他們分配給與其最相似的聚類。然后,再計算每個所獲新聚類中心,不斷重復這一過程直到標準測度函數開始收斂為止。一般都采用均方差作為標準測度函數,具體定義如下:

其中,p代表對象空間中的一個點,mi為聚類的均值。
改進的Kmean算法
楊善林[8]等人構造了距離代價函數,并以距離代價最小準則求解最佳聚類數K。距離代價函數為:

其中,m為全部樣本的均值,p代表對象空間中的一個點,mi為聚類的均值
該方法的原理是:首先,根據經驗規則計算和確定最優解的上界,其中n為輸入的數據個數;其次,用Kmean算法實現所有數目下的空間聚類;然后,根據距離代價函數分別計算不同聚類數目K下的F(S,K)值;最后,搜尋距離代價函數最小的F(S,K),并記下相應的K值。
提取ROI
由于腫塊的灰度值與正常組織不同,所以我們提取的特征包括每個像素點的灰度值以及以該像素點為中心的4,8連通區域的均值,窗口內的均值。將這些特征作為Kmean的輸入,K值根據改進的Kmean方法獲得。根據腫塊亮度比較大的特點,將每幅圖像中灰度值比較大的簇提取出來,作為感興趣區域(ROI)。
經過Kmean聚類后得到的感興趣區域如圖3所示。其中紅色曲線表示得到的感興趣區域。由圖可以看出來,提取的ROI中均存在假陽性區域。

由于通過Kmean得到的ROI并不都是腫塊,所以需要提取可以表征腫塊的特征。形態學特征已廣泛應用于醫學圖像的目標檢測。因此,通過對得到的ROI的二值圖像中的獨立區域提取形態學特征,將ROI進行進一步的分類。在本文中我們主要用的特征包括:面積(Area),離心率(Eccentricity),圓形度(Circularity),可靠性(Solidity)以及占空比(Extent)。
評論