0%

cs131 lecture 10 Clustering- mean-shift clustering

論文名稱:Mean Shift, Mode Seeking, and Clustering

流程:

  1. 隨機初始化起點與視窗$h$
  2. 計算中心重心
  3. 移動搜索視窗到重心位置
  4. 重複步驟2~3直到收斂

重心計算公式:

其中$x是輸入的資料集,x={x_1,x_2…x_k},x_i是第i個資料$

$S_h是視窗半徑為h$的區域

mean shift 演算法範例:

圖(1)~(3)計算重心並移動,移動幅度(1)>(2)>(3),圖(4)收斂

特性

  • Unsupervised learning
  • 跟k-means不同的是,不用先假設資料有幾群
  • 調整一個視窗大小參數,並且具有物理意義,視窗大小代表中心的搜索範圍,但視窗範圍會影響到輸出結果
  • 對outliers具有穩健性
  • 資料維度越高,運算越巨大

參考

ML - Clustering Mean Shift Algorithm