cs131 lecture 5 Features And Fitting-RANSAC

線段檢測的難題

RANdom SAmple Consensus，隨機抽樣一致
將資料分成 inliers(正常數據), outliers(異常數據)
RANSAC 目標：濾除異常數據，使用正常的數據進行檢測

直覺來看，在線段檢測中，若選擇的 edge 是 outliers 進行擬合時，其他點應該不會在所擬合的線段上

隨機選取兩點得到直線後，藍色點為靠近線段的 inliers，紫色點為遠離線段的 outliers

循環 k 次迭代：

參數符號定義：

選擇較高的迭代次數$k$來讓找到 inliers 的機率提高

假設演算法跑完$k$次成功機率為$p$

$1-p = (1-w^n)^k$

$p = 1-(1-w^n)^k$

$當n不變時、k越大、p越大，其中p自行定義$

更新迭代次數$k$公式：

$k=\frac{log(1-p)}{log(1-w^n)}$

改善 RANSAC 效率方法：

RANSAC 優缺點：

優點
- 通用方法適合各種擬合問題
- 好實現
缺點
- 對於資料集中 outliers 數量變多時，時間成本會大幅提升，真實問題通常都有較大佔比的 outliers(可能的解決方法：隨機選擇資料集中的子集合)
- 非確定性算法：每次跑完結果可能不一樣，但會在一定機率下跑出合理的結果