數位影像的類別
- Binary : 二值化影像,影像像素值非 0 即 1,在影像顯示中 0 表示黑色、1 代表白色
- Grayscale : 灰階影像,影像像素值在
[0~255]
之間,像素值越大越接近白色 - Color : 彩色影像,常見的是 RGB 和 CMYK,RGB 彩色影像是由紅、綠、藍三個色彩通道組合而成。CMYK 則是由青色(Cyan)、洋紅色(Magenta)、黃色(Yellow)、黑色(blacK)四個通道組成。
影像解析度
- dpi:Dots Per Inch,每英寸點數,dpi 的數值越高,所輸出的解析度就越高,常用在印表機上的設定
影像轉換
變換矩陣 transformation matrix
對原 x,y 座標進行縮放
角度轉換
矩陣可以做多重轉換:
$ p’=R_2R_1Sp $
其中 p 是座標點,$R_1 R_2 是角度轉換矩陣,S是縮放矩陣,p’是轉換後的座標點$
多重轉換的細節:
- 矩陣變換是由右到左做變換
- 上列式子與 $ p’=R_2(R_1(Sp)) $ 相等
- 也與$ p’=(R_2R_1S)p $ ,先做矩陣變換運算,再與座標變換
齊次坐標 Homogeneous coordinates
- 變換矩陣可以做縮放、旋轉,但卻不能加上常量進行平移
- 解決方法:每個向量末端加上”1”
新的轉換矩陣可以旋轉、縮放,還可以平移了,讚
齊次坐標上的影像縮放
為何在加上每個向量末端加上”1”就可以進行縮放?
原因是在:我們也許想透過除法的方式達到縮放的效果,但實際上矩陣運算並不能直接做除法運算,因此將他轉換為齊次座標,再進行除法運算
用圖片來解釋比較清楚:
有個座標點為$ [x, y] = [15, 21] $,今天想將它縮小3倍,
我們透過齊次座標的方式把$[x, y]$改寫成$[x, y, w] = [15, 21, 3]$
其中的$W$把它想像成是我們的投影機距離
將整個矩陣除與 3,$[ \frac{15}{3}, \frac{21}{3}, \frac{3}{3}] = [5, 7, 1]$
就是在上面的圖片中將投影機向前推進到$W=1$的位置
因此座標位置也跟著等比例縮小了