開始使用計算機視覺

數字影象處理和計算機視覺是一個有趣的領域,因為它位於數學和電腦科學之間。因此,理解基礎知識並使用程式設計來理解該主題非常有用。

數字影象是 2 維或 3 維訊號的離散化。換句話說,數字影象是連續域的畫素或體素的取樣組。

                                        f : R² ⊃ Ω → R

其中 f 是Ω上的數字影象:矩形影象域

為簡單起見,我們只討論二維數字影象,就像 StackOverflow 頭像中的影象一樣。

關於畫素:在我們開始討論影象型別之前,關於畫素值的快速說明。根據經驗,畫素以值 0 開始,其表示無光(黑色),達到 1,最大強度(例如白色),並且它們以整數表示。

二進位制影象: 僅黑白影象。每個畫素為 0 或 1,每個畫素可以用一個位元表示。它們並不是非常普遍地知道,因為它們通常用於科學應用或用於其他影象處理操作,例如掩模。

StackOverflow 文件

二進位制影象示例。 (警告此檔案的影象畫素值不一定是二進位制,這是用於演示,這也是 Lena,影象處理世界的明星)

灰度影象: 藉助線上過濾器,每個人都能很好地瞭解這些影象。這些影象通常是每畫素一個位元組,0 為黑色,255 為白色,兩者之間的所有內容都是不同的灰色,因為人類只能區分 40 種灰度,這個範圍對於許多應用來說已經足夠了(注意這些值)這裡的畫素對映從 0 到 1 到位元組值 0 - 255)

StackOverflow 文件

彩色影象: 最後,最常見的數字影象型別,彩色影象。我們在這裡必須提到渠道的概念。數字影象也具有通道,實際上,上述二進位制和灰度影象也具有通道。最常見的描述是 RGB(紅 - 綠 - 藍)模型,在這種情況下,影象有 3 個通道(不要將它與尺寸混淆,這些仍然是 2D 影象)來描述影象的紅色,藍色和綠色。在這種情況下,每個畫素是一個三元組,值介於 0 - 255(無紅色至大多數紅色),0 - 255(無綠色至大多數綠色),0 - 255(無藍色至最藍色)之間。對於此模型,畫素{0,0,0}為黑色,{255,255,255}為白色,{255,0,0}為紅色,{255,255,0}為黃色。但是,顏色是一個非常廣泛的主題,你可以檢視參考資料以獲取更多資訊。

StackOverflow 文件

超光譜影象:

在我們討論了頻道之後,談論高光譜影象更容易。這些影象可以有數百個通道,通常用於顯微鏡,衛星成像等。

閱讀

  1. 訊號取樣: https//en.wikipedia.org/wiki/Sampling_(signal_processing)

  2. 數字影象處理聖經:RC Gonzalez,RE Woods:數字影象處理。第三版,Pearson Prentice Hall,Upper Saddle River,2008。

  3. 計算機視覺評論(直到深度學習):R。Szeliski:計算機視覺:演算法和應用。施普林格,紐約,2010 年。

  4. 要了解二進位制,灰度,彩色影象: https//en.wikipedia.org/wiki/Grayscale