Az előző heti posztban a klasszifikációig, illetve a címkézésig jutottunk a számítógépes vízió folyamatának bemutatásával. Miután megválaszoltuk, mit kellene keresnünk a képen, a következő kérdés, hogy hol találhatók azok az információk?
3. Detektálás.
A számítógép általában négyzetes területet vagy kört jelöl ki elemzésre, de ez nem mindig megfelelő; a kutya nem szögletes, sem a deszka ebben az esetben, tehát alkalmazkodni kell. Itt előfordulhatnak apró pontatlanságok és hibák, de ezt ellensúlyozza, hogy nem egy információ alapján dönti el az AI, hogy kutya van-e a képen vagy macska, mert ez egy elég robosztus technológia. A színek közötti kontraszt segít a megfelelő terület elemzésében és az abból való következtetésben.
Az utolsó lépés felvet egy nem AI jellegű problémát is, ami nem más, mint a képminőség, de erről a jövő heti, befejező posztba írunk.