Konvolucijske nevronske mreže (CNN) so bile najprej zasnovane za namene prepoznavanja slik na področju računalniškega vida. Ta omrežja so specializirana vrsta umetne nevronske mreže, ki se je izkazala za zelo učinkovito pri analizi vizualnih podatkov. Razvoj CNN-jev je vodila potreba po ustvarjanju modelov, ki bi lahko natančno klasificirali in kategorizirali slike, njihov uspeh na tem področju pa je vodil do njihove široke uporabe v različnih drugih aplikacijah, kot so zaznavanje objektov, segmentacija slik in celo obdelava naravnega jezika.
CNN se zgleduje po strukturi in funkcionalnosti vidne skorje v človeških možganih. Tako kot vidna skorja so tudi CNN sestavljeni iz več plasti medsebojno povezanih nevronov, ki obdelujejo različne vidike vhodnih podatkov. Ključna inovacija CNN-jev je v njihovi zmožnosti samodejnega učenja in izločanja ustreznih funkcij iz slik, kar odpravlja potrebo po ročnem načrtovanju funkcij. To dosežemo z uporabo konvolucijskih plasti, ki na vhodno sliko uporabijo filtre za zaznavanje različnih vizualnih vzorcev in značilnosti, kot so robovi, vogali in teksture.
Prvi preboj v CNN je prišel z uvedbo arhitekture LeNet-5 s strani Yanna LeCuna et al. leta 1998. LeNet-5 je bil posebej zasnovan za prepoznavanje rokopisnih števk in je dosegel izjemno zmogljivost na naboru podatkov MNIST, primerjalnem naboru podatkov, ki se pogosto uporablja za ocenjevanje algoritmov za prepoznavanje slik. LeNet-5 je pokazal moč CNN-jev pri zajemanju hierarhičnih značilnosti iz slik, kar omogoča natančno klasifikacijo tudi ob prisotnosti variacij v merilu, vrtenju in prevajanju.
Od takrat so se CNN-ji znatno razvili z razvojem globljih in kompleksnejših arhitektur. Eden pomembnih napredkov je bila uvedba arhitekture AlexNet s strani Alexa Križhevskyja in drugih. leta 2012. AlexNet je dosegel preboj v klasifikaciji slik z zmago na tekmovanju ImageNet Large Scale Visual Recognition Challenge (ILSVRC) z bistveno nižjo stopnjo napak v primerjavi s prejšnjimi pristopi. Ta uspeh je utrl pot široki uporabi CNN-jev pri nalogah prepoznavanja slik.
CNN so bili uspešno uporabljeni tudi pri drugih nalogah računalniškega vida. Na primer, pri zaznavanju objektov se lahko CNN kombinirajo z dodatnimi plastmi za lokalizacijo in razvrstitev predmetov znotraj slike. Slavna regionalna konvolucijska nevronska mreža (R-CNN), ki so jo predstavili Ross Girshick et al. leta 2014 je primer takšne arhitekture. R-CNN je dosegel najsodobnejše rezultate pri merilih uspešnosti zaznavanja objektov, tako da je izkoristil moč CNN-jev za ekstrakcijo funkcij in jih združil z metodami predlogov regij.
Konvolucijske nevronske mreže so bile najprej zasnovane za naloge prepoznavanja slik na področju računalniškega vida. Revolucionirali so področje s samodejnim učenjem ustreznih funkcij iz slik, s čimer so odpravili potrebo po ročnem načrtovanju funkcij. Razvoj CNN-jev je vodil do znatnega napredka pri klasifikaciji slik, zaznavanju objektov in raznih drugih nalogah računalniškega vida.
Druga nedavna vprašanja in odgovori v zvezi EITC/AI/ADL Napredno poglobljeno učenje:
- Zakaj moramo uporabiti optimizacije v strojnem učenju?
- Kdaj pride do prekomernega opremljanja?
- Ali lahko konvolucijske nevronske mreže obravnavajo zaporedne podatke z vključevanjem konvolucij skozi čas, kot se uporabljajo v modelih konvolucionarnega zaporedja v zaporedje?
- Ali se generativna kontradiktorna omrežja (GAN) zanašajo na idejo generatorja in diskriminatorja?