Katere so ključne komponente konvolucijske nevronske mreže (CNN) in njihove vloge pri nalogah prepoznavanja slik?

by Akademija EITCA / Torek, 08 avgust 2023 / Objavljeno v Umetna inteligenca, EITC/AI/DLTF poglobljeno učenje s TensorFlow, Konvolucijske nevronske mreže v TensorFlowu, Konvolucijske nevronske mreže s TensorFlow, Pregled izpita

Konvolucijska nevronska mreža (CNN) je vrsta modela globokega učenja, ki se pogosto uporablja pri nalogah prepoznavanja slik. Zasnovan je posebej za učinkovito obdelavo in analizo vizualnih podatkov, zaradi česar je močno orodje v aplikacijah za računalniški vid. V tem odgovoru bomo razpravljali o ključnih komponentah CNN in njihovih vlogah pri nalogah prepoznavanja slik.

1. Konvolucijski sloji: Konvolucijski sloji so gradniki CNN. Sestavljeni so iz nabora učljivih filtrov ali jeder, ki se zvijejo z vhodno sliko za izdelavo zemljevidov funkcij. Vsak filter zazna določen vzorec ali funkcijo na sliki, kot so robovi, vogali ali teksture. Operacija konvolucije vključuje drsenje filtra čez sliko in izračun pikčastega produkta med utežmi filtra in ustreznim zaplatom slike. Ta postopek se ponovi za vsako lokacijo na sliki, pri čemer se ustvari zemljevid značilnosti, ki poudarja prisotnost različnih značilnosti.

Primer: Vzemimo filter 3×3, ki zazna vodoravne robove. Ko se zvije z vhodno sliko, bo ustvaril zemljevid funkcij, ki poudarja vodoravne robove na sliki.

2. Združevanje plasti: Združevanje plasti se uporablja za znižanje vzorčenja zemljevidov funkcij, ki jih ustvarijo konvolucijske plasti. Zmanjšajo prostorske dimenzije zemljevidov funkcij, hkrati pa ohranijo najpomembnejše informacije. Najpogosteje uporabljena operacija združevanja je največje združevanje, ki izbere največjo vrednost v oknu združevanja. To pomaga zmanjšati računalniško kompleksnost omrežja in ga naredi bolj robustnega za majhne prostorske variacije v vhodni sliki.

Primer: uporaba največjega združevanja z oknom združevanja 2×2 na zemljevidu funkcij bo izbrala največjo vrednost v vsaki neprekrivajoči se regiji 2×2, s čimer se bodo prostorske dimenzije dejansko zmanjšale za polovico.

3. Aktivacijske funkcije: Aktivacijske funkcije uvajajo nelinearnost v CNN, kar mu omogoča učenje kompleksnih vzorcev in napovedovanje. Najpogosteje uporabljena aktivacijska funkcija v CNN je popravljena linearna enota (ReLU), ki izračuna izhod kot največjo vrednost nič in vhod. ReLU ima prednost zaradi svoje preprostosti in zmožnosti ublažitve težave z izginjajočim gradientom.

Primer: če je izhod nevrona negativen, ga ReLU nastavi na nič, kar dejansko izklopi nevron. Če je rezultat pozitiven, ga ReLU ohrani nespremenjenega.

4. Popolnoma povezani sloji: Popolnoma povezani sloji so odgovorni za izdelavo končnih napovedi na podlagi ekstrahiranih funkcij. Vzamejo sploščene zemljevide funkcij iz prejšnjih plasti in jih prenesejo skozi vrsto popolnoma povezanih nevronov. Vsak nevron v popolnoma povezani plasti je povezan z vsakim nevronom v prejšnji plasti, kar mu omogoča učenje zapletenih odnosov med značilnostmi in natančno napovedovanje.

Primer: v nalogi prepoznavanja slik ima lahko popolnoma povezana plast nevrone, ki ustrezajo različnim razredom, kot so "mačka", "pes" in "avto". Izhod popolnoma povezane plasti je mogoče interpretirati kot verjetnost, da vhodna slika pripada vsakemu razredu.

5. Funkcija izgube: Funkcija izgube meri neskladje med predvidenimi izhodi in osnovnimi oznakami resnice. Kvantificira, kako dobro CNN deluje pri obravnavani nalogi, in zagotavlja signal za posodabljanje parametrov modela med usposabljanjem. Izbira funkcije izgube je odvisna od specifične naloge prepoznavanja slike, kot je binarna navzkrižna entropija za binarno klasifikacijo ali kategorična navzkrižna entropija za večrazredno klasifikacijo.

Primer: V nalogi binarne klasifikacije binarna navzkrižna entropijska izguba primerja predvideno verjetnost pozitivnega razreda z resnično oznako (0 ali 1) in kaznuje velika odstopanja med njima.

Konvolucijska nevronska mreža (CNN) je sestavljena iz konvolucijskih plasti, plasti združevanja, aktivacijskih funkcij, popolnoma povezanih plasti in funkcije izgube. Konvolucijski sloji izvlečejo pomembne funkcije iz vhodne slike, medtem ko združujoči sloji znižujejo vzorec zemljevidov funkcij. Aktivacijske funkcije uvedejo nelinearnost, popolnoma povezane plasti pa naredijo končne napovedi. Funkcija izgube meri neskladje med predvidenimi izhodi in osnovnimi oznakami resnice, kar vodi proces usposabljanja.

Druga nedavna vprašanja in odgovori v zvezi Konvolucijske nevronske mreže v TensorFlowu:

Več vprašanj in odgovorov:

Polje: Umetna inteligenca
Program: EITC/AI/DLTF poglobljeno učenje s TensorFlow (pojdite na certifikacijski program)
Lekcija: Konvolucijske nevronske mreže v TensorFlowu (pojdite na povezano lekcijo)
Tema: Konvolucijske nevronske mreže s TensorFlow (pojdite na sorodno temo)
Pregled izpita

Označeni pod: Umetna inteligenca, CNN, Računalniška vizija, Konvolucijska nevronska mreža, Globoko učenje, Prepoznavanje slike

Akademija EITCA

Katere so ključne komponente konvolucijske nevronske mreže (CNN) in njihove vloge pri nalogah prepoznavanja slik?

Druga nedavna vprašanja in odgovori v zvezi Konvolucijske nevronske mreže v TensorFlowu:

Več vprašanj in odgovorov:

Akademija EITCA je del evropskega IT certifikacijskega okvira

Upravičenost do akademije EITCA 80% podpore EITCI DSJC

Akademija EITCA

PRIJAVITE SE NA SVOJ RAČUN PO VAŠEM UPORABNIKU ALI E-poštnemu naslovu

Pozabili svoje podrobnosti?

USTVARI RAČUN

Katere so ključne komponente konvolucijske nevronske mreže (CNN) in njihove vloge pri nalogah prepoznavanja slik?

Druga nedavna vprašanja in odgovori v zvezi Konvolucijske nevronske mreže v TensorFlowu:

Več vprašanj in odgovorov:

Upravičenost do akademije EITCA 80% podpore EITCI DSJC