Arhitektura nevronske mreže, uporabljene v primeru, je nevronska mreža s posredovanjem podatkov s tremi plastmi: vhodna plast, skrita plast in izhodna plast. Vhodni sloj je sestavljen iz 784 enot, kar ustreza številu slikovnih pik na vhodni sliki. Vsaka enota v vhodnem sloju predstavlja vrednost intenzivnosti piksla na sliki.
Skrita plast je sestavljena iz 128 enot, ki so v celoti povezane z vhodno plastjo. Vsaka enota v skritem sloju izračuna tehtano vsoto vnosov iz vhodnega sloja in uporabi aktivacijsko funkcijo za ustvarjanje izhoda. V tem primeru je aktivacijska funkcija, uporabljena v skritem sloju, funkcija rektificirane linearne enote (ReLU). Funkcija ReLU je definirana kot f(x) = max(0, x), kjer je x tehtana vsota vnosov v enoto. Funkcija ReLU uvaja nelinearnost v omrežje, kar mu omogoča učenje zapletenih vzorcev in odnosov v podatkih.
Izhodni sloj je sestavljen iz 10 enot, od katerih vsaka predstavlja enega od možnih razredov v problemu klasifikacije. Enote v izhodnem sloju so prav tako popolnoma povezane z enotami v skritem sloju. Podobno kot pri skritem sloju vsaka enota v izhodnem sloju izračuna tehtano vsoto vnosov iz skritega sloja in uporabi aktivacijsko funkcijo. V tem primeru je aktivacijska funkcija, uporabljena v izhodni plasti, funkcija softmax. Funkcija softmax pretvori uteženo vsoto vnosov v verjetnostno porazdelitev po razredih, kjer je vsota verjetnosti enaka 1. Enota z največjo verjetnostjo predstavlja predvideni razred vhodne slike.
Če povzamemo, arhitektura nevronske mreže, uporabljena v primeru, je sestavljena iz vhodne plasti s 784 enotami, skrite plasti s 128 enotami, ki uporabljajo aktivacijsko funkcijo ReLU, in izhodne plasti z 10 enotami, ki uporabljajo aktivacijsko funkcijo softmax.
Druga nedavna vprašanja in odgovori v zvezi Gradnja nevronske mreže za izvedbo klasifikacije:
- Ali je treba uporabiti funkcijo asinhronega učenja za modele strojnega učenja, ki se izvajajo v TensorFlow.js?
- Kako se model sestavi in uri v TensorFlow.js in kakšna je vloga funkcije kategorične navzkrižne entropijske izgube?
- Kakšen je pomen hitrosti učenja in števila epoh v procesu strojnega učenja?
- Kako so podatki o usposabljanju razdeljeni na nize za usposabljanje in teste v TensorFlow.js?
- Kakšen je namen TensorFlow.js pri izgradnji nevronske mreže za naloge klasifikacije?