Proces usposabljanja modela strojnega učenja vključuje njegovo izpostavljanje ogromnim količinam podatkov, da se lahko nauči vzorcev in sprejema napovedi ali odločitve, ne da bi bil izrecno programiran za vsak scenarij. Med fazo usposabljanja je model strojnega učenja podvržen vrsti iteracij, kjer prilagodi svoje notranje parametre, da zmanjša napake in izboljša svojo učinkovitost pri dani nalogi.
Nadzor med usposabljanjem se nanaša na raven človeškega posredovanja, ki je potrebno za vodenje učnega procesa modela. Potreba po nadzoru se lahko razlikuje glede na vrsto uporabljenega algoritma strojnega učenja, zapletenost naloge in kakovost podatkov, ki so zagotovljeni za usposabljanje.
Pri nadzorovanem učenju, ki je vrsta strojnega učenja, kjer se model uri na označenih podatkih, je nadzor bistven. Označeni podatki pomenijo, da je vsaka vhodna podatkovna točka seznanjena s pravilnim izhodom, kar omogoča modelu, da se nauči preslikave med vhodi in izhodi. Med nadzorovanim usposabljanjem je potreben človeški nadzor, da zagotovimo pravilne oznake za podatke o usposabljanju, ocenimo napovedi modela in prilagodimo parametre modela na podlagi povratnih informacij.
Na primer, če je cilj nadzorovane naloge prepoznavanja slik usposobiti model za razvrščanje slik mačk in psov, mora človeški nadzornik vsako sliko označiti kot mačko ali psa. Model bi se nato iz teh označenih primerov naučil napovedovati nove, še nevidene slike. Nadzornik bi ocenil napovedi modela in zagotovil povratne informacije za izboljšanje njegove natančnosti.
Po drugi strani algoritmi za nenadzorovano učenje ne potrebujejo označenih podatkov za usposabljanje. Ti algoritmi se učijo vzorcev in struktur iz vhodnih podatkov brez izrecnih navodil. Učenje brez nadzora se pogosto uporablja za naloge, kot so združevanje v gruče, odkrivanje nepravilnosti in zmanjšanje dimenzionalnosti. Pri nenadzorovanem učenju se lahko stroj uči neodvisno brez potrebe po človeškem nadzoru med usposabljanjem.
Polnadzorovano učenje je hibridni pristop, ki združuje elemente tako nadzorovanega kot nenadzorovanega učenja. Pri tem pristopu se model uri na kombinaciji označenih in neoznačenih podatkov. Označeni podatki zagotavljajo nekaj nadzora za usmerjanje učnega procesa, medtem ko neoznačeni podatki omogočajo modelu odkrivanje dodatnih vzorcev in odnosov v podatkih.
Učenje z okrepitvijo je še ena paradigma strojnega učenja, kjer se agent nauči sprejemati zaporedne odločitve z interakcijo z okoljem. Pri učenju z okrepitvijo agent prejme povratne informacije v obliki nagrad ali kazni na podlagi svojih dejanj. Agent se skozi čas s poskusi in napakami nauči povečati svojo kumulativno nagrado. Medtem ko učenje s krepitvijo ne zahteva eksplicitnega nadzora v tradicionalnem smislu, bo morda potreben človeški nadzor za oblikovanje strukture nagrajevanja, določitev učnih ciljev ali natančnejšo prilagoditev učnega procesa.
Potreba po nadzoru med usposabljanjem strojnega učenja je odvisna od uporabljene učne paradigme, razpoložljivosti označenih podatkov in kompleksnosti naloge. Nadzorovano učenje zahteva človeški nadzor za zagotavljanje označenih podatkov in ovrednotenje delovanja modela. Učenje brez nadzora ne zahteva nadzora, saj se model uči neodvisno iz neoznačenih podatkov. Polnadzorovano učenje združuje elemente nadzorovanega in nenadzorovanega učenja, medtem ko učenje s krepitvijo vključuje učenje skozi interakcijo z okoljem.
Druga nedavna vprašanja in odgovori v zvezi EITC/AI/GCML Google Cloud Machine Learning:
- Kaj je besedilo v govor (TTS) in kako deluje z AI?
- Kakšne so omejitve pri delu z velikimi nabori podatkov v strojnem učenju?
- Ali lahko strojno učenje pomaga pri dialogu?
- Kaj je igrišče TensorFlow?
- Kaj pravzaprav pomeni večji nabor podatkov?
- Kateri so primeri hiperparametrov algoritma?
- Kaj je učenje ansambla?
- Kaj pa, če izbrani algoritem strojnega učenja ni primeren in kako se prepričati, da je izbran pravi?
- Kateri so ključni parametri, ki se uporabljajo v algoritmih, ki temeljijo na nevronski mreži?
- Kaj je TensorBoard?
Oglejte si več vprašanj in odgovorov v EITC/AI/GCML Google Cloud Machine Learning