Nadzorovano in nenadzorovano učenje sta dve temeljni vrsti paradigem strojnega učenja, ki služita različnim namenom glede na naravo podatkov in cilje obravnavane naloge. Razumevanje, kdaj uporabiti nadzorovano usposabljanje v primerjavi z nenadzorovanim usposabljanjem, je ključnega pomena pri oblikovanju učinkovitih modelov strojnega učenja. Izbira med tema dvema pristopoma je odvisna od razpoložljivosti označenih podatkov, želenega rezultata in osnovne strukture nabora podatkov.
Nadzorovano učenje je vrsta strojnega učenja, kjer se model uri na označenem naboru podatkov. Pri nadzorovanem učenju se algoritem nauči preslikati vhodne podatke v pravilen izhod, tako da se mu predstavijo primeri za usposabljanje. Ti primeri usposabljanja so sestavljeni iz vhodno-izhodnih parov, kjer vhodne podatke spremlja ustrezen pravilen izhod ali ciljna vrednost. Cilj nadzorovanega učenja je naučiti se funkcije preslikave vhodnih spremenljivk v izhodne spremenljivke, ki jih je nato mogoče uporabiti za napovedovanje nevidnih podatkov.
Nadzorovano učenje se običajno uporablja, ko je znan želeni rezultat in je cilj naučiti se razmerja med vhodnimi in izhodnimi spremenljivkami. Običajno se uporablja pri nalogah, kot je klasifikacija, kjer je cilj napovedati oznake razreda novih primerkov, in regresija, kjer je cilj predvideti neprekinjeno vrednost. V scenariju nadzorovanega učenja bi lahko na primer usposobili model za predvidevanje, ali je e-poštno sporočilo vsiljena pošta ali ne, na podlagi vsebine e-poštnega sporočila in označenega statusa neželene/neželene pošte prejšnjih e-poštnih sporočil.
Po drugi strani pa je nenadzorovano učenje vrsta strojnega učenja, kjer se model uri na neoznačenem nizu podatkov. Pri nenadzorovanem učenju se algoritem iz vhodnih podatkov nauči vzorcev in struktur brez eksplicitne povratne informacije o pravilnem izhodu. Cilj nenadzorovanega učenja je raziskati osnovno strukturo podatkov, odkriti skrite vzorce in pridobiti pomembne vpoglede brez potrebe po označenih podatkih.
Nenadzorovano učenje se običajno uporablja, kadar je cilj raziskovanje podatkov, iskanje skritih vzorcev in združevanje podobnih podatkovnih točk. Pogosto se uporablja pri nalogah, kot je združevanje v gruče, kjer je cilj združiti podobne podatkovne točke v gruče na podlagi njihovih značilnosti, in zmanjšanje dimenzionalnosti, kjer je cilj zmanjšati število funkcij, hkrati pa ohraniti bistvene informacije v podatkih. Na primer, v scenariju nenadzorovanega učenja lahko uporabite združevanje v skupine za združevanje strank na podlagi njihovega nakupovalnega vedenja brez kakršnega koli predhodnega znanja o segmentih strank.
Izbira med nadzorovanim in nenadzorovanim učenjem je odvisna od več dejavnikov. Če imate označen nabor podatkov in želite napovedati določene rezultate, je nadzorovano učenje prava izbira. Po drugi strani pa je nenadzorovano učenje primernejše, če imate neoznačen nabor podatkov in želite raziskati strukturo podatkov ali najti skrite vzorce. V nekaterih primerih se lahko za izkoriščanje prednosti obeh pristopov uporabi kombinacija nadzorovanih in nenadzorovanih tehnik, znana kot polnadzorovano učenje.
Odločitev o uporabi nadzorovanega usposabljanja v primerjavi z nenadzorovanim usposabljanjem v strojnem učenju je odvisna od razpoložljivosti označenih podatkov, narave naloge in želenega rezultata. Razumevanje razlik med nadzorovanim in nenadzorovanim učenjem je bistvenega pomena za oblikovanje učinkovitih modelov strojnega učenja, ki lahko pridobijo pomembne vpoglede in naredijo natančne napovedi iz podatkov.
Druga nedavna vprašanja in odgovori v zvezi EITC/AI/GCML Google Cloud Machine Learning:
- Kaj je besedilo v govor (TTS) in kako deluje z AI?
- Kakšne so omejitve pri delu z velikimi nabori podatkov v strojnem učenju?
- Ali lahko strojno učenje pomaga pri dialogu?
- Kaj je igrišče TensorFlow?
- Kaj pravzaprav pomeni večji nabor podatkov?
- Kateri so primeri hiperparametrov algoritma?
- Kaj je učenje ansambla?
- Kaj pa, če izbrani algoritem strojnega učenja ni primeren in kako se prepričati, da je izbran pravi?
- Ali model strojnega učenja potrebuje nadzor med usposabljanjem?
- Kateri so ključni parametri, ki se uporabljajo v algoritmih, ki temeljijo na nevronski mreži?
Oglejte si več vprašanj in odgovorov v EITC/AI/GCML Google Cloud Machine Learning