Označeni podatki se v kontekstu umetne inteligence (AI) in posebej v domeni Googlovega strojnega učenja v oblaku nanašajo na nabor podatkov, ki je bil komentiran ali označen s posebnimi oznakami ali kategorijami. Te oznake služijo kot osnovna resnica ali referenca za urjenje algoritmov strojnega učenja. S povezovanjem podatkovnih točk z njihovimi ustreznimi oznakami se lahko model strojnega učenja nauči prepoznati vzorce in narediti napovedi na podlagi novih, še nevidenih podatkov.
Označeni podatki igrajo ključno vlogo pri nadzorovanem učenju, kar je pogost pristop pri strojnem učenju. Pri nadzorovanem učenju se model uri na označenem naboru podatkov, da se nauči razmerja med vhodnimi funkcijami in njihovimi ustreznimi izhodnimi oznakami. Ta proces usposabljanja omogoča modelu, da posploši svoje znanje in poda natančne napovedi na podlagi novih, še nevidenih podatkov.
Za ponazoritev tega koncepta si oglejmo primer naloge strojnega učenja na področju prepoznavanja slik. Recimo, da želimo zgraditi model, ki lahko razvrsti slike živali v različne kategorije, kot so mačke, psi in ptice. Potrebovali bi označen nabor podatkov, kjer je vsaka slika povezana s svojo pravilno oznako. Na primer, slika mačke bi bila označena kot "mačka", slika psa kot "pes" in tako naprej.
Označeni nabor podatkov bi bil sestavljen iz zbirke slik in njihovih ustreznih oznak. Vsaka slika bi bila predstavljena z nizom funkcij, kot so vrednosti slikovnih pik ali predstavitve višje ravni, izvlečene iz slike. Oznake bi pokazale pravilno kategorijo ali razred, ki mu pripada posamezna slika.
Med fazo usposabljanja bi bil model strojnega učenja predstavljen z označenim naborom podatkov. Naučil bi se prepoznati vzorce in razmerja med vhodnimi funkcijami in ustreznimi oznakami. Model bi posodobil svoje notranje parametre, da bi zmanjšal razliko med svojimi napovedmi in resničnimi oznakami v podatkih o usposabljanju.
Ko je model usposobljen, ga je mogoče uporabiti za napovedovanje novih, še nevidenih slik. Glede na neoznačeno sliko bi model analiziral njene značilnosti in predvidel najverjetnejšo oznako na podlagi naučenega znanja iz označenega niza podatkov. Na primer, če model predvideva, da slika vsebuje mačko, to pomeni, da je na sliki prepoznal vzorce, ki kažejo na mačko.
Označeni podatki so temeljna komponenta pri usposabljanju modelov strojnega učenja. Zagotavlja potrebne informacije, iz katerih se lahko model uči in daje natančne napovedi. S povezovanjem podatkovnih točk z njihovimi ustreznimi oznakami se lahko model nauči prepoznati vzorce in posploši svoje znanje na nevidne podatke.
Druga nedavna vprašanja in odgovori v zvezi EITC/AI/GCML Google Cloud Machine Learning:
- Kaj je besedilo v govor (TTS) in kako deluje z AI?
- Kakšne so omejitve pri delu z velikimi nabori podatkov v strojnem učenju?
- Ali lahko strojno učenje pomaga pri dialogu?
- Kaj je igrišče TensorFlow?
- Kaj pravzaprav pomeni večji nabor podatkov?
- Kateri so primeri hiperparametrov algoritma?
- Kaj je učenje ansambla?
- Kaj pa, če izbrani algoritem strojnega učenja ni primeren in kako se prepričati, da je izbran pravi?
- Ali model strojnega učenja potrebuje nadzor med usposabljanjem?
- Kateri so ključni parametri, ki se uporabljajo v algoritmih, ki temeljijo na nevronski mreži?
Oglejte si več vprašanj in odgovorov v EITC/AI/GCML Google Cloud Machine Learning