AutoML Tables je zmogljivo orodje za strojno učenje, ki ga zagotavlja Google Cloud in uporabnikom omogoča izdelavo in uvajanje modelov strojnega učenja brez potrebe po obsežnem strokovnem znanju na področju programiranja ali znanosti o podatkih. Avtomatizira proces inženiringa funkcij, izbire modela, prilagajanja hiperparametrov in vrednotenja modela, zaradi česar je dostopen uporabnikom z različnimi stopnjami znanja strojnega učenja.
Kar zadeva tipe podatkov, lahko tabele AutoML obravnavajo široko paleto tipov strukturiranih podatkov. Strukturirani podatki se nanašajo na podatke, ki so organizirani v obliki tabele, pri čemer vrstice predstavljajo primere ali primere, stolpci pa značilnosti ali spremenljivke. Tabele AutoML lahko obravnavajo tako numerične kot kategorične vrste podatkov, kar uporabnikom omogoča delo z različnimi nabori podatkov.
1. Numerični podatki: AutoML Tables podpira različne tipe numeričnih podatkov, vključno s celimi števili in števili s plavajočo vejico. Ti tipi podatkov so primerni za predstavitev zveznih ali diskretnih številskih vrednosti. Na primer, če imamo nabor podatkov o cenah stanovanj, bi bil stolpec s cenami predstavljen kot številski podatkovni tip.
2. Kategorični podatki: tabele AutoML podpirajo tudi kategorične vrste podatkov, ki predstavljajo diskretne vrednosti, ki spadajo v posebne kategorije. Kategorične podatke lahko nadalje razdelimo na dve podvrsti:
a. Nominalni podatki: Nominalni podatki predstavljajo kategorije, ki nimajo lastnega reda ali hierarhije. Na primer, če imamo nabor podatkov o povratnih informacijah strank, ima lahko stolpec razpoloženja kategorije, kot so »pozitivno«, »nevtralno« in »negativno«. Tabele AutoML lahko obravnavajo takšne nominalne kategorične podatke.
b. Vrstni podatki: Vrstni podatki predstavljajo kategorije, ki imajo določen vrstni red ali hierarhijo. Če imamo na primer nabor podatkov o ocenah filmov, bi lahko stolpec z ocenami vseboval kategorije, kot so »slabo«, »primerno«, »dobro« in »odlično«. Tabele AutoML lahko obravnavajo takšne redne kategorične podatke in upoštevajo vrstni red kategorij med usposabljanjem modela.
3. Besedilni podatki: AutoML Tables nudi tudi podporo za besedilne podatke. Besedilni podatki so običajno nestrukturirani in zahtevajo predhodno obdelavo za pretvorbo v strukturirano obliko, primerno za strojno učenje. Tabele AutoML lahko obravnavajo besedilne podatke z uporabo tehnik, kot je vdelava besedila ali predstavitev vrečke besed. Na primer, če imamo nabor podatkov o ocenah strank, lahko besedilo ocene pretvorimo v numerične značilnosti z uporabo tehnik, kot je vdelava besed, ki jih nato lahko tabele AutoML uporabijo za usposabljanje modelov.
4. Podatki časovnih vrst: tabele AutoML lahko obravnavajo podatke časovnih vrst, ki so podatki, zbrani v zaporedju časovnih intervalov. Podatke o časovnih vrstah pogosto najdemo na različnih področjih, kot so finance, vremenska napoved in analiza borz. Tabele AutoML lahko obdelujejo podatke časovnih vrst z vključitvijo funkcij, povezanih s časom, kot so časovni žigi in spremenljivke z zamikom.
Tabele AutoML lahko obravnavajo široko paleto tipov strukturiranih podatkov, vključno s numeričnimi, kategoričnimi (tako nominalnimi kot ordinalnimi), besedilnimi in podatki o časovnih serijah. Ta vsestranskost omogoča uporabnikom, da izkoristijo moč tabel AutoML za raznolik nabor nalog strojnega učenja na različnih področjih.
Druga nedavna vprašanja in odgovori v zvezi Tabele AutoML:
- Kako lahko prehajate med tabelami Vertex AI in AutoML?
- Zakaj so bile tabele AutoML ukinjene in kaj jih je nasledilo?
- Kako lahko uporabniki uvedejo svoj model in pridobijo napovedi v tabelah AutoML?
- Katere možnosti so na voljo za nastavitev proračuna za usposabljanje v AutoML Tables?
- Katere informacije nudi zavihek Analiziranje v tabelah AutoML?
- Kako lahko uporabniki uvozijo svoje podatke o usposabljanju v tabele AutoML?