Če želite programsko izvleči oznake iz slik z uporabo Pythona in API-ja Vision, lahko izkoristite zmogljive zmogljivosti API-ja Google Cloud Vision. Vision API ponuja obsežen nabor funkcij za analizo slike, vključno z zaznavanjem oznak, ki vam omogoča samodejno prepoznavanje in ekstrahiranje oznak iz slik.
Za začetek boste morali nastaviti projekt Google Cloud in omogočiti Vision API. Ko to storite, lahko namestite zahtevane knjižnice Python tako, da zaženete naslednji ukaz:
python pip install google-cloud-vision
Nato morate potrditi svojo aplikacijo za dostop do Vision API. To lahko storite tako, da ustvarite ključ storitvenega računa in nastavite spremenljivko okolja `GOOGLE_APPLICATION_CREDENTIALS`, da kaže na pot datoteke ključa. To lahko storite z naslednjo kodo:
python import os from google.cloud import vision os.environ['GOOGLE_APPLICATION_CREDENTIALS'] = '/path/to/service_account_key.json'
Zdaj lahko uporabite Vision API za programsko pridobivanje nalepk iz slik. Naslednji delček kode prikazuje, kako to storiti:
python def extract_labels(image_path): client = vision.ImageAnnotatorClient() with open(image_path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) response = client.label_detection(image=image) labels = response.label_annotations extracted_labels = [label.description for label in labels] return extracted_labels
V tej kodi najprej ustvarimo primerek razreda `ImageAnnotatorClient` iz knjižnice `google.cloud.vision`. Nato preberemo slikovno datoteko, ustvarimo objekt `Image` iz vsebine datoteke in ga pošljemo API-ju Vision za zaznavanje oznak. Odgovor API-ja vsebuje seznam opomb oznak, iz katerih izluščimo opise oznak.
Zdaj lahko pokličete funkcijo `extract_labels` tako, da posredujete pot do slikovne datoteke, ki jo želite analizirati. Vrnil bo seznam oznak, ekstrahiranih iz slike.
python image_path = '/path/to/image.jpg' labels = extract_labels(image_path) print(labels)
To bo izpisalo ekstrahirane oznake iz slike.
plaintext ['cat', 'animal', 'whiskers', 'small to medium-sized cats', 'mammal']
Vision API uporablja napredne modele strojnega učenja za analizo slik in prepoznavanje predmetov, prizorov in drugih vizualnih funkcij. Natančno lahko zazna široko paleto oznak, zaradi česar je dragoceno orodje za različne aplikacije, kot so razvrščanje slik, moderiranje vsebine in vizualno iskanje.
Če želite programsko ekstrahirati oznake iz slik z uporabo Pythona in API-ja Vision, morate nastaviti projekt Google Cloud, omogočiti API Vision, namestiti zahtevane knjižnice Python, preveriti pristnost svoje aplikacije in nato uporabiti API Vision za izvedbo zaznavanja oznak na slike. Ekstrahirane oznake se lahko uporabijo za nadaljnjo analizo ali za izboljšanje razumevanja vsebine slike.
Druga nedavna vprašanja in odgovori v zvezi EITC/AI/GVAPI Google Vision API:
- Katere so nekatere vnaprej določene kategorije za prepoznavanje objektov v Google Vision API?
- Ali Google Vision API omogoča prepoznavanje obraza?
- Kako je mogoče besedilo za prikaz dodati sliki pri risanju robov predmeta s funkcijo "draw_vertices"?
- Kakšni so parametri metode "draw.line" v navedeni kodi in kako se uporabljajo za risanje črt med vrednostmi tock?
- Kako lahko knjižnico vzglavnikov uporabimo za risanje robov predmetov v Pythonu?
- Kakšen je namen funkcije "draw_vertices" v predloženi kodi?
- Kako lahko Google Vision API pomaga pri razumevanju oblik in predmetov na sliki?
- Kako lahko uporabniki raziskujejo vizualno podobne slike, ki jih priporoča API?
- Kateri različni elementi so na voljo v objektu odziva funkcije spletnega zaznavanja API-ja Google Vision?
- Kako funkcija zaznavanja spleta pomaga pri ustvarjanju oznak za naložene slike?
Oglejte si več vprašanj in odgovorov v EITC/AI/GVAPI Google Vision API