Za dostop do ekstrahiranega besedila iz slike s pomočjo API-ja Google Vision lahko sledite nizu korakov, ki vključujejo uporabo zmogljivosti API-ja za optično prepoznavanje znakov (OCR). Tehnologija OCR v Google Vision API omogoča zaznavanje in ekstrahiranje besedila iz slik, vključno z rokopisom. Ta funkcionalnost je še posebej uporabna v aplikacijah, ki zahtevajo analizo in razumevanje besedilnih informacij v vizualnih podatkih.
Najprej morate nastaviti potrebno okolje za delo z Google Vision API. To vključuje ustvarjanje projekta v konzoli Google Cloud Console, omogočanje API-ja Vision in pridobitev zahtevanih poverilnic za preverjanje pristnosti, kot je ključ API-ja ali ključ storitvenega računa.
Ko je vaše okolje nastavljeno, lahko uporabite metodo `asyncBatchAnnotateFiles` API-ja Vision za izvedbo OCR v slikovni datoteki. Ta metoda vam omogoča posredovanje seznama slikovnih datotek za obdelavo in asinhrono prejemanje rezultatov. Druga možnost je, da uporabite metodo asyncBatchAnnotateImages` za neposredno obdelavo seznama slik.
Če želite izvleči besedilo iz slike, morate ustvariti primerek predmeta `AnnotateImageRequest` in določiti želene funkcije. V tem primeru bi nastavili funkcijo `TEXT_DETECTION`, da pokažete, da želite iz slike izvleči besedilo. Določite lahko tudi dodatne parametre, kot je jezikovni namig, da izboljšate natančnost OCR.
Nato morate kodirati slikovno datoteko v niz, kodiran z base64, in ustvariti primerek predmeta `Image` z uporabo kodiranih slikovnih podatkov. Ta objekt `Image` je treba dodati prej ustvarjenemu objektu `AnnotateImageRequest`.
Ko nastavite zahtevo, jo lahko pošljete API-ju Vision z metodo `batchAnnotateImages` ali `batchAnnotateFiles`, odvisno od izbranega pristopa. API bo obdelal sliko in vrnil odgovor, ki bo vseboval izvlečeno besedilo.
Za dostop do izvlečenega besedila iz odgovora lahko iterirate po polju `textAnnotations` predmeta `AnnotateImageResponse`. To polje vsebuje seznam objektov `EntityAnnotation`, od katerih vsak predstavlja zaznan element besedila na sliki. Polje »description« vsakega predmeta »EntityAnnotation« vsebuje izvlečeno besedilo.
Tukaj je primer izrezka kode v Pythonu, ki prikazuje, kako dostopati do ekstrahiranega besedila iz slike z uporabo Google Vision API:
python from google.cloud import vision def extract_text_from_image(image_path): client = vision.ImageAnnotatorClient() with open(image_path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) request = vision.AnnotateImageRequest( image=image, features=[{'type': vision.Feature.Type.TEXT_DETECTION}] ) response = client.batch_annotate_images(requests=[request]) for annotation in response.responses[0].text_annotations: extracted_text = annotation.description print(extracted_text) # Usage extract_text_from_image('path_to_image.jpg')
V tem primeru funkcija `extract_text_from_image` vzame pot do slikovne datoteke kot vhod in uporabi odjemalsko knjižnico Google Cloud Vision za pošiljanje zahteve API-ju Vision. Ekstrahirano besedilo se nato natisne.
Za dostop do ekstrahiranega besedila iz slike z uporabo Google Vision API, morate nastaviti okolje, ustvariti objekt `AnnotateImageRequest` z želenimi funkcijami, kodirati slikovno datoteko, poslati zahtevo API-ju in pridobiti ekstrahirano besedilo iz odgovora. Zmožnosti OCR API-ja Vision omogočajo zaznavanje in ekstrahiranje besedila iz slik, vključno z rokopisom.
Druga nedavna vprašanja in odgovori v zvezi Odkrivanje in črpanje besedila iz rokopisa:
- Kakšne omejitve lahko nastanejo pri pridobivanju besedila iz zapletenih dokumentov z uporabo Google Vision API?
- Kakšen je pomen stopenj zaupanja pri razlagi besedila API-ja Google Vision?
- Kako lahko Google Vision API natančno prepozna in izvleče besedilo iz ročno napisanih zapiskov?
- Kakšni so izzivi pri odkrivanju in ekstrahiranju besedila iz ročno napisanih slik?
- Ali lahko Google Vision prepozna rokopis?