Kako lahko dostopate do ekstrahiranega besedila iz slike z uporabo Google Vision API?

by Akademija EITCA / Sreda, 27 december 2023 / Objavljeno v Umetna inteligenca, EITC/AI/GVAPI Google Vision API, Razumevanje besedila v vizualnih podatkih, Odkrivanje in črpanje besedila iz rokopisa, Pregled izpita

Za dostop do ekstrahiranega besedila iz slike s pomočjo API-ja Google Vision lahko sledite nizu korakov, ki vključujejo uporabo zmogljivosti API-ja za optično prepoznavanje znakov (OCR). Tehnologija OCR v Google Vision API omogoča zaznavanje in ekstrahiranje besedila iz slik, vključno z rokopisom. Ta funkcionalnost je še posebej uporabna v aplikacijah, ki zahtevajo analizo in razumevanje besedilnih informacij v vizualnih podatkih.

Najprej morate nastaviti potrebno okolje za delo z Google Vision API. To vključuje ustvarjanje projekta v konzoli Google Cloud Console, omogočanje API-ja Vision in pridobitev zahtevanih poverilnic za preverjanje pristnosti, kot je ključ API-ja ali ključ storitvenega računa.

Ko je vaše okolje nastavljeno, lahko uporabite metodo `asyncBatchAnnotateFiles` API-ja Vision za izvedbo OCR v slikovni datoteki. Ta metoda vam omogoča posredovanje seznama slikovnih datotek za obdelavo in asinhrono prejemanje rezultatov. Druga možnost je, da uporabite metodo asyncBatchAnnotateImages` za neposredno obdelavo seznama slik.

Če želite izvleči besedilo iz slike, morate ustvariti primerek predmeta `AnnotateImageRequest` in določiti želene funkcije. V tem primeru bi nastavili funkcijo `TEXT_DETECTION`, da pokažete, da želite iz slike izvleči besedilo. Določite lahko tudi dodatne parametre, kot je jezikovni namig, da izboljšate natančnost OCR.

Nato morate kodirati slikovno datoteko v niz, kodiran z base64, in ustvariti primerek predmeta `Image` z uporabo kodiranih slikovnih podatkov. Ta objekt `Image` je treba dodati prej ustvarjenemu objektu `AnnotateImageRequest`.

Ko nastavite zahtevo, jo lahko pošljete API-ju Vision z metodo `batchAnnotateImages` ali `batchAnnotateFiles`, odvisno od izbranega pristopa. API bo obdelal sliko in vrnil odgovor, ki bo vseboval izvlečeno besedilo.

Za dostop do izvlečenega besedila iz odgovora lahko iterirate po polju `textAnnotations` predmeta `AnnotateImageResponse`. To polje vsebuje seznam objektov `EntityAnnotation`, od katerih vsak predstavlja zaznan element besedila na sliki. Polje »description« vsakega predmeta »EntityAnnotation« vsebuje izvlečeno besedilo.

Tukaj je primer izrezka kode v Pythonu, ki prikazuje, kako dostopati do ekstrahiranega besedila iz slike z uporabo Google Vision API:

python
from google.cloud import vision

def extract_text_from_image(image_path):
    client = vision.ImageAnnotatorClient()

    with open(image_path, 'rb') as image_file:
        content = image_file.read()

    image = vision.Image(content=content)

    request = vision.AnnotateImageRequest(
        image=image,
        features=[{'type': vision.Feature.Type.TEXT_DETECTION}]
    )

    response = client.batch_annotate_images(requests=[request])

    for annotation in response.responses[0].text_annotations:
        extracted_text = annotation.description
        print(extracted_text)

# Usage
extract_text_from_image('path_to_image.jpg')

V tem primeru funkcija `extract_text_from_image` vzame pot do slikovne datoteke kot vhod in uporabi odjemalsko knjižnico Google Cloud Vision za pošiljanje zahteve API-ju Vision. Ekstrahirano besedilo se nato natisne.

Za dostop do ekstrahiranega besedila iz slike z uporabo Google Vision API, morate nastaviti okolje, ustvariti objekt `AnnotateImageRequest` z želenimi funkcijami, kodirati slikovno datoteko, poslati zahtevo API-ju in pridobiti ekstrahirano besedilo iz odgovora. Zmožnosti OCR API-ja Vision omogočajo zaznavanje in ekstrahiranje besedila iz slik, vključno z rokopisom.

Druga nedavna vprašanja in odgovori v zvezi Odkrivanje in črpanje besedila iz rokopisa:

Več vprašanj in odgovorov:

Polje: Umetna inteligenca
Program: EITC/AI/GVAPI Google Vision API (pojdite na certifikacijski program)
Lekcija: Razumevanje besedila v vizualnih podatkih (pojdite na povezano lekcijo)
Tema: Odkrivanje in črpanje besedila iz rokopisa (pojdite na sorodno temo)
Pregled izpita

Označeni pod: Umetna inteligenca, Google Cloud Vision API, Obdelava slik, OCR, Optično prepoznavanje znakov, Ekstrakcija besedila

Akademija EITCA

Kako lahko dostopate do ekstrahiranega besedila iz slike z uporabo Google Vision API?

Druga nedavna vprašanja in odgovori v zvezi Odkrivanje in črpanje besedila iz rokopisa:

Več vprašanj in odgovorov:

Akademija EITCA je del evropskega IT certifikacijskega okvira

Upravičenost do akademije EITCA 80% podpore EITCI DSJC

Akademija EITCA

PRIJAVITE SE NA SVOJ RAČUN PO VAŠEM UPORABNIKU ALI E-poštnemu naslovu

Pozabili svoje podrobnosti?

USTVARI RAČUN

Kako lahko dostopate do ekstrahiranega besedila iz slike z uporabo Google Vision API?

Druga nedavna vprašanja in odgovori v zvezi Odkrivanje in črpanje besedila iz rokopisa:

Več vprašanj in odgovorov:

Upravičenost do akademije EITCA 80% podpore EITCI DSJC