Mitä tiedostomuotoja OCR-järjestelmä tukee lataamisessa?
OCR-järjestelmät tukevat tiedostojen lataamista useissa muodoissa, jotta käyttäjät voivat joustavasti muuntaa asiakirjoja eri lähteistä muokattavaksi tekstiksi. Seuraavassa on joitain yleisiä tiedostomuotoja, joita OCR-järjestelmät voivat tukea:
Kuvamuoto:
JPEG/JPG: laajalti käytetty kuvanpakkausmuoto, joka sopii valokuville ja skannatuille asiakirjoille.
PNG: Häviötön pakattu kuvamuoto, joka tukee läpinäkyvyyttä ja jota käytetään yleisesti verkkokuvissa ja kuvakkeissa.
TIFF/TIF (mukaan lukien monisivuinen TIFF): Korkealaatuinen kuvamuoto, jota käytetään yleisesti paino- ja julkaisuteollisuudessa ja tukee monisivuisia asiakirjoja.
BMP: Vakiokuvamuoto Windows-järjestelmissä, joka on pakkaamaton ja jolla on korkea laatu, mutta suuret tiedostokoot.
GIF: Kuvamuoto, joka tukee animaatiota ja läpinäkyvyyttä. Vaikka sitä käytetään pääasiassa verkkokuviin, OCR-järjestelmät voivat myös tukea sitä.
Asiakirjan muoto:
PDF: Kannettava asiakirjamuoto, jota käytetään laajalti asiakirjojen, kuten e-kirjojen, raporttien ja sopimusten, jakamiseen ja tulostamiseen. OCR-järjestelmät pystyvät yleensä tunnistamaan skannatun tekstin PDF-tiedostoista.
Vaikka OCR-järjestelmät pystyvät käsittelemään tiedostoja useissa muodoissa, eri muodoissa olevilla tiedostoilla voi olla erilaisia tunnistusvaikutuksia OCR-prosessin aikana. Esimerkiksi TIFF-tiedostot, joissa on korkea skannauslaatu ja selkeät kuvat, ovat yleensä helpompia tunnistaa tarkasti kuin JPEG-tiedostot. Siksi käyttäjien tulee tehdä valintoja tarpeidensa ja tiedostojen laadun perusteella valitessaan ladata tiedostoja.
JPEG/JPG: laajalti käytetty kuvanpakkausmuoto, joka sopii valokuville ja skannatuille asiakirjoille.
PNG: Häviötön pakattu kuvamuoto, joka tukee läpinäkyvyyttä ja jota käytetään yleisesti verkkokuvissa ja kuvakkeissa.
TIFF/TIF (mukaan lukien monisivuinen TIFF): Korkealaatuinen kuvamuoto, jota käytetään yleisesti paino- ja julkaisuteollisuudessa ja tukee monisivuisia asiakirjoja.
BMP: Vakiokuvamuoto Windows-järjestelmissä, joka on pakkaamaton ja jolla on korkea laatu, mutta suuret tiedostokoot.
GIF: Kuvamuoto, joka tukee animaatiota ja läpinäkyvyyttä. Vaikka sitä käytetään pääasiassa verkkokuviin, OCR-järjestelmät voivat myös tukea sitä.
PDF: Kannettava asiakirjamuoto, jota käytetään laajalti asiakirjojen, kuten e-kirjojen, raporttien ja sopimusten, jakamiseen ja tulostamiseen. OCR-järjestelmät pystyvät yleensä tunnistamaan skannatun tekstin PDF-tiedostoista.
Vaikka OCR-järjestelmät pystyvät käsittelemään tiedostoja useissa muodoissa, eri muodoissa olevilla tiedostoilla voi olla erilaisia tunnistusvaikutuksia OCR-prosessin aikana. Esimerkiksi TIFF-tiedostot, joissa on korkea skannauslaatu ja selkeät kuvat, ovat yleensä helpompia tunnistaa tarkasti kuin JPEG-tiedostot. Siksi käyttäjien tulee tehdä valintoja tarpeidensa ja tiedostojen laadun perusteella valitessaan ladata tiedostoja.