Whatsapp

gImageReader – Extraheer tekst uit afbeeldingen en pdf's in Linux

Anonim

gImageReader is een gratis en open-source pdf-lezer waarmee tekst uit afbeeldingen en pdf's kan worden gehaald. Het is gebouwd als een eenvoudige Gtk/Qt-front-end voor Tesseract-OCR, een open-source OCR-engine voor het herkennen van teksten en patronen in documenten en afbeeldingen met behulp vanKunstmatige intelligentie

Op zichzelf is Tesseract een opdrachtregelprogramma dat beperkt is tot gebruik door Linux-gebruikers die voldoende vertrouwd zijn met hun terminals. Dankzij gImageReader kan iedereen nu profiteren van de OCR-efficiëntie van de engine.

gImageReader werkt door teksten uit PDF- of afbeeldingsbestanden te scannen in een van de verschillende talen die het ondersteunt dankzij het bestaan ​​van Unicode-tekens . Het beschikt over een eenvoudige, goed georganiseerde, aanpasbare gebruikersinterface waarmee u spellingcontrole en verta altaken kunt uitvoeren.

Functies in gImageReader

gImageReader is gebruiksvriendelijk en ondersteunt het werken met zowel softcopy-documenten als snapshots van geüploade media, b.v. schermafbeeldingen. Je hebt zelfs de mogelijkheid om het tekstgebied te selecteren waarin je geïnteresseerd bent en alleen de tekst die je nodig hebt. Uiteindelijk functioneert gImagereader zowel als pdf-lezer als als hulpmiddel voor het extraheren van tekst. Gekke dingen.

Installeer gImageReader op Linux

Om gImageReader optimaal te gebruiken, moet u Tesseract handmatig installeren taalpakketten zodat u afbeeldingen en bestanden goed kunt analyseren.Het pakket heet 'Tesseract-ocr-eng' en is verkrijgbaar bij de softwarebeheerder in Debianen Fedora distributies.

Als je Ubuntu gebruikt, kun je eenvoudig de PPAen voer de installatieopdracht uit met de onderstaande opdrachten:

$ sudo add-apt-repository ppa:sandromani/gimagereader
$ sudo apt-update
$ sudo apt installeer gimagereader

Op Debian, Fedora en OpenSUSE installeer het vanuit de pakketbeheerder.

$ sudo apt install gimagereader
$ sudo dnf installeer gimagereader
$ sudo zypper installeer gimagereader

Voel je niet buitengesloten als je Arch Linux of een van zijn derivaten gebruikt. De AUR heeft u gedekt. En als u de app liever vanaf de bron opnieuw wilt bouwen, vindt u instructies in de GitHub-repository Wiki-link.

Bent u iemand die afgedrukte tekst uit afbeeldingen ha alt? U kunt zelfs snapshots van geselecteerde gebieden maken met uw telefoon en deze uploaden naar uw laptop. Wat nog cooler is, is de meertalige ondersteuning – die weliswaar niet perfect is, maar op dit moment al een van de beste opties in de community is.

gImageReader is een van de beste PDF-lezers in de open-sourcewereld, vooral met zijn OCR-mogelijkheden, dus probeer het eens en kijk gewoon hoe je het wil.

Zoals gewoonlijk bent u van harte welkom om uw ervaringen met de app met ons te delen als u die heeft. En om andere suggesties toe te voegen in de opmerkingen hieronder.