Szövegesen kereshető PDF

Fórum: 

Üdv!

Mitvel szoktáok "normál" pdf fájl átalakítani úgy, hogy a szöveges részek kereshetőek legyenek?

Linux Mint 18.1 Xfce 64bit

OCR programmal. Tesseract pld

OCR programmal. Tesseract pld.
Tegyük fel PDF-ben igaziból egy JPG kép csücsül. Ha jó minőségben van a kép, akkor az egész olyan mint az 1x1. Ha fika, akkor melós a dolog. Az ubuntu.hu -n bloggolta nemrég valaki hogyan csinálta terminálos megoldással. Itt is volt már szó róla. Keress rá a tesseract, tesseract-ocr-hun kifejezésekre.

Értékelés: 

0
Még nincs értékelve

RE:OCR programmal. Tesseract pld

#1

Ha jól tudom a Tesseract "csak" egy OCR motor, ahhoz kell egy külön progi is, amivel át tudom alakítani a PDF fájlokat.

Mit ajánlassz a Tesseract-hoz?

Értékelés: 

0
Még nincs értékelve

RE:RE:OCR programmal. Tesseract pld

#2 Ma találkoztam először a "LyX"-el. Fogalmam nincs hogy mit tud - de nézd meg - talán találsz benne olyat.

ami hasznos lehet a számodra.

http://www.lyx.org/

Értékelés: 

0
Még nincs értékelve

Lios

https://sourceforge.net/projects/lios/?source=typ_redirect

Lios és a Tesseract OCR. Csak ne felejtsd el hozzá feltenni a tesseract-ocr-hun csomagot.

Meg sem közelíti a sajnos a ABBYY readert (nem is értem miért nem készítik el Linuxra - a motor persze elérhető, csak a grafikus felület nem. Én biztos vennék egyet), de azért használható. Csak fapados egy kicsit.

Értékelés: 

0
Még nincs értékelve

RE:Lios

#4

Közben kipróbáltam már pár dolgot (köztük ezt is), de sajnos úgy látom, hogy a Linuxon erre még nincs profi megoldás.

 

Értékelés: 

0
Még nincs értékelve

Nincs rá igény. Nem linuxozik

Nincs rá igény. Nem linuxozik a sok irodista Gizike. Viszont, ami van az ingyenes. Amint lenne kereslet szélesebb körben, valami biztosan beindulna. Ez egy hasonló terület, mint a CAD.

Értékelés: 

0
Még nincs értékelve

abbyy

az abbyy- nak van egy váltzata - portable - ami wine-nal futtatható....én meg virtualboxban futtatok  win7-et és ott használom az abbyy-t..

Értékelés: 

0
Még nincs értékelve
kimarite képe

OCR

Mai fórumtéma, néhány megoldás említve lett:

-- ABBYY FineReader Engine 11 CLI for Linux is a powerful, ready-to-use command line based application for system administrators, developers and advanced computer users who want to use optical character recognition (OCR, text recognition) and PDF conversion technologies on the Linux platform.
http://www.ocr4linux.com/en:start

-- gImageReader
A graphical frontend to tesseract-ocr
https://sourceforge.net/projects/gimagereader/

-- Free Online OCR Service
Use Optical Character Recognition software online. Service supports
46 languages including Chinese, Japanese and Korean
Extract text from PDF and images (JPG, BMP, TIFF, GIF) and convert into editable
Word, Excel and Text output formats
https://www.onlineocr.net/

-- VietOCR
A Java/.NET GUI frontend for Tesseract OCR engine. Supports optical character recognition for Vietnamese and other languages supported by Tesseract.
http://vietocr.sourceforge.net/
https://wiki.ubuntuusers.de/vietOCR/

-- Cuneiform-Qt
Cuneiform-Qt is GUI frontend for Cuneiform OCR System
https://en.altlinux.org/Cuneiform-Qt
-- Cuneiform-Linux
https://wiki.ubuntuusers.de/Cuneiform-Linux/

Értékelés: 

0
Még nincs értékelve

RE:OCR

#8

Köszönöm

Ezeket feljegyzem, de most vissza kellett térnem windowsra. Nagyon bejött a Linux. de jelenleg több száz oldalas DOC fájlokkal kell dolgoznom és a LibreOffice-el kínszenvedés volt használni őket. :(

Értékelés: 

0
Még nincs értékelve