Beküldte Hymer -
Fórum:
A HP f4180 All-In-One nyomtatómat mégiscsak telepítem az eredeti programmal a wine-ba. Képek szkennelésére tökéletesen megfelel az XSane, de a szövegfelismerés nem jó, és valahol olvastam, hogy ez még nem megoldott a Linuxon. A HP telepítés beindul szépen, pontosan úgy, ahogy a Windowson, de aztán elakad, és tudatja, hogy telepíteni kell USB hardware-t és USB software-t. Hardware van, de úgy látszik, ezt a wine nem érzékeli. Mit tegyek?
RE: USB hardware és USB software Wine-hoz
Beküldte bartaszili -
Értékelés:
@#0 Valahol olvastad. Próbáltad? Nem driver kell a szöveg felismeréshez. Jobb ha tisztában vagy a dolgokkal. Van egy képed, azt megnyitod a szövegfelismerő programban, majd nekiereszted. A szkennered csak beszkennel egy képet. Ezt lemented akárhová, majd később azzal dolgozol. A te nyomtatódat tökéletesen kezeli a hplip linuxos driver. Azt jelenti, hogy tudsz vele nyomtatni színeset vagy feketét vagy fotót is, tudsz szkennelni mindenféle felbontásban. Csak rádugod a gépre és automatán felismeri. A szövegfelismerő szoftver egy harmadik játékos. Windowson a legismertebb pld. Abbyy fine reader. Linuxon nem tudom, biztosan van egy pár. Ezrr éve nem kellett OCR szoftvert használjak.
---
Program se kell, van online progi is:
https://www.onlineocr.net/
Nem ismeri fel
Beküldte Hymer -
Értékelés:
Szeretném, ha pdf formátumban mentené, képekkel elrendezve. Persze doc is jó, azt már tudom konvertálni. Az XSane saját szövegfelismerője csak txt-et adott, de azok is csak értelmetlenül szórt betűk voltak. Kipróbáltam az online programot, de ami kijött pdf, az csak egy fekete mező volt, azzal, hogy a pdf értelmezhetetlen.
RE:Nem ismeri fel
Beküldte bartaszili -
Értékelés:
---
Itt olvashatsz a témáról:
http://www.webupd8.org/2011/03/gimagereader-tesseract-ocr-gui-gets.html
https://help.ubuntu.com/community/OCR
---
Szóval a tesseract-nak van magyar kiegészítője, és azt írják linuxon ez nagyon jó. Legalábbis angolul szuperül működik. Majd te leteszteled a magyart. GImageReadert felrakod hozzá, az a grafikus felülete.
---
https://wiki.gnome.org/action/show/Apps/OCRFeeder?action=show&redirect=O...
Ez is egy grafikus felület hozzá. Githubon érhető el a tesseract fejlesztése.
Majd én is kipróbálom, ha lesz egy kis időm.
---
A google docs is tud szöveget felismerni. Meg ahogy látom van jópár online szolgáltatás még ezeken kívül is.
RE:Nem ismeri fel
Beküldte kimarite -
Értékelés:
-- Libreoffice
-- GIMP
PDF: Portable Document Format, vendor; Adobe
-----
'A HP telepítés beindul szépen, pontosan úgy, ahogy a Windowson, de aztán elakad, és tudatja, hogy telepíteni kell USB hardware-t és USB software-t.'
-- ezt hol és hogy írja pontosan a hplip telepítő? Kép lenne róla?
-- a driverek és a firmware-ek a Wine által telepítve nem igazán (pontosabban: nem) fognak működni.
-
Kipróbáltam az általam javasoltakat
Beküldte bartaszili -
Értékelés:
Telepítettem a tesseract-ot, magyar nyelvet is. gImageReadert is meg OCRFeeder-t is a Mint (18.1) Szoftver központjából.
- a szkenneremet egyik progi sem akarja használni a kettő közül, úgyhogy külön szkenneltem, majd mentettem.
- a gImageReader PDF-et is kinyit, a másik csak képet nyit meg
- ezután kijelölöd a területet, amit fel akarsz ismertetni
- simán is fordít, de az magyarul nem helyes, amikor kiválasztod a magyart, akkor már nagyon jól felismerte.
- 300DPI-re állítottam végül, és szürke árnyalatra a szkennert.
- nem a xsane-t használtam, mert feleslegesen sok beállítás van benne. csak a simát, amit alapból telepít a mint
- OCRFeeder nem indult el az ikonjára kattintva. De ha terminálból indítom, akkor megy. Panaszkodik a Pythonra, de működik a szkennelést kivéve. Ezzel menthetsz ODT formátumba, amit a LibreOffice kezel.
- gImageReader csak TXT fájlba ment, de az is jó, mivel így is - úgy is utólag szerkesztened kell. Nem lesz soha 100% jó.
----
Megjegyzem, kb. 15 éve szkennelgettem utoljára... Recognita, meg Abbyy... A legcsúcsabb verziójukkal sem tudtam sokkal jobb végeredményt kihozni. Ha eljátszadoznék a képpel, és egy borotva éles szöveget kapnék, ami teljesen vízszintes, vakító, piszok mentes háttérrel, akkor gondolom számíthatnék 99% helyes felismerésre.
---
kézírás felejtős, hacsak nem úgy írsz, mint egy írógép
RE:RE:Nem ismeri fel
Beküldte kimarite -
Értékelés:
-- a lehetőségek (parancsok)
Kicsit több lehetőség:
https://nigibox.wordpress.com/2009/10/22/5-useful-pdf-manipulating-tools...
A wine nem találja az USB-t
Beküldte Hymer -
Értékelés:
Köszi, hogy így elmélyedtél a kérdésben, de őszintén szólva, ez nekem sok. A hp saját programja nagyon jól működött a windowson. Itt is lehetne telepíteni a wine-on. Visszatérhetnénk az első kérdésre, hogy lehetne a wine-t összekötni az USB-vel? Ez egyszerűen megoldaná a problémát.
USB vezérlőt kellene
Beküldte Hymer -
Értékelés:
USB vezérlőt kellene telepíteni. A wine control parancsra választhattam a Programok hozzáadása, és ott a Wine Geckot és a Wine mono-t lehetett választani. Telepítettem mindkettőt. Most a terminalban a wine control parancsra semmi sem jön elő. Hogyan telepítsem az USB vezérlőt?
RE: USB vezérlőt kellene
Beküldte kimarite -
Értékelés:
''A HP telepítés beindul szépen, pontosan úgy, ahogy a Windowson, de aztán elakad, és tudatja, hogy telepíteni kell USB hardware-t és USB software-t.'
ez az elképzelés nem fog működni. Mivelhogy ezért hozták létre a hplip-et ..., mert nem is működne. Fényképezőgép meghajtó programot is natív linux-szosat tudsz telepíteni, tehát nem a Wine által telepíted, mobiltelefonét sem tudod (pl. Nokia Suite), valamint a monitorod driver CD-jét sem használod, nem használhatod a Wine általi megoldással.
De egyébként még mindíg nem árultad el, hogy miben több a Windows-zos HP illesztőprogram, mint a linux-szos hplip. Csak azért kérdezem, mert azokra a dolgokra kéne megoldást találnunk, amit nem tud a hplip szerinted. Másként nem megy ...
Másik megoldás egy virtuális Windows a nyomtató kezelésére: Virtualbox, Qemu, VMware, stb..
Pdf formátum szövegfelismeréssel és képekkel
Beküldte Hymer -
Értékelés:
Egy dolog miatt hiányzik a HP szoftver. Mások által megformázott meghívókat vagy cikkeket teszek fel honlapra elég gyakran, és nem akarom újra tipografálni az egészet, elosztani a képeket és a szövegeket, hanem úgy ahogy van, gyorsan feltenném az eredetit. Azért szövegfelismerő pdf-formátumban, hogy a szöveges információt könnyen meg lehessen jelölni és kimásolni. Lehet persze doc vagy odt is, azt már könnyedén exportálom a LibreOfficeban pdf-ként. Kizárólag ezt hiányolom, a képek szkennelésével nincs gond. A Poppler parancsokat még nem próbáltam. Nem egészen értem, honnan tudja a terminál, melyik file-ról van szó és hogy magyarul kellene a szöveg. A terminál nekem még nagyon idegen, szívesebben használnék grafikus programokat, bár attól tartok, a Linuxban meg kell barátkoznom a terminállal.
RE: PDF formátum szöveg felismeréssel és képekkel
Beküldte kimarite -
Értékelés:
Én az Evince-t használom a PDF-hez: ez a Dokumentum megjelenítő.
Nem mindig tudok szöveget másolni, de nem minden PDF szöveges PDF.
De meg kell mondjam, még mindig nem igazán értem a kérdésed. Talán azért, mert (tulajdonképpen) fogalmam sincs, mire gondolsz, amikor a Windows-zos HP alkalmazásról beszélsz, számomra elég részlet szegényen. Azaz nem értem még mindig, hogy az mit tud, amit a linux-szos alkalmazások nem: megnyitsz egy fájlt -valamilyen formátumút- és nyomtatsz, ... ennyi lenne érzésem szerint a dolog. Az Evince-vel a szöveg is másolható (PDF), a Libreoffice is sok fájl formátumot ismer. Tehát, ha szöveget másolnál, nem a nyomtatással nyitod meg, hanem az azt kezelő valamely alkalmazással.
Amikt ajánlottam a terminál-ba, az nem igazán neked való.
Félreértettelek. De például ezt tudja (pdfinfo):
Egy példa
Beküldte Hymer -
Értékelés:
Itt egy példa arra, hogy milyen tipusú képeket kapok: http://varosvedo.hu/wp-content/uploads/2017/03/fener_kiallitas.jpg
Az ilyeneket meg az ennél bonyolultabbakat szeretném úgy megcsinálni, hogy pont így nézzen ki a kép a honlapon azzal a különbséggel, hogy a szöveg megjelölhető és másolható legyen szövegként. Tudom, ezt nem nagy művészet reprodukálni a LibreOfficeban, de néha többet kapok egyszerre, és ha van egyszerűbb megoldás, nincs kedvem a színekkel, betűméretekkel, elrendezéssel bajlódni. Erre kellene a pdf szövegfelismeréssel.
RE:Egy példa
Beküldte bartaszili -
Értékelés:
---
Windowson hogy csinálod? Írd le részletesen. Konkrét végeredményt mutass linken.
---
Látatlanban mondom a HP szoftverről, hogy kizárt, hogy egy beszkennelt kártyát olyan formátumban kapsz meg szövegfelismerve bármilyen operációs rendszeren, hogy azt beágyazhasd mindenféle utómunka nélkül pld. egy WordPress CMS-be. Ilyen nincs, nem is volt, nem is lesz egyhamar.
Cáfolhatod, de akkor tényeket mutass.
RE:Pdf formátum szövegfelismeréssel és képekkel
Beküldte bartaszili -
Értékelés:
1) szkenneled a képet
2) felismeri a szöveget rajta a program
3) az eredeti képre rárakja a felismert szöveget helyes méretben és stílusban, pöccre kitakarva a mögötte lévő eredetit
4) ahogy van menti PDFbe.
5) te nem segítesz a proginak közben semmit, csak 3x kattintasz: 1-szkennelj, 2-ismerd fel, 3-mentsd
??? Jól értem, vagy hibás a dolog?
Pdf szövegfelismeréssel
Beküldte Hymer -
Értékelés:
Igen. Pontosabban előre vagy a szkennelés után beállítom, hogy képet vagy dokumentumot akarok-e, aztán ha jól emlékszem, a kész képen a pdf-en belül is választhatok, hogy "kereshető" legyen, vagyis szöveg vagy kép. De nem fáradok el, ha többször kell kattintani, csak legyen jó a magyar szöveg. Nekem úgy is jó, ha a kész képen felismeri a szöveget és azt úgy helyezi el a kép(ek) mellé/közé, ahogy az az eredetin volt.
RE: Pdf szövegfelismeréssel
Beküldte bartaszili -
Értékelés:
Re re re Pdf szövegfelismeréssel
Beküldte Hymer -
Értékelés:
(Svédül "Lycka till!") A windowsom már nincs meg, de találtam egy képet a beállításról itt: https://support.hp.com/doc-images/451/c05174173.gif
Ha behatóbban érdekel, ez ezen az oldalon olvasható 2. lépés cím alatt: https://support.hp.com/hu-hu/product/hp-deskjet-f4100-all-in-one-printer...
De mindegy, ha nem így megy a Linuxon, csak az eredmény legyen egy szövegfelismerős dokumentum.
RE:Re re re Pdf szövegfelismeréssel
Beküldte bartaszili -
Értékelés:
Idézek: "There is an important shortcoming: the program does not do OCR on the scan, so the text is not recognized. Acrobat does OCR by default when it scans; when it’s done, lines of text can be highlighted and the text is searchable."
Forrás: http://www.brucebnews.com/2015/02/using-hp-scan-capture-to-create-pdfs-f...
Ez a HP Scan and Capture program nekem is megvan. Az Adobe Acrobat húzós árú program, de jó. Ezer éve használtam, akkor még nem tudott ilyen intelligens dokumentumot csinálni... Mibe fogadunk, hogy most se tud?
---
Végeredmény: Egyik OCR progi sem fogja meghatározni a font típusát, nagyságát, stílusát. Nem fogják pozícionálni a dokumentumon. Nem erre lettek kitalálva, hanem szavak betűk, számok felismarésére.
Ez nem a linux hiányossága, és Windowson is így van. Egy egyszerű levelet az ügyvédtől nagyjából megcsinál doc-nak. De ennyi.
Akkor keresem a legjobb OCR-t
Beküldte Hymer -
Értékelés:
OK, lehet, hogy rosszul emlékszem, beletörődtem. Akkor próbálgatom az OCR programokat, melyik a legjobb közülük. Átnézem az itt kapott jó tanácsokat.
RE:Re re re Pdf szövegfelismeréssel
Beküldte kimarite -
Értékelés:
RE:RE:Re re re Pdf szövegfelismeréssel
Beküldte bartaszili -
Értékelés:
Én anno úgy tettem fel egy weboldalra az ilyen hirdetéseket, hogy szkenneltem képnek, azt beágyaztam, és alá írtam a szöveget. Átláthatóbb, az eredeti plakátot azonnal látod, nem kell kattintani és másolható a szöveg is, ill. emailben is el lehetett küldeni, vagy pdfben letölteni.
[Megoldva] Köszönöm a segítséget.
Beküldte Hymer -
Értékelés:
Köszönöm a segítséget.
RE: [Megoldva] Köszönöm a segítséget.
Beküldte csabrix -
Értékelés:
Mi lett a megoldás?
RE:RE:RE:Re re re Pdf szövegfelismeréssel
Beküldte kimarite -
Értékelés:
A megoldás az lett, hogy
Beküldte Hymer -
Értékelés:
A megoldás az lett, hogy feladtam. Lehet, hogy rosszul emlékszem arra, hogy a HP a windowsban mire volt képes. Ugyanakkor furcsának találom, hogy nincs olyan program, amelyik a beszkennelt képet ujjáteremti kereshető szöveggel és az eredeti layout-tal. Ennél nehezebb feladatokat is megoldottak már a programozók. Javaslom a programteremtő informatikusoknak, hogy alkossanak egy ilyen programot. Szerintem világsiker lesz.
RE: A megoldás az lett, hogy
Beküldte kimarite -
Értékelés:
http://www.youtube.com/watch?v=0PkOJKx9Md8
Hiába van nyolc óra,
mer' aztán úgyis tizenegy.
És aztán megint hét óra
és aztán megint nyolc óra!
És úgyis minden hiába.
Úgyis minden hiába.
.. de csak nem így van. ;)