USB hardware és USB software Wine-hoz | Linux Mint Magyar Közösség

Beküldte Hymer - 2017. ápr. 24. 11:53

Fórum:

Alkalmazások

A HP f4180 All-In-One nyomtatómat mégiscsak telepítem az eredeti programmal a wine-ba. Képek szkennelésére tökéletesen megfelel az XSane, de a szövegfelismerés nem jó, és valahol olvastam, hogy ez még nem megoldott a Linuxon. A HP telepítés beindul szépen, pontosan úgy, ahogy a Windowson, de aztán elakad, és tudatja, hogy telepíteni kell USB hardware-t és USB software-t. Hardware van, de úgy látszik, ezt a wine nem érzékeli. Mit tegyek?

RE: USB hardware és USB software Wine-hoz

Beküldte bartaszili - 2017. ápr. 24. 12:55

Értékelés:

Még nincs értékelve

@#0 Valahol olvastad. Próbáltad? Nem driver kell a szöveg felismeréshez. Jobb ha tisztában vagy a dolgokkal. Van egy képed, azt megnyitod a szövegfelismerő programban, majd nekiereszted. A szkennered csak beszkennel egy képet. Ezt lemented akárhová, majd később azzal dolgozol. A te nyomtatódat tökéletesen kezeli a hplip linuxos driver. Azt jelenti, hogy tudsz vele nyomtatni színeset vagy feketét vagy fotót is, tudsz szkennelni mindenféle felbontásban. Csak rádugod a gépre és automatán felismeri. A szövegfelismerő szoftver egy harmadik játékos. Windowson a legismertebb pld. Abbyy fine reader. Linuxon nem tudom, biztosan van egy pár. Ezrr éve nem kellett OCR szoftvert használjak.
---
Program se kell, van online progi is:
https://www.onlineocr.net/

Nem ismeri fel

Beküldte Hymer - 2017. ápr. 24. 13:40

Értékelés:

Még nincs értékelve

Szeretném, ha pdf formátumban mentené, képekkel elrendezve. Persze doc is jó, azt már tudom konvertálni. Az XSane saját szövegfelismerője csak txt-et adott, de azok is csak értelmetlenül szórt betűk voltak. Kipróbáltam az online programot, de ami kijött pdf, az csak egy fekete mező volt, azzal, hogy a pdf értelmezhetetlen.

RE:Nem ismeri fel

Beküldte bartaszili - 2017. ápr. 24. 15:38

Értékelés:

Még nincs értékelve

#2 Ne szkennelj túl nagy felbontásban szöveget. 150 DPI jó kell legyen egy sima A4-es laphoz, amin 12-es betűk vannak. Ha kicsik a betűk, akkor növeld a felbontást, hogy hasonló képet kapj, mint az A4/12pt/150DPI-nél. Nyomd le a papírt, hogy éles legyen a kép. Fekete/fehérben szkennelj. 600DPI már brutálisan nagy. Ilyenkor minden papír hibát betűnek néz majd a felismerő. Javíthatod az élességet, ha a képen megemeled a fényerőt egy képszerkesztővel. Ha esetleg szürkésre sikeredik a szkennelés. Neked kell kitapasztalni mik a jó általános beállítások. Ezt egyszer megcsinálod, és mindig jó lesz úgy valszeg. Viszont a karakter felismerő programnak ismernie kell a magyar ABC-t. Alapból mindegyik angol szavakat keres. Ilyenkor legjobb esetben ékezet mentesen kapod meg a szöveget, az ékezetes betűknél meg valszeg számok, vagy idióta karakterek lesznek. Amelyik progi nem támogatja a nyelvet, amit beolvastatnál vele, azzal marha nehéz dolgod lesz. Inkább manuálisan gépeld le. De ez az online szolgáltatás nagyon jól felismerte nálam. Leteszteltem.
---
Itt olvashatsz a témáról:
http://www.webupd8.org/2011/03/gimagereader-tesseract-ocr-gui-gets.html
https://help.ubuntu.com/community/OCR
---
Szóval a tesseract-nak van magyar kiegészítője, és azt írják linuxon ez nagyon jó. Legalábbis angolul szuperül működik. Majd te leteszteled a magyart. GImageReadert felrakod hozzá, az a grafikus felülete.
---
https://wiki.gnome.org/action/show/Apps/OCRFeeder?action=show&redirect=O...
Ez is egy grafikus felület hozzá. Githubon érhető el a tesseract fejlesztése.
Majd én is kipróbálom, ha lesz egy kis időm.
---
A google docs is tud szöveget felismerni. Meg ahogy látom van jópár online szolgáltatás még ezeken kívül is.

RE:Nem ismeri fel

Beküldte kimarite - 2017. ápr. 24. 19:51

Értékelés:

Még nincs értékelve

#2 PDF-be konvertáláshoz két ismertebb alkalmazás:
-- Libreoffice
-- GIMP

PDF: Portable Document Format, vendor; Adobe

-----

'A HP telepítés beindul szépen, pontosan úgy, ahogy a Windowson, de aztán elakad, és tudatja, hogy telepíteni kell USB hardware-t és USB software-t.'
-- ezt hol és hogy írja pontosan a hplip telepítő? Kép lenne róla?
-- a driverek és a firmware-ek a Wine által telepítve nem igazán (pontosabban: nem) fognak működni.
-

Kipróbáltam az általam javasoltakat

Beküldte bartaszili - 2017. ápr. 24. 20:24

Értékelés:

Még nincs értékelve

Telepítettem a tesseract-ot, magyar nyelvet is. gImageReadert is meg OCRFeeder-t is a Mint (18.1) Szoftver központjából.
- a szkenneremet egyik progi sem akarja használni a kettő közül, úgyhogy külön szkenneltem, majd mentettem.
- a gImageReader PDF-et is kinyit, a másik csak képet nyit meg
- ezután kijelölöd a területet, amit fel akarsz ismertetni
- simán is fordít, de az magyarul nem helyes, amikor kiválasztod a magyart, akkor már nagyon jól felismerte.
- 300DPI-re állítottam végül, és szürke árnyalatra a szkennert.
- nem a xsane-t használtam, mert feleslegesen sok beállítás van benne. csak a simát, amit alapból telepít a mint
- OCRFeeder nem indult el az ikonjára kattintva. De ha terminálból indítom, akkor megy. Panaszkodik a Pythonra, de működik a szkennelést kivéve. Ezzel menthetsz ODT formátumba, amit a LibreOffice kezel.
- gImageReader csak TXT fájlba ment, de az is jó, mivel így is - úgy is utólag szerkesztened kell. Nem lesz soha 100% jó.

----
Megjegyzem, kb. 15 éve szkennelgettem utoljára... Recognita, meg Abbyy... A legcsúcsabb verziójukkal sem tudtam sokkal jobb végeredményt kihozni. Ha eljátszadoznék a képpel, és egy borotva éles szöveget kapnék, ami teljesen vízszintes, vakító, piszok mentes háttérrel, akkor gondolom számíthatnék 99% helyes felismerésre.

---
kézírás felejtős, hacsak nem úgy írsz, mint egy írógép

RE:RE:Nem ismeri fel

Beküldte kimarite - 2017. ápr. 24. 20:38

Értékelés:

Még nincs értékelve

#4 PDF to Text, stb.

sudo apt-get install poppler-utils

-- a lehetőségek (parancsok)

* pdffonts -- font analyzer
* pdfimages -- image extractor
* pdfinfo -- document information
* pdfseparate -- page extraction tool
* pdftocairo -- PDF to PNG/JPEG/PDF/PS/EPS/SVG converter using Cairo
* pdftohtml -- PDF to HTML converter
* pdftoppm -- PDF to PPM/PNG/JPEG image converter
* pdftops -- PDF to PostScript (PS) converter
* pdftotext -- text extraction
* pdfunite -- document merging tool

Kicsit több lehetőség:
https://nigibox.wordpress.com/2009/10/22/5-useful-pdf-manipulating-tools...

A wine nem találja az USB-t

Beküldte Hymer - 2017. ápr. 25. 09:38

Értékelés:

Még nincs értékelve

Köszi, hogy így elmélyedtél a kérdésben, de őszintén szólva, ez nekem sok. A hp saját programja nagyon jól működött a windowson. Itt is lehetne telepíteni a wine-on. Visszatérhetnénk az első kérdésre, hogy lehetne a wine-t összekötni az USB-vel? Ez egyszerűen megoldaná a problémát.

USB vezérlőt kellene

Beküldte Hymer - 2017. ápr. 25. 11:10

Értékelés:

Még nincs értékelve

USB vezérlőt kellene telepíteni. A wine control parancsra választhattam a Programok hozzáadása, és ott a Wine Geckot és a Wine mono-t lehetett választani. Telepítettem mindkettőt. Most a terminalban a wine control parancsra semmi sem jön elő. Hogyan telepítsem az USB vezérlőt?

RE: USB vezérlőt kellene

Beküldte kimarite - 2017. ápr. 25. 21:16

Értékelés:

Még nincs értékelve

#8 Nem tudom, minek neked a Wine-hoz az USB vezérlőt telepítened, amikor a Wine nem, hanem a HP használja (USB-s nyomtató). Őszintén szólva leírtam már, hogy ez nem fog menni. Alkalmazásokat telepíthetsz a Wine által, azaz Windows-zos 'programokat'. Ezek közé a driverek és illesztőprogramok nagyon nem tartoznak bele, tehát
''A HP telepítés beindul szépen, pontosan úgy, ahogy a Windowson, de aztán elakad, és tudatja, hogy telepíteni kell USB hardware-t és USB software-t.'
ez az elképzelés nem fog működni. Mivelhogy ezért hozták létre a hplip-et ..., mert nem is működne. Fényképezőgép meghajtó programot is natív linux-szosat tudsz telepíteni, tehát nem a Wine által telepíted, mobiltelefonét sem tudod (pl. Nokia Suite), valamint a monitorod driver CD-jét sem használod, nem használhatod a Wine általi megoldással.

De egyébként még mindíg nem árultad el, hogy miben több a Windows-zos HP illesztőprogram, mint a linux-szos hplip. Csak azért kérdezem, mert azokra a dolgokra kéne megoldást találnunk, amit nem tud a hplip szerinted. Másként nem megy ...
Másik megoldás egy virtuális Windows a nyomtató kezelésére: Virtualbox, Qemu, VMware, stb..

Pdf formátum szövegfelismeréssel és képekkel

Beküldte Hymer - 2017. ápr. 25. 22:21

Értékelés:

Még nincs értékelve

Egy dolog miatt hiányzik a HP szoftver. Mások által megformázott meghívókat vagy cikkeket teszek fel honlapra elég gyakran, és nem akarom újra tipografálni az egészet, elosztani a képeket és a szövegeket, hanem úgy ahogy van, gyorsan feltenném az eredetit. Azért szövegfelismerő pdf-formátumban, hogy a szöveges információt könnyen meg lehessen jelölni és kimásolni. Lehet persze doc vagy odt is, azt már könnyedén exportálom a LibreOfficeban pdf-ként. Kizárólag ezt hiányolom, a képek szkennelésével nincs gond. A Poppler parancsokat még nem próbáltam. Nem egészen értem, honnan tudja a terminál, melyik file-ról van szó és hogy magyarul kellene a szöveg. A terminál nekem még nagyon idegen, szívesebben használnék grafikus programokat, bár attól tartok, a Linuxban meg kell barátkoznom a terminállal.

RE: PDF formátum szöveg felismeréssel és képekkel

Beküldte kimarite - 2017. ápr. 25. 23:04

Értékelés:

Még nincs értékelve

#10 Nem ismerem a HP szoftvert. De, ha jól értem, más linux-szos alkalmazásokkal meg tudod nyitni a meghívókat vagy cikkeket úgy megformázva, ahogy eredetileg vannak és ez általában így van. Ezek általában milyen formátumban vannak? Milyen formátum megnyitásával van probléma és melyik formátumnak nem tudom másolni a szöveg részét? Ha a szöveg egy képben van mentve, azt nem fogod tudni másolni kijelöléssel ... . Avagy a HP alkalmazás (Windows alatt) erre is képes lenne, képből szöveget ismer fel?

Én az Evince-t használom a PDF-hez: ez a Dokumentum megjelenítő.
Nem mindig tudok szöveget másolni, de nem minden PDF szöveges PDF.

De meg kell mondjam, még mindig nem igazán értem a kérdésed. Talán azért, mert (tulajdonképpen) fogalmam sincs, mire gondolsz, amikor a Windows-zos HP alkalmazásról beszélsz, számomra elég részlet szegényen. Azaz nem értem még mindig, hogy az mit tud, amit a linux-szos alkalmazások nem: megnyitsz egy fájlt -valamilyen formátumút- és nyomtatsz, ... ennyi lenne érzésem szerint a dolog. Az Evince-vel a szöveg is másolható (PDF), a Libreoffice is sok fájl formátumot ismer. Tehát, ha szöveget másolnál, nem a nyomtatással nyitod meg, hanem az azt kezelő valamely alkalmazással.

Amikt ajánlottam a terminál-ba, az nem igazán neked való.
Félreértettelek. De például ezt tudja (pdfinfo):

cd Documents/civil/kerékpár/
kim@kim:~/Documents/civil/kerékpár$ pdfinfo
pdfinfo version 0.26.5
Copyright 2005-2014 The Poppler Developers - http://poppler.freedesktop.org
Copyright 1996-2011 Glyph & Cog, LLC
Usage: pdfinfo [options] <PDF-file>
-f <int> : first page to convert
-l <int> : last page to convert
-box : print the page bounding boxes
-meta : print the document metadata (XML)
-js : print all JavaScript in the PDF
-rawdates : print the undecoded date strings directly from the PDF file
-enc <string> : output text encoding name
-listenc : list available encodings
-opw <string> : owner password (for encrypted files)
-upw <string> : user password (for encrypted files)
-v : print copyright and version info
-h : print usage information
-help : print usage information
--help : print usage information
-? : print usage information
kim@kim:~/Documents/civil/kerékpár$ pdfinfo Dunamenti\ kerékpáros\ teljesítménytúrák\ 2017.pdf
Title: Layout 1
Creator: QuarkXPress(R) 9.5
Producer: QuarkXPress(R) 9.5
CreationDate: Sun Jan 15 09:24:22 2017
ModDate: Sun Jan 15 09:24:22 2017
Tagged: no
UserProperties: no
Suspects: no
Form: none
JavaScript: no
Pages: 6
Encrypted: no
Page size: 297.638 x 419.528 pts
Page rot: 0
File size: 12658116 bytes
Optimized: no
PDF version: 1.4

Egy példa

Beküldte Hymer - 2017. ápr. 26. 08:30

Értékelés:

Még nincs értékelve

Itt egy példa arra, hogy milyen tipusú képeket kapok: http://varosvedo.hu/wp-content/uploads/2017/03/fener_kiallitas.jpg

Az ilyeneket meg az ennél bonyolultabbakat szeretném úgy megcsinálni, hogy pont így nézzen ki a kép a honlapon azzal a különbséggel, hogy a szöveg megjelölhető és másolható legyen szövegként. Tudom, ezt nem nagy művészet reprodukálni a LibreOfficeban, de néha többet kapok egyszerre, és ha van egyszerűbb megoldás, nincs kedvem a színekkel, betűméretekkel, elrendezéssel bajlódni. Erre kellene a pdf szövegfelismeréssel.

RE:Egy példa

Beküldte bartaszili - 2017. ápr. 26. 10:54

Értékelés:

Még nincs értékelve

#12 Hogyan működik egy weboldal? Mert nagy baromságon töröd a fejed. Egy képen nem tudsz szöveget kijelölni, hacsak css-el nem rakod a kép elé. Na és ha valami extra ritka font van a grafikán, akkor mit csinálsz? Pdf-et nem tudsz beágyazni képnek. De abba el tudod menteni úgy, hogy a delikvens kattintson a linkre, letölti, vagy kinyílik új ablakban, új fülön... És ekkor tudja kijelölni a szöveget. Pdf, doc, odt... doksikban.
---
Windowson hogy csinálod? Írd le részletesen. Konkrét végeredményt mutass linken.
---
Látatlanban mondom a HP szoftverről, hogy kizárt, hogy egy beszkennelt kártyát olyan formátumban kapsz meg szövegfelismerve bármilyen operációs rendszeren, hogy azt beágyazhasd mindenféle utómunka nélkül pld. egy WordPress CMS-be. Ilyen nincs, nem is volt, nem is lesz egyhamar.

Cáfolhatod, de akkor tényeket mutass.

RE:Pdf formátum szövegfelismeréssel és képekkel

Beküldte bartaszili - 2017. ápr. 26. 11:31

Értékelés:

Még nincs értékelve

#10 Ha jól értem. Jól értem???
1) szkenneled a képet
2) felismeri a szöveget rajta a program
3) az eredeti képre rárakja a felismert szöveget helyes méretben és stílusban, pöccre kitakarva a mögötte lévő eredetit
4) ahogy van menti PDFbe.
5) te nem segítesz a proginak közben semmit, csak 3x kattintasz: 1-szkennelj, 2-ismerd fel, 3-mentsd
??? Jól értem, vagy hibás a dolog?

Pdf szövegfelismeréssel

Beküldte Hymer - 2017. ápr. 26. 12:19

Értékelés:

Még nincs értékelve

Igen. Pontosabban előre vagy a szkennelés után beállítom, hogy képet vagy dokumentumot akarok-e, aztán ha jól emlékszem, a kész képen a pdf-en belül is választhatok, hogy "kereshető" legyen, vagyis szöveg vagy kép. De nem fáradok el, ha többször kell kattintani, csak legyen jó a magyar szöveg. Nekem úgy is jó, ha a kész képen felismeri a szöveget és azt úgy helyezi el a kép(ek) mellé/közé, ahogy az az eredetin volt.

RE: Pdf szövegfelismeréssel

Beküldte bartaszili - 2017. ápr. 26. 12:59

Értékelés:

Még nincs értékelve

#15 Hogy mondják svédül, hogy "good luck"? Ezt te így csinálod jelenleg windowson? Megmutatod?

Re re re Pdf szövegfelismeréssel

Beküldte Hymer - 2017. ápr. 26. 14:19

Értékelés:

Még nincs értékelve

(Svédül "Lycka till!") A windowsom már nincs meg, de találtam egy képet a beállításról itt: https://support.hp.com/doc-images/451/c05174173.gif

Ha behatóbban érdekel, ez ezen az oldalon olvasható 2. lépés cím alatt: https://support.hp.com/hu-hu/product/hp-deskjet-f4100-all-in-one-printer...

De mindegy, ha nem így megy a Linuxon, csak az eredmény legyen egy szövegfelismerős dokumentum.

RE:Re re re Pdf szövegfelismeréssel

Beküldte bartaszili - 2017. ápr. 26. 15:01

Értékelés:

Még nincs értékelve

#17
Idézek: "There is an important shortcoming: the program does not do OCR on the scan, so the text is not recognized. Acrobat does OCR by default when it scans; when it’s done, lines of text can be highlighted and the text is searchable."
Forrás: http://www.brucebnews.com/2015/02/using-hp-scan-capture-to-create-pdfs-f...

Ez a HP Scan and Capture program nekem is megvan. Az Adobe Acrobat húzós árú program, de jó. Ezer éve használtam, akkor még nem tudott ilyen intelligens dokumentumot csinálni... Mibe fogadunk, hogy most se tud?

---

Végeredmény: Egyik OCR progi sem fogja meghatározni a font típusát, nagyságát, stílusát. Nem fogják pozícionálni a dokumentumon. Nem erre lettek kitalálva, hanem szavak betűk, számok felismarésére.
Ez nem a linux hiányossága, és Windowson is így van. Egy egyszerű levelet az ügyvédtől nagyjából megcsinál doc-nak. De ennyi.

Akkor keresem a legjobb OCR-t

Beküldte Hymer - 2017. ápr. 26. 20:34

Értékelés:

Még nincs értékelve

OK, lehet, hogy rosszul emlékszem, beletörődtem. Akkor próbálgatom az OCR programokat, melyik a legjobb közülük. Átnézem az itt kapott jó tanácsokat.

RE:Re re re Pdf szövegfelismeréssel

Beküldte kimarite - 2017. ápr. 26. 22:40

Értékelés:

Még nincs értékelve

#17 Értem. Megoldásra váró probléma az informatikában.

RE:RE:Re re re Pdf szövegfelismeréssel

Beküldte bartaszili - 2017. ápr. 27. 07:44

Értékelés:

Átlag: 5 (1 szavazat)

#20 Az Acrobat tud valami ilyesmit. Szkennelsz vele egy nyomtatványt, abból kreál egy szerkeszthető PDF-et. Apple termékeken, vagy Windowson. Nem tudom Wine vagy PlayOnLinux tudja e 100%-ban futtatni? Viszont ez nincs ingyen. Egy művészi posztert, szórólapot az se fog szerintem megcsinálni.

Én anno úgy tettem fel egy weboldalra az ilyen hirdetéseket, hogy szkenneltem képnek, azt beágyaztam, és alá írtam a szöveget. Átláthatóbb, az eredeti plakátot azonnal látod, nem kell kattintani és másolható a szöveg is, ill. emailben is el lehetett küldeni, vagy pdfben letölteni.

[Megoldva] Köszönöm a segítséget.

Beküldte Hymer - 2017. ápr. 28. 07:55

Értékelés:

Még nincs értékelve

Köszönöm a segítséget.

RE: [Megoldva] Köszönöm a segítséget.

Beküldte csabrix - 2017. ápr. 28. 23:02

Értékelés:

Még nincs értékelve

Mi lett a megoldás?

RE:RE:RE:Re re re Pdf szövegfelismeréssel

Beküldte kimarite - 2017. ápr. 29. 18:38

Értékelés:

Még nincs értékelve

#21 Én is így csinálom: beillesztem az eredeti plakátot és alá írom a hírt szövegesen.

A megoldás az lett, hogy

Beküldte Hymer - 2017. ápr. 30. 11:14

Értékelés:

Még nincs értékelve

A megoldás az lett, hogy feladtam. Lehet, hogy rosszul emlékszem arra, hogy a HP a windowsban mire volt képes. Ugyanakkor furcsának találom, hogy nincs olyan program, amelyik a beszkennelt képet ujjáteremti kereshető szöveggel és az eredeti layout-tal. Ennél nehezebb feladatokat is megoldottak már a programozók. Javaslom a programteremtő informatikusoknak, hogy alkossanak egy ilyen programot. Szerintem világsiker lesz.

RE: A megoldás az lett, hogy

Beküldte kimarite - 2017. ápr. 30. 12:09

Értékelés:

Még nincs értékelve

#25 Igazad van .. :D

^{http://www.youtube.com/watch?v=0PkOJKx9Md8
Hiába van nyolc óra,
mer' aztán úgyis tizenegy.
És aztán megint hét óra
és aztán megint nyolc óra!}

^{És úgyis minden hiába.
Úgyis minden hiába.}

^{.. de csak nem így van. ;)}

Fórum:

Értékelés:

Értékelés:

Értékelés:

Értékelés:

Értékelés:

Értékelés:

Értékelés:

Értékelés:

Értékelés:

Értékelés:

Értékelés:

Értékelés:

Értékelés:

Értékelés:

Értékelés:

Értékelés:

Értékelés:

Értékelés:

Értékelés:

Értékelés:

Értékelés:

Értékelés:

Értékelés:

Értékelés:

Értékelés:

Értékelés:

Keresés az oldalon

Bejelentkezés

Szavazás