Hangalapú gépelés Linuxon

Mindenki ismeri azokat a „csodálatos” appokat, amelyekkel például egyetlen kattintással el lehet tüntetni egy fényképről a hátteret. Ezek a fejlett képességek nekem nagyon hiányoznak a Linuxból.

Elég gyorsan tudok gépelni, de nem tudok szabályosan tíz ujjal írni, és rengetegszer ütök mellé. Nem győzőm javítani az elütéseket. Egy hosszabb levél megírása ezért elég időigénye.
Már többször eszembe jutott, hogy milyen jó lenne, ha Linuxon is lenne hangalapú gépelés.
(Most talán majd valaki megírja, ha van ilyen, én nem tudok róla)

Most arról fogok írni, hogy hogyan lehet ezt a képességet arra használni, hogy például ide a Fórumba írt bejegyzéshez ne kelljen gépelni annyit.
Csak a telefonunkba kell mondani a szöveget, ami azonnal megjelenik a monitoron.

A Samsung telefonom billentyűzetén van egy mikrofon ikon, amit lenyomva „legépeli” azt, amit mondok. De vannak külön alkalmazások is erre a célra. Az egyik ilyen az Azonnali átírás és értesítés nevet viseli.
https://play.google.com/store/apps/details?id=com.google.audio.hearing.visualization.accessibility.scribe

A bevezető két mondatomat így írta le az applikáció:

Mindenki ismeri azokat a „csodálatos” appokat, amelyekkel egyetlen kattintással el lehet tüntetni egy fényképről a hátteret. Ezek a fejlett képességek hiányoznak a Linuxból.

mindenki ismeri azokat a csodálatos appokat amelyekkel egyetlen kattintással el lehet tüntetni egy fényképről a hátteret ezek a fejlett képességek hiányoznak a linuxból

Sajnos ezek az appok még nem tökéletesek. Nem kezdik nagybetűvel a mondatot, nem ismerik fel a mondatok végét, vagy a tagmondatokat, nem használnak írásjeleket, és például a Linuxot is kisbetűvel írta.
De ezek javítása sokkal kisebb munka, mint a teljes írás begépelése.

A diktált szöveg átvitele a PC-re többféleképpen is megvalósítható.
Ha a diktálás után belekattintunk a szövegbe > Összes kijelölés > Másolás után például a KDEConnect használatakor a vágólap tartalma beilleszthető egy Linux alkalmazásokba.

De én tovább gondoltam ezt lehetőséget, és összekombináltam az általam korábban bemutatott Scrcpy alkalmazással ami a telefon kijelzőjét megjeleníti a monitoron.
Így sokkal kényelmesebb a diktálás is, és a másolás-beillesztéshez sincs szükség más alkalmazásra, mert a képernyőről közvetlenül kimásolhatjuk.

Megemlítek még egy lehetőséget.
Ha a telefonról akarok bejegyzést írni a Fórumba, akkor azt is megtehetem hangvezérléssel, és ebben az esetben közvetlenül a szerkesztőablakba kerülhet, amit diktálunk.

Hozzászólások

Secretary 1.0

Secretary 1.0 a hagyományos, kiforrott megoldás

Pontosan és gyorsan, kiváló helyesírással helyezi el az általad diktált szöveget bármely a rendszered által használt felületen, lehet az akár a linuxmint.hu hozzászólás szövegdoboza is.
Ahogy azt ma divatos nevezni, emberi erőforrás révén a teljesítménye lehet kicsit hullámzó és maximum heti 40 órában, 8 óránkénti napi bontásban áll a rendelkezésedre, néha lehet beteg és szabadságra is el kell engedni, viszont lehet, hogy főz neked kávét is. Ha három darabot igényelsz belőle, akkor már jó eséllyel lefedheted ilyen módon az alvásidődön kívüli teljes időszakot. :-)

Tízujjas vakon gépelés

Továbbra is tartom, hogy a Linux azért egy picit rétegdolog, mivel a fejlesztők bizonyára mind tudnak vakon gépelni, nem érzik annyira hiányát a hangalapú gépelésnek és nem igazán fordulnak az ilyen fejlesztés irányába. A blogodat olvasva arra jutottam, hogy a legnagyobb előrelépést ennek az amúgy már némileg elsajátított képességnek a tökéletesítése jelentené számodra. Nem kell telepíteni és ingyenesen, mindig minden rendszeren a rendelkezésedre áll. Nem olyan nagy kaland a magadévá tenni, én úgy látom, hogy neked jók a képességeid, hamar meglennél vele.

Hangalapú gépelés Linuxon

Beírtam a témát a nagy keresőbe, és az első találat ezt hozta: a Google Chrome indítása, bejelentkezés a Google fiókba és a Dokumentumokban egy új dokumentumban a Ctrl+Shift+S használata.
Ezt kipróbáltam, alapvetően működik, bár nekem a szöveget nem tagolta.
Innen is lehet közvetlen másolni a szöveget a vágólappal bárhová, ha van mikrofon a konfigurációdban, akkor nem kell ehhez feltétlen a telefon.

Értékelés: 

0
Még nincs értékelve

Secretary 1.0

#1 Ilyen?
https://www.linkedin.com/pulse/secretary-version-10-todays-administrativ...

Értékelés: 

0
Még nincs értékelve

Secretary 1.0

#1.1   "Érdekes, hogy milyen dolgok jutnak eszedbe."

Amióta a telefonra számítógépként gondolok, keresem azokat a lehetőségeket, hogy a kettőt összekössem.
Vezetékkel, wifin, Bluetooth-szal, vagy az interneten. Akár közvetlenül, akár valamilyen applikáció segítségével.

Jó lenne azt megoldani, hogy bárhonnan elérjem a PC-met még akkor is, ha ki van kapcsolva.
Ez a wake on lan, meg magic packet nekem még nem sikerült. De csak elméleti jelentősége van a dolognak, csak szeretném, ha működne. Nagy hasznát nem venném.

 

Értékelés: 

0
Még nincs értékelve

Speech Note

Ha mégsem járható út a Secretary, mert esetleg affektálós, vagy hisztis, netán olyan emancipunci kiadás, ami esetleg összeférhetetlenségi jelenségeket okoz asszonypajtást illetően, akkor megoldás lehet a Speech Note.

Szoftverkezelőből telepíthető, imádni fogod, mert AI alapú, ám mindent helyi gépről futtat. Viszont pont emiatt tartsd szem előtt, hogy ménkű erős gép, és minél erősebb videokártya javasolt hozzá. Nem a látvány miatt, hanem mert annak a számítási kapacitására is szükség lehet. Ha AMD kártya, akkor még külön kell telepíteni ahhoz való illesztőket, a beállításoknál részletezi, hogy mit.

A program telepítője közel 1 GB, így letöltés közben adódhatnak hibák, ilyenkor meg kell próbálni újra. A telepített programhoz több mint 3 GB tárhely kell, és ebben nincsenek benne a nyelvek. Azokat külön le kell tölteni, de mindezt a program felületéről lehet menedzselni. Külön van a diktáláshoz, és külön a szövegfelolvasáshoz nyelv, és legtöbbször többféle változat közül lehet válogatni, pl. magyar nyelvi csomagból is több van, ezek a szókészlet mennyiségében térnek el. Diktálás előtt ki lehet választani a szótárat / nyelvet, ezt használja a szövegfelismeréshez.

Annyit még érdemes tudni, hogy diktáláshoz a billentyűzet kiosztásnak egyeznie kell a diktált nyelvvel, mert a billentyűzet gombok lenyomását szimulálja ilyenkor,

És persze, tud fordítani is,

Diktálásnál nagyobb szünetet kell hagyni a mondatok közt, innen tudja, hogy hol a mondat vége, ill. mondatonként végzi a feldolgozást. Beállításoknál ez is szabályozható.

Értékelés: 

5
Átlag: 5 (1 szavazat)

Speech Note

#2 Tudok olyat, akinek nagyon hasznos lehet, merthogy pötyögtetve tud gépelni, de az utóbbi időben a látása eléggé odalett, így eléggé beszorult ezen a téren, mert a szokásosnál is nehezebben találja meg a gombokat a billentyűzeten. Visszaállítási pont készítése után próbálgattam egy kicsit az éles rendszeremen.

Köszönöm szépen!

Értékelés: 

0
Még nincs értékelve

Speech Note

#2 Köszönöm, ki fogom próbálni, de csak kíváncsiságból.
Tudtam (sejtettem) én, hogy van ilyen app, de úgy gondoltam, egyszerűbb, ha valaki más keresi meg helyettem.laugh

Értékelés: 

0
Még nincs értékelve

Speech Note

#2   Kipróbáltam.

A letöltéssel nem volt gond, és csodálkoztam volna, ha lett volna. Még a 25 GB-os filmek letöltésével se szokott gond lenni. Ezt nem is értem. Nem mindegy, hogy mekkora a fájl?
Mindegyik kicsi bitecskékből áll, nem?

Amúgy 1.9 GB-ot kellett letölteni, ami 6.3 GB-ot foglal el telepítés után, de ez csak a program, és még további összetevőket kell letölteni.

A nyelv kiválasztásával kell kezdeni, de ott sok minden eldől.
Nem azt kell kiválasztani, hogy Magyar, mert ott 14-féle magyar program közül kell választani.
Mivel nekem csak alaplapi videovezérlőm van, már a kiválasztáskor sejtettem, hogy nem fog működni.
Az i betű ikonra kattintva kaphatunk leírást az adott összetevő sebességéről, minőségéről, a letöltendő méretről. Van amelyik 44 MB, de van amelyik 1.47 GB.

Én találomra ezeket az összetevőket választottam:
Speech to Text: DeepSpeech ITML 45 MB

Text to Speech: Coqui CSS10 VITS Femele 96 MB

Translator: Hungarian to English 16 MB

A beállításokban hiányolta a videokártya kiegészítők telepítését, de mivel nincs videokártyám...

A mikrofonom valahol a pincében van, és nem akartam fél napig keresni, ezért elindítottam egy filmet a PC-n, majd az alkalmazásban rákattintottam a Listen gombra, mire megindult a hallott szöveg leírása.

Ez lett az eredmény:
Te yeztet nek rokhának köztekk ferhértaplédiketesziet jit ar vüzöbpősö azőazokat kösögtalat mituhakaznimakn a merna makaromagscs si bágea

Hogy mit mondtak éppen a filmben (magyarul) az mindegy, mert bármit mondhattak volna.
Itt már láttam, hogy rövid életű lesz nálam a program.
(A szöveg megfejtői között értékes jutalmakat sorsolok ki. Már a közelítő megoldásért is milliós díjat lehet nyerni a lottón.)

Kipróbáltam a felolvasást is. Ehhez a Read gombra kell kattintani.
Ez tökéletesen működik.
Ezt a szöveget másoltam be:
Vélhetőleg egy zárlatos töltő okozott tüzet az Óbudai Egyetem Kandó Kálmán Kollégiumában a Bécsi úton. A tüzet a Katasztrófavédelem eloltotta, személyi sérülés nem történt, a lakhatatlanná vált szobák lakóinak az Óbudai Egyetem azonnal elhelyezést biztosított.

Itt meghallgatható a felolvasás:
https://mega.nz/file/1aM1wCCb#ofHJjDQdbTGvRhrSItAQ7N2kBvpWzeOF5mqGU3nxwoo

Kipróbáltam még a fordítást is:

A Speech Note fordítása:
Presumably, a short-circuit charger caused a fire in the Kandó Kálmán College of Óbuda University on Bécsi út. The fire was extinguished by the Disaster Management, there were no personal injuries, the inhabitants of the uninhabitable rooms were immediately accommodated by Óbuda University.

A DeepL fordítása:
A fire at the Kandó Kálmán College of the University of Óbuda on Bécsi út is believed to have been caused by a faulty charger. The fire was extinguished by the Disaster Management, there were no personal injuries, and the residents of the uninhabitable rooms were immediately provided with accommodation by the Óbuda University.

A Speech Note fordtás visszafordítása DeepL segítségével:
Feltehetően egy rövidzárlatos töltő okozta a tüzet az Óbudai Egyetem Kandó Kálmán Szakkollégiumában a Bécsi úton. A tüzet a katasztrófavédelem eloltotta, személyi sérülés nem történt, a lakhatatlanná vált helyiségek lakóit az Óbudai Egyetem azonnal elhelyezte.

Abban biztos voltam, hogy a fordítás jól fog működni.
Profi program, de nálam elhasalt.laugh

Értékelés: 

0
Még nincs értékelve

Hm, a googlnek van a legjobb

Hm, a googlnek van a legjobb magyar felismerése. Akcentussal beszélva is felismer. Háttér zajokat szűr. Angollal előrébb lennél azt sokan beszélik a világon sokféle akcentussal, stb. Vagy kínait. De a magyar az gond a szinte jelentéktelen felhasználói tábor miatt. A világon nagyon nagyon kevés ember beszélni magyar. Ezért a szoftverek nem szoktak külön hangsúlyt fektetni rá. És ha még a linuxot is bele kevered, akkor megint rosszabbodik a helyzet. Az informatikával foglalkozó minisztérium foglalkozhatna ilyen dolgokkal, hogy valami értelmesre is költsön az ország. A hátrányos helyzetben lévő embereken is segítenének ezzel.

Értékelés: 

0
Még nincs értékelve