Megjelent a Speech Note 4.3.0 verzió

Megjelent a Speech Note 4.3.0 verzió, rengeteg újdonsággal, a magyar nyelvet is jobban támogatja ez a verzió!

Mi is az a Speech Note?
A Speech Note segítségével több nyelven készíthetsz, olvashatsz és fordíthatsz jegyzeteket. Ehhez a Speech to Text, Text Speech és Gépi fordítást használja. A szöveg- és hangfeldolgozás teljesen offline, helyileg, a te készülékeden történik. A számítógépen, hálózati kapcsolat használata nélkül. A magánéleted mindig tiszteletbe lesz tartva. Nem küldenek adatokat az internetre.

Változások a Speech Note 4.3.0 verzióban

  • Globális billentyűparancsok. A gyorsbillentyűk segítségével elindíthatod vagy leállíthatod a felolvasás hallgatását a billentyűzet használatával. A billentyűparancsok akkor is működnek, ha az alkalmazás nem aktív (pl. kicsinyítve van a háttérben)
  • „Akciók” támogatása. Ez a funkció lehetővé teszi a külső alkalmazások számára, hogy bizonyos műveleteket indítsanak el, amikor a Speech Note fut. Egy művelet indítható DBus hívással vagy parancssori opcióval.

Felhasználói felület:

  • Asztali értesítések. Alapértelmezés szerint, ha a Speech Note a háttérben van, az asztali értesítések jelzik a hallgatás és olvasás megkezdését vagy befejezését.
  • Fájlok megnyitása fogd és vidd kézmozdulattal.
  • A beszédsebesség-szabályozási lehetőség átkerült az alkalmazás főablakába.
  • Javítás: Az alkalmazás egyes platformokon nem használt natív widgeteket.

Fordító:

  • Új model: angolról magyarra

Beszéd szöveggé alakítása:

  • Új nyelvek: afrikaans, gudzsaráti, hausza, telugu, tswana, jávai, héber (magyarral eddig is meant!)
  • Új motor: 'Faster Whisper'. Valamivel jobb teljesítményt nyújt a Whisper modellek meglévő motorjához képest, különösen a nagyobb modelleken, mint a Medium vagy Large.
  • Új motor: 'April-asr'. Támogatja a köztes eredményeket és az írásjeleket (csak angol nyelven). Az új motor a következő nyelveken használható modellekkel érkezik: angol, francia, lengyel.
  • Szöveg beszúrása bármely aktív ablakba. A globális billentyűkombináció vagy „művelet” használatával közvetlenül beillesztheted a dekódolt szöveget bármely, éppen fókuszban lévő ablakba.
  • Szöveg másolása a vágólapra. Globális billentyűparancs vagy „művelet” használatával a dekódolt szöveg a vágólapra másolható, ahelyett, hogy az aktuális jegyzetbe illesztené be.
  • Hallgatás leállítása gomb. A Mégse funkcióval ellentétben ezzel a gombbal leállíthatja a hallgatást, de a már rögzített hang szöveggé dekódolásra kerül.
  • Az Opus audiokodek támogatása a „Fájl átírása” részben
  • Hatékonyabb GPU-gyorsítás a Whisper modellekhez. Az átlagos dekódolási idő háromszorosára csökkent.
  • Új Whisper modellek angol nyelven: 'Distil-Whisper Medium' és 'Distil-Whisper Large-v2'. Mindkét Distil model gyorsabb, mint a jelenleg engedélyezett „Whisper Medium” és „Whisper Large”.
  • A Whisper Large model új verziója: 'Whisper Large-v3'
  • Javítás: A Whisper modellek CUDA-gyorsítása nem működött Maxwell architektúrájú NVIDIA grafikus kártyákon.

Szöveg beszédre alakítása:

  • Új nyelvek: afrikaans, gudzsaráti, hausza, telugu, tswana, jávai, héber (Magyar eddig is volt)
  • Új motor: 'Mimic 3' a következő nyelveken szólal meg: afrikaans, bengáli, német, görög, angol, spanyol, perzsa, finn, francia, gudzsaráti, hausza, magyar, olasz, jávai, nepáli, holland, lengyel, orosz, Svéd, telugu, tswana, ukrán, joruba.
  • Szöveg olvasása a vágólapról. A globális billentyűparancs vagy „művelet” használatával közvetlenül olvashatja a vágólapon lévő szöveget.
  • Új Piper hangok a következő nyelvekhez: arab, angol, magyar, lengyel, cseh, német, ukrán, vietnami, szerb, francia, spanyol, nepáli.
  • További lépések a „Beszédsebesség” opcióban. A sebességet 0,1 és 2,0 között állíthatjuk be.
  • A diakritikus jelek helyreállítása a beszédszintézis előtt arab és héber nyelven.
  • GPU-gyorsítás támogatása „Coqui” modelleknél.
  • Javítás: A Coqui kínai MMS Hakka és Min Nan hangja megszakadt.
  • Javítás: A hangfájlba exportálás nem volt lehetséges, ha a szöveg nagyon hosszú volt.

Egyéb:

  • Beállítási lehetőség bizonyos grafikus kártyák támogatásának letiltásához
  • Beállítás "Gyorsítótár törlése bezáráskor"
  • Gyorsítótár tömörítés. Az ideiglenes hangfájlokat a rendszer Opus formátumban tárolja a nyers hang helyett. Ez jelentősen csökkenti a szükséges lemezterületet.
  • Az opcionális funkciók elérhetőségének észlelése. A beállításokban ellenőrizheti, hogy milyen opcionális funkciók állnak rendelkezésre.

Hozzászólások

kami911 képe

Na ez izgalmasan hangzik, ki

Értékelés: 

0
Még nincs értékelve

Na ez izgalmasan hangzik, ki fogom próbálni, pláne, hogy most már ezek szerint a magyar nyelvet is támogatja.

Na ez izgalmasan hangzik, ki

Értékelés: 

0
Még nincs értékelve

#1 Meglepően jó a minőség, a felolvasás nem profi minőség, de élvezhető, a diktálás is jól teljesít.