Beküldte balacy -
Megjelent a Speech Note 4.3.0 verzió, rengeteg újdonsággal, a magyar nyelvet is jobban támogatja ez a verzió!
Mi is az a Speech Note?
A Speech Note segítségével több nyelven készíthetsz, olvashatsz és fordíthatsz jegyzeteket. Ehhez a Speech to Text, Text Speech és Gépi fordítást használja. A szöveg- és hangfeldolgozás teljesen offline, helyileg, a te készülékeden történik. A számítógépen, hálózati kapcsolat használata nélkül. A magánéleted mindig tiszteletbe lesz tartva. Nem küldenek adatokat az internetre.
Változások a Speech Note 4.3.0 verzióban
- Globális billentyűparancsok. A gyorsbillentyűk segítségével elindíthatod vagy leállíthatod a felolvasás hallgatását a billentyűzet használatával. A billentyűparancsok akkor is működnek, ha az alkalmazás nem aktív (pl. kicsinyítve van a háttérben)
- „Akciók” támogatása. Ez a funkció lehetővé teszi a külső alkalmazások számára, hogy bizonyos műveleteket indítsanak el, amikor a Speech Note fut. Egy művelet indítható DBus hívással vagy parancssori opcióval.
Felhasználói felület:
- Asztali értesítések. Alapértelmezés szerint, ha a Speech Note a háttérben van, az asztali értesítések jelzik a hallgatás és olvasás megkezdését vagy befejezését.
- Fájlok megnyitása fogd és vidd kézmozdulattal.
- A beszédsebesség-szabályozási lehetőség átkerült az alkalmazás főablakába.
- Javítás: Az alkalmazás egyes platformokon nem használt natív widgeteket.
Fordító:
- Új model: angolról magyarra
Beszéd szöveggé alakítása:
- Új nyelvek: afrikaans, gudzsaráti, hausza, telugu, tswana, jávai, héber (magyarral eddig is meant!)
- Új motor: 'Faster Whisper'. Valamivel jobb teljesítményt nyújt a Whisper modellek meglévő motorjához képest, különösen a nagyobb modelleken, mint a Medium vagy Large.
- Új motor: 'April-asr'. Támogatja a köztes eredményeket és az írásjeleket (csak angol nyelven). Az új motor a következő nyelveken használható modellekkel érkezik: angol, francia, lengyel.
- Szöveg beszúrása bármely aktív ablakba. A globális billentyűkombináció vagy „művelet” használatával közvetlenül beillesztheted a dekódolt szöveget bármely, éppen fókuszban lévő ablakba.
- Szöveg másolása a vágólapra. Globális billentyűparancs vagy „művelet” használatával a dekódolt szöveg a vágólapra másolható, ahelyett, hogy az aktuális jegyzetbe illesztené be.
- Hallgatás leállítása gomb. A Mégse funkcióval ellentétben ezzel a gombbal leállíthatja a hallgatást, de a már rögzített hang szöveggé dekódolásra kerül.
- Az Opus audiokodek támogatása a „Fájl átírása” részben
- Hatékonyabb GPU-gyorsítás a Whisper modellekhez. Az átlagos dekódolási idő háromszorosára csökkent.
- Új Whisper modellek angol nyelven: 'Distil-Whisper Medium' és 'Distil-Whisper Large-v2'. Mindkét Distil model gyorsabb, mint a jelenleg engedélyezett „Whisper Medium” és „Whisper Large”.
- A Whisper Large model új verziója: 'Whisper Large-v3'
- Javítás: A Whisper modellek CUDA-gyorsítása nem működött Maxwell architektúrájú NVIDIA grafikus kártyákon.
Szöveg beszédre alakítása:
- Új nyelvek: afrikaans, gudzsaráti, hausza, telugu, tswana, jávai, héber (Magyar eddig is volt)
- Új motor: 'Mimic 3' a következő nyelveken szólal meg: afrikaans, bengáli, német, görög, angol, spanyol, perzsa, finn, francia, gudzsaráti, hausza, magyar, olasz, jávai, nepáli, holland, lengyel, orosz, Svéd, telugu, tswana, ukrán, joruba.
- Szöveg olvasása a vágólapról. A globális billentyűparancs vagy „művelet” használatával közvetlenül olvashatja a vágólapon lévő szöveget.
- Új Piper hangok a következő nyelvekhez: arab, angol, magyar, lengyel, cseh, német, ukrán, vietnami, szerb, francia, spanyol, nepáli.
- További lépések a „Beszédsebesség” opcióban. A sebességet 0,1 és 2,0 között állíthatjuk be.
- A diakritikus jelek helyreállítása a beszédszintézis előtt arab és héber nyelven.
- GPU-gyorsítás támogatása „Coqui” modelleknél.
- Javítás: A Coqui kínai MMS Hakka és Min Nan hangja megszakadt.
- Javítás: A hangfájlba exportálás nem volt lehetséges, ha a szöveg nagyon hosszú volt.
Egyéb:
- Beállítási lehetőség bizonyos grafikus kártyák támogatásának letiltásához
- Beállítás "Gyorsítótár törlése bezáráskor"
- Gyorsítótár tömörítés. Az ideiglenes hangfájlokat a rendszer Opus formátumban tárolja a nyers hang helyett. Ez jelentősen csökkenti a szükséges lemezterületet.
- Az opcionális funkciók elérhetőségének észlelése. A beállításokban ellenőrizheti, hogy milyen opcionális funkciók állnak rendelkezésre.
Hozzászólások
Na ez izgalmasan hangzik, ki
Beküldte kami911 -
Értékelés:
Na ez izgalmasan hangzik, ki fogom próbálni, pláne, hogy most már ezek szerint a magyar nyelvet is támogatja.
Na ez izgalmasan hangzik, ki
Beküldte balacy -
Értékelés: