A Canonical elindította a Project Myna kezdeményezést (nevét a beszédutánzásáról ismert seregélyről kapta), egy Ubuntu Desktop projektről van szó, amely beszédfelismeréses diktálást épít be az operációs rendszerbe.
Az első kiadást Ubuntu 26.10-re (Stonking Stingray) tervezik, és a cél, hogy a Ubuntu Desktop élmény szerves részévé váljon.
A funkciót natív asztali diktáló eszközként fejlesztik. A felhasználó lenyom egy gyorsbillentyűt, beszél, a rendszer pedig a leírt szöveget beilleszti az éppen használt alkalmazásba. A kezdeti verzió vizuális visszajelzést is ad diktálás közben.
Az első kiadásnál a Canonical szűken tartja a funkciók körét. A Project Myna nem lesz hangasszisztens, nem kezel hangparancsokat, nem fordít, és nem irányítja a teljes asztalt. Automatikus nyelvfelismerés sem lesz. A hangsúly kizárólag a megbízható asztali diktáláson van.
A Myna helyben futó, AI-alapú beszédfelismerő modelleket használ, amelyek a felhasználó gépén működnek, és a modell telepítése után nem igényelnek internetkapcsolatot. Az első kiadás a Wayland rendszeren futó Ubuntu Desktopot célozza, elsődleges támogatott környezetként a GNOME-et, és később további asztali környezetek támogatását is tervezik.
A mikrofonhoz csak akkor kap hozzáférést a rendszer, amikor a felhasználó elindítja a diktálást. A hangot a memóriában dolgozza fel, majd eldobja, nem tölt fel hangfelvételeket külső szolgáltatásokba. A felépítés moduláris: a beszédfelismerés külön egységként működik a felhasználói interakciótól, a diktálás kezelésétől és a szöveg beillesztésétől.
Ubuntu 26.10 után a Canonical tovább javítja az asztali integrációt, és keresi a lehetőségeket, hogyan teheti a diktálást természetesebbé és pontosabbá. A fejlesztési irányokat a korai felhasználók és a szélesebb közösség visszajelzései határozzák meg.
További részletekért nézd meg a bejelentést.

