Svájc bemutatja az Apertust: egy nyílt forráskódú, nyilvános LLM-modell az adatvédelem jegyében
Mi az Apertus, és miért különleges?
-
A Svájci Szövetségi Műszaki Egyetemek (EPFL és ETH Zürich) valamint a Svájci Nemzeti Szuperszámítóközpont (CSCS) közös fejlesztése az Apertus, egy teljesen nyílt, többnyelvű nagy nyelvi modell (LLM), amely átláthatóság, inklúzivitás és jogkövetés alapon készült.
(CyberInsider, Swiss AI) -
Az „Apertus” név a latin open szóból származik, mellyel a modell nyitottságára utalnak.
(The Verge, Swiss AI)
Fejlesztési háttér és hozzáférhetőség
-
A modell fejlesztését a Swiss AI Initiative keretében hajtották végre — közpénzből, az ETH Domain irányítása alatt. A tanítás több mint 10 millió GPU órás kapacitást igényelt, amit a CSCS “Alps” szuperszámítógépe biztosított.
-
Az „Alps” rendszer különlegessége, hogy 100 %-ban karbonsemleges elektromos áramot használ, és több mint 10 000 NVIDIA Grace Hopper Superchipet tartalmaz – egy együttműködés eredménye az NVIDIA és az HPE/Cray cégekkel.
Nyelvi sokszínűség és technikai paraméterek
-
A modell 15 billió tokenen készült, több mint 1 000 nyelvet lefedve. Ebből mintegy 40% nem angol – kis népszerűségű nyelvek is jelen vannak, mint a svájci német vagy a rétoromán (Romansh).
(CyberInsider, Swiss AI, www.watson.ch/, The Verge) -
Két modellváltozat érhető el: 8 milliárd és 70 milliárd paraméteres, az előbbi ideális oktatási vagy kisebb szervezeti felhasználásra, míg az utóbbi nagyobb léptékű alkalmazásokhoz is megfelelő.
(CyberInsider, Swisscom, The Verge)
Átláthatóság, etikai megfelelés és szabályozások
-
A modell teljes fejlesztési folyamata – architektúra, tanítási adatok, modellsúlyok és checkpoint-ok is – nyilvános és dokumentált. Minden forráskód és anyag Apache 2.0 licence alatt érhető el, ami kereskedelmi felhasználást is lehetővé tesz.
(CyberInsider, Swisscom, EPFL Hírek) -
Az Apertus kizárólag nyilvánosan elérhető adatokat használ, szigorúan tiszteletben tartva a weboldalak gép által értelmezett opt-out kéréseit, akár visszamenőleges hatállyal is, és kiszűrve a személyes adatokat.
(CyberInsider, Swiss AI, The Verge) -
A fejlesztést a svájci adatvédelmi, szerzői jogi törvények és az EU AI Act átláthatósági előírásai alapján végezték.
(CyberInsider, EPFL Hírek)
Apertus céljai és felhasználása
-
A modell a közjó szolgálatára készült – egyfajta digitális közmű, amelyhez fejlesztők, kutatók, civil és üzleti szereplők egyaránt hozzáférnek.
(CyberInsider, Swisscom) -
A Swisscom az egyik első szervezetek közül, amely telepítette az Apertust a Sovereign Swiss AI Platformjára. Emellett használható a Hugging Face és a Public AI Inference Utility platformokon is.
(CyberInsider, Swisscom, The Verge) -
A Public AI Inference Utility egy webes felületet kínál az Apertus lekérdezésére – hirdetésmentesen, átlátható és adatgyűjtés nélkül.
(CyberInsider)
Jövőbe tekintés
-
A fejlesztők a jövőben domain-specifikus verziókat terveznek az egészségügy, klímakutatás, jogi elemzések és oktatás területén, miközben megőrzik a transzparencia, többnyelvűség és közösségi hozzáférés elveit.
(CyberInsider, Swisscom) -
A Swiss {ai} Weeks eseménysorozathoz kapcsolódva hackathonokat szerveznek, ahol fejlesztők növelhetik a modell használhatóságát és ötletekkel járulhatnak hozzá a további fejlesztésekhez.
(Swisscom, Greater Geneva Bern area)
Összegzés
Az Apertus a generatív mesterséges intelligencia új modelljét képviseli: egy teljes mértékben nyílt, többnyelvű, átlátható és etikai szempontból felelős LLM – mindez a közjó szolgálatára. Az infrastruktúra, jogi megfelelés és nyílt hozzáférhetőség mint értékek olyan normákat állítanak fel, amelyek követendő példát jelenthetnek a jövő AI-fejlesztéseiben.
