Az Anthropic nyilatkozata az amerikai kormányzati utasításról: felfüggesztik a hozzáférést a Fable 5 és Mythos 5 szolgáltatásokhoz

enlightened Ez az oldal a közösségért készül. heart Kövess minket máshol is:  Linux Mint Magyar Közösség a Mastodon-on  Telegram csatorna – csak hírek  Beszélgessünk a Telegram – Linux csevegő csoport  Hírek olvasása RSS segítségével  Linux Mint Hivatalos Magyar Közösség a Facebook-on      Linux Mint Baráti Kör a Facebook-on
wink Ha hasznosnak találod, és szeretnéd, hogy folytatódjon, támogasd a munkát Ko-fi vagy Paypal segítségével. laugh

kami911 képe

Az amerikai kormány nemzetbiztonsági felhatalmazásaira hivatkozva exportkorlátozási utasítást adott ki, amely megtiltja, hogy bármely külföldi állampolgár – akár az Egyesült Államokon belül, akár azon kívül, beleértve az Anthropic külföldi állampolgárságú alkalmazottait is – hozzáférjen a Fable 5 és a Mythos 5 szolgáltatásokhoz. Ennek az utasításnak a gyakorlati következménye, hogy az Anthropicnak azonnal le kell tiltania a Fable 5 és a Mythos 5 elérését minden ügyfelünk számára, hogy megfeleljünk az előírásoknak. Az Anthropic többi modelljének elérhetőségét ez nem érinti.

A kormánytól kapott levél nem részletezte konkrétan, milyen nemzetbiztonsági aggályokra hivatkozik. Úgy tudja az Anthropic, hogy a kormány tudomására jutott egy módszer, amellyel meg lehet kerülni, „jailbreakelni” a Fable 5-öt. Megnéztek egy bemutatót, ahol ezzel a konkrét technikával néhány korábbról ismert, kisebb sebezhetőséget azonosítottak. Ezek a sebezhetőségek viszonylag egyszerűnek tűnnek, és azt találtuk, hogy más, nyilvánosan elérhető modellek is képesek felfedezni őket, megkerülés nélkül is.

Az Anthropic álláspontja a Fable védelmi mechanizmusaival kapcsolatban – ahogy azt a bejelentéskor megjelent blogbejegyzésben is leírták – a következő:

  • Erős védelmi mechanizmusokat vezettek be, amelyek nagymértékben csökkentik annak esélyét, hogy a Fable-t többek között kiberbiztonsággal kapcsolatos feladatokra visszaélésre használják. Olyannyira szigorúak ezek a védelmek, hogy sok felhasználó túlzottan korlátozónak tartja őket.
  • A Fable indulását megelőző hetekben az Anthropic együttműködött az amerikai kormánnyal, a brit AISI-vel, több független magánszervezettel és belső csapatokkal, és összesen több ezer órában „red teamelte” a Fable védelmi mechanizmusait.
  • Ezek a tesztek azt mutatták, hogy a Fable védelmi mechanizmusai lényegesen hatékonyabbak, mint bármely korábban bevezetett modellé.
  • Eddig egyetlen tesztelő sem talált univerzális jailbreaket – olyan módszert, amellyel nagyon széles körben meg lehetne kerülni a modell védelmi mechanizmusait, és számos kiberképességet fel lehetne oldani.
  • Úgy gondolják az Anthropic-nál, jelenleg egyetlen modellszolgáltató sem tud tökéletes védelmet nyújtani a jailbreakek ellen. Az iparágban használt minden védelmi megoldás sebezhető a nem univerzális jailbreakekkel szemben (amelyek bizonyos körülmények között képesek kiberinformációkat kinyerni), és valószínű, hogy idővel univerzális jailbreakeket is találnak majd. Ezt egyértelműen jelezték, amikor kiadták a Fable 5-öt.

Mivel ma nem tűnik lehetségesnek a tökéletes védelem a jailbreakekkel szemben, az Anthropic többrétegű védelmi stratégiát alkalmazott a Fable 5 esetében. Arra törekedtek, hogy a jailbreakek vagy szűk körűek legyenek (a nem univerzális jailbreakek esetében), vagy nagyon drágák legyenek előállítani (az univerzális jailbreakek esetében), és ezt alapos monitorozással kombináltuk, hogy a sikeres támadásokat gyorsan észleljük és leállítsuk. Ezért írták elő a Fable esetében az ügyféladatok 30 napos megőrzését is – ez olyan szabályozás, amelynek valódi költségei vannak a cég számára az ügyfeleknél, viszont lehetővé teszi, hogy kutassák és kezeljék a jailbreakeket.

A többrétegű védelem stratégiája mellett csökkent a Fable által jelentett kockázatokat, és nagyjából az iparágban már használt modellek kockázati szintjére hozza őket.

Nem kapott az Anthropic még olyan, aggasztó, nem univerzális, lehetséges jailbreakről szóló bejelentést sem, amely ténylegesen káros eredményhez vezetett volna. Az eddig jelzett lehetséges jailbreakek vagy teljesen ártalmatlan válaszokat eredményeztek, vagy olyan kisebb megállapítások, amelyek nem adnak Mythos-specifikus többletképességet.

Eddig a kormány csak szóban mutatott be egy lehetséges, szűk körű, nem univerzális jailbreaket. Lényegében arról van szó, hogy a modellt megkérik: olvasson el egy konkrét kódrészt, és javítsa a szoftverhibákat. Úgy tudják, egy lehetséges jailbreaket osztottak meg a kormánnyal. Átnéztek egy jelentést, amelyről úgy gondolják, hogy a kormányzati utasítás alapját adja, és megerősíthető, hogy az ott bemutatott képességszint más modelleknél is széles körben elérhető (köztük az OpenAI GPT-5.5 modelljénél), és a rendszerek védelmén dolgozó szakemberek nap mint nap így használják ezeket az eszközöket.

Az Anthropicleget tesz a kormány jogi utasításának, és minden felhasználónál megszüntetik a Fable 5 és a Mythos 5 elérését. Ugyanakkor nem értenek egyet azzal, hogy egy szűk körű, lehetséges jailbreak feltárása önmagában elegendő ok legyen egy, már emberek százmillióihoz eljuttatott kereskedelmi modell visszahívására. Ha ezt a mércét az egész iparágra alkalmaznák, akkor szerintük gyakorlatilag minden új modell bevezetése leállna az összes élvonalbeli modellszolgáltatónál.

Ahogy korábban nyilvánosan is elmondta a cég, a kormánynak rendelkeznie kell azzal a jogkörrel, hogy megakadályozza a nem biztonságos bevezetések megtörténését, egy olyan törvényben rögzített eljárás részeként, amely átlátható, tisztességes, egyértelmű és műszaki tényeken alapul. A mostani lépés nem felel meg ezeknek az elveknek.