Egy nyílt forráskódú webarchívumban fedezték fel az érzékeny adatokat: egy friss kutatás szerint csaknem 12 000 érvényes API-kulcsot és jelszót találtak a Common Crawl adathalmazában, amelyet számos mesterséges intelligencia (AI) modell tanítására használnak. A Common Crawl egy non-profit szervezet, amely 2008 óta hatalmas, nyílt forráskódú webadat-gyűjteményt tart fenn. Az archívum petabájtnyi adatot tartalmaz, és bárki számára szabadon hozzáférhető.