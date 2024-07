Firma Cloudflare opracowała narzędzie, które nie spotka się zapewne z przychylnym przyjęciem ze strony firm projektujących i następnie szkolących modele sztucznej inteligencji.

Wiele firm zajmujących się sztuczną inteligencją wykorzystuje treści publikowane w internecie do szkolenia swoich dużych modeli językowych. Nowe narzędzie blokuje opracowane przez nie boty, uniemożliwiając im pobieranie treści z hostowanych przez Cloudflare witryn internetowych, które są następnie wykorzystywane do szkolenia modeli AI. Procesowi temu nadana roboczą nazwę „scraping” (zeskrobywanie). Z platformy hostnigowej firmy Clouflare korzysta obecnie znaczny odsetek witryn internetowych na świecie, ponieważ użytkownicy mogą je wtedy szybciej ładować. Teraz „skrobanie” treści z takich witryn będzie dzięki temu narzędziu blokowane.

Narzędzie wykorzystuje sztuczną inteligencję do wykrywania automatycznych prób ekstrakcji treści. Według Cloudflare, narzędzie oprogramowanie potrafi wykrywać boty, które pobierają treści na potrzeby projektów szkoleniowych LLM, nawet jeśli próbują uniknąć wykrycia. Botów takich używa np. firma Perplexity AI. Przeglądając strony internetowe, boty takie generują ruch podobny do standardowe, dlatego są trudne do wykrycia. W rezultacie operatorzy witryn internetowych mają trudności z zablokowaniem możliwości korzystania z ich treści przez sztuczną inteligencję, którą szkoli firma Perplexity AI.

Cloudflare zapowiada, że będzie z czasem aktualizować narzędzie, uwzględniając np. zmiany w wirtualnych odciskach palców pozostawianych przez boty AI czy też pojawienie się nowych botów. W ramach inicjatywy firma wdroży też narzędzie, które umożliwi operatorom stron internetowych zgłaszanie wszelkich nowych botów, jakie mogą napotkać.