Nyheter

Fastly: ”AI skrapar webben utan att fråga – dags att sätta stopp för otyget”

Text: Lorraine Bellon, produktmarknadschef Fastly

Det här är inte science fiction. Det händer varje dag. AI-botar från både kända och okända aktörer sveper över internet och hämtar artiklar, kod, bilder och texter – för att integreras i språkmodeller, sökmotorer och andra AI-tjänster. De allra flesta gör det utan vare sig samtycke eller hänvisning till källan.

Konsekvenserna är allvarliga. Kreatörer drabbas hårt, för medieföretag hotas intäktsmodellerna. För open source-projekt, där utvecklare bygger kod som 70 procent av världen är beroende av, är problemet existentiellt. I takt med att AI-användningen skjuter i höjden ökar också belastningen på servrar och nätverk – ofta med höga kostnader som följd.

Fyra utmaningar som behöver hanteras: 

Traditionella skydd räcker inte
Verktyg som robots.txt har blivit mindre effektiva. Dagens AI-bottar ignorerar helt enkelt de regler som finns.

Svårt att skilja goda från onda
Dagens botskydd har svårt att särskilja mellan legitima AI-bottar och de som exploaterar innehåll

Överbelastar system och infrastruktur
Wikipedia är ett exempel där systemen, byggda för vanliga användare, knappt klarar trycket från AI-bottar. Den oönskade trafiken försämrar prestandan och ökar kostnaderna

Fokus går åt försvar
Utvecklare vittnar om att de tvingas lägga upp till all sin tid på att stoppa aggressiva AI-bottar istället för att vidareutveckla sina projekt.

Lösningen finns i bättre kontroll

För att bevara det öppna internet behöver vi bättre sätt att identifiera och hantera AI-bottar. Vi ser två huvudtyper: De som systematiskt bygger upp kunskapsbaser genom att samla in data från nätet, ofta utan att fråga om lov, och de som hämtar information för att svara på specifika frågor – som när du googlar influensasymtom eller ber ChatGPT researcha ett ämne.

Utmaningen ligger i att många AI-bottar inte identifierar sig. En ansvarsfull botoperatör publicerar information om sina bottar, till exempel vilka IP-adresser de använder. Men långt ifrån alla gör det, särskilt inte de som samlar in innehåll utan tillstånd.

Det är dags att återta kontrollen över det öppna internet. Inte genom att stänga ute all AI, utan genom att låta innehållsskapare bestämma villkoren för hur deras material används.

Bild: Gerd Altmann