En teknisk metod som visat sig vara mycket effektiv för att automatiskt extrahera och kopiera stora mängder data från hemsidor är s.k. ”web scraping”. I det kommande ska vi gå närmare in på hur web scraping kan användas och hur det träffas av gällande rättsregler.

Inledning

Aldrig tidigare har data och annan lagrad information varit så viktig som idag. Kvantiteten av information som upprättas, digitaliseras och struktureras ökar exponentiellt varje år för att tillgodose efterfrågan på marknaden och vårt sätt att konsumera digitala produkter, teknik och nya innovationer. Stora ekonomiska summor investeras årligen för att skapa nya produkter eller tjänster som i stor utsträckning består av data. Även viljan och intresset för artificiell intelligens (AI) och machine learning har satt sin egen prägel på möjligheterna och de databehov som krävs för att träna sin ”robot” eller sin algoritm.

Men var kommer ”all” data ifrån? Antal källor är i stort sett obegränsat. Det kan röra sig om allt ifrån fysiska sammanställningar som på ett eller annat sätt har digitaliserats, eller mer sofistikerade digitala databaser på internet. Med hjälp av internet sprids information obehindrat världen över men många gånger utan någon vidare kunskap om var en uppgift har sitt ursprung.

Vad är web scraping?

Web scraping, eller webbskrapning som det brukar benämnas på svenska, är en teknisk metod för att automatiskt ”skrapa” stora mängder av innehållet på en eller flera hemsidor, innebärande att innehållet på hemsidorna kopieras. Uppgifterna som kopieras kan avse all typ av digital information som är tillgänglig för en besökare av en hemsida. Det kan röra sig om bilder, sammanställningar, kontaktuppgifter eller sökresultatet från en databas, men även annan information som används uteslutande för att tekniskt driva webbplatsen, såsom funktioner och algoritmer. Den tekniska metoden kan antingen utgöras av ett enklare skript/macro som att t.ex. kopiera uppgifter från en hemsida för att sedan strukturera dessa i en databas. Metoden kan även ingå som en integrerad funktion i ett mer komplext program, exempelvis genom att data från en hemsida skrapas för att sedan behandlas genom olika typer av algoritmer, för att slutligen, och tillsammans med annan bearbetad information, ingå som en del av en ny produkt eller databas. Web scraping kan även användas för att kopiera uppgifter från en webbplats för att direkt spegla informationen på en annan hemsida. Ett vanligt exempel på detta är exempelvis prisjämförelsehemsidor där information skrapas från diverse återförsäljares hemsidor för att därefter sammanställas och presenteras på en enda hemsida. Det är egentligen bara fantasin som sätter gränsen för hur web scraping kan användas.

Är web scraping olagligt?

Som teknisk metod är web scraping inte olaglig. Däremot kan användandet av web scraping strida mot användarvillkoren på en hemsida, göra intrång i eller innebära en otillåten kopiering eller nyttjande av upphovsrättsligt skyddade verk eller innebära en otillåten behandling av personuppgifter. Det kan jämföras med exempelvis fildelning i den mening att tekniken bakom fildelning, dvs. peer-to-peer-tekniken (P2P), inte är olaglig i sig, men går att använda för olagliga ändamål.

Förbud mot web scraping p.g.a. användarvillkor

På många hemsidor finns det ofta publicerat allmänna villkor eller användarvillkor som är uppställda av det bolag som är avsändare eller innehavare av webbplatsen. I svensk rätt finns det inget generellt formkrav för hur avtal kan ingås, varför avtal kan bli bindande bara genom parternas muntliga överenskommelse. Dessutom kan avtal ingås genom att en parts handlande, i form av konsumtion och nyttjande av tjänster, uppfattas som en accept av avtalet (s.k. konkludent handlande). Genom att använda sig av en hemsida och innehållet på sådan sida får besökaren anses acceptera de villkor som gäller på plattformen. För att de allmänna villkoren ska bli legalt bindande måste dessa dock vara väl synliga för besökaren och därmed inte flera klick bort. Villkoren ska inte heller vara oskäligt betungande för besökaren då sådana villkor förutsätter högre krav på synlighet, tydlighet och aktiv accept för att bli bindande. Men som utgångspunkt får alltså hemsideinnehavarens villkor anses bindande för besökaren förutsatt att de är väl synliga och inte oskäligt betungande för besökaren. Vid en bedömning av om ett visst skrapande är tillåtet måste därför användarvillkoren på hemsidan alltid iakttas. Många användarvillkor innehåller ett villkor som förbjuder automatisk hämtning av data från hemsidan och om sådant villkor finns blir skrapningen otillåten, även om den skrapade datan inte skyddas av upphovsrätt eller består av personuppgifter. Ett skrapande i strid mot användarvillkor innebär därmed ett avtalsbrott som kan ge hemsideinnehavaren rätt att kräva skadestånd.

Utöver villkoren i användarvillkor kan web scraping även göra intrång i upphovsrättsligt skyddade verk eller innebära en otillåten behandling av personuppgifter. För att säkerställa att så inte är fallet är det av särskild vikt att kontrollera den informationen som avses att skrapas.

Upphovsrättsligt skyddade verk

Enligt upphovsrättslagen skyddas varje litterärt och konstnärligt verk som uppfyller kravet om verkshöjd med upphovsrätt, oavsett om alstret skapas i fysisk eller digital form. Det upphovsrättsligt skyddade verket kan bestå av texter, bilder, video, datorprogram, databaser eller källkoden tillhörande en hemsida. Även det kompletta utseendet på en hemsida, dvs. en webbplats layout, kan skyddas med upphovsrätt. Det finns alltså i princip ett obegränsat antal typer av multimedier och fysiska verk som kan uppbära ett upphovsrättsligt skydd. En stor del av det innehåll som skrapas kan alltså vara skyddat med upphovsrätt. Eftersom upphovsrätten uppstår formlöst, och därmed inte kräver någon föregående registrering, är det svårt att på förhand veta om ett visst innehåll på en hemsida är skyddat med upphovsrätt. För att web scraping ska vara i strid med upphovsrättslagstiftningen är kravet att det skrapade verket kopieras eller tillhandahålls till allmänheten. Eftersom tekniken bygger på att information på hemsidan kopieras innebär oftast redan själva skrapningen en otillåten kopiering om det material som skrapas skyddas av upphovsrätt. Ett tillhandahållande till allmänheten kan bestå av att verket läggs upp på en annan hemsida eller komma att ingå i en ny tjänst eller produkt.

Otillåten behandling av personuppgifter

Den skrapade informationen kan även innehålla uppgifter som direkt eller indirekt kan hänföras till fysiska individer, dvs. personuppgifter. Det kan röra sig om kontaktuppgifter, i form av e-postadresser, namn och telefonnummer som hänför sig till privatpersoner eller medarbetare hos ett företag. Den som inom ramen för sin verksamhet hanterar personuppgifter måste följa dataskyddsförordningen (GDPR). När en hemsida skrapas sker en behandling av personuppgifter och den som bestämmer att skrapningen ska ske blir personuppgiftsansvarig för behandlingen av personuppgifterna. Sådan behandling är enbart tillåten om det finns en laglig grund. GDPR förskriver sex (6) lagliga grunder som en personuppgiftsansvarig kan stödja sin behandling på:

  • Samtycke – den registrerade personen har lämnat sitt samtycke till behandlingen,
  • Avtal – den registrerade personen har ett avtal med den personuppgiftsansvariga,
  • Intresseavvägning – den personuppgiftsansvarigas intressen väger tyngre än den registrerades och behandlingen är nödvändig för det aktuella ändamålet,
  • Rättslig förpliktelse – den personuppgiftsansvariga är skyldig enligt lag att behandla personuppgifterna,
  • Myndighetsutövning och uppgift av allmänt intresse – den personuppgiftsansvariga måste behandla personuppgifter för att utföra sina myndighetsuppgifter eller för att utföra en uppgift av allmänt intresse (aktualiseras som utgångspunkt enbart för myndigheter), samt
  • Grundläggande intresse – den personuppgiftsansvariga måste behandla personuppgifter för att skydda en registrerad som inte kan lämna samtycke.

När en hemsida skrapas av någon annan än hemsideinnehavaren själv och som inte heller sker på hemsideinnehavarens instruktion får det konstateras att den som skrapar informationen sällan har en sådan relation med de personer vars personuppgifter behandlas genom skrapningen som ger skraparen en laglig grund enligt ovan. Den som skrapar en hemsida har sällan något avtal med individerna, inga rättsliga förpliktelser avseende uppgifterna och inte heller ett direkt samtycke från individerna. Det kan utvärderas om behandlingen kan stödjas på ett berättigat intresse, vilket får utvärderas från fall till fall.

Utöver att det ska finnas en laglig grund för behandlingen av personuppgifter ska den personuppgiftsansvariga även iaktta den registrerades rättigheter, däribland rätten till information. I korthet innebär rätten till information att den registrerade ska bli informerad om dennes personuppgifter är föremål för behandling. Informationen ska lämnas av den personuppgiftsansvariga när personuppgifterna samlas in eller på begäran av den registrerade. Kort sagt innebär det att den som skrapar information innehållande personuppgifter måste tillhandahålla information till de individer vars personuppgifter behandlas genom skrapningen, vilket i förlängningen innebär att den som skrapar informationen inte kan göra det anonymt eller oanmält.

Skydda sig mot web scraping?

Det finns en rad tekniska skyddssystem som kan användas för att skydda värdefull information på en hemsida. Genom användningen av olika typer av ”betalväggar” kan en besökares tillgång till data begränsas. Det går även att minska antalet tillåtna sökningar i en databas som sker från en besökare för att minimera riskerna att en stor mängd information kopieras på en och samma gång. Även om det finns tekniska lösningar mot illegal skrapning är dessa lösningar oftast begränsade eftersom tekniska skyddsmekanismer i regel alltid kan brytas ner för att sedan kringgås. Utifrån ett juridiskt perspektiv är det emellertid viktigt att se till att det finns adekvata villkor som är tydliga och lättillgängliga för besökaren av hemsidan då dessa kan ligga till grund för ett senare skadeståndsanspråk.

Sammanfattande slutsatser och reflektioner

Innan ni beslutar er för att samla in data eller annan information på internet är det alltid viktigt att granska eventuella avtalsvillkor på hemsidan och ta reda på om datan som avses att skrapas är personuppgifter eller omfattas av ett upphovsrättsligt skydd. Även om större delen av informationen på internet är lättillgänglig och gratis så innebär det inte att man får använda eller samla in uppgifterna på vilket sätt som helst. Det är följaktligen en god idé att utgå ifrån att datan på hemsidor på ett eller annat sätt skyddas med upphovsrätt eller innehåller personuppgifter oavsett förekomsten av avtalsvillkor, men en bedömning bör alltid göras från fall till fall.