30. listopada 2024., Okružni sud u Amsterdamu donio je presudu u slučaju izdavača protiv HowardsHome, koja otvara novo poglavlje u regulaciji tekstovno-podatkovnog rudarenja (TDM)1. Ključno pitanje bilo je može li robots.txt2, široko korišten tehnički alat, služiti kao pravno sredstvo zaštite autorskih prava u digitalnom prostoru. Sud je presudio da robots.txt datoteke ne zadovoljavaju standarde "strojno čitljivih sredstava" kako ih definira DSM Direktiva3, čime je stao na stranu HowardsHome-a. Ova odluka donosi važne implikacije za nositelje prava, tehnološke kompanije i zakonodavstvo unutar EU-a, a istovremeno je relevantna u kontekstu sličnih slučajeva, poput LAION protiv Kneschkea.
Kako HowardsHome koristi javno dostupne podatke?
HowardsHome je trgovačko društvo sa sjedištem u Nizozemskoj te, prema informacijama iz presude, djeluje kao komercijalna platforma specijalizirana za praćenje vijesti. Njihova glavna djelatnost uključuje automatizirano prikupljanje i organizaciju javno dostupnih podataka, poput naslova i sažetaka vijesti, koje korisnicima omogućuju brzo i jednostavno praćenje medijskog sadržaja iz različitih izvora.
Spomenuto trgovačko društvo prikupljanje podataka provodi putem tzv. RSS feedova. RSS (Really Simple Syndication) omogućuje automatizirano dohvaćanje sadržaja, poput naslova i sažetaka članaka, čime olakšava praćenje medijskog sadržaja iz različitih izvora na jednoj platformi. U ovom slučaju, HowardsHome koristi RSS feedove za dohvaćanje podataka, što nije u suprotnosti s tehničkim pravilima web stranica, ali je pojedine izdavače potaknulo na pokretanje odgovarajućih pravnih radnji jer smatraju da se time narušavaju njihova autorska prava.
Izdavači protiv HowardsHome: argumenti i zahtjevi
U ovom slučaju, tužitelji su tri vodeća izdavača iz Nizozemske – DPG Media, Mediahuis i NRC. Ove medijske kuće upravljaju velikim portfeljem novinskih izdanja, digitalnih platformi i baza podataka koje uključuju vijesti, članke, fotografije i druge sadržaje. Izdavači su podnijeli nadležnom sudu kondemnatorni tužbeni zahtjev u kojem su od suda tražili da naloži HowardsHomeu prestanak distribuiranja i javnog priopćavanja njihovih tekstualnih i slikovnih sadržaja bez prethodnog odobrenja, što je uključivalo naslove i sažetke članaka. Svoje zahtjeve dodatno su poduprli traženjem naknade štete zbog navodnog kršenja autorskih prava. Osim toga, zahtijevali su i da se HowardsHome obveže na dostavljanje iscrpnog popisa svih povreda te plaćanje kazne za svaku buduću povredu, kao i pokrivanje troškova postupka. Prema izdavačima, način na koji HowardsHome koristi njihove sadržaje, oslanjajući se na RSS feedove i automatizirane procese, predstavlja povredu njihovih ulaganja u stvaranje i održavanje baza podataka te ugrožava komercijalnu vrijednost njihovih publikacija. Istovremeno su tvrdili da su robots.txt datoteke, koje jasno zabranjuju prikupljanje podataka, zanemarene, čime su povrede dodatno intenzivirane. Naime, izdavači su na svojim web stranicama koristili robots.txt datoteke kako bi jasno zabranili automatizirano prikupljanje sadržaja od strane HowardsHome-a. Njihov argument bio je da robots.txt predstavlja adekvatno sredstvo rezervacije prava prema DSM Direktivi.
U svom odgovoru na tužbu, tuženik - HowardsHome je osporio tvrdnje izdavača naglašavajući zakonitost svojih praksi i usklađenost s europskim zakonodavstvom. Prvo, istaknuli su da koriste isključivo javno dostupne podatke putem RSS feedova, bez pristupanja sadržajima tužitelja zaštićenim paywallom. Prikupljeni podaci ograničeni su na naslove, kratke sažetke (snippets)4 i poveznice na izvorne članke, što prema njima ne predstavlja povredu autorskih prava. Tuženik je također naglasio kako robots.txt nije pravno obvezujuće sredstvo prema članku 4. DSM Direktive5. Tuženik je isticao kako robots.txt predstavlja tehničku uputu za botove, ali ne ispunjava zahtjeve strojno čitljive rezervacije prava kako ih Direktiva definira.
Odluka suda
Okružni sud u Amsterdamu donio je presudu u korist HowardsHome-a, zaključujući da njihovo korištenje javno dostupnih podataka putem RSS feedova nije povrijedilo autorska prava tužitelja. U središtu spora bila je upotreba robots.txt datoteka te pitanje njihova statusa kao strojno čitljivog sredstva za rezervaciju prava prema DSM Direktivi. Sud je odbacio tvrdnje izdavača, donoseći nekoliko važnih zaključaka koji imaju šire implikacije za budućnost regulacije digitalnog okruženja.
Prvo, sud je jasno naveo da robots.txt nije strojno čitljivo sredstvo u smislu Direktive. Iako je robots.txt tehnički alat koji upravlja ponašanjem botova, sud je utvrdio da on ne zadovoljava kriterije potrebne za rezervaciju prava prema članku 4. DSM Direktive. Prema stajalištu ovoga suda, robots.txt nema standardiziranu pravnu vrijednost niti tehničku specifičnost potrebnu da bi ga sustavi prepoznali kao pravno obvezujuću rezervaciju prava. Budući da robots.txt nije od strane ovog suda prepoznat kao pravno obvezujuće sredstvo, nositelji prava moraju koristiti naprednija rješenja poput metapodataka, digitalnih oznaka ili drugih standardiziranih tehničkih alata koji su pravno prihvaćeni i jasno signaliziraju rezervaciju prava.
Drugo, sud je zaključio da korištenje kratkih isječaka sadržaja (snippets) ne predstavlja povredu autorskih prava. HowardsHome prikuplja i prikazuje naslove i kratke sažetke članaka, ali takva praksa ne zamjenjuje komercijalnu eksploataciju izvornog sadržaja. Sud je potvrdio da se ovakva upotreba uklapa u zakonsku iznimku6. Snippets ne narušavaju prava izdavača jer su namijenjeni informiranju korisnika i često upućuju na izvornu stranicu, čime zapravo mogu doprinijeti povećanju prometa na web stranicama izdavača.
Treće, sud je potvrdio primjenu TDM iznimke iz članka 4. DSM Direktive, prema kojoj je automatizirano prikupljanje i obrada javno dostupnih podataka dopuštena pod uvjetom da nositelji prava nisu izričito rezervirali svoja prava korištenjem strojno čitljivih oznaka. Budući da izdavači nisu koristili takva sredstva, sud je ocijenio da HowardsHome nije povrijedio zakon. Ova odredba Direktive osmišljena je kako bi podržala tehnološke inovacije, omogućujući razvoj umjetne inteligencije i drugih alata koji ovise o velikim količinama podataka.
Paralele sa slučajem LAION protiv Kneschkea
Usporedba s presudom u slučaju LAION protiv Kneschkea, donesenom u Hamburgu 27. rujna 2024., otkriva sličnosti, ali i ključne razlike. U tom slučaju, LAION (Large-scale Artificial Intelligence Open Network) koristio je fotografije fotografa Roberta Kneschkea za treniranje AI modela, unatoč tome što su te fotografije bile zaštićene robots.txt datotekama s jasnim zabranama. Sud u Hamburgu presudio je u korist LAION-a, također se pozivajući na TDM iznimku za nekomercijalne svrhe znanstvenog istraživanja. Glavna razlika između dva slučaja leži u kontekstu primjene TDM-a. LAION je koristio podatke za razvoj umjetne inteligencije, dok HowardsHome koristi podatke za komercijalne usluge praćenja vijesti. Ipak, oba slučaja potvrđuju da robots.txt nije dovoljno sredstvo za rezervaciju prava jer nije pravno prepoznat kao strojno čitljiv standard. Dok je presuda u slučaju LAION naglašavala nekomercijalnu prirodu korištenja podataka, presuda u slučaju HowardsHome proširuje primjenu TDM iznimke i na komercijalne svrhe, pod uvjetom da se poštuju pravila zakonitog pristupa i da se prava nisu izričito rezervirala na tehnički adekvatan način.
Zašto su ove presude važne?
Ove presude postavljaju jasne granice između slobode informacija i zaštite autorskih prava. S jedne strane, one podržavaju razvoj tehnologija koje ovise o prikupljanju velikih količina podataka, poput umjetne inteligencije. S druge strane, naglašavaju odgovornost nositelja prava da koriste naprednije tehničke alate, poput digitalnih vodenih žigova ili metapodataka, ako žele učinkovito zaštititi svoja prava. Obje presude naglašavaju problem trenutnog opt-out sustava7, koji zahtijeva da nositelji prava aktivno rezerviraju svoja prava.
Ovaj sustav prebacuje odgovornost na autore i izdavače, dok korisnicima podataka omogućuje širok pristup sve dok prava nisu rezervirana na "strojno čitljiv način". Sustav koji zahtijeva od izdavača da koriste strojno čitljive oznake kako bi rezervirali svoja autorska prava stavlja nerazmjeran teret na kreatore sadržaja – autore i nositelje prava, dok korisnici, posebno komercijalni, dobivaju praktički neograničen pristup bez adekvatne naknade.
Zaključak
Presuda u slučaju HowardsHome pokazala je jasne prednosti trenutnog opt-out sustava, osobito u kontekstu podrške slobodnom pristupu informacijama i razvoju tehnologija poput umjetne inteligencije. Omogućavanje automatiziranog prikupljanja podataka bez potrebe za prethodnim odobrenjem pruža jednostavnost i ubrzava tehnološke inovacije. Međutim, slučaj također otkriva ozbiljne izazove za nositelje prava, koji se suočavaju s dodatnim troškovima i odgovornošću za zaštitu vlastitih sadržaja u sve složenijem digitalnom okruženju.
Pitanje ravnoteže između prava autora i slobode informacija ostaje otvoreno. Trenutni opt-out sustav ima očite slabosti, posebno u pogledu komercijalne eksploatacije sadržaja bez adekvatne naknade. S druge strane, uvođenje hibridnog modela, koji bi zadržao opt-out za nekomercijalne svrhe, ali zahtijevao opt-in za komercijalne korisnike bi možda moglo osigurati pravedniju zaštitu i kompenzaciju autorima i nositeljima prava.
Stjepan Matić
^ 1 TDM na engleskom označava Text and Data Mining, odnosno tekstualno i podatkovno rudarenje. To je proces automatskog prikupljanja i analize velikih količina podataka, s ciljem pronalaženja obrazaca, trendova ili korisnih informacija. TDM se često koristi u istraživanjima, razvoju umjetne inteligencije i analizi podataka za različite komercijalne i nekomercijalne svrhe.
^ 2 Robots.txt je datoteka na web poslužitelju koja daje upute automatiziranim alatima (botovima) o tome koje dijelove stranice smiju ili ne smiju dohvaćati.
^ 3 DIREKTIVA (EU) 2019/790 EUROPSKOG PARLAMENTA I VIJEĆA od 17. travnja 2019. o autorskom pravu i srodnim pravima na jedinstvenom digitalnom tržištu i izmjeni direktiva 96/9/EZ i 2001/29/EZ; implementirana u hrvatsko zakonodavstvo novim Zakonom o autorskom pravu i srodnim pravima („Narodne novine“ broj 111/21.).
^ 4 Snippets su kratki isječci sadržaja koji pružaju sažetu informaciju o većem tekstu ili članku. U kontekstu interneta, snippets se najčešće koriste kako bi korisnicima dali osnovnu ideju o sadržaju stranice bez potrebe za otvaranjem cijelog članka. Vidi više na: https://dictionary.cambridge.org/dictionary/english/snippet#google_vignette
^ 5 Iznimka ili ograničenje za potrebe rudarenja teksta i podataka:
^ 6 Naš Zakon o autorskom pravu i srodnim pravima takvu iznimku vidi u pogledu nezaštićene tvorevine iz članka 18. stavak 2. točke 3. – dnevne novosti, i druge vijesti koje imaju karakter običnih medijskih informacija
^ 7 Opt-out sustav omogućuje korisnicima slobodan pristup resursima ili podacima sve dok nositelji prava ne signaliziraju zabranu korištenja, obično putem tehničkih alata poput strojno čitljivih oznaka. Ovaj model, primijenjen u članku 4. DSM Direktive, potiče inovacije i olakšava razvoj tehnologija poput umjetne inteligencije jer uklanja prepreke u vidu pribave bilo kakvih odobrenja i/ili plaćanja naknade. Međutim, opt-out sustav stavlja značajan teret na nositelje prava, koji moraju aktivno implementirati zaštitne mjere kako bi rezervirali svoja (autorska) prava. To posebno pogađa manje izdavače i autore s ograničenim resursima, ostavljajući ih ranjivima na masovno iskorištavanje njihovog sadržaja.