Reddit vs. Internet Archive: AI adatgyűjtés miatti blokkolás
A Reddit bejelentette, hogy korlátozza az Internet Archive hozzáférését a platformjához, miután AI cégeket kapott rajta, amint adataikat kaparták le a Wayback Machine archívumból. Ez jelentős változást jelent a digitális megőrzés terén.
Mi történt pontosan?
A Reddit közölte, hogy tetten érte az AI cégeket, amint scraping technikával gyűjtötték az adatokat az Internet Archive Wayback Machine archívumából. Emiatt a cég úgy döntött, hogy blokkolja az Internet Archive indexelését a Reddit nagy részén.
A Wayback Machine ezentúl nem férhet hozzá poszt részletoldalakhoz, hozzászólásokhoz vagy profilokhoz. Ehelyett csak a Reddit.com főoldalt indexelheti, ami azt jelenti, hogy az archívum kizárólag a legnépszerűbb hírcímekről és posztokról készíthet pillanatfelvételeket egy adott napról.
A Reddit lépései védik a felhasználói adatokat az AI cégek visszaéléseitől, miközben korlátozzák a digitális örökség megőrzését.
Milyen hatással jár ez?
Ez a döntés érinti a digitális archívumok működését, mivel a Wayback Machine kulcsszerepet játszik az internet történetének megőrzésében. A Reddit felhasználói tartalmainak nagy része így eltűnik a jövőbeli archívumokból, ami hosszú távon befolyásolhatja a kutatásokat és a történelmi dokumentációt.
A blokkolás része a Reddit erőfeszítéseinek, hogy ellenőrizze adatai használatát, különösen az AI modellek tanítására. Hasonló intézkedéseket más platformok is fontolgatnak a növekvő adatvédelem miatti aggodalmak közepette.
Összefoglalva, ez a lépés kiemeli a feszültséget a nyílt archívumok és a platformok adatvédelmi prioritásai között, hangsúlyozva a technológiai cégek felelősségét a tartalomkezelésben.


