«Questo caso riguarda le due facce di Anthropic: quella pubblica che tenta di ingraziarsi i consumatori con affermazioni di rettitudine e di rispetto dei limiti e della legge, e quella privata che ignora qualsiasi regola che interferisca con i suoi tentativi di arricchire ulteriormente le proprie tasche». Reddit ha fatto causa alla società guidata da Dario Amodei, accusata di aver addestrato i propri algoritmi dall’estate 2024 effettuando oltre 10mila accessi alla piattaforma, nonostante l’ex startup avesse garantito di aver impedito alla propria tecnologia di pescare da quella fonte.
Reddit, quanto vale lo sfruttamento commerciale dei dati per addestrare l’AI
Secondo i responsabili di Reddit lo sfruttamento commerciale dei dati che sarebbe stato portato avanti da Anthropic varrebbe miliardi di dollari. Non si tratta della prima volta in cui una società di Intelligenza artificiale viene accusata di aver addestrato i propri algoritmi su contenuti senza riconoscere alcun pagamento dei diritti d’autore. Uno dei casi più celebri riguarda lo scontro legale tra il New York Times e OpenAI.
«Reddit – ha aggiunto la società che ha accusato Anthropic – ospita quasi 20 anni di discussioni ricche e umane su praticamente ogni argomento immaginabile. Queste conversazioni non avvengono da nessun’altra parte e sono fondamentali per l’addestramento di modelli linguistici come Claude». Bisogna d’altra parte aggiungere che lo scorso anno Reddit ha siglato un accordo con Google da circa 60 milioni di dollari per autorizzare la Big Tech a sfruttare i dati della piattaforma.
I dati sono fondamentali per l’AI (e non soltanto per quella di Anthropic), ma da tempo gli esperti sostengono che le società abbiano di fatto esaurito le informazioni da dare in pasto agli algoritmi. I social sono la nuova frontiera da cui pescare, dato che sono in costante aggiornamento? Nei giorni scorsi si è parlato di Meta e della possibilità di impedire alla multinazionale di Zuckerberg di sfruttare i propri dati per addestrare l’AI.