Causa contro il creatore di ChatGPT OpenAI per furto dei nostri dati!
Una nuova causa contro il creatore di #chatgpt #openai sostiene che le pratiche di formazione sull' #intelligenza_artificiale della vivace azienda della #silicon_valley hanno #violato la #privacy e il #copyright di - beh, praticamente di tutti coloro che hanno mai pubblicato qualcosa #online.
Per #addestrare i suoi potenti #modelli di #linguaggio_ai, OpenAI ha utilizzato un'incredibile quantità di #dati prelevati da vari angoli del web. Sebbene OpenAI non sappia nemmeno esattamente su cosa sono addestrati i suoi sistemi, quei set di dati includono di tutto, dagli #articoli di #wikipedia e #romanzi famosi ai post sui #social_media e all'erotismo incredibilmente di nicchia - e OpenAI non ha chiesto il permesso per nulla di tutto ciò.
La class action, intentata in California, sostiene che il mancato rispetto delle corrette linee guida sugli appalti, inclusa la ricerca del consenso di coloro che hanno prodotto quel contenuto in primo luogo, equivale a un vero e proprio #furto di dati.
"Nonostante i #protocolli stabiliti per l'acquisto e l'uso di informazioni personali, gli imputati hanno adottato un #approccio diverso: furto", si legge nel deposito. "Hanno sistematicamente raschiato 300 miliardi di parole da #internet, 'libri, articoli, siti Web e post, comprese le informazioni personali ottenute senza consenso'".
È una #critica giusta. Se sei stato online negli ultimi decenni, i tuoi output digitali sono probabilmente incorporati nei set di dati di OpenAI, il che significa che tutto ciò che i #modelli_generativi di OpenAI sfornano - a scopo di #lucro - potrebbe contenere frammenti del tuo lavoro digitale raschiato silenziosamente dentro.
Detto questo, resta da vedere se il caso regge effettivamente in tribunale. L'infrastruttura di Internet è complicata e ciò che è ampiamente visto come il Web libero e aperto spesso non è nessuna di queste cose; le #piattaforme hanno i propri termini e accordi con gli utenti, e anche se siamo quelli che hanno fatto il lavoro per riempire quei siti di #contenuti, in molti casi tecnicamente appartengono alla piattaforma e non, sfortunatamente, agli utenti.
"Quando metti contenuti su un sito di social media o su qualsiasi sito, generalmente stai concedendo una licenza molto ampia al sito per poter utilizzare i tuoi contenuti in qualsiasi modo", ha detto a WaPo Katherine Gardner, un avvocato specializzato in proprietà intellettuale . "Sarà molto difficile per l'utente finale ordinario affermare di avere diritto a qualsiasi tipo di pagamento o compenso per l'utilizzo dei propri dati nell'ambito della formazione".
https://futurism.com/the-byte/openai-sued-train-ai