Apple Inc. (NASDAQ:AAPL) è stata accusata di aver utilizzato i video di YouTube, società controllata da Alphabet Inc. (NASDAQ:GOOGL) (NASDAQ:GOOG), per addestrare i suoi modelli di IA senza il consenso dei creator.
Cosa è successo
Lo YouTuber tech Marques Brownlee, noto anche come MKBHD, è intervenuto sui social media per esprimere le sue preoccupazioni sull’utilizzo da parte di Apple dei contenuti di YouTube per l’addestramento dell’IA.
Brownlee ha rivelato che Apple si è rifornita di dati da diverse aziende, una delle quali ha effettuato lo scraping di dati e trascrizioni da video di YouTube, compresi i suoi. Le aziende non sono responsabili dello scraping, ma è probabile che il problema persista, ha osservato Brownlee.
“Apple tecnicamente evita la ‘colpa’ in questo caso perché non è lei a fare lo scraping, ma questo sarà un problema in evoluzione per molto tempo”, ha scritto Brownlee.
Apple has sourced data for their AI from several companies
One of them scraped tons of data/transcripts from YouTube videos, including mine
Apple technically avoids "fault" here because they're not the ones scraping
But this is going to be an evolving problem for a long time https://t.co/U93riaeSlY
— Marques Brownlee (@MKBHD) July 16, 2024
MKBHD ha scritto in un altro post: “In effetti, pago un servizio (al minuto) per ottenere trascrizioni più accurate dei miei video, che poi carico sul back-end di YouTube. Quindi, le aziende che scannerizzano le trascrizioni stanno rubando il lavoro pagato in più di un modo. Non è il massimo”.
Fun fact, I pay a service (by the minute) for more accurate transcriptions of my own videos, which I then upload to YouTube's back-end. So companies that scrape transcripts are stealing *paid* work in more than one way. Not great.
— Marques Brownlee (@MKBHD) July 16, 2024
Il report di 9to5Mac, condiviso da Brownlee, ha rivelato che diversi giganti tecnologici, tra cui Apple, hanno addestrato i loro modelli di IA utilizzando i file dei sottotitoli scaricati da terzi da oltre 170.000 video. Questi dati includevano trascrizioni di video di creatori come Brownlee, MrBeast, PewDiePie, Stephen Colbert, John Oliver e Jimmy Kimmel.
L’indagine di Proof News ha rivelato che il dataset di EleutherAI, noto come il Pile, è stato utilizzato da importanti aziende come NVIDIA Corp. (NASDAQ:NVDA) e Salesforce Inc (NYSE:CRM) per l’addestramento dell’IA.
Le aziende hanno perseguito questa pratica nonostante le norme di YouTube vietino la raccolta non autorizzata di materiale dalla piattaforma.
Apple, Nvidia, Google e Anthropic non hanno risposto immediatamente alla richiesta di commento di Benzinga.
Perché è importante
Il problema dello scraping di contenuti non autorizzati per l’addestramento dell’IA è una preoccupazione crescente nel settore tecnologico. Di recente, OpenAI e Anthropic hanno segnalato di aver ignorato le regole del web scraping, suscitando polemiche. Queste aziende avrebbero aggirato il protocollo robots.txt, progettato per impedire lo scraping automatico dei siti web.
In risposta a tali pratiche, Reddit Inc. (NYSE:RDDT) ha recentemente aggiornato la sua piattaforma per bloccare lo scraping automatico dei contenuti. Questo cambiamento di politica ha portato a un’impennata di quasi il 9% del valore delle azioni di Reddit, evidenziando la sensibilità del mercato ai problemi di privacy dei dati.
In precedenza, Meta Platforms Inc. (NASDAQ:META) ha dovuto affrontare un problema di scraping dei dati, che ha portato ad azioni legali contro un’azienda cinese. Questo incidente sottolinea la natura diffusa del problema tra le varie piattaforme di social media.
Inoltre, Elon Musk ha citato lo scraping dell’IA come motivo per l’implementazione di tweet paywall su X, Inc. (ex Twitter Inc.). Ora gli utenti hanno bisogno di un account per leggere i tweet e coloro che desiderano visualizzare più di 600 post al giorno devono pagare l’accesso a Twitter Blue.
Per ulteriori aggiornamenti su questo argomento, aggiungi Benzinga Italia ai tuoi preferiti oppure seguici sui nostri canali social: X e Facebook.
Ricevi informazioni esclusive sui movimenti di mercato 30 minuti prima degli altri trader
La prova gratuita di 14 giorni di Benzinga Pro, disponibile solo in inglese, ti permette di accedere ad informazioni esclusive per poter ricevere segnali di trading utilizzabili prima di milioni di altri trader. CLICCA QUI per iniziare la prova gratuita.
Immagine tramite Shutterstock