Site icon La terrazza Mongardino

Milagros Miceli, ricercatrice: “È una bugia che l’intelligenza artificiale automatizzerà tutto. Ha bisogno del lavoro manuale e precario di milioni di persone” | Tecnologia


L’intelligenza artificiale (AI) non è così automatica come si predica. Questa tecnologia funziona grazie a potenti computer che eseguono calcoli su estesi database. Ma questi database devono essere sistemati e testati, un lavoro manuale che le aziende esternalizzano a legioni di lavoratori che generalmente sono pagati molto poco; a volte, centesimi di dollaro per ogni attività completata. Questa realtà è stata descritta nel libro Lavoro fantasma (in spagnolo, Ghost Work), pubblicato nel 2019 da Mary Gray, antropologa e ricercatrice di Microsoft, e dal collega Siddarth Suri.

Al momento della pubblicazione di quell’opera, Milagros Miceli (Buenos Aires, 41 anni), sociologa e dottore in Informatica, stava già svolgendo ricerche sull’argomento da due anni. Quando fu assunta presso il neonato German Internet Institute, che prende il nome dal pioniere dell’intelligenza artificiale Joseph Weizenbaum, le conseguenze sociali degli algoritmi venivano affrontate da un punto di vista molto teorico. Miceli voleva andare oltre. “Mi chiedevo se qualcuno stesse parlando con le persone dietro quegli algoritmi. È così che sono arrivato agli annotatori di dati, che etichettano le immagini delle sedie con la parola “sedia” in modo che la macchina impari a distinguerle, e poi ai data lavoratore, un concetto che abbiamo sviluppato,” spiega.

Da allora Miceli ha seguito quel tema. Oggi è una delle massime esperte nel campo poco conosciuto dei data work. È anche ricercatrice senior presso il DAIR Institute, il centro fondato da Timnit Gebru, responsabile dell’etica dell’intelligenza artificiale di Google che è stato licenziato poco dopo aver firmato un rapporto in cui l’azienda non se la passava bene. Questo dicembre ha partecipato alla III Conferenza sulla riflessione sulla giustizia digitale globale, tenutasi a Barcellona, ​​per parlare di tutto questo.

Chiedere. Cos’è un dataworker?

Risposta. Un data lavoratore è una persona che fondamentalmente produce dati per addestrare i sistemi di intelligenza artificiale. Questo compito può essere svolto registrando la propria voce, caricando selfie, etichettando e classificando i dati, interpretandoli… Ciò che molte persone a volte non immaginano è che questo è un lavoro continuo, non finisce sul momento. I sistemi richiedono lavoro manuale, come la manutenzione dei set di dati, il loro controllo o la loro messa a punto.

P. Che tipo di qualifica è necessaria per svolgere questi compiti?

R. C’è un mito secondo cui coloro che fanno questo non sono lavoratori qualificati. Ma, in pratica, si tratta di lavoratori che hanno completato almeno l’istruzione terziaria o superiore. Ho conosciuto persone che hanno anche un dottorato e fanno questo tipo di lavoro.

P. Dove si trovano i lavoratori dei dati?

R. Abbondano popolazioni vulnerabili o povere, con un tasso di disoccupazione molto elevato, ma che hanno un’istruzione superiore. La natura del lavoro è in realtà molto difficile. L’ho provato. Non richiede solo un livello di conoscenza formale, ma anche artigianale.

Milagros Miceli, prima di intervenire alla III Conferenza sulla riflessione sulla giustizia digitale globale, tenutasi a Barcellona.

Alberto Garcia

P. Potresti darmi un esempio?

R. L’etichettatura e la segmentazione delle immagini satellitari sono aree molto comuni. È molto difficile. Innanzitutto è stancante per gli occhi e per la mano che muove il mouse senza sosta. Oltre a ciò, bisogna fare molta attenzione a separare un albero da una persona, o una casa da un’auto, in immagini spesso sfocate. Ciò richiede una certa conoscenza dell’architettura e della vegetazione specifiche di un paese. E se sbagli, non vieni pagato nulla.

P. Qual è la situazione per i lavoratori dei dati?

R. Ancora invariato da quando è iniziato. Si trovano in una situazione di totale precarietà e mancanza di protezione. Qui regna quello che una volta veniva chiamato il uberizzazione di lavoro: vengono pagati per l’attività completata e non per il tempo necessario per completare l’attività. Nel caso dei data work, non viene conteggiato il tempo necessario per effettuare il login, per trovare un task disponibile, che non sempre è disponibile, o per comprendere le istruzioni, che possono essere molto complesse e sono quasi sempre in inglese. Il tutto con il rischio che poi il cliente dica che non è stato fatto quanto richiesto, e quindi non paghi. Ciò accade in molti casi e inoltre il cliente ha il diritto di conservare i dati che gli sono stati forniti.

Ad alcuni lavoratori dei dati viene impedito l’accesso alle piattaforme per porre domande, ad esempio, sullo stipendio. Poi alcune piattaforme, come la più grande di tutte, Amazon Mechanical Turk, non pagano con soldi, ma con voucher, in questo caso, da spendere su Amazon. Ecco come si realizza il monopolio perfetto. Naturalmente, quando succede qualcosa al lavoratore, ad esempio avere conseguenze derivanti dal lavorare con contenuti psicologicamente disturbanti, nessuno lo aiuta. In molti casi hanno precedentemente firmato un accordo di riservatezza che vieta loro di rivelare la natura di ciò che fanno. Alcuni operatori ci hanno raccontato che, per questo motivo, e nonostante soffrissero di stress post-traumatico, hanno evitato di rivolgersi ai terapisti. Né possono inserire nel loro curriculum il fatto di essere stati moderatori di contenuti per una piattaforma così eccezionale.

P. Quindi, ci sono moderatori di contenuti che non sono sul libro paga, ma che entrano attraverso questo percorso di micro-lavoro?

R. Ci sono moderatori di contenuti che non vengono assunti e la maggior parte dei moderatori di contenuti ha contratti precari tramite società terze in Europa, ma molti anche nei paesi del sud del mondo. Queste aziende, tra l’altro, sono le stesse che utilizzavano il tagging delle immagini. Molte volte, infatti, le stesse persone ruotano da un team all’altro. D’altro canto, la moderazione dei contenuti viene spesso effettuata contemporaneamente all’etichettatura dei dati: decidono se ciò che stanno monitorando è o meno incitamento all’odio, informazioni che vengono poi utilizzate per addestrare gli algoritmi.

P. Sai quanti lavoratori dei dati ci sono?

R. È molto difficile dare un numero. La Banca Mondiale, un’istituzione conservatrice, afferma che nel mondo ce ne sono tra i 150 e i 420 milioni. Quello che sappiamo è che i numeri sono cresciuti in modo esponenziale negli ultimi anni. L’idea che il lavoro sarà automatizzato è una bugia. L’intelligenza artificiale richiede molto lavoro manuale.

P. Il discorso del uberizzazione Dice che i microlavoratori vogliono lavorare in orari specifici, come complemento al loro stipendio. La stessa cosa che sostengono in Glovo. È così? I lavoratori dei dati sono a tempo pieno o solo part-time?

R. È un altro mito, sì. Non ci sono quasi lavoratori dati occasionali e ciò ha a che fare con la complessità e l’elevata professionalizzazione richieste, come accennato in precedenza, per svolgere questi compiti. Più i modelli di intelligenza artificiale diventano sofisticati, più qualificati devono essere i lavoratori che gestiscono i loro database. Non è più come dieci anni fa, quando alle persone veniva chiesto di identificare i gattini in una serie di foto. Quello non esiste più. Per guadagnare qualche soldo, devi lavorare ogni giorno.

P. Il classico esempio di microlavoro digitale, come dice lui, è stato il tagging delle immagini. Ora qual è il più richiesto?

R. Sette anni fa, quando ho iniziato, la moda era taggare le fotografie. L’importante era avere quantità, non qualità. Nel 2019 abbiamo condotto uno studio in cui analizzavamo le istruzioni date ai lavoratori e la maggior parte era in questo senso. Ma recentemente si è verificato uno spostamento molto marcato verso compiti che hanno più a che fare con la linguistica e l’intelligenza artificiale generativa: produrre dati da zero per uno scopo specifico. Ad esempio, gli artisti disoccupati vengono assunti e gli viene chiesto di creare immagini secondo alcune istruzioni di base, le cosiddette richiede. Questo viene poi affidato all’algoritmo Midjourney per affinare il suo funzionamento. Oppure vengono assunti giornalisti o scrittori per scrivere cronache o racconti in modo che la macchina possa estrarre schemi. Per arricchire i database vengono registrate anche le persone che leggono testi in dialetti o lingue minoritarie.

P. L’intelligenza artificiale può funzionare senza questo lavoro manuale? Hai bisogno di supporto umano 24 ore su 24?

R. Questo sistema è progettato per avere i lavoratori disponibili 24 ore al giorno, sette giorni alla settimana, e pagarli il minimo essenziale. E se le condizioni non sono di loro gradimento, le aziende possono trasferirsi nel paese o nella città successiva. Regole su larga scala, e funzionano solo se abbiamo milioni di lavoratori. Naturalmente c’è un altro modo di fare le cose. I modelli funzionano meglio se addestrati su set di dati più piccoli ma meglio curati. Per questo non servono milioni di lavoratori, ma bravi professionisti e comunicazione con loro. L’opposto dell’anonimato e della mediazione algoritmica.

P. Gli ultimi modelli di intelligenza artificiale generativa sono già stati addestrati con tutti i dati disponibili su Internet, quindi la nuova generazione deve includere tutto questo e anche nuovi dati sintetici o prodotti artificialmente. Pensi che l’intelligenza artificiale generativa farà salire alle stelle la domanda di lavoratori dei dati?

R. Se dovessi fare una previsione è che i lavoratori dei dati continueranno a crescere. Anche chi scommette che il futuro è nei dati sintetici, nei dati generati dalle macchine, sa che questo è difficile dal punto di vista tecnico. Senza entrare troppo nei dettagli, addestrare un’IA con i dati generati da un’IA produce un loop, finisce per ripetere la stessa cosa, è come un gioco di specchi infinito. Quindi scrittori, artisti, giornalisti o traduttori continueranno a essere necessari per generare dati che servano ad arricchire i database su cui vengono applicati gli algoritmi.

Ma anche se potessi addestrare modelli con dati sintetici, avresti comunque bisogno di dataworker per attività di verifica algoritmica, che consistono, ad esempio, nel sedersi con ChatGPT e fargli domande e dire se ciò che risponde è giusto o sbagliato, se c’è è un’opzione migliore, ecc. Proseguendo con il linguaggio, è qualcosa di dinamico, che cambia. I chatbot devono essere costantemente perfezionati, e solo gli esseri umani possono farlo, perché conoscono e comprendono i contesti.

P. Perché pensi che questa dimensione manuale dell’intelligenza artificiale sia così opaca?

R. E’ totalmente intenzionale. Viene venduto il mito di una tecnologia miracolosa e incredibilmente potente, di cui dovremmo temere perché può ucciderci tutti. A ciò aggiungo che questa tecnologia si basa sul lavoro nero, sul lavoro precario, sul lavoro di sfruttamento di milioni di lavoratori. Ma per vendere questo mito di una tecnologia ultrapotente e temibile è necessario cancellare ogni traccia dell’umanità. Tuttavia, l’intelligenza artificiale non funzionerebbe senza legioni di colletti blu. Perché continuare a nasconderli e a renderli precari?



source

Exit mobile version