L'intelligenza artificiale può prevedere se qualcuno era effettivamente nel sito di un campione di DNA. Credito:Gorodenkoff/Shutterstock
Le prove del DNA spesso non sono così ermetiche come molte persone pensano. Le tecniche sensibili sviluppate negli ultimi 20 anni significano che ora la polizia può rilevare minuscole tracce di DNA sulla scena del crimine o su una prova. Ma le tracce di un perpetratore sono spesso mescolate con quelle di molte altre persone che sono state trasferite nel sito del campione, per esempio tramite una stretta di mano. E questo problema ha portato a condannare ingiustamente le persone.
Gli scienziati hanno sviluppato algoritmi per separare questa zuppa di DNA e per misurare le quantità relative del DNA di ogni persona in un campione. Questi metodi di "genotipizzazione probabilistica" hanno permesso agli investigatori forensi di indicare quanto sia probabile che il DNA di un individuo sia stato incluso in un campione misto trovato sulla scena del crimine.
E adesso, si stanno sviluppando tecniche più sofisticate di intelligenza artificiale (AI) nel tentativo di estrarre i profili del DNA e cercare di capire se un campione di DNA provenga direttamente da qualcuno che era sulla scena del crimine, o se fosse stato appena trasferito innocentemente.
Ma se questa tecnologia ha successo, potrebbe introdurre un nuovo problema, perché attualmente è impossibile capire esattamente come questa IA arrivi alle sue conclusioni. E come possiamo fidarci della tecnologia per fornire prove vitali se non possiamo interrogarci su come ha prodotto quella prova in primo luogo? Ha il potenziale per aprire la strada a ancora più errori giudiziari e quindi questa mancanza di trasparenza può essere una barriera all'uso della tecnologia nelle indagini forensi.
Sfide simili sono emerse quando il software per l'analisi del DNA è stato sviluppato per la prima volta un decennio fa. Le prove derivate dal software di miscelazione del DNA si sono scontrate molto rapidamente con le sfide delle squadre di difesa (inclusa quella di OJ Simpson), che erano preoccupati che l'accusa dimostrasse che il software era stato correttamente convalidato.
Quanto sono stati accurati i risultati, e qual era il tasso di errore noto? Come funzionava esattamente il software e poteva ospitare ipotesi di difesa? I risultati erano davvero così affidabili che una giuria poteva condannare in sicurezza?
È un principio fondamentale della legge che le prove devono essere aperte al controllo. La giuria non può fare affidamento su asserzioni sfacciate (affermazioni fatte senza prove), non importa chi li fa e che esperienza hanno. Ma i proprietari del software hanno sostenuto che era la loro proprietà intellettuale protetta e il modo in cui funzionava non doveva essere reso pubblico.
Ne seguì una battaglia che prevedeva l'uso di nuove procedure giudiziarie per consentire alle squadre di difesa di esaminare privatamente come funzionava il software. Finalmente, i tribunali erano convinti che fosse necessario il pieno accesso al codice sorgente, anche per verificare ipotesi diverse da quelle avanzate dall'accusa.
Ma il software non ha completamente risolto i problemi delle miscele di DNA e dei piccoli, campioni degradati. Non sappiamo ancora con certezza se il DNA in un campione provenga direttamente da una persona o vi sia stato trasferito. Ciò è complicato dal fatto che persone diverse perdono il DNA a velocità diverse, un fenomeno noto come "stato di dispersione".
Per esempio, un campione prelevato da un'arma del delitto potrebbe contenere più DNA di qualcuno che non l'ha toccato rispetto alla persona che ha effettivamente commesso l'omicidio. Per questo motivo le persone sono state accusate di reati gravi.
Aggiungi il fatto che il DNA viene trasferito a velocità diverse su superfici diverse e in condizioni ambientali diverse e potrebbe diventare quasi impossibile sapere esattamente da dove provenga il DNA in un campione. Questo problema di "trasferimento e persistenza" minaccia di minare seriamente il DNA forense.
Di conseguenza, sono in corso esperimenti per trovare modi per quantificare in modo più accurato il trasferimento del DNA in diverse circostanze. E l'intelligenza artificiale ha il potenziale per analizzare i dati di questi esperimenti e utilizzarli per indicare l'origine del DNA in un campione.
Ma il software basato sull'intelligenza artificiale ha un problema di trasparenza ancora maggiore rispetto al software di genotipizzazione probabilistica, e uno che è attualmente fondamentale per il modo in cui funziona. Il modo esatto in cui funziona il software non è solo un segreto commerciale, non è chiaro nemmeno agli sviluppatori di software.
Problemi di trasparenza
L'intelligenza artificiale utilizza algoritmi matematici per completare compiti come abbinare un'espressione facciale a un particolare insieme di emozioni. Ma, in modo cruciale, è in grado di apprendere attraverso un processo di tentativi ed errori e manipola gradualmente gli algoritmi sottostanti per diventare più efficiente.
È questo processo di manipolazione e cambiamento che non è sempre trasparente. Il software apporta le sue modifiche in modo incredibilmente rapido secondo la propria logica indecifrabile. Può ottenere risultati straordinariamente efficienti, ma non possiamo dire come sia stato possibile. Si comporta come una scatola nera che prende input e fornisce output, ma i cui meccanismi interni sono invisibili. I programmatori possono seguire un processo di sviluppo più chiaro, ma è più lento e meno efficiente.
Questo problema di trasparenza riguarda molte applicazioni più ampie dell'IA. Per esempio, rende molto difficile correggere i sistemi di intelligenza artificiale le cui decisioni mostrano un pregiudizio razziale o di genere, come quelli usati per vagliare i curricula dei dipendenti, o per prendere di mira le risorse della polizia.
E l'avvento dell'analisi del DNA guidata dall'intelligenza artificiale aggiungerà un'ulteriore dimensione ai problemi già incontrati. Gli avvocati difensori potrebbero giustamente contestare l'uso di questa tecnologia, anche se il suo uso è limitato alla raccolta di informazioni piuttosto che alla fornitura di prove dell'accusa. A meno che i problemi di trasparenza non vengano affrontati in una fase iniziale, gli ostacoli all'utilizzo dell'IA in ambito forense potrebbero rivelarsi insormontabili.
Come possiamo affrontare queste sfide? Un'opzione potrebbe essere quella di optare per il meno efficiente, forme vincolate di IA. Ma se lo scopo dell'IA è svolgere i compiti di cui siamo meno capaci o meno disposti a svolgere noi stessi, quindi ridurre l'efficienza potrebbe essere una soluzione scadente. Qualunque forma di intelligenza artificiale scegliamo di utilizzare, all'interno di un sistema contraddittorio di giustizia penale deve esserci la possibilità di revisione, per decodificare tutte le decisioni automatizzate, e per terze parti di fornire una convalida inequivocabile.
In definitiva, non è solo un problema tecnico, ma un urgente problema etico che va al cuore dei nostri sistemi di giustizia penale. In gioco c'è il diritto a una fiera, prova aperta e trasparente. Questo è un requisito fondamentale che deve essere affrontato prima che la corsa precipitosa del progresso tecnologico ci porti oltre il punto di non ritorno.
Questo articolo è stato ripubblicato da The Conversation con una licenza Creative Commons. Leggi l'articolo originale.