• Home
  • Chimica
  • Astronomia
  • Energia
  • Natura
  • Biologia
  • Fisica
  • Elettronica
  • L'intelligenza artificiale fa luce sul dark web

    Per abbinare utenti di forum diversi che probabilmente sono la stessa persona, un algoritmo calcola le somiglianze nei profili, come i loro nomi utente; nel contenuto, come frasi simili; e nella loro rete, come la comunità con cui interagiscono. Credito:Massachusetts Institute of Technology

    Sotto la rete superficiale, la forma pubblica di Internet che utilizzi quotidianamente per controllare la posta elettronica o leggere articoli di notizie, esiste una "rete oscura" nascosta. Host ad anonimo, siti protetti da password, il dark web è il luogo in cui i mercati criminali prosperano nella pubblicità e nella vendita di armi, droghe, e persone trafficate. Le forze dell'ordine lavorano continuamente per fermare queste attività, ma le sfide che devono affrontare nell'investigare e perseguire le persone del mondo reale dietro gli utenti che pubblicano su questi siti sono enormi.

    "La natura pop-up dei mercati del dark web rende estremamente difficile il monitoraggio dei loro partecipanti e delle loro attività, "dice Charlie Dagli, un ricercatore nel gruppo di sistemi e tecnologie di intelligenza artificiale del MIT Lincoln Laboratory. Dagli si riferisce alla velocità con cui i mercati del dark web chiudono (perché sono hackerati, perquisito, abbandonato, o impostato come una "truffa di uscita" in cui il sito si chiude intenzionalmente dopo che i clienti pagano per ordini inevasi) e ne compaiono di nuovi. La breve vita di questi mercati, da pochi mesi a un paio d'anni, ostacolare gli sforzi per identificare i propri utenti.

    Per vincere questa sfida, Lincoln Laboratory sta sviluppando nuovi strumenti software per analizzare i dati di superficie e dark web.

    Questi strumenti sfruttano l'unico vantaggio che presenta questo problema simile a un colpo di talpa:le connessioni che venditori e acquirenti mantengono su più livelli del Web, dalla superficie al buio, e nei forum del dark web. "Questo costante passaggio da un sito all'altro è ormai una parte consolidata del funzionamento dei mercati del dark web, "dice Dagli.

    Gli utenti creano costantemente nuovi profili. Sebbene potrebbero non utilizzare gli stessi nomi utente da sito a sito, mantengono vive le loro connessioni segnalandosi l'un l'altro attraverso il loro contenuto. Questi segnali possono essere utilizzati per collegare personaggi appartenenti allo stesso utente nei forum del dark web e, più rivelatore, collegare i personaggi del dark web al surface web per scoprire la vera identità di un utente.

    Collegare gli utenti sul dark web è ciò che le forze dell'ordine stanno già cercando di fare. Il problema è che la quantità di dati di cui hanno bisogno per riordinare manualmente:500, 000 numeri di telefono e 2 milioni di annunci di sesso pubblicati al mese:sono troppo grandi e non strutturati perché possano trovare rapidamente collegamenti. Così, solo una bassa percentuale di casi può essere perseguita.

    Per automatizzare il processo di collegamento delle persone, Lincoln Laboratory sta addestrando algoritmi di apprendimento automatico per calcolare la somiglianza tra gli utenti su diversi forum. I calcoli si basano su tre aspetti della comunicazione online degli utenti:"Come si identificano con gli altri, di cosa scrivono, e con chi scrivono, " spiega Dagli.

    L'algoritmo riceve prima i dati degli utenti su un determinato Forum A e crea un modello di paternità per ciascun utente. Quindi, i dati degli utenti del Forum B vengono confrontati con tutti i modelli utente del Forum A. Per trovare corrispondenze per le informazioni del profilo, l'algoritmo cerca indizi diretti, come cambiamenti nell'ortografia del nome utente come "sergeygork" sul forum A a "sergey gorkin" sul forum B, o somiglianze più sottili come "joe knight" e "joe nightmare".

    La prossima caratteristica che il sistema esamina è la somiglianza dei contenuti. Il sistema rileva frasi uniche, ad esempio "divertimento al sole", che vengono utilizzati in più annunci. "C'è un sacco di copia e incolla in corso, quindi compariranno frasi simili che probabilmente provengono dallo stesso utente, " dice Dagli. Il sistema poi cerca somiglianze nella rete di un utente, che è la cerchia di persone con cui l'utente interagisce, e gli argomenti trattati dalla rete dell'utente.

    Il profilo, contenuto, e le funzionalità di rete vengono quindi fuse per fornire un singolo output:un punteggio di probabilità che due personaggi di due forum rappresentino la stessa persona nella vita reale.

    I ricercatori hanno testato questi algoritmi di collegamento delle persone sia con dati open source di Twitter e Instagram sia con dati di verità sul terreno etichettati a mano dai forum del dark web. Tutti i dati utilizzati in questo lavoro sono ottenuti attraverso mezzi autorizzati. I risultati sono promettenti. "Ogni volta che segnaliamo una partita, abbiamo ragione il 95% delle volte. Il sistema è uno dei migliori sistemi di collegamento che possiamo trovare in letteratura, "dice Dagli.

    Questo lavoro è lo sviluppo più recente nella ricerca in corso. Dal 2014 al 2017, Il Lincoln Laboratory ha contribuito al programma Memex della Defense Advanced Research Projects Agency (DARPA). Memex ha prodotto una suite di software per l'analisi dei dati di superficie e dark web sviluppata in collaborazione con dozzine di università, laboratori nazionali, e aziende. Dieci tecnologie di laboratorio che abbracciano testi, discorso, e l'analisi visiva creata per Memex è stata rilasciata come software open source tramite il DARPA Open Catalog.

    Oggi, più di 30 agenzie in tutto il mondo utilizzano il software Memex per condurre indagini. Uno dei più grandi utenti, e uno stakeholder nello sviluppo di Memex, è l'Unità di risposta alla tratta di esseri umani (HTRU) nell'ufficio del procuratore distrettuale di Manhattan.

    Il procuratore distrettuale di Manhattan Cyrus Vance Jr. ha dichiarato in una testimonianza scritta alla Camera dei rappresentanti degli Stati Uniti che il suo ufficio ha utilizzato strumenti Memex per esaminare più di 6 000 arresti per segni di tratta di esseri umani solo nel 2017. "Abbiamo utilizzato Memex anche in 271 indagini sulla tratta di esseri umani e in sei nuove incriminazioni per traffico sessuale presentate nel 2017, " ha affermato. Con l'introduzione di Memex, gli arresti per prostituzione esaminati da HTRU per gli indicatori di traffico di esseri umani sono aumentati dal 5 al 62%, e le indagini sugli arresti per prostituzione del Dipartimento di Polizia di New York sono aumentate da 15 a 300 all'anno.

    Jennifer Dolle, il vice capo di HTRU, ha visitato il laboratorio per presentare come l'unità ha beneficiato di queste tecnologie. "Utilizziamo questi strumenti ogni singolo giorno. Hanno davvero cambiato il modo in cui operiamo nel nostro ufficio, "Dolla dice, spiegando che prima di Memex, un'indagine sulla tratta di esseri umani potrebbe richiedere tempi notevolmente più lunghi.

    Ora, Gli strumenti Memex consentono a HTRU di migliorare rapidamente i casi emergenti e di costruire indagini sul traffico sessuale da lead che hanno poche informazioni. Per esempio, questi strumenti, incluso uno chiamato TellFinder (creato dal collaboratore di Memex Uncharted Software) per l'indicizzazione, riassumendo, e la ricerca di dati sugli annunci sessuali, sono stati utilizzati per identificare ulteriori, vittime minorenni dai dati in un unico annuncio di prostituzione online. "Questi ulteriori indizi investigativi consentono all'HTRU di perseguire i trafficanti con l'accusa di crimini violenti e ritenere questi imputati responsabili della vera natura dei crimini che commettono contro vittime vulnerabili, "dice Dolle.

    I ricercatori stanno continuando a imparare come le tecnologie emergenti possono essere adattate alle esigenze delle agenzie e al modo in cui opera il dark web. "L'apprendimento automatico basato sui dati è diventato uno strumento dimostrabilmente importante per le forze dell'ordine per combattere i mercati online illeciti sul dark web, "dice Lin Li, un investigatore principale di questo lavoro continuo nel programma Human Dynamic Dark Networks del laboratorio, che è finanziato attraverso l'Ufficio Tecnologico del laboratorio. "Ma, alcune delle sfide e delle aree di ricerca in corso includono l'ampliamento della nostra comprensione dell'economia della domanda, perturbare l'economia dell'offerta, e acquisire una migliore consapevolezza generale della situazione."

    Una migliore comprensione di come funzionano le catene di domanda e offerta dell'economia del dark web aiuterà il team a sviluppare tecnologie per interrompere queste catene. Parte dell'obiettivo è aumentare i rischi derivanti dalla partecipazione a questa economia illecita; collegare i personaggi del dark web a quelli del web di superficie è una tattica potenzialmente potente.

    "Questa economia illecita in rapida crescita è stata mostrata dalla DARPA per finanziare attività terroristiche e mostrata da HTRU come un motore della schiavitù moderna. Sconfiggere il terrorismo ed eliminare la schiavitù sono esigenze nazionali e umanitarie, "dice Joseph Campbell, leader del Gruppo Tecnologie e Sistemi di Intelligenza Artificiale. "Il nostro gruppo ha una straordinaria esperienza nell'IA, apprendimento automatico, e l'analisi delle reti umane basate su informazioni estratte dal discorso multilingue, testo, e video combinati con comunicazioni e attività di rete. Le tecnologie all'avanguardia che creiamo, sviluppare, e anticipo vengono trasferiti ai nostri sponsor, che li usano quotidianamente con un enorme impatto per questi bisogni nazionali e umanitari".

    Questa storia è stata ripubblicata per gentile concessione di MIT News (web.mit.edu/newsoffice/), un popolare sito che copre notizie sulla ricerca del MIT, innovazione e didattica.




    © Scienza https://it.scienceaq.com