Un esempio di tweet che ha ispirato lo studio di ricerca. Credito:Zhang et al.
attacchi DDoS (Distributed Denial of Service), che sono progettati per impedire agli utenti legittimi di accedere a specifici sistemi di rete, sono diventati sempre più comuni negli ultimi dieci anni o giù di lì. Questi attacchi rendono servizi come Facebook, Reddit e siti di online banking estremamente lenti o impossibili da utilizzare esaurendo le risorse di rete o del server (ad es. larghezza di banda, CPU e memoria).
I ricercatori di tutto il mondo hanno cercato di sviluppare tecniche per prevenire attacchi DDoS o intervenire rapidamente per ridurne gli effetti negativi. Un passo importante per contrastare tali attacchi è la pronta raccolta di feedback dagli utenti per determinarne l'impatto e trovare soluzioni mirate.
Con questo in testa, un team di ricercatori dell'Università del Maryland ha sviluppato un modello di apprendimento automatico che potrebbe aiutare a determinare la portata dell'impatto degli attacchi DoS mentre si verificano sulla base dei tweet pubblicati dagli utenti. Il loro studio, recentemente pre-pubblicato su arXiv, è stato finanziato da un UMBC-USNA Cyber Innovation Grant.
"La ricerca si è basata sull'osservazione che quando ci sono difficoltà nell'accesso ai servizi di rete, i clienti a volte condividono tali informazioni sui social network, "Dottor Tim Oates, uno dei ricercatori che ha condotto lo studio, ha detto a TechXplore. "Il nostro obiettivo principale era sviluppare un sistema che tenesse traccia degli attacchi di negazione del servizio (DoS) di rete analizzando i loro effetti a catena attraverso i post sui social media".
Iniziare con, Il Dr. Oates e i suoi colleghi hanno raccolto una serie di tweet sugli attacchi DoS basati su una cronologia storica degli attacchi avvenuti in passato. Guardando questi tweet, in cui gli utenti hanno descritto i problemi riscontrati durante un attacco, i ricercatori sono stati in grado di identificare "modelli linguistici" (cioè, parole chiave pertinenti). Hanno quindi addestrato un classificatore dell'albero decisionale per rilevare gli attacchi DDoS in base a queste parole chiave.
"Abbiamo ipotizzato che i clienti interessati utilizzino un linguaggio simile sui social media per descrivere i problemi durante un attacco DDoS come il sistema o il prodotto che è lento o che esegue la scansione, "Chi Zhang, un altro ricercatore coinvolto nello studio ha detto a TechXplore. "Così, quando vengono raccolti nuovi tweet (storicamente o in tempo reale), il modello prima scopre gli argomenti (un insieme di parole chiave che definiscono in senso lato un'area di discussione) dei tweet raccolti in quella finestra temporale."
Successivamente, il classificatore sviluppato dal Dr. Oates, Zhang e i loro colleghi classificano i tweet in base a quanto le parole chiave differivano dai modelli linguistici osservati nei post degli utenti durante gli attacchi DDoS passati. Finalmente, il modello utilizza il numero di tweet relativi a DDos rilevati per calcolare la scala di impatto di un attacco.
Quando i ricercatori hanno valutato il loro modello, hanno scoperto che ha ottenuto risultati simili agli approcci all'avanguardia supervisionati per determinare la portata degli attacchi DDoS. Un grande vantaggio del loro classificatore, però, è che è debolmente controllato, quindi richiede pochissima etichettatura umana dei dati di addestramento.
"Siamo stati in grado di sviluppare un modello debolmente supervisionato per il rilevamento di nuovi eventi che funziona quasi quanto i modelli supervisionati, " ha detto Zhang. "La sua natura debolmente controllata significa che è necessaria solo una piccola quantità di dati etichettati umani, quindi risparmia molte risorse in termini di lavoro umano, poiché chiedere alle persone di annotare potenzialmente migliaia di Tweet è in genere piuttosto costoso."
Nel futuro, il loro modello debolmente supervisionato potrebbe aiutare a determinare la portata degli attacchi DDoS in modo rapido ed efficace, esclusivamente sulla base dei dati di Twitter. Potrebbe anche essere adattato e applicato ad altre attività che potrebbero trarre vantaggio dall'analisi dei tweet degli utenti in tempo reale.
Nei loro studi successivi, i ricercatori hanno in programma di sviluppare ulteriormente il loro modello per analizzare i tweet scritti in altre lingue. Infine, vorrebbero anche cambiare il suo livello di classificazione per testare le sue prestazioni nel determinare la scala di impatto di altri tipi di eventi, come focolai di malattie (ad es. Ebola).
"Ci siamo resi conto che le persone hanno molti modi per descrivere i problemi su Twitter, "Ashwinkumar Ganesan, un altro ricercatore che ha condotto lo studio, ha detto a TechXplore. "Quindi, è necessario creare una cache più ampia di tweet e modelli migliori che gestiscano questa variazione del linguaggio. Inoltre, gli attacchi non sono limitati a obiettivi nel mondo di lingua inglese, quindi anche progettare il sistema in modo che possa essere scalato ad altre lingue è molto importante."
© 2019 Scienza X Rete