Identificare feature significative per l’analisi nell’informatica forense uti...Antonio Notarangelo
Ähnlich wie Presentazione_compressione_di_insiemi_di_espressioni_regolari_tramite_programmazione_genetica_in_sistemi_di_rilevazione_delle_intrusioni (9)
1. Università degli Studi di TriesteUniversità degli Studi di Trieste
Dipartimento di Ingegneria e ArchitetturaDipartimento di Ingegneria e Architettura
Corso di Laurea Magistrale in Ingegneria InformaticaCorso di Laurea Magistrale in Ingegneria Informatica
Compressione di insiemi di espressioniCompressione di insiemi di espressioni
regolari tramite programmazioneregolari tramite programmazione
genetica in sistemi di rilevazione dellegenetica in sistemi di rilevazione delle
intrusioniintrusioni
Tesi di Laurea in Reti di Calcolatori II
Laureando
Simone Cumar
Relatore
Alberto Bartoli
Correlatore
Eric Medvet
11. ObiettiviObiettivi
➢
Ridurre la lunghezza delle Regex
“all regular expressions are NOT created equal”
➢
Ridurre il numero di Regex
➢
Il tutto riconoscendo le stesse stringhe
12. ““Riconoscendo le stesseRiconoscendo le stesse
stringhe...”stringhe...”
➢
RE riconosce s RE estrae una sottostringa non↔
vuota di s
➢
Regex: a*(b|c)
➢
Estrazione: daaabde
•
a*beee
•
a*ceee
•
a*deee
•
a*(b|c|d)eee
13. Confrontare Insiemi diConfrontare Insiemi di
Espressioni RegolariEspressioni Regolari
➢
Con la definizione precedente:
stringhe riconosciute da una RE infinite→
➢
Confronto su insiemi finiti di stringhe
➢
Classificare stringhe
➢
Da riconoscere – Esempi Positivi
➢
Da NON riconoscere – Esempi Negativi
15. Genetic ProgrammingGenetic Programming
➢
Paradigma di calcolo evoluzionistico per
l'ottimizzazione multi-obiettivo
➢
Le basi
➢
Individui
➢
Fitness
➢
Generazioni
➢
Operatori genetici – Crossover e Mutation
16. GP nel Nostro CasoGP nel Nostro Caso
➢
Individui
➢
Ogni individuo è un'espressione regolare
➢
Fitness
➢
Lunghezza
➢
Distanza di edit tra la stringa estratta e quella che si
desidera estrarre
➢
Popolazione Iniziale
➢
Mix Regex da ridurre e casuali
30. Fase SperimentaleFase Sperimentale
➢
Evoluzione
➢
7 insiemi di espressioni regolari da Snort – Ruleset
➢
4 evoluzioni per insieme
➢
Tempi esecuzione – da 4/5h fino a qualche giorno
➢
Testing
➢
Verifica su insieme di esempi differente
31. RisultatiRisultati
RulesetRuleset # RE prima# RE prima # RE dopo# RE dopo RatioRatio
chat.rules.pcre 14 8 0.57
policy.rules.pcre 10 4 0.4
pop3.rules.pcre 16 2 0.13
web-php.rules.pcre 16 2 0.13
ftp.rules.pcre 35 5 0.14
spyware-put.rules.pcre 460 67 0.15
web-activex.rules.pcre 474 1 < 0.01
Diminuzione media di circa l'80% sul numero
di espressioni regolari
32. Risultati (2)Risultati (2)
Ruleset Σ lunghezze prima Σ lunghezze dopo Ratio
chat.rules.pcre 307 82 0.27
policy.rules.pcre 260 134 0.52
pop3.rules.pcre 265 42 0.16
web-php.rules.pcre 400 127 0.32
ftp.rules.pcre 645 66 0.10
spyware-put.rules.pcre 16277 2421 0.15
web-activex.rules.pcre 59742 24 < 0.01
Diminuzione media di circa l'80% sulla
lunghezza aggregata delle RE