1. Piano di didattica alternativa per la laurea magistrale
Un approfondimento in informatica: Semantic Web
Costanza Romano
03 Febbraio 2016
Costanza Romano Piano di didattica alternativa per la laurea magistrale 03 Febbraio 2016 1 / 29
2. Alunni ISICT e Formazione
Cos’è ISICT?
"..un istituto di eccellenza che affianca i corsi di studio in ICT
dell’Università di Genova per integrare la formazione universitaria
con una didattica che è il risultato della stretta collaborazione
tra università, aziende ed enti, preparando i giovani
all’inserimento nel mondo del lavoro"
Costanza Romano Piano di didattica alternativa per la laurea magistrale 03 Febbraio 2016 2 / 29
3. Didattica ISICT
Formazione manageriale
Il contesto industriale della
liguria
Gestione dell’Innovazione
Riservatezza, Proprietà
Intellettuale, Brevetti
Progettare l’Organizzazione
. . .
Approfondimenti tecnici
Business Intelligence and
Analytics
Bioinformatica
Robotica
Elaborazione quantistica
dell’informazione
. . .
Costanza Romano Piano di didattica alternativa per la laurea magistrale 03 Febbraio 2016 3 / 29
4. Potenzialità dell’ingegnere informatico
Apprendimento da dati
Ottimizzazione e statistica per l’apprendimento da dati
Semantic Web
Tutorials, NETTAB 2013
SWAT4LS 2013
Bioinformatica
Bioinformatica e Proteomica
Infrastrutture di rete
Ericsson Bootcamp
Costanza Romano Piano di didattica alternativa per la laurea magistrale 03 Febbraio 2016 4 / 29
5. Percorso di didattica alternativa
Costanza Romano Piano di didattica alternativa per la laurea magistrale 03 Febbraio 2016 5 / 29
6. Indice
Attività eseguite
1 Ottimizzazione e statistica per l’apprendimento da dati
2 Tutorials, NETTAB 2013
3 SWAT4LS 2013
4 Bioinformatica e Proteomica
5 Ericsson Bootcamp
Costanza Romano Piano di didattica alternativa per la laurea magistrale 03 Febbraio 2016 6 / 29
7. Ottimizzazione e statistica per l’apprendimento da dati
Erogato dall’Università degli Studi di Genova
Novembre - Dicembre 2013
Argomenti trattati
Richiami di probabilità e statistica
Modelli di apprendimento da dati
Numero di ore 15
Numero di ore con coeff. moltiplicativo 2,5 37,5
Costanza Romano Piano di didattica alternativa per la laurea magistrale 03 Febbraio 2016 7 / 29
8. Indice
Attività eseguite
1 Ottimizzazione e statistica per l’apprendimento da dati
2 Tutorials, NETTAB 2013
3 SWAT4LS 2013
4 Bioinformatica e Proteomica
5 Ericsson Bootcamp
Costanza Romano Piano di didattica alternativa per la laurea magistrale 03 Febbraio 2016 8 / 29
9. Tutorials, NETTAB 2013
Società italiana di Bioinformatica
16 Ottobre 2013
Interventi
Incentrato su Semantic, Social, and Mobile Applications for
Bioinformatics and Biomedical laboratories
Semantic Web for Life Sciences
OpenPHACTS and NanoPubblications
Standards for Web Application on Mobile
Mobile Application for Life Sciences
Numero di ore 8
Numero di ore con coeff. moltiplicativo 2,5 20
Costanza Romano Piano di didattica alternativa per la laurea magistrale 03 Febbraio 2016 9 / 29
10. Indice
Attività eseguite
1 Ottimizzazione e statistica per l’apprendimento da dati
2 Tutorials, NETTAB 2013
3 SWAT4LS 2013
4 Bioinformatica e Proteomica
5 Ericsson Bootcamp
Costanza Romano Piano di didattica alternativa per la laurea magistrale 03 Febbraio 2016 10 / 29
11. SWAT4LS 2013
Organizzato dal gruppo SWAT4LS
9,11 Dicembre 2013
Tutorials e Hackhaton
Intoduzione al Semantic Web
COEUS Platform: un esempio di Semantic Web Application
RDF Linked Data and identifiers.org at European Bioinformatics
Institute (EBI)
Hackathon: Progettazione di una WebApp semantica per la
generazione di mappe
Numero di ore 16
Numero di ore con coeff. moltiplicativo 2,5 40
Costanza Romano Piano di didattica alternativa per la laurea magistrale 03 Febbraio 2016 11 / 29
12. Indice
Attività eseguite
1 Ottimizzazione e statistica per l’apprendimento da dati
2 Tutorials, NETTAB 2013
3 SWAT4LS 2013
4 Bioinformatica e Proteomica
5 Ericsson Bootcamp
Costanza Romano Piano di didattica alternativa per la laurea magistrale 03 Febbraio 2016 12 / 29
13. Bioinformatica e Proteomica
Organizzato dell’IRCSS San Martino IST
1-2,9-10 Aprile 2014
Interventi
Introduzione alla proteomica
Tecniche di elettroforesi bidimensionale
La spettrometria di massa: MALDI/TOF e LC/MS
Introduzione alla bioinformatica
Strumenti bioinformatici per l’analisi dei dati della spettrometria di massa
Strumenti bioinformatici per l’analisi dei dati di elettroforesi bidimensionale
Reti di interazione proteina-proteina e relativa analisi dei dati
Dalla ricerca di base alla biomaker discovery
Analisi supervisionata dei dati di proteomica
Numero di ore 16
Numero di ore con coeff. moltiplicativo 2,5 40
Costanza Romano Piano di didattica alternativa per la laurea magistrale 03 Febbraio 2016 13 / 29
14. Indice
Attività eseguite
1 Ottimizzazione e statistica per l’apprendimento da dati
2 Tutorials, NETTAB 2013
3 SWAT4LS 2013
4 Bioinformatica e Proteomica
5 Ericsson Bootcamp
Costanza Romano Piano di didattica alternativa per la laurea magistrale 03 Febbraio 2016 14 / 29
15. Ericsson Bootcamp
Organizzato da Ericsson Academy
15-18 Luglio 2014
Tematiche
IP Fundamentals (ISO/OSI, TCP/IP, IPv4, IPv6)
IP Routing
Ethernet
Multi-Protocol Label Switching (MPLS)
Quality of Service (QoS)
Numero di ore 16
Numero di ore con coeff. moltiplicativo 2,5 40
Costanza Romano Piano di didattica alternativa per la laurea magistrale 03 Febbraio 2016 15 / 29
17. Le basi
Una Tripla è formata da tre elementi Soggetto-Predicato-Oggetto
Soggetto e oggetto sono risorse legate da una relazione definita da
Predicato
Ogni elemento di una tripla è definito da una URI univoca, che lo
identifica
Costanza Romano Piano di didattica alternativa per la laurea magistrale 03 Febbraio 2016 17 / 29
18. Le basi
Una Tripla è formata da tre elementi Soggetto-Predicato-Oggetto
Soggetto e oggetto sono risorse legate da una relazione definita da
Predicato
Ogni elemento di una tripla è definito da una URI univoca, che lo
identifica
Costanza Romano Piano di didattica alternativa per la laurea magistrale 03 Febbraio 2016 17 / 29
19. Le basi
Una Tripla è formata da tre elementi Soggetto-Predicato-Oggetto
Soggetto e oggetto sono risorse legate da una relazione definita da
Predicato
Ogni elemento di una tripla è definito da una URI univoca, che lo
identifica
Costanza Romano Piano di didattica alternativa per la laurea magistrale 03 Febbraio 2016 17 / 29
20. Semantic Web
Il Semantic Web è un’estensione del Web tradizionale che si occupa di
dati rappresentati sotto forma di triple
La struttura delle relazioni tra elementi si può rappresentare
attraverso le ontologie, cioè rappresentazioni della conoscenza
relative ad un certo ambito, utilizzate per lo scambio di informazione
tra diversi sistemi
A partire da queste rappresentazioni, gli Smart Agents (applicazioni
semantiche) derivano conoscenza
Costanza Romano Piano di didattica alternativa per la laurea magistrale 03 Febbraio 2016 18 / 29
21. Semantic Web
Il Semantic Web è un’estensione del Web tradizionale che si occupa di
dati rappresentati sotto forma di triple
La struttura delle relazioni tra elementi si può rappresentare
attraverso le ontologie, cioè rappresentazioni della conoscenza
relative ad un certo ambito, utilizzate per lo scambio di informazione
tra diversi sistemi
A partire da queste rappresentazioni, gli Smart Agents (applicazioni
semantiche) derivano conoscenza
Costanza Romano Piano di didattica alternativa per la laurea magistrale 03 Febbraio 2016 18 / 29
22. Semantic Web
Il Semantic Web è un’estensione del Web tradizionale che si occupa di
dati rappresentati sotto forma di triple
La struttura delle relazioni tra elementi si può rappresentare
attraverso le ontologie, cioè rappresentazioni della conoscenza
relative ad un certo ambito, utilizzate per lo scambio di informazione
tra diversi sistemi
A partire da queste rappresentazioni, gli Smart Agents (applicazioni
semantiche) derivano conoscenza
Costanza Romano Piano di didattica alternativa per la laurea magistrale 03 Febbraio 2016 18 / 29
23. Hackhaton
Generazione di una mappa dei campioni biologici a partire dai loro metadati
Dati disponibili: metadati di un insieme di campioni biologici sul sito
EBI (European Bioinformatics Institute).
Obiettivo: ottenere una mappa visualizzabile con l’informazione
ricavata dai metadati.
Costanza Romano Piano di didattica alternativa per la laurea magistrale 03 Febbraio 2016 19 / 29
24. Procedimento
Interrogazione dello SPARQL endpoint di EBI
SPARQL: linguaggio SQL-like, permette di ottenere informazione dai
metadati semantici
SPARQL endpoint: punto di accesso ai dati forniti.
Ottenimento file RDF/XML contenenti le informazioni relative ai
campioni con informazioni geografiche
RDF/XML: estensione di XML in grado di rappresentare i dati
semantici mantenendo la struttura innestata di XML
Trasformazione risultati in KML (tramite XSLT)
KML: estensione di KML; è il formato di riferimento a cui si
appoggiano tool di visualizzazione di mappe come Google Maps
Visualizzazione dei risultati tramite Google Maps
Costanza Romano Piano di didattica alternativa per la laurea magistrale 03 Febbraio 2016 20 / 29
25. EBI SPARQL Endpoint
Costanza Romano Piano di didattica alternativa per la laurea magistrale 03 Febbraio 2016 21 / 29
26. Procedimento
Interrogazione dello SPARQL endpoint di EBI
SPARQL: linguaggio SQL-like, permette di ottenere informazione dai
metadati semantici
SPARQL endpoint: punto di accesso ai dati forniti.
Ottenimento file XML contenenti le informazioni relative ai campioni
con informazioni geografiche
Trasformazione risultati in KML (tramite XSLT)
KML: estensione di KML; è il formato di riferimento a cui si
appoggiano tool di visualizzazione di mappe come Google Maps
Visualizzazione dei risultati tramite Google Maps
Costanza Romano Piano di didattica alternativa per la laurea magistrale 03 Febbraio 2016 22 / 29
27. Struttra dei dati
<sparql>
<head>
<variable name="item"/>
<variable name="latVal"/>
<variable name="longVal"/>
<variable name="label"/>
<variable name="desc"/>
</head>
<results>
<result>
<binding name="item">
<uri> http://rdf.ebi.ac.uk/resource/biosamples/sample/SAMEA1904954 </uri>
</binding>
<binding name="latVal">
<literal datatype="http://www.w3.org/2001/XMLSchema#double">-489679.0</literal>
</binding>
<binding name="longVal">
<literal datatype="http://www.w3.org/2001/XMLSchema#double">-151843.0</literal>
</binding>
<binding name="label">
<literal datatype="http://www.w3.org/2001/XMLSchema#string">ERS249851</literal>
</binding>
<binding name="desc">
<literal datatype="http://www.w3.org/2001/XMLSchema#string">
16S rRNA tag sequences of day 36 of the iron fertilization experiment LOHAFEX
</literal>
</binding>
</result>
</results>
</sparql>
Costanza Romano Piano di didattica alternativa per la laurea magistrale 03 Febbraio 2016 23 / 29
28. Procedimento
Interrogazione dello SPARQL endpoint di EBI
SPARQL: linguaggio SQL-like, permette di ottenere informazione dai
metadati semantici
SPARQL endpoint: punto di accesso ai dati forniti.
Ottenimento file XML contenenti le informazioni relative ai campioni
con informazioni geografiche
Trasformazione risultati in KML (tramite XSLT)
KML: estensione di KML; è il formato di riferimento a cui si
appoggiano tool di visualizzazione di mappe come Google Maps
Visualizzazione dei risultati tramite Google Maps
Costanza Romano Piano di didattica alternativa per la laurea magistrale 03 Febbraio 2016 24 / 29
29. Trasformazione
<xsl:stylesheet xmlns:xsl="http://www.w3.org/1999/XSL/Transform" version="1.0">
<xsl:template match="/">
<kml xmlns="http://www.opengis.net/kml/2.2">
<Document>
<xsl:for-each select="sparql/results/result">
<Placemark>
<name>
<xsl:value-of select="binding[@name=’label’]/literal"/>
<xsl:value-of select="binding/uri"/>
</name>
<description>
<xsl:value-of select="binding[@name=’desc’]/literal"/>
</description>
<Point>
<coordinates>
<xsl:value-of select="binding[@name=’longVal’]/literal"/>
,
<xsl:value-of select="binding[@name=’latVal’]/literal"/>
</coordinates>
</Point>
</Placemark>
</xsl:for-each>
</Document>
</kml>
</xsl:template>
</xsl:stylesheet>
Costanza Romano Piano di didattica alternativa per la laurea magistrale 03 Febbraio 2016 25 / 29
30. Formato di Output
<?xml version="1.0" encoding="UTF-8"?>
<kml xmlns="http://www.opengis.net/kml/2.2">
<Document>
<Placemark>
<name>ERS249851 http://rdf.ebi.ac.uk/resource/biosamples/sample/SAMEA1904954</name>
<description>16S rRNA tag sequences of day 36 of the iron fertilization experiment LOHAFEX</descrip
<Point>
<coordinates>-151843.0,-489679.0</coordinates>
</Point>
</Placemark>
</Document>
</kml>
Costanza Romano Piano di didattica alternativa per la laurea magistrale 03 Febbraio 2016 26 / 29
31. Tesi di laurea magistrale
Insider Threat: Discovery of Internal Threats Through Behaviour-based
Models
Costanza Romano Piano di didattica alternativa per la laurea magistrale 03 Febbraio 2016 27 / 29
32. Tesi di laurea magistrale
Svolta presso ThinkingSafe Ltd, Egham, Surrey, UK
Rilevamento di potenziali dipendenti a rischio tramite indicatori
comportamentali
1 Stress
2 Aggressività
3 Isolamento
Basata su rilevamento nel testo delle email di indicatori linguistici
derivati
Modifica dell’algoritmo di detection proprietario di ThinkingSafe per
l’applicazione sui testi in italiano
Possibilità ottenuta grazie al contributo ISICT per la tesi all’estero
Costanza Romano Piano di didattica alternativa per la laurea magistrale 03 Febbraio 2016 28 / 29