4. Web, WWW, “panza de paianjen mondiala”
Serviciu Internet
WWW Internet
Dr. Sabin Buragawww.purl.org/net/busaco
world wide web
5. Idee (Sir Tim Berners-Lee la CERN – 1989)
integrarea unor sisteme informaționale
disparate într-un mod unitar,
fără diferențe între sursele de date
Dr. Sabin Buragawww.purl.org/net/busaco
world wide web
6. Idee (Sir Tim Berners-Lee la CERN – 1989)
integrarea unor sisteme informaționale
disparate într-un mod unitar,
fără diferențe între sursele de date
Dr. Sabin Buragawww.purl.org/net/busaco
world wide web
7. Idee (Sir Tim Berners-Lee la CERN – 1989)
integrarea unor sisteme informaționale
disparate într-un mod unitar,
fără diferențe între sursele de date
Dr. Sabin Buragawww.purl.org/net/busaco
world wide web
8. Idee (Sir Tim Berners-Lee la CERN – 1989)
integrarea unor sisteme informaționale
disparate într-un mod unitar,
fără diferențe între sursele de date
anything can link to anything
Dr. Sabin Buragawww.purl.org/net/busaco
world wide web
9. “a common information space in which
we communicate by sharing information”
Sir Tim Berners-Lee (2013)
“Information Management: A Proposal”
www.w3.org/History/1989/proposal.html
Dr. Sabin Buragawww.purl.org/net/busaco
world wide web
10. Bazat pe modelul client/server
client
Web
(browser)
cerere
raspuns
server
Web
Dr. Sabin Buragawww.purl.org/net/busaco
world wide web
11. …si pe hipertext (hipermedia)
Dr. Sabin Buragawww.purl.org/net/busaco
12. Scopuri principale:
independenta de dispozitiv
independenta de software
scalabilitatea
ubicuitatea
Dr. Sabin Buragawww.purl.org/net/busaco
world wide web
13. Scopuri principale:
independenta de dispozitiv
independenta de software
scalabilitatea
ubicuitatea
caracter deschisopen standards
Dr. Sabin Buragawww.purl.org/net/busaco
world wide web
15. Resursele sunt identificate prin adresa lor
identificator uniform de resurse
URI – Uniform Resource Identifier
http://slideshare.net/busaco/presentations
Dr. Sabin Buragawww.purl.org/net/busaco
arhitectura Web-ului
16. Accesul la conţinutul – reprezentarea –
resurselor Web
se realizează printr-un protocol
HTTP – HyperText Transfer Protocol
Dr. Sabin Buragawww.purl.org/net/busaco
arhitectura Web-ului
17. adrese Web
URI = URL + URN
codificarea
datelor
Unicode
protocoale Web
HTTP, HTTPS, SPDY
nume de
domenii
DNS
protocoalele
Internet
TCP/IP
Dr. Sabin Buragawww.purl.org/net/busaco
arhitectura Web-ului
18. resursele – documentele – includ <marcaje />
Dr. Sabin Buragawww.purl.org/net/busaco
pagini Web
21. adresabilitate via URI
http://world.info/europe/romania/iasi/#weather?today
identifica
informatii
meteo
despre Iasi
resursa Web
reprezinta
reprezentare
<weather>
<point lat=… long=…>
<name lang= "ro">
Iasi
</name>
<type>city</type>
…
</point>
<temperature when=…>
<value>…</value>
</temperature>
</weather>
reprezentarea – intr-un format deschis (e.g., HTML, XML,
JSON, RDF,…) – include date propriu-zise + meta-date
Dr. Sabin Buragawww.purl.org/net/busaco
Relatiile dintre o resursa Web, adresa ei (URI) si
reprezentarea structurata a resursei
24. sistem pe care rulează un server Web
găzduind o serie de pagini (resurse) înrudite
ale unei organizaţii, companii sau persoane
Dr. Sabin Buragawww.purl.org/net/busaco
Sit Web
25. colecţie interconectată de pagini Web
cu conţinut generat dinamic, menită a oferi
utilizatorilor o funcţionalitate specifică
Dr. Sabin Buragawww.purl.org/net/busaco
Aplicaţie Web
26. interacţiunea dintre aplicaţie şi utilizatori
are loc via o interfaţă Web
Dr. Sabin Buragawww.purl.org/net/busaco
Aplicaţie Web
27. interacţiunea dintre aplicaţie şi utilizatori
are loc via o interfaţă Web
uzual, sit Web = aplicaţie Web
Dr. Sabin Buragawww.purl.org/net/busaco
Aplicaţie Web
28. exemple:
Amazon, Coursera, Dropbox, Expedia, Flickr,
info.uaic.ro, PHPMyAdmin, Reddit, Quora,
SlideShare, Twitter, Vimeo, webmin, WordPress
…și multe, multe altele
Dr. Sabin Buragawww.purl.org/net/busaco
Aplicaţie Web
31. Dr. Sabin Buragawww.purl.org/net/busaco
Aplicaţie Web = Interfaţă + Conţinut (Date) + Program
mitul 1: cea mai importantă este interfaţa
mitul 2: cel mai important este programul
mitul 3: cele mai importante sunt datele
HTML, CSS, Ajax, Flash, Silverlight, SVG, WebGL,…
32. Dr. Sabin Buragawww.purl.org/net/busaco
Aplicaţie Web = Interfaţă + Conţinut (Date) + Program
mitul 1: cea mai importantă este interfaţa
mitul 2: cel mai important este programul
mitul 3: cele mai importante sunt datele
server: C#, Java, JavaScript, PHP, Ruby,…; client: JavaScript
33. Dr. Sabin Buragawww.purl.org/net/busaco
Aplicaţie Web = Interfaţă + Conţinut (Date) + Program
mitul 1: cea mai importantă este interfaţa
mitul 2: cel mai important este programul
mitul 3: cele mai importante sunt datele
relationale (SQL), XML, grafuri, modelare semantica (RDF)
34. Dr. Sabin Buragawww.purl.org/net/busaco
Aplicaţie Web = Interfaţă + Conţinut (Date) + Program
mitul 1: cea mai importantă este interfaţa
mitul 2: cel mai important este programul
mitul 3: cele mai importante sunt datele
fapt: sunt importante toate!
36. WWW platforma în care utilizatorul
îşi controlează propriile date
aşa-numitul Web 2.0, conform Tim O’Reilly, 2005
Dr. Sabin Buragawww.purl.org/net/busaco
Web-ul prezent
38. Partajare de artefacte informationale
documente, fotografii, multimedia, cod-sursă etc.
Dr. Sabin Buragawww.purl.org/net/busaco
Web-ul social: Caracteristici
39. Inteligenţa colectivă
editare & management colaborativ al conţinutului
aplicaţii de tip wiki
Dr. Sabin Buragawww.purl.org/net/busaco
Web-ul social: Caracteristici
40. Servicii şi nu pachete software
aplicaţiile masive („mamut”) sunt substituite
de cele constituite din servicii specifice,
disponibile pe Web, uşor de înlocuit
SaaS – Software as a Service
Dr. Sabin Buragawww.purl.org/net/busaco
Web-ul social: Caracteristici
41. Software rulat oriunde
ubicuitatea aplicaţiilor Web
bookmark-uri salvate local (pentru fiecare browser)
vs. bookmark-uri disponibile pe Web, uşor de accesat
şi de partajat cu alţii
Dr. Sabin Buragawww.purl.org/net/busaco
Web-ul social: Caracteristici
42. Mediatizare (syndication) Web
date privitoare la un sit Web sunt expuse liber
via un flux (feed)
în format RSS (Really Simple Syndication)
sau Atom
XML
Dr. Sabin Buragawww.purl.org/net/busaco
Web-ul social: Caracteristici
43. Podcasting = pod (iPod) + broadcast
flux audio/video automat expediat utilizatorului
pentru a fi redat de un player multimedia – e.g., iTunes
accesibil oricând via un podcast feed
Dr. Sabin Buragawww.purl.org/net/busaco
Web-ul social: Caracteristici
44. Transformare/refolosire a datelor
datele sunt – sau ar trebui sa fie – disponibile
în formate deschise, universale, facil de procesat
Dr. Sabin Buragawww.purl.org/net/busaco
Web-ul social: Caracteristici
45. Transformare/refolosire a datelor
datele sunt – sau ar trebui sa fie – disponibile
în formate deschise, universale, facil de procesat
vezi succesul JSON (JavaScript Object Notation)
Dr. Sabin Buragawww.purl.org/net/busaco
Web-ul social: Caracteristici
47. Interactiune bogata cu utilizatorul
RIA – Rich Internet Applications
aplicarea modalitatilor de interactiune traditionala
(la nivel de desktop) in contextul aplicatiilor Web
Dr. Sabin Buragawww.purl.org/net/busaco
Web-ul social: Caracteristici
48. Interactiune bogata cu utilizatorul
RIA – Rich Internet Applications
avantajele Web-ului (ubicuitate, date distribuite
via hipertext, posibilitati de cautare etc.) +
interactiune sofisticata + utilizabilitate
Dr. Sabin Buragawww.purl.org/net/busaco
Web-ul social: Caracteristici
49. Interactiune bogata cu utilizatorul
RIA – Rich Internet Applications
avantajele Web-ului (ubicuitate, date distribuite
via hipertext, posibilitati de cautare etc.) +
interactiune sofisticata + utilizabilitate
suita de tehnologii HTML5
(inclusiv la nivelul dispozitivelor mobile)
Dr. Sabin Buragawww.purl.org/net/busaco
Web-ul social: Caracteristici
50. Valori de bază
deschidere, transparenţă, respect
Dr. Sabin Buragawww.purl.org/net/busaco
Web-ul social: Caracteristici
51. Valori de bază
deschidere, transparenţă, respect
iniţiativa Creative Commons
reasonable, flexible copyright
Dr. Sabin Buragawww.purl.org/net/busaco
Web-ul social: Caracteristici
53. Valori de bază
partajarea pe Web a datelor deschise (open data)
Dr. Sabin Buragawww.purl.org/net/busaco
Web-ul social: Caracteristici
54. Valori de bază
partajarea pe Web a datelor deschise (open data)
exemplificari:
Data Hub – thedatahub.org
Open Data Commons – opendatacommons.org
Wikimedia Commons – commons.wikimedia.org
Dr. Sabin Buragawww.purl.org/net/busaco
Web-ul social: Caracteristici
56. Constituirea unor “pânze” (web-uri) – grupări,
rețele – de informații disponibile liber, evoluând
conform intereselor unei comunităţi
(e.g., utilizatori, organizație, industrie,…)
Dr. Sabin Buragawww.purl.org/net/busaco
remarci
59. o manieră de a atașa meta-date
date privitoare la date
„mai mult decât datele”
Dr. Sabin Buragawww.purl.org/net/busaco
necesităţi
60. o manieră de a ataşa meta-date
vocabulare de termeni descriind „ceva”
(proprietăți, domenii, persoane, lumi,...)
Dr. Sabin Buragawww.purl.org/net/busaco
necesităţi
61. un mod de specificare de relații între resurse
structuri de organizare a datelor
în cadrul unui sau mai multor web-uri
Dr. Sabin Buragawww.purl.org/net/busaco
necesităţi
62. modelarea & procesarea cunoștințelor
despre „lucruri” (knowledge about things)
Dr. Sabin Buragawww.purl.org/net/busaco
necesităţi
Mike Bergman, The Rationale for Semantic Technologies (2012)
http://www.mkbergman.com/1015/the-rationale-for-semantic-technologies/
67. „Java este un limbaj de programare.”
„XWiki este o aplicație Web scrisă în limbajul Java.”
„Programarea Java poate fi mai ușoară decât cea în C++.”
Dr. Sabin Buragawww.purl.org/net/busaco
necesităţi
68. „Java este un limbaj de programare.”
„XWiki este o aplicație Web scrisă în limbajul Java.”
„Programarea Java poate fi mai ușoară decât cea în C++.”
ușor de înțeles de
(unii) oameni
Dr. Sabin Buragawww.purl.org/net/busaco
necesităţi
69. „Java este un limbaj de programare.”
„XWiki este o aplicație Web scrisă în limbajul Java.”
„Programarea Java poate fi mai ușoară decât cea în C++.”
ușor de înțeles de
(unii) oameni
… dar pot fi oare înțelese de către calculatoare?
Dr. Sabin Buragawww.purl.org/net/busaco
necesităţi
70. RDF (Resource Description Framework)
folosit la asocierea de meta-date resurselor Web
și la specificarea relațiilor dintre resurse
Dr. Sabin Buragawww.purl.org/net/busaco
rdf
71. Dr. Sabin Buragawww.purl.org/net/busaco
engleză
Titlu: Remember That Night
Artist: David Gilmour
Anul apariției: 2007
Format: Blu-ray
Audio: Dolby True-HD
Video: VC-1 (1080i)
Tip: concert
Subtitrare: N/A
Detalii: www.davidgilmour.com
http://www.blu-ray.com/movies/David-Gilmour-Remember-That-Night-Blu-ray/493/
73. Interogarea datelor RDF
se poate realiza via limbajul SPARQL
Dr. Sabin Buragawww.purl.org/net/busaco
rdf
74. Interogarea datelor RDF
se poate realiza via limbajul SPARQL
serviciile SPARQL pot fi descrise și invocate
via tehnologiile serviciilor Web clasice – e.g., REST
exemple:
http://dbpedia.org/sparql/
http://graph.facebook.com/
Dr. Sabin Buragawww.purl.org/net/busaco
rdf
75. vocabulare de meta-date privind resursele
set standardizat de meta-date asociate documentelor
DCMI (Dublin Core Metadata Initiative)
documente multimedia partajabile
Adobe XMP (Extensible Metadata Platform)
Dr. Sabin Buragawww.purl.org/net/busaco
rdf: utilizări
77. relații între resurse
rețele sociale
FOAF (Friend Of A Friend)
proiecte software
DOAP (Description Of A Project)
comunități online
SIOC (Semantically Interconnected Online Communities)
Dr. Sabin Buragawww.purl.org/net/busaco
rdf: utilizări
78. modelarea cunoștințelor
în termeni „înțeleși” de software
RDF Schema
SKOS (Simple Knowledge Organizational System)
OWL (Web Ontology Language)
Dr. Sabin Buragawww.purl.org/net/busaco
rdf: utilizări
81. Inițiativă privind publicarea și reutilizarea
datelor structurate disponibile liber pe Web
interconectare a resurselor descrise la nivel de Web
http://linkeddata.org/
Dr. Sabin Buragawww.purl.org/net/busaco
linked data
82. Inițiativă privind publicarea și reutilizarea
datelor structurate disponibile liber pe Web
inclusiv folosind formatul de date JSON – JSON-LD
http://json-ld.org/
Dr. Sabin Buragawww.purl.org/net/busaco
linked data
86. Dr. Sabin Buragawww.purl.org/net/busaco
augmentarea cautarii resurselor Web pe baza
microformatelor, schemelor de microdate HTML5 si RDFa
studiu de caz: Google Knowledge Graph
http://www.google.com/insidesearch/features/search/knowledge.html
87. Dr. Sabin Buragawww.purl.org/net/busaco
definirea unui graf social privind persoanele & relatiile acestora cu
diverse resurse de interes (fotografii, produse, locatii geografice,…)
Facebook Open Graph – developers.facebook.com/docs/opengraph/
89. PREFIX rdf:
<http://www.w3.org/1999/02/22-rdf-syntax-ns#>
SELECT DISTINCT *
WHERE {
<http://dbpedia.org/resource/Linus_Torvalds>
rdf:type ?val
}
LIMIT 20
interogari asupra DBpedia
(varianta procesabila de catre masina a enciclopediei Wikipedia)
http://dbpedia.org/isparql/
Dr. Sabin Buragawww.purl.org/net/busaco
Cine este Linus Torvalds?
90. diverse URI-uri
desemnand concepte
(definite in cadrul
unor web-uri)
interogari asupra DBpedia
(varianta procesabila de catre masina a enciclopediei Wikipedia)
http://dbpedia.org/isparql/
Dr. Sabin Buragawww.purl.org/net/busaco
Cine este Linus Torvalds?
93. constituirea unui Web of Data
„Web 3.0”?
„semantic
Web”?
Dr. Sabin Buragawww.purl.org/net/busaco
“concluzii”
94. constituirea unui Web of Data
acces pe baza protocolului HTTP
Dr. Sabin Buragawww.purl.org/net/busaco
“concluzii”
95. constituirea unui Web of Data
descriere de resurse și a relațiilor dintre ele via RDF
Dr. Sabin Buragawww.purl.org/net/busaco
“concluzii”
96. constituirea unui Web of Data
datele pot fi „mixate” pe baza vocabularelor multiple
Dr. Sabin Buragawww.purl.org/net/busaco
“concluzii”
97. constituirea unui Web of Data
datele pot fi „mixate” pe baza vocabularelor multiple
numeroase vocabulare sunt deja standardizate
inclusiv in vederea regasirii de resurse Web via motoare
de cautare – e.g., microdate HTML5: schema.org
Dr. Sabin Buragawww.purl.org/net/busaco
“concluzii”
98. constituirea unui Web of Data
structurarea avansată via modele conceptuale:
taxonomii, tezaure, ontologii – folosind OWL et al.
Dr. Sabin Buragawww.purl.org/net/busaco
“concluzii”
99. constituirea unui Web of Data
structurarea avansată via modele conceptuale:
taxonomii, tezaure, ontologii – folosind OWL et al.
managementul cunostintelor (knowledge management)
+
inginerie ontologica (ontology engineering)
Dr. Sabin Buragawww.purl.org/net/busaco
“concluzii”
100. Web attitude (Tim Berners-Lee)
Anyone can say anything about anything
Dr. Sabin Buragawww.purl.org/net/busaco
Punct de vedere
101. Web attitude (Tim Berners-Lee)
No one knows everything about anything
Dr. Sabin Buragawww.purl.org/net/busaco
Punct de vedere
102. Web attitude (Tim Berners-Lee)
My system is most valuable
because of its interconnection to its peers
Dr. Sabin Buragawww.purl.org/net/busaco
Punct de vedere