This document summarizes the agenda and goals of a research group meeting on improving the quality of peer-to-peer (P2P) systems. The agenda includes welcome addresses from various deans and professors, presentations on P2P applications and quality in P2P systems. The goals of the research group are introduced, including identifying quality attributes of P2P systems, examining relationships between attributes, and prototyping mechanisms using reference scenarios in disaster recovery communications and software development. Researchers are assigned topics related to performance, costs, security, and other quality attributes.
2. Verbesserung der Qualität von Peer-to-Peer-Systemen (QuaP2P) Improving the Quality of P2P-Systems 31. Oktober 2006 Eröffnung der DFG Forschergruppe Prof. Dr.rer.nat. Max Mühlhäuser Prof. Dr.rer.nat. Andy Schürr Prof. Dr.-Ing. Ralf Steinmetz (Sprecher) Prof. Alejandro Buchmann, Ph.D. Prof. Dr.rer.nat. Claudia Eckert Dr.-Ing. Oliver Heckmann Prof. Dr. Jussi Kangasharju
3.
4.
5. Participating Research Groups / Chairs Alejandro Buchmann Jussi Kangasharju Oliver Heckmann Ralf Steinmetz Claudia Eckert Andy Schürr Max Mühlhäuser Content Management Software Engineering IT Security Ubiquitous Computing Communication Networks Quality of Service Databases & Middleware QuaP2P QuaP2P
6.
7.
8.
9.
10.
11.
12. Quality Attributes Costs Security Quality of P2P Systems Retrievability Coherence Consistency Correctness Performance Scalability Flexibility Stability Dependability Service Provisioning Overlay Operations Individual Node Complete System IP Infrastructure Availability Reliability Robustness/ Fault tolerance Integrity Confidentiality Authentication Non-repudiation Trust Validity Efficiency Adaptability [Heckmann et.al. 2006 a]
13. Reference Scenario A: Disaster Recovery [Steinmetz et.al. 2006] Haben Sie oder der Herr?? Ein besseres Bild dazu oder soll dies bleiben? NL: Ich versuche bis Montag ein besseres zu bekommen.
17. Scenario B: Globally Distributed Software Development „ nomadic" developers (team work on site) Abbreviations: RM = Resource Management CM = Content Management DB = Database [Steinmetz et.al. 2006] RM-System Trace-DB Modeling tool CM-System Programming environment Developers in Intranet Project Leader RM-System Trace-DB Modeling tool CM-System Programming environment Developers in Intranet Subcontractors CM-System Programming environment „ nomadic" developers Open-Source Projects Bugtracker Feature-tracker Sourceforge … „ nomadic" developers … …
18.
19. Joint Activities Goals (finished + in progress) Joint publications Joint events (@fairs, seminar, lab work, colloquium, …) Joint theses (BSc, MSc, diploma,…) Joint prototypes (simulation, scenarios, open source) Pubs: Events: Thesis: Prof. C.Eckert, SEC M.Benz 2+1 1 MM / Bradler 2 1 5+3 1 OH / Graffi Pubs: Events: Thesis: Pubs: Events: Thesis: Pubs: Events: Thesis: Pubs: Events: Thesis: Pubs: Events: Thesis: Pubs: Events: Thesis: RSt / Kovacevic 2+1 1 2 1 2 1 2 1 AS / Mukherjee 2 2 2 1 2 2 AB / Leng JK / Schröder 2 1 3 1 2 1 +1 2 1 2 1 2+1 1 Prof. J. Kangasharju, UP2P J.Schröder-Bernhardi 2 1 Prof. A.Schürr, ES P.Mukherjee 2 2 Prof. A.Buchmann, DVS C.Leng 3 1 Dr. O.Heckmann, KOM K.Graffi 2 1 Prof. M.Mühlhäuser, TK D.Bradler 3 1 Prof. R.Steinmetz, KOM A.Kovacevic CE / Benz
20. Allocation of the Research Topics Alejandro Buchmann Jussi Kangasharju Oliver Heckmann Ralf Steinmetz Claudia Eckert Andy Schürr Max Mühlhäuser Content Management Software Engineering IT Security Ubiquitous Computing Communication Networks Quality of Service Databases & Middleware Flexibility Scalability Stability Performance Costs Efficiency Adaptability Validity Trust Correctness Consistency Coherence Retrievability Integrity Confidentiality Authentication Non-Repudiation Availability Reliability Robustness
21.
22. DFG Financed Researchers Efficiency Performance Costs Kalman Graffi Adaptability Scalability Stability Adaptability Flexibility Catastrophe scenario Dirk Bradler IT Security Integrity Confidentiality Authentication Non-Repudiation Michael Benz Dependability Availability Reliability Robustness Validity Correctness Software development scenario Patrick Mukherjee Validity Consistency Coherence Retrievability Julian Schröder-Bernhardi Efficiency Adaptability Validity Trust Aleksandra Kovacivic Christof Leng
23. DFG Financed Researchers Efficiency Performance Costs Kalman Graffi Adaptability Scalability Stability IT Security Integrity Confidentiality Authentication Non-Repudiation Michael Benz Dependability Availability Reliability Robustness Validity Correctness Software development scenario Patrick Mukherjee Validity Consistency Coherence Retrievability Julian Schröder-Bernhardi Efficiency Adaptability Validity Trust Aleksandra Kovacivic Christof Leng Dipl.-Wirtsch.-Inform. Dirk Bradler Studied Management Information Systems at TUD 2000 – 2006 Since 2006 at Telecooperation ( Prof. Mühlhäuser ) Thesis: „ Deploying and Managing Distributed Services in a Peer-to-Peer Network”, in cooperation with SAP Labs, Palo Alto, CA Adaptability Flexibility Catastrophe scenario Dirk Bradler
24. Rescue Communication System 1/2 “… all area communications seemed simultaneously Overwhelmed.” – After-Action Report on the Reponse to the September 11 Terrorist Attack on the Pentagon “ In the first few hours, foot messengers at times proved to be the most reliable means of communicating.” - After-Action Report on the Reponse to the September 11 Terrorist Attack on the Pentagon “ Improve communications between the operating branches and sections.”- Findings from San Simeon Earthquake December 22, 2003 After catastrophes communication is very limited or not possible at all.
25. Rescue Communication System 2/2 “ It's expensive to serve, but it's easy to use P2P to share.” - Greg Bildson, COO of LimeWire P2P systems can improve communication after catastrophes. “ We believe P2P networks […] do indeed represent the next distribution channel for digital media.” - Michael Weiss, CEO StreamCast “ These networks scale indefinitely without increasing search time and without the need for costly centralized resources.” - Skype
26. Flexibility in P2P Systems Context awareness eases configuration and deployment of P2P based applications. Context Definition: Information that is relevant for the interaction with the application and that can be used as additional information to enhance the interaction with the user
27. Selection of Concrete Tasks Implement context processing in P2P simulator Evaluate different P2P topologies
28. DFG Financed Researchers Efficiency Performance Costs Kalman Graffi Adaptability Scalability Stability Adaptability Flexibility Catastrophe scenario Dirk Bradler IT Security Integrity Confidentiality Authentication Non-Repudiation Michael Benz Dependability Availability Reliability Robustness Validity Consistency Coherence Retrievability Julian Schröder-Bernhardi Efficiency Adaptability Validity Trust Aleksandra Kovacivic Christof Leng Dipl.-Inform. Patrick Mukherjee Studied Computer Science at TU Berlin, 1997 – 2004. Accenture 2005 – 2006 Since 2006 at Real-Time Systems Lab ( Prof. Schürr ) Thesis: „Constraint-basierte Simulation von Eisenbahnfahrten: Hierarchische Problemzerlegung und –lösung“ (Adaptive distribution of simulation problems) Validity Correctness Software development scenario Patrick Mukherjee
29.
30.
31.
32.
33. DFG Financed Researchers Efficiency Performance Costs Kalman Graffi Adaptability Scalability Stability Adaptability Flexibility Catastrophe scenario Dirk Bradler IT Security Integrity Confidentiality Authentication Non-Repudiation Michael Benz Validity Correctness Software development scenario Patrick Mukherjee Validity Consistency Coherence Retrievability Efficiency Adaptability Validity Trust Aleksandra Kovacivic Christof Leng Julian Schröder-Bernhardi Dipl.-Inform. Julian Schröder-Bernhardi Studied Computer Science at TUD 2000 – 2006. Since 2006 at Ubiquitous Peer-to-Peer Infrastructures Group ( Prof. Kangasharju ) Diploma Thesis: "Analysis of communication and traffic in P2P-network with focus on web caches", in cooperation with T-Systemts Dependability Availability Reliability Robustness
34.
35.
36.
37. Current focus Investigation of the interdependencies between dependability and the other quality criteria. Providing a language for the evaluation of the service quality.
38. DFG Financed Researchers Efficiency Performance Costs Kalman Graffi Adaptability Scalability Stability Adaptability Flexibility Catastrophe scenario Dirk Bradler Dependability Availability Reliability Robustness Validity Correctness Software development scenario Patrick Mukherjee Validity Consistency Coherence Retrievability Julian Schröder-Bernhardi Efficiency Adaptability Validity Trust Aleksandra Kovacivic Christof Leng Dipl.-Inform. Michael Benz Studied Computer Science at TUD, 2000 – 2005 Since 2006 at IT-Security Group ( Prof. Eckert ) Thesis: "Cluster based rendering with distributed frame buffers" IT Security Integrity Confidentiality Authentication Non-Repudiation Michael Benz
39.
40.
41.
42.
43.
44. DFG Financed Researchers Efficiency Performance Costs Kalman Graffi Adaptability Flexibility Catastrophe scenario Dirk Bradler IT Security Integrity Confidentiality Authentication Non-Repudiation Michael Benz Dependability Availability Reliability Robustness Validity Correctness Software development scenario Patrick Mukherjee Validity Consistency Coherence Retrievability Julian Schröder-Bernhardi Efficiency Adaptability Validity Trust Christof Leng Dipl.-Ing. Aleksandra Kovacevic Studied Computer Engineering and Computer Science at University of Belgrade, Serbia 1999 – 2004 Since 2005 at Multimedia Communications Lab ( Prof. Steinmetz ) Thesis: “Digital Sealed File System (DSFS) – The System for Data Modification Detection Adaptability Scalability Stability Aleksandra Kovacivic
49. DFG Financed Researchers Adaptability Scalability Stability Adaptability Flexibility Catastrophe scenario Dirk Bradler IT Security Integrity Confidentiality Authentication Non-Repudiation Michael Benz Dependability Availability Reliability Robustness Validity Correctness Software development scenario Patrick Mukherjee Validity Consistency Coherence Retrievability Julian Schröder-Bernhardi Efficiency Adaptability Validity Trust Aleksandra Kovacivic Christof Leng Dipl.-Inform. Kalman Graffi Studied Computer Science & Mathematics at TUD, 2002 – 2006, with distinction Since 2006 at Multimedia Communications Lab ( Prof. Steinmetz ) Thesis: "A Security Framework for Organic Mesh Networks" Efficiency Performance Costs Kalman Graffi
50.
51.
52. DFG Financed Researchers Efficiency Performance Costs Kalman Graffi Adaptability Scalability Stability Adaptability Flexibility Catastrophe scenario Dirk Bradler IT Security Integrity Confidentiality Authentication Non-Repudiation Michael Benz Dependability Availability Reliability Robustness Validity Correctness Software development scenario Patrick Mukherjee Julian Schröder-Bernhardi Efficiency Adaptability Validity Trust Aleksandra Kovacivic Dipl.-Inform. Christof Leng Studied Computer Science at TUD, 1996 – 2004, with distinction Since 2005 at Databases and Distributed Systems Group ( Prof. A. Buchmann ) Thesis: "Design and Implementation of a Trust Protocol for Peer-to-Peer Networks" Validity Consistency Coherence Retrievability Christof Leng
53.
54.
55.
56.
57. Allocation of the Research Topics Alejandro Buchmann Jussi Kangasharju Oliver Heckmann Ralf Steinmetz Claudia Eckert Andy Schürr Max Mühlhäuser Content Management Software Engineering IT Security Ubiquitous Computing Communication Networks Quality of Service Databases & Middleware Flexibility Scalability Stability Performance Costs Efficiency Adaptability Validity Trust Correctness Consistency Coherence Retrievability Integrity Confidentiality Authentication Non-Repudiation Availability Reliability Robustness
62. Mitarbeiter Skalierbarkeit & Stabilität Aleksandra Kovacevic FG Multimedia Kommunikation Sicherheit Michael Benz FG Sicherheit in der Informationstechnik Verlässlichkeit Julian Schröder-Bernhardi FG Ubiquitäre Peer-to-Peer Infrastrukturen Konsistenz & Korrektheit Patrick Mukherjee FG Echtzeitsysteme Kohärenz & Lokalisierbarkeit Christof Leng FG Datenbanken und Verteilte Systeme Effizienz Kalman Graffi FG Multimedia Kommunikation Flexibilität Dirk Bradler FG Telekooperation
63. Aufteilung der Forschungsthemen Alejandro Buchmann Jussi Kangasharju Oliver Heckmann Ralf Steinmetz Claudia Eckert Andy Schürr Max Mühlhäuser Content Management Software Engineering IT Sicherheit Ubiquitous Computing Kommunikationsnetze Dienstgüte Datenbanken & Middleware Flexibilität Skalierbarkeit Stabilität Leistungsfähigkeit Aufwand Effizienz Adaptivität Validität Vertrauens-würdigkeit Korrektheit Konsistenz Kohärenz Lokalisierbarkeit Integrität Vertraulichkeit Authentizität Verbindlichkeit Verfügbarkeit Zuverlässigkeit Robustheit
64. DFG finanzierte Forschende Effizienz Leistungsfähigkeit Aufwand Kalman Graffi Adaptivität Skalierbarkeit Stabilität Adaptivität Flexibilität Katastrophenszenario Dirk Bradler IT Sicherheit Integrität Vertraulichkeit Authentizität Verbindlichkeit Michael Benz Verlässlichkeit Verfügbarkeit Zuverlässigkeit Robustheit Validität Korrektheit Software- entwicklungs- szenario Patrick Mukherjee Effizienz Adaptivität Validität Vertrauens-würdigkeit Julian Schröder-Bernhardi Aleksandra Kovacivic Validität Konsistenz Kohärenz Lokalisierbarkeit Christof Leng
65.
66.
67.
68.
69.
70.
Hinweis der Redaktion
Relevanz für P2P Flexibilität Lokalität ist einer der wichtigsten Faktoren bei der Bearbeitung des Szenarios Ort der Helfer, Sanitätsstationen, etc. Skalierbarkeit & Stabilität Kein strukturiertes Netz vorhanden Provisorische Infrastruktur vorhanden Unbekannte, sich ändernde Netzwerktopologie während das neue Netz aufgebaut wird Verschiedene Organisationen beteiligt Große, schnell ansteigende Anzahl an heterogenen Knoten Effizienz Knappe Ressourcen Verkehrs- und Diensttypen müssen priorisiert werden Lokalisierbarkeit Finden aller verfügbaren Ressourcen/Meldungen/Dienste Robustheit/Fehlertoleranz Die essentiellen Informationen dürfen nicht verändert oder verloren gehen
2 TR + KolloquWS05/06 + AMCIS06 + in Planung 2 Pubs Sandra & kalman, + in Planung die gemeinsamen Meilensteine BitZipper (JK + AB), Studienstiftungsseminar (AB + OH), WSN Seminar (CE + AB + RST)
geographische Verteilung von komplex strukturierten Entwicklungsdaten mit Metadaten (Modelle, Quelldateien, Tabellen, … ) Gewährleistung der Lokalisierbarkeit, Verfügbarkeit • paralleler lesender und schreibender Zugriff auf versionierte Entwicklungsdaten Gewährleistung der Kohärenz, Konsistenz • vielfältige Abhängigkeiten zwischen Entwicklungsdaten (Traceability- Links) Gewährleistung der Korrektheit • Entwickler müssen jederzeit auf alle Versionen aller (benötigten) Entwicklungsdaten zugreifen können Gewährleistung der Zuverlässigkeit, Robustheit • Entwicklungsprozesse und –organisationen legen Zugriffsrechte für sicherheitskritische Datenbestände (im Sinne von Safety und Security) fest Gewährleistung der Integrität, Vertraulichkeit, Authentizität
Availability is the ability to deliver a service / information within a given time. Higher availability is normaly achieved by replication. How many replicas do we need? Is a file availably, if you can download it at 2.3 kB/s? Is the service still there, if node X leaves? Can we provide better availability without increasing the number of replicas? Where to store the replicas?
Reliability is the ability to deliver a service / information as specified. Availability is necessary for reliability. In P2P reliability needs to be guaranteed for some service In a rescue scenario important messages need to get delivered (“Where is the surgeon that is on duty?“) In other cases reliability is to expansive, e.g. for video-streaming (re-transmission costs bandwidth + time…)
Robustness is the ability of a system to maintain function even with changes in internal structure or external environment. How many nodes may leave, without bringing the network down. Fault-tolerance is the property that enables a system to continue operating properly in the event of the failure of some of its components. How many „bad nodes“ can be part of the network, without bringing the network down.
Wenn wir über Effizienz reden, stellt sich zuallererst die Frage: Was eigentlich ist Effizienz? Effizienz ist definiert als die erbrachte Leistung im Verhältnis zu dem Aufwand, der benötigt wurde, um die Leistung zu erfüllen. Wenn wir nun die Effizienz verbessern/erhöhen wollen, haben wir 2 Möglichkeiten: Zum einen können wir versuchen für den selben Arbeitsaufwand noch mehr Leistung zu erbringen. Das schaffen wir indem wir bestehende Resourcen intelligenter nutzen. Zum anderen haben wir aber auch die Möglichkeit, eine Leistung / eine Funktionalität mit weniger Aufwand als bisher zu verwirklichen. Was heißt das aber genau auf Peer-to-Peer Netze bezogen? Wie können wir also höhere Effizienz erreichen? Als Informatiker kennen wir die Lösung: * Peerflaschen einblenden * -> haha Wie die Grafik ausführlich veranschaulicht: Wir betrachten die Bottlenecks im System, die Engpässe die dazu führen, dass die Resourcen nicht optimal genutzt werden können. Peers unterscheiden sich in ihrer Rechenkraft, ihrem verfügbaren Speicher, ihrer Verfügbarkeit, und weiteren Faktoren die berücksichtigt werden müssen. Zusätzlich betrachten wir die Heterogenität der Verbindungen und der Nachrichtentypen. Schwache Geräte sollen nur den Anteil leisten den sie können, kommt es dennoch zu Engpässen, so muss der Zugriff auf die Ressource bestmöglich verwaltet werden. Dazu betrachten wir ein Beispiel.
Wir haben ein unstrukturiertes P2P Netz gegeben. Ein Rechner tätigt für sein Subnetz, das an ihm angeschlossen ist, mehrere Anfragen über eine Verbindung mit relative wenig Bandbreite. Kommt nun ein weiterer Nutzer hinzu, der diese Verbindung ebenfalls nutzen möchte, aber dessen Anfrage an das Netzwerk weitaus wichtiger ist, da es z.B. ein Notruf ist. So werden seine Messages zwar bis zum Engpass gut weitergeleitet, doch ohne gesonderte Strategie für den Umgang mit Engpässen werden die Messages nach ihrer Eingangsreihenfolge abgearbeitet. Dabei verzögern die vielen unwichtigen Anfragen des blauen Servers, die wichtige Anfrage von dem Nutzer. Bis die Nachricht vom Nutzer an der Reihe ist, ist wertvolle Zeit vergangen. Geschieht das in jedem Schritt, so ist die Qualität mit der die Anfrage bearbeitet wird, für viele Anwendungen nicht mehr ausreichend. Als Lösung bietet sich an, Scheduling Mechanismen einzusetzen, um wichtigere Nachrichten höher priorisiert zu bearbeiten. Dadurch erreicht man, dass zeitkritische Anwendungen ebenso zufriedenstellend bearbeitet werden wie Durchsatzfokusierte. In diesem Fall haben wir bei gleichem Aufwand, das heißt bei gleicher Anzahl an Nachrichten die pro Zeiteinheit bearbeitet werden, eine höherwertige Leistung erbracht. Durch Forschung über die Effizienz von Peer-to-Peer Systemen können wir zum einen die Leistung erhöhen und dadurch mehr Nutzer für P2P begeistern aber auch die Kosten senken und damit mehr Geräten die Teilnahme an P2P Netzen ermöglichen. Ich danke fürs zuhören und hoffe das spannende Thema der Effizienz etwas zugänglicher gemacht zu haben.
Blickwinkel Leistungsfähigkeit Leistungsfähigkeit der Diensterbringung Leistungsfähigkeit der Overlay-Operationen Blickwinkel Aufwand Aufwand eines individuellen Knotens Aufwand des gesamten P2P-Systems Aufwand aus Sicht der unterstützenden IP Infrastruktur