1 Peer-to-Peer Technologischer Überblick - KOM

Transcrição

1 Peer-to-Peer Technologischer Überblick - KOM
Peer-to-Peer
Technologischer Überblick
Dr.-Ing. Nicolas C. Liebau, KOM, TU Darmstadt
Dr.-Ing. Nicolas C. Liebau
[email protected]
Tel.+49 6151 165240
KOM - Multimedia Communications Lab
Prof. Dr.-Ing. Ralf Steinmetz (Director)
Dept. of Electrical Engineering and Information Technology
Dept. of Computer Science (adjunct Professor)
TUD – Technische Universität Darmstadt
Merckstr. 25, D-64283 Darmstadt, Germany
Tel.+49 6151 166150, Fax. +49 6151 166152
www.KOM.tu-darmstadt.de
18.02.2009
© author(s) of these slides 2008 including research results of the research network KOM and TU Darmstadt otherwise as specified at the respective slide
Observations
Content Owners
ƒ Distribution of digital content over the Internet
ƒ Media industry fighting it since 1999
ƒ February 2001 – Napster has 50 million reg. User
2.79 billion music-downloads
ƒ February 2006 – Episode of TV-series “Lost”
downloaded 500.000 times via BitTorrent-network
ƒ P2P Traffic in the Internet
ƒ 60% – 80% P2P file sharing traffic on backbones
Internet Protocol Breakdown 1993 - 2006
KOM – Multimedia Communications Lab
Source: CacheLogic Research
2
1
Bekannte Anwendungsgebiete
Dateitauschbörsen (Filesharing)
ƒ eMule, KaZaA, BitTorrent, DC++, …
Kommerzielle Verteilung digitaler Medien
ƒ Download, Video on Demand (VoD) Streaming,
Live Streaming
ƒ Mercora (Audio), In2movies, Octoshape, Zattoo, ….
VoIP
ƒ Skype
Persistente Datenhaltung
ƒ OceanStore
KOM – Multimedia Communications Lab
3
KOM – Multimedia Communications Lab
4
Inhalt
Definition
Overlay-Netzwerke
ƒ Gnutella
ƒ Chord
ƒ Kademlia
ƒ Globase.KOM
Verteilung digitaler Medien
ƒ Swarming mit BitTorrent
ƒ Network Coding
ƒ Life Streaming
ƒ VoD Streaming
Forschungsthemen und industrielles Umfeld
2
Peer-to-Peer Technologie
Definition & Overlay-Netzwerke
Dr.-Ing. Nicolas C. Liebau
[email protected]
Tel.+49 6151 165240
KOM - Multimedia Communications Lab
Prof. Dr.-Ing. Ralf Steinmetz (Director)
Dept. of Electrical Engineering and Information Technology
Dept. of Computer Science (adjunct Professor)
TUD – Technische Universität Darmstadt
Merckstr. 25, D-64283 Darmstadt, Germany
Tel.+49 6151 166150, Fax. +49 6151 166152
www.KOM.tu-darmstadt.de
18.02.2009
© author(s) of these slides 2008 including research results of the research network KOM and TU Darmstadt otherwise as specified at the respective slide
P2P - Definition
Charakteristika
ƒ Peers bilden ein Overlay-Netzwerk
ƒ Peers bieten und konsumieren Dienste und Ressourcen
ƒ Peers besitzen signifikante Autonomie
ƒ Es ist ein selbstorganisierendes System
ƒ Dienste können zwischen allen teilnehmenden Peers ausgetauscht werden
ƒ Keine zentrale Kontrolle & keine Nutzung zentraler Dienste
Ebenfalls wichtig
ƒ Peers sind heterogen
ƒ Zuverlässige, dauerhafte Verbindungen der Peers können nicht vorausgesetzt
werden
ƒ Z.B. Unterstützung Einwahl-Nutzern mit variablen IP-Adressen
ƒ Z.B. hinter Firewall
ƒ P2P-Systeme operieren außerhalb des DNS-Systems
KOM – Multimedia Communications Lab
6
3
Overlay Netzwerk Schicht
Dienst B
Dienst A
Dienst C
Peers
identifiziert
Peers
identified
by PeerID
durch PeerID
Overlay Netzwerk
TCP/IP
TCP/IP
Network
Relay Network
HTTP
Firewall + NAT
TCP/IP
TCP/IP
Network
Network
TCP
TCP/IP
TCP/IP
Network
Network
UnderlayNetzwerk
Picture adapted from Traversat, et.al Project JXTA virtual network
KOM – Multimedia Communications Lab
7
Übersicht P2P-Overlays
Unstrukturierte P2P-Overlays
Strukturierte P2P
Zentrales P2P
Reines P2P
Hybrides P2P
DHT-basiert
1. Besitzt alle Eigenschaften von P2P
2. Zentrale Stelle
notwendig um Dienste
zu leisten
3. Zentrale Stelle ist Art
Index/GruppenDatenbank
1.
1. Besitzt alle Eigenschaften von P2P
2. Jeder Knoten kann
entfernt werden ohne
Funktions-verlust
3. Æ dynamisch zentrale
Stellen
1.
Beispiel: Napster
2.
3.
Besitzt alle Eigenschaften von P2P
Jeder Knoten kann
entfernt werden ohne
Funktions-verlust
Æ keine zentrale
Stelle
Beispiele:
Gnutella 0.4, Freenet
1. Generation
Beispiele:
Gnutella 0.6, Fasttrack,
eDonkey
2. Generation
Besitzt alle Eigenschaften von P2P
2.
Any terminal entity
can be removed
without loss of
functionality
3.
Æ keine zentrale
Stelle
4.
Verbindungen im
Overlay sind “fest”
Beispiele: Chord, CAN
3. Generation
KOM – Multimedia Communications Lab
nach R.Schollmeier and J.Eberspächer, TU München
8
4
Gnutella v0.4
Ein Netzwerk zum Suchen und Entdecken
Gedacht für Mensch und nicht Maschine
Total dezentral Æ Nicht wirklich zu stoppen
Freie Interpretation der Anfrage
ƒ Suchanfrage wird unverändert weitergeleitet
ƒ Antworten können verschiedenste Form haben
ƒ Dateinamen
ƒ Werbenachrichten
ƒ URLs
“Anonymes“ Suchen
KOM – Multimedia Communications Lab
9
Gnutella Protokoll [1]
Gnutella Deskriptoren regeln Kommunikation
Deskriptoren
ƒ Ping :
ƒ Pong :
ƒ Query :
Netz aktiv erforschen
Antwort auf Ping
Eigentliche Suchanfrage
(TTL limitiert Reichweite)
ƒ Query hit :
Positivantwort auf Suchanfrage
ƒ Push Request : Initiiert das Senden (Firewall)
Reichweite
ƒ Bei TTL 7 erreichen die Suchanfragen ca. 10 000 Hosts
KOM – Multimedia Communications Lab 10
5
Gnutella 0.6
Hybrides P2P Overlay Netzwerk
Gnutella 0.6 ist ein typisches P2P System der 2. Generation
von R.Schollmeier and J.Eberspächer, TU München
KOM – Multimedia Communications Lab 13
Chord
Benutzt SHA-1 zum Abbilden von IP-Adressen/Objektname
auf 160 Bit ID
ƒ Grundlegende Ring Topologie mod 2n
709
ƒ Successor/
660-709
Predecessor
Link zum Ring-Successor
2011
1009-1622
2207
1623-2011
2012-2207
2682
Circular Key Space
659
612-659
Erweiterte Topologie
1622
1008
710-1008
611
3486-4095
0-611
2208-2682
2906
3485
2683-2906
2907-3485
ƒ K-ter Finger zu Peer n ist Abkürzung, die auf den Peer zeigt verantwortlich für
Objekt ID (n + 2k)
ƒ O(log(N)) Finger führen zu lookup-Operation mit O(log(N))
Finger zeigen auf Peers mit
ObjektIDs, exponentiell
ansteigend. Hier: 709 + 2k
= …, 965, 1221, 1733, 2757
709
660-709
1622
1008
2011
1009-1622
710-1008
1623-2011
2207
2012-2207
2682
2208-2682
659
612-659
611
3486-4095
0-611
3485
2907-3485
2906
2683-2906
KOM – Multimedia Communications Lab 14
6
Chord: Inhaltsadressierung
Lookup
ƒ Enthält Hash-Wert des gesuchten Inhalts
ƒ In jedem Schritt wird die Distanz zum Ziel halbiert
Finger werden benutzt um
Ziel schneller zu finden.
Ohne Finger: Keine
Abkürzung, im Kreis laufen
Konten 1008 sucht
Element 3000
1622
1008
709
1009-1622
710-1008
2011
2207
1623-2011
660-709
2012-2207
1
2682
3
659
612-659
611
3486-…
0-611
Verantwortlich
für 1008 + 1024
3485
2
2208-2682
2906
2683-2906
2907-3485
Verantwortlich
für 2207 + 512
Verantwortlich
für 3000
Verantwortliches
Peer gefunden
KOM – Multimedia Communications Lab 15
Kademlia: Systembeschreibung
Knoten sind Blätter in einem binären Baum
ƒ Position wird durch kürzesten eindeutigen
Prefix der Node ID bestimmt
Für jeden Knoten (z.B. Knoten „001“)
ƒ Teile den Binären Baum in eine Serie aufeinander-folgender niedrigerer
Unterbäume die diesen Knoten nicht enthalten
ƒ Mindestens ein Kontaktknoten benötigt zu jedem Unterbaum
ƒ Große Unterbäume bieten viele Alternativen für Nachbarn
Bucket 0:
distance [20, 21)
Bucket 1:
distance [21, 22)
...
Bucket n:
distance [2n, 2n+1)
KOM – Multimedia Communications Lab 17
7
Kademlia: Lookup-Operation
Jeder Hop leitet das Queries an alle kleineren Unterbäume um das
Ziel herum weiter
Beispiele: Knoten „001“ routet nach “101”
ƒ Knoten „001“ benötig einen Kontakt im
1-(*) Unterbaum (z.B. „110“)
ƒ Knoten „110“benötig einen Kontakt im 10-(*) Unterbaum (z.B. „100“
ƒ Knoten „100“ leitet das Query zum Ziel „101“
1
3
2
KOM – Multimedia Communications Lab 18
Globase.KOM: Scenario
Čevapčići…
Location-based Search
Suche nach Inhalten
in einem definierten
geographischem
Gebiet
ED
OS
L
C
KOM – Multimedia Communications Lab 21
8
Globase.KOM: Overview
Globase.KOM
(Geographical LOcationBAsed SEarch):
ƒ Welt unterteilt in
nicht überscheidende, rechteckige
Zonen
ƒ Zweischichtiges Overlay:
ƒ Hierarchischer Superpeers- Baum
ƒ Unstrukturiertes P2P-Network für
verbundene Peer
ƒ Fehlerbehebungs- und Such- effizienz
Æ Zwischen-verbindungen:
ƒ Lernen von erhaltenen Nachrichten
*Assumption: peer knows its Galileo/GPS coordinates
KOM – Multimedia Communications Lab 22
Query-Beispiel: Gebietssuche
A
B
B
G
F
E
D
C
J
F
G
H
I
K
J
H
E
K
D
C
I
A
SEARCH QUERY
Schritte zur Durchführung einer Bereichssuche:
ƒ Query beginnt auf Knoten J
ƒ Antworten von Knoten A, B, C, E, und F
KOM – Multimedia Communications Lab 23
9
Zusammenfassung Overlay-Netzwerke
Strukturierte Overlays
ƒ Für Systeme die Primärschlüssel-Abfragen benötigen
ƒ Vollständige Suchergebnisse
ƒ Eventuell nicht 100% aktuell
Unstrukturierte Overlays
ƒ Besser geeignet für komplexere Abfragen
ƒ Aktuelle Ergebnisse
ƒ Eventuell nicht vollständig
Aktuell Forschungsfragen
ƒ Routing-Optimierung
ƒ Netzpartitionierung und -zusammenführung
ƒ Adaption an das Underlay (Lokationsbewußtsein)
ƒ Umgang mit „Churn“
KOM – Multimedia Communications Lab 24
Peer-to-Peer Technologie
Verteilung digitaler Medien –
Schwarm-Effekt & Streaming
Dr.-Ing. Nicolas C. Liebau
[email protected]
Tel.+49 6151 165240
KOM - Multimedia Communications Lab
Prof. Dr.-Ing. Ralf Steinmetz (Director)
Dept. of Electrical Engineering and Information Technology
Dept. of Computer Science (adjunct Professor)
TUD – Technische Universität Darmstadt
Merckstr. 25, D-64283 Darmstadt, Germany
Tel.+49 6151 166150, Fax. +49 6151 166152
www.KOM.tu-darmstadt.de
18.02.2009
© author(s) of these slides 2008 including research results of the research network KOM and TU Darmstadt otherwise as specified at the respective slide
10
Verteilung digitaler Inhalte mit P2P
Quellserver
(Content provider)
Content Provider möchte Ubuntu Linux (1 GB) verteilen
Dateien
ƒ Multimedia Daten:
ƒ Audio (3 MB+)
ƒ Video (650 MB+)
ƒ Software Updates (100 MB+)
ƒ Neue OS Releases (1,5 GB+)
1000+ clients
Ziel des Content Providers: Kosten minimieren
Umgebung: Quellserverbetriebskosten hängen von Ausgangsbbandbreite ab
Einsparung: Nutzen P2P-basiertes Content-Delivery-System
KOM – Multimedia Communications Lab 26
Kooperatives Dateitauschen (wie BitTorrent):
Idealer BitTorrent-Betrieb
von www.wtata.com
BitTorrent zu Beginn
KOM – Multimedia Communications Lab 27
11
BitTorrent: Schnelle Verteilung mit Anreizen
Prozess
1. Große Datei wird in “Chunks” aufgeteilt
4 5
2. Peers, die an der gleichen Datei
interessiert sind, “selbstorganisieren”
sich in einem “torrent”
Torrent of Bits
3. Peers tauschen untereinander “Chunks”
der Datei aus
Anreizmechanismus für Upload
ƒ
tit-for-tat
Bewertung
...
ƒ
ƒ
Leichtgewichtig und effizient
Skaliert gut bei „Flash Crowd“
KOM – Multimedia Communications Lab 28
Wie BitTorrent funktioniert: Publishing
Seed = Quelle
...
foo.torrent
3 4 5
Hier bin ich!
foo.torrent
peer list
Tracker site
announce: tracker URL
for bootstrap
creation date: epoch time
of file creation
length: file size
name: file name
piece length: chunk size
pieces: SHA1 hash key
of each chunk
Web site
Der “Publisher”
ƒ Erstellen Metadatei “foo.torrent”
ƒ Veröffentlichen auf Webseite
ƒ Starten des Trackers
ƒ Starten eines BT-Clients als
initiale Quelle (initial seed)
KOM – Multimedia Communications Lab 29
12
Wie BitTorrent funktioniert: Downloading
seed
...
3 4 5
foo.torrent
peer list
Tracker site
Der Downloader
ƒ Download der Metadatei foo.torrent
ƒ Start eines BT-Clients, verbinden
zum Tracker
ƒ Beziehe Peer-Liste vom Tracker
ƒ Beziehe erstes Chunk von anderen
Peers (seeds)
Web site
peer list
download
I am here!
foo.torrent
KOM – Multimedia Communications Lab 30
Wie BitTorrent funktioniert: Downloading
seed
...
3 4 5
foo.torrent
peer list
Tracker site
foo.torrent
Web site
Der Downloader
ƒ Download der Metadatei foo.torrent
ƒ Start eines BT-Clients, verbinden
zum Tracker
ƒ Beziehe Peer-Liste vom Tracker
ƒ Beziehe erstes Chunk von anderen
Peers (seeds)
ƒ Tausche Chunks der Datei mit
anderen Peers
ƒ Download vollständig: werde eine
neue Quelle (seed)
foo.torrent
KOM – Multimedia Communications Lab 31
13
Wie BitTorrent funktioniert: Downloading
seed
Zukünftige Leistungsfähigkeit
... 3 4 5
Hängt vom Hinzukommen
und
Verlassen von neuen Downloadern
und Quellen ab
foo.torrent
peer list
Tracker site
Web site
foo.torrent
foo.torrent
The downloader
ƒ Download der Metadatei foo.torrent
ƒ Start eines BT-Clients, verbinden
zum Tracker
ƒ Beziehe Peer-Liste vom Tracker
ƒ Beziehe erstes Chunk von anderen
Peers (seeds)
ƒ Tausche Chunks der Datei mit
anderen Peers
ƒ Download vollständig: werde eine
neue Quelle (seed)
ƒ Initiale Quelle verlässt das
Netzwerk
seed
...
3 4 5
KOM – Multimedia Communications Lab 32
Streaming
Traditionelle CDN
ƒ Regionale Datenzentren
Live Streaming
ƒ Verteilen an Datenzentren
ƒ Verteilen an Endknoten
VoD Streaming
ƒ Upload in alle Datenzentren
ƒ Download-Anforderung wird an lokales Datenzentrum geleitet
Nachteile
ƒ Hohe Verkehr
ƒ In Datenzentren
ƒ Hohe operative Kosten
KOM – Multimedia Communications Lab 33
Quelle: Goolge Earth
14
P2P Live Streaming
Kooperation der Endknoten
ƒ Leiten (Teil des) Streams an weitere
Endknoten weiter
ƒ Herausforderung:
Kleine Upload-Bandbreite der Peers
ƒ Server können unterstützen
ƒ Aufbau eines Multicast-StreamingBaums auf Anwendungsebene
ƒ Detailablauf abhängig von verwendetem
Codec
ƒ Standard: H.264
ƒ Chunk basiert
ƒ Z.B. Octoshape, emundoo
ƒ Layered Video Codecs
KOM – Multimedia Communications Lab 34
Quelle: Goolge Earth
P2P Live Streaming
Forschungsfragen
ƒ Aufbau des Streaming-Baums
ƒ Unterstützung heterogener Peers
ƒ Aufbau eines „Meshs“ zur Unterstützung mit „nicht vollständigen“ Streams
ƒ Unterhaltung des Streaming-Baums
ƒ Umgang mit ausfallenden Knoten
ƒ Mesh oder Multibaum besser als einfacher Baum
ƒ Abspielstrategien
ƒ Delay-erhaltend
ƒ Delay bleibt konstant, Paketverluste geduldet
ƒ Qualitäterhaltend
ƒ Keine Paketverluste, Abspiel wird verzögert
ƒ Welche ergibt höhere QoE?
ƒ Anreize zur Kooperation
KOM – Multimedia Communications Lab 35
15
P2P VoD Streaming
Kooperation mit vorangegangenen
Nutzern
ƒ Datei in Teile unterteilt
ƒ Rechtzeitiges herunterladen des
benötigten Dateiteils
ƒ Ähnlich BitTorrent
ƒ Z.B. NextShare, emundoo
ƒ Eventuell Unterstützung durch Server
(Quelle)
KOM – Multimedia Communications Lab 36
Quelle: Goolge Earth
Aktuelle Fragestellungen bei P2P Streaming
Minimieren der Wartezeiten bis zum
Anspielen
ƒ Auch bei Vorspulen, etc.
Minimieren von Caching
Teilgröße
ƒ Abhängig von Verteilung
ƒ Je kleiner, je größerer
Verwaltungsaufwand
ƒ Abhängig von Codierung
ƒ Je kleiner je eher passend zu Key
Frames
Replikationsmechanismus
ƒ Welche Teile, welche Anzahl
ƒ Auf welchen Knoten
ƒ Zusätzlich zur Entlastung der
Quellserver
Anreize zur Kooperation
ƒ Nicht-monetäre Anreizsysteme
Peer-assisted CDNs
ƒ Hybride P2P-Systeme mit Servern für
ƒ Erhöhung der Zuverlässigkeit
ƒ Gerade bei kleinen Schwärmen
ƒ NAT-Durchdringung
KOM – Multimedia Communications Lab 37
16
Peer-to-Peer Technologie
Forschungsthemen und industrielles Umfeld
Dr.-Ing. Nicolas C. Liebau
[email protected]
Tel.+49 6151 165240
KOM - Multimedia Communications Lab
Prof. Dr.-Ing. Ralf Steinmetz (Director)
Dept. of Electrical Engineering and Information Technology
Dept. of Computer Science (adjunct Professor)
TUD – Technische Universität Darmstadt
Merckstr. 25, D-64283 Darmstadt, Germany
Tel.+49 6151 166150, Fax. +49 6151 166152
www.KOM.tu-darmstadt.de
18.02.2009
© author(s) of these slides 2008 including research results of the research network KOM and TU Darmstadt otherwise as specified at the respective slide
Aktuelle Forschungsthemen
Medienverteilungsstrategien
ƒ BitTorrent, etc.
ƒ Anreizmechanismen
ƒ Vertrauen und Reputation
Streaming (VoD oder live)
Overlay-Netzwerke
ƒ Overlay-Konstruktion
ƒ Overlay-Partitionierung und
Fusionierung
ƒ Lokationsbewusste Konstruktion
ƒ Hierarchische Overlay-Netzwerke
ƒ Ingenieursmethodiken
P2P-Information-Retrieval
ƒ Komplexe Suchanfragen in P2PSystemen
ƒ Semantische Overlay-Netzwerke und
semantisches “Query-Routing” in P2PSystemen
Datenmanagement
ƒ Platzierung, Replikation, Deskriptoren,
…
Sicherheit
Dienste und Applikationen
“Mobile Peer-to-Peer”
KOM – Multimedia Communications Lab 39
17
Zukünftige P2P Forschungsthemen
Sicherheit
ƒ Mitgliedschafts- & Zugangskontrolle
Virtuelle P2P-Umgebungen
Selbst-X
ƒ Selbstkonfiguration von Overlays, Mechanismen für Dienste und Anwendungen
ƒ Selbstheilung
ƒ Selbstorganisation
Netzwerkeffizienz von P2P-Systemen
ƒ Aus Blickwinkel eines ISPs Æ Einsparung von Transitverkehr
Kontrolle von P2P-Systemen aus dem Netzwerk
ƒ Kommunikation zwischen Overlay und Underlay um Effizienz zu erhöhen
ƒ Qualitätsgarantien (QoS) für P2P-Dienste
Hybride P2P-Architekturen
P2P- Rahmenwerke (ähnlich GRID ???)
KOM – Multimedia Communications Lab 40
Observations
Music Media Purchasing Trending
Responding [%]
50%
40%
Online
30%
CDs
20%
Both
10%
0%
2000
2002
2004
2006
2008
2010
Year
KOM – Multimedia Communications Lab 41
18
Development of the Telephony Industry
Percentage voice telephony
of total revenues
0
20
40
Observations
60
80
100
China Mobile
Vodafone Group
China Unicom
Telecom Italia
ƒ Telephony service becoming a free
commodity
ƒ Telephony companies will
loose more revenues
ƒ How to pay their employees?
Consequences
ƒ New business models required!
ƒ Coupling telephony with other services
China Telecom
France Telecom
ƒ IP-TV
ƒ Triple Play
Deutsche Telekom
ƒ Merge of traditional telephony
business with
NTT
Cable & Wireless
ƒ broadcasting business
ƒ Media distribution
SBC Communications
BT Group
KOM – Multimedia Communications Lab 42
P2P based Content Distribution Market
TV/Video
Download
Audio
Software
Streaming
Streaming
Download
B2B
G
am
es
Applications/Games/
Publishing
Publishing
C2C
Solution Provider
KOM – Multimedia Communications Lab 43
19
Fragen …
KOM – Multimedia Communications Lab 44
20