Difference between revisions of "FAQ eD2k-Kademlia-de"

From AMule Project FAQ
Jump to: navigation, search
(not much done :()
m (Reordered language selection)
 
(40 intermediate revisions by 21 users not shown)
Line 1: Line 1:
 
<center>
 
<center>
<u><h4>Häufig gestellte Fragen über eD2k&Kademlia</h4></u>
+
[[FAQ_eD2k-Kademlia|English]] |  
 
+
'''Deutsch''' |
[[FAQ_eD2k-Kademlia|English]] | [[FAQ_eD2k-Kademlia-es|Español]] | [[FAQ_eD2k-Kademlia-it|Italiano]] | '''Deutsch'''
+
[[FAQ_eD2k-Kademlia-es|Espa&ntilde;ol]] |  
 +
[[FAQ_ed2k-fr|Fran&ccedil;ais]] |
 +
[[FAQ_eD2k-Kademlia-it|Italiano]] |  
 +
[[FAQ_eD2k-Kademlia-nl|Nederlands]] | [
 +
[[FAQ_eD2k-Kademlia-pl|Polish]] |
 +
[[FAQ_eD2k-Kademlia-ru|Russian]]
 
</center>
 
</center>
  
 
== Was ist ED2K? ==
 
== Was ist ED2K? ==
ED2k ist ein Protokoll, das ursprünglich vom P2P (Perr-to-Peer) Client [[eDonkey2000]] verwendet wurde, der ihm auch seinen Namen gab. Es ist ein Server/Client-Protokoll mit der Möglichkeit, Quellen zwischen den Clients auszutauschen.
 
  
Das ED2k-Netzwerk ist serverbasiert, im Gegensatz zu reinen P2P-Netzwerken wie [[Kazaa]]. Nach dem Start von [[aMule]] ist also das erste, sich mit einem Server zu verbinden (entwedermanuell oder automatisch).
+
ED2k ist ein Protokoll, das urspr&uuml;nglich vom P2P (Peer-to-Peer) Client [[eDonkey2000]] verwendet wurde, der ihm auch seinen Namen gab. Es ist ein Server/Client-Protokoll mit der M&ouml;glichkeit, Quellen zwischen den Clients auszutauschen.
  
Sobald die Verbindung hergestellt wurde, kann der Client eine Suchanfrage an den verbundenen Server stellen oder alle Server global absuchen. Die Antworten enthalten eine Liste aller Dateien, die den gegebenen Suchkriterien entsprechen.
+
Das ED2k-Netzwerk ist serverbasiert, im Gegensatz zu reinen P2P-Netzwerken wie [[Kazaa]]. Nach dem Start von [[aMule-de|aMule]] ist also das erste, sich mit einem Server zu verbinden (entweder manuell oder automatisch).
 +
 
 +
Sobald die Verbindung hergestellt wurde, kann der Client eine Suchanfrage an den verbundenen Server stellen, oder alle Server global absuchen. Die Antworten enthalten eine Liste aller Dateien, die den gegebenen Suchkriterien entsprechen.
  
 
Wird vom Nutzer ein Download initiiert, fragt der Clients den Server nach Quellen, was dieser mit einer Liste von IP Adressen anderer Clients beantwortet, die die gesuchte Datei (oder Teile davon) haben.
 
Wird vom Nutzer ein Download initiiert, fragt der Clients den Server nach Quellen, was dieser mit einer Liste von IP Adressen anderer Clients beantwortet, die die gesuchte Datei (oder Teile davon) haben.
  
  
Sobald der eigene Client an der Spitze der Warteschlange des Gegenübers angekommen ist ([[FAQ_eD2k-Kademlia-de#Was_hat_es_mit_diesem_ganzen_Krempel_(Credits,_Bewertungen,_Warteschlangen_usw.)_auf_sich?|siehe auch "Was hat es mit diesem ganzen Krempel (Credits, Bewertungen, Warteschlangen usw.) auf sich?"]]), beginnt dieser einen Block der Datei heraufzuladen und, wenn der Block vollständig ist, den eigenen Client wieder in die Warteschlange einzureihen. Auf diese Weise werden die verschiedenen Teile im ED2k-Netzwerk verteilt, so dass, auch wenn eventuell niemand zu einem bestimmten Zeitpunkt die vollständige Datei hat, diese dennoch durch Downloads von schiedenen Leuten vollstöndig erhältlich sein kann (leider gibt es eine Menge Leute, die eine Datei nicht weiter freigeben, nachdem sie vollständig heruntergeladen wurde).<br>
+
Sobald der eigene Client an der Spitze der Warteschlange des Gegen&uuml;bers angekommen ist ([[FAQ_eD2k-Kademlia-de#Was_hat_es_mit_diesem_ganzen_Krempel_(Credits,_Bewertungen,_Warteschlangen_usw.)_auf_sich?|siehe auch "Was hat es mit diesem ganzen Krempel (Credits, Bewertungen, Warteschlangen usw.) auf sich?"]]), beginnt dieser einen Chunk der Datei heraufzuladen und, wenn dieser vollständig ist, den eigenen Client wieder in die Warteschlange einzureihen. Auf diese Weise werden die verschiedenen Teile im ED2k-Netzwerk verteilt, so dass, auch wenn eventuell niemand zu einem bestimmten Zeitpunkt die vollständige Datei hat, diese dennoch durch Downloads von verschiedenen Leuten vollständig erhältlich sein kann (leider gibt es eine Menge Leute, die eine Datei nicht weiter freigeben, nachdem sie vollständig heruntergeladen wurde).
Zu berücksichtigen ist, dass Clients immer nur '''einen''' Block zur gleichen Zeit zu einem anderen Client hochladen. Auch wenn der Client für zwei verschiedene Dateien in der Warteschlange steht und an der Spitze ankommt, wird trotzdem nur eine der beiden an ihn hochgeladen werden (die andere, abhängig vom verwendeten ED2k-Client, bleibt eventuell an der Spitze stehen, bis der erste Download abgeschlossen ist, wird aber keinesfalls vorher beginnen).
+
  
Haben beide Clients eine Hohe ID (siehe [[FAQ_eD2k-Kademlia-de#Was_sind_niedrige_und_hohe_IDs?|Was sind niedrige und hohe IDs?]]) läuft der Transfer direkt zwischen den beiden ab (Peer-to-Peer), hat einer aber nur eine niedrige ID, wird die Verbindung mit Hilfe des Servers (des Clients mit der niedrigen ID) aufgebaut, da eine niedrige ID bedeutet, dass der Client keine eingehenden Verbindungen annehmen kann. Daraus ergibt sich, dass zwei Clients mit niedrigen IDs '''keine''' Verbindung zwischeneinander aufbauen können.
+
Zu ber&uuml;cksichtigen ist, dass Clients immer nur '''einen''' Chunk zur gleichen Zeit zu einem anderen Client hochladen. Auch wenn der Client f&uuml;r zwei verschiedene Dateien in der Warteschlange steht und an der Spitze ankommt, wird trotzdem nur eine der beiden an ihn hochgeladen werden (die andere, abhängig vom verwendeten ED2k-Client, bleibt eventuell an der Spitze stehen, bis der erste Download abgeschlossen ist, wird aber keinesfalls vorher beginnen).
  
== What is Kademlia? ==
+
Haben beide Clients eine Hohe ID (siehe [[FAQ_eD2k-Kademlia-de#Was_sind_niedrige_und_hohe_IDs?|Was sind niedrige und hohe IDs?]]) läuft der Transfer direkt zwischen den beiden ab (Peer-to-Peer), hat einer aber nur eine niedrige ID, wird die Verbindung mit Hilfe des Servers (des Clients mit der niedrigen ID) aufgebaut, da eine niedrige ID bedeutet, dass der Client keine eingehenden Verbindungen annehmen kann. Daraus ergibt sich, dass zwei Clients mit niedrigen IDs '''keine''' Verbindung zwischeneinander aufbauen k&ouml;nnen.
Kademlia ist die logische Weiterentwicklung des ED2k-Netzwerkes. Kademlia ist die Zukunft. Siehe [[FAQ_eD2k-Kademlia-de#Gibt_es_Grenzen_im_ED2k-Netzwerk?|Gibt es Grenzen im ED2k-Netzwerk?]] für weitergehende Informationen und warum Kademlia notwendig ist.
+
  
Da Kademlia ein dezentrales Netzwerk ist, entfällt der Flaschenhals der Notwendigkeit von Servern (auch wenn [[Lugdunum]] sehr viel getan hat, diesen Flaschenhals breiter zu machen). Anstatt zu einem Server verbindet man sich einfach zu einem Client (mit bekannter IP-Adresse und Port), der das [[Kademlia]]-Netzwerk unterstützt. Diesen Vorgang nennt man "Boot Strapping".
+
== Was ist Kademlia? ==
 +
 
 +
Kademlia ist die logische Weiterentwicklung des ED2k-Netzwerkes. Kademlia ist die Zukunft. Siehe [[FAQ_eD2k-Kademlia-de#Gibt_es_Grenzen_im_ED2k-Netzwerk?|Gibt es Grenzen im ED2k-Netzwerk?]] f&uuml;r weitergehende Informationen und warum Kademlia notwendig ist.
 +
 
 +
Da Kademlia ein dezentrales Netzwerk ist, entfällt der Flaschenhals der Notwendigkeit von Servern (auch wenn [[Lugdunum]] sehr viel getan hat, diesen Flaschenhals breiter zu machen). Anstatt zu einem Server verbindet man sich einfach zu einem Client (mit bekannter IP-Adresse und Port), der das [[Kademlia-de|Kademlia]]-Netzwerk unterst&uuml;tzt. Diesen Vorgang nennt man "Bootstrapping".
  
 
Besteht die Verbindung, bekommt man, abhängig von der Fähigkeit, eingehende Verbindungen anzunehmen, den Status "offen" oder "hinter Firewall", die den hohen und niedrigen IDs des ED2k-Netzwerkes ähnlich sind. Dann erhält man eine ID.
 
Besteht die Verbindung, bekommt man, abhängig von der Fähigkeit, eingehende Verbindungen anzunehmen, den Status "offen" oder "hinter Firewall", die den hohen und niedrigen IDs des ED2k-Netzwerkes ähnlich sind. Dann erhält man eine ID.
  
Im Moment werden "hinter Firewall"-Clients noch nicht von Kademlia unterstützt und erhalten daher keine ID und keine Möglichkeit, sich mit dem Netzwerk zu verbinden. Dies wird aber später noch ermöglicht werden.
+
Im Moment werden "hinter Firewall"-Clients noch nicht von Kademlia unterst&uuml;tzt und erhalten daher keine ID und keine M&ouml;glichkeit, sich mit dem Netzwerk zu verbinden. Dies wird aber später noch erm&ouml;glicht werden.
  
Bei der Suche fungiert jeder Client als kleiner Server und bekommt die Verantwortung für bestimmte Schlüsselwörter oder Quellen. Dies macht die Suche nach Quellen sehr viel komplexer, da es keine zentralen Server zum Fragen mehr gibt, sondern die Anfrage sich durch das Netzwerk arbeiten muss.
+
Bei der Suche fungiert jeder Client als kleiner Server und bekommt die Verantwortung f&uuml;r bestimmte Schl&uuml;sselw&ouml;rter oder Quellen. Dies macht die Suche nach Quellen sehr viel komplexer, da es keine zentralen Server zum Fragen mehr gibt, sondern die Anfrage sich durch das Netzwerk arbeiten muss.
  
Momentan wird Kademlia noch nicht von aMule unterstützt, aber das wird sich bald ändern.
+
Seit dem 26.07.05 besteht in der CVS-Version die M&ouml;glichkeit, das KAD-Netzwerk zu nutzen, und ab Version 2.1.0 ist die Kademlia-Unterst&uuml;tzung offizieller Bestandteil des Clients.
  
 
== Sind Kademlia und Overnet gleich? ==
 
== Sind Kademlia und Overnet gleich? ==
Kurez und knapp: Nein. Overnet ist die natürliche serverlose Weiterentwicklung des eDonkey-Clients, während Kademlia jene der *Mule-Clients ist. Die Philosophie ist also die gleiche, aber die Regeln sind verschieden. [http://www.edonkey2000.com/documentation/how_on.html Hier] kann man mehr über die  Arbeitsweise von Overnet erfahren, allerdings ist zu berücksichtigen, dass die Entwicklung von Overnet im geschlossenen Rahmen abläuft, bis es Version 1.0 erreicht, während Kademlia von Anfang an offen entwickelt wurde.
 
  
== Was ist ein Block? ==
+
Kurz und knapp: Nein. Overnet ist die nat&uuml;rliche serverlose Weiterentwicklung des eDonkey-Clients, während Kademlia jene der *Mule-Clients ist. Die Philosophie ist also die gleiche, aber die Regeln sind verschieden. [http://www.edonkey2000.com/documentation/how_on.html Hier] kann man mehr &uuml;ber die  Arbeitsweise von Overnet erfahren, allerdings ist zu ber&uuml;cksichtigen, dass die Entwicklung von Overnet im geschlossenen Rahmen abläuft, bis es Version 1.0 erreicht, während Kademlia von Anfang an offen entwickelt wurde.
Um die Weiterverteilung zerstörter Dateien zu vermeiden, werden im ED2k-Protokoll Dateien in mehrere Abschnitte unterteile, sogenannte <i>Blöcke</i>, deren jeweils einzelne Prüfsumme erzeugt wird (siehe [[FAQ_eD2k-Kademlia#Was_ist_ein_Hash?|nächster Eintrag]]). Jeder Block hat eine Größe von 9.28MB, eine 15MB Datei wird also in zwei Blöcke (9.28MB & 5.72MB) aufgeteilt, eine 315KB Datei bleibt in einem Stück und eine 100MB Datei wird in 11 Teile gespalten (10*9.28MB & 7.2MB).
+
 
 +
== Was ist ein Chunk? ==
 +
 
 +
Im eD2k-Protokoll wird jede Datei in mehrere Teilst&uuml;cke, auch "Chunks" genannt, zerlegt, und dann deren jeweils eigene Pr&uuml;fsumme (Dateihash) ermittelt, um die Weitergabe schadhafter Dateien zu vermeiden (man beachte dazu auch [[FAQ_eD2k-Kademlia-de#Was_ist_ein_Hash?|Was ist ein Hash?]]).
 +
Jeder dieser Chunks ist 9.28MB gro&szlig;, was bedeutet, da&szlig; eine 15MB gro&szlig;e Datei in zwei Chunks (9.28MB + 5.72MB) aufgeteilt wird, eine Datei von 315KB in einem St&uuml;ck bleibt, und eine Datei von 100MB wiederum in 11 Teile (10x9.28MB + 7.2MB).
 +
 
 +
(Anm.: Diese Teilst&uuml;cke wurden fr&uuml;her auf Deutsch auch "Block" genannt, was aber zu Verwechslungen f&uuml;hren konnte, da ein Block wiederum ein 180KB grosses Teilst&uuml;ck eines Chunks ist. - Man beachte dazu auch [[Block_Hash-de|diesen Beitrag]].)
  
 
== Was ist ein Hash? ==
 
== Was ist ein Hash? ==
Dateien in einzelne Blöcke aufzuteilen (siehe [[FAQ_eD2k-Kademlia-de#Was_ist_ein_Block?|Was ist ein Block?]]) verhindert zwar, komplett zerstörte Dateien herunterzuladen, aber dafür ist es nötig, beschädigte Blöcke zu finden. Dafür werden MD4 Prüfsummen verwendet.
 
  
Eine [[MD4 hash|MD4 Prüfsumme]] ist ein einzigartiger Wert für jeden einzelnen Block, der durch eine fortlaufende mathematische Berechnung unter Berücksichtigung jedes einzelnen Bits des Blocks entsteht. Schon durch Änderung nur eines Bits im Block ändert sich auch die Prüfsumme. Somit kann die Integrität jedes einzelnen Blocks nach dem Download überprüft werden.
+
Dateien in einzelne St&uuml;cke aufzuteilen (siehe [[FAQ_eD2k-Kademlia-de#Was_ist_ein_Chunk?|Was ist ein Chunk?]]) verhindert zwar, komplett zerst&ouml;rte Dateien herunterzuladen, aber daf&uuml;r ist es n&ouml;tig, beschädigte Chunks zu finden. Daf&uuml;r werden MD4-Pr&uuml;fsummen verwendet.
  
Aber nicht nur für die Blöcke werden Prüfsummen errechnet, sondern, um eine Prüfsumme für die gesamte Datei zu erhalten, werden die entstehenden Prüfsummen in der Reihenfolge der Blöcke aneinandergehängt und für den entstehenden String wiederum die Prüfsumme gebildet. Auf diese Art und Weise bekommt jede Datei im ED2k-Netzwerk eine einzigartige Kennzeichnung. Die Dateiprüfsumme wird also nicht durch hashen der ganzen Datei sondern aus den einzelnen Blockhashs gebildet.
+
Eine [[MD4 hash-de|MD4-Pr&uuml;fsumme]] ist ein einzigartiger Wert f&uuml;r jeden einzelnen Chunk, der durch eine fortlaufende mathematische Berechnung unter Ber&uuml;cksichtigung jedes einzelnen Bits des Chunks entsteht. Schon durch Änderung nur eines Bits im Chunk ändert sich auch die Pr&uuml;fsumme. Somit kann die Integrität jedes einzelnen Chunks nach dem Download &uuml;berpr&uuml;ft werden.
  
Tatsächlich benötigt man aber die Prüfsumme und die Größe einer Datei, um sie zu identifizieren. Alle diese Informationen sind in den ominösen ED2k-URIs enthalten, die überall zu finden sind.
+
Aber nicht nur f&uuml;r die Chunks werden Pr&uuml;fsummen errechnet, sondern, um eine Pr&uuml;fsumme f&uuml;r die gesamte Datei zu erhalten, werden die entstehenden Pr&uuml;fsummen in der Reihenfolge der Chunks aneinandergehängt und f&uuml;r den entstehenden String wiederum die Pr&uuml;fsumme gebildet. Auf diese Art und Weise bekommt jede Datei im ED2k-Netzwerk eine einzigartige Kennzeichnung. Die Dateipr&uuml;fsumme wird also nicht durch hashen der ganzen Datei, sondern aus den einzelnen Chunkpr&uuml;fsummen gebildet.
 +
 
 +
Tatsächlich ben&ouml;tigt man aber die Pr&uuml;fsumme und die Gr&ouml;&szlig;e einer Datei, um sie zu identifizieren. Alle diese Informationen sind in den omin&ouml;sen ED2k-URIs enthalten, die &uuml;berall zu finden sind.
 +
 
 +
Hier ein Beispiel:
  
Hier ein Beispiel: <br>
 
 
ed2k://|file|aMule-2.0.0rc7.tar.bz2|1877051|527CE82275B39AAB5D902DD945B43425|/
 
ed2k://|file|aMule-2.0.0rc7.tar.bz2|1877051|527CE82275B39AAB5D902DD945B43425|/
  
Die interessanten Teile sind der fünfte Teil, "1877051", die Größe der Datei in Bytes und der letzte Teil, "527CE82275B39AAB5D902DD945B43425", was die Dateiprüfsumme der Datei ist, als 32 hexadezimale Ziffern.
+
Die interessanten Teile sind der f&uuml;nfte Teil, "1877051", die Gr&ouml;&szlig;e der Datei in Bytes, und der letzte Teil, "527CE82275B39AAB5D902DD945B43425", was die Dateipr&uuml;fsumme der Datei ist, als 32 Stellige hexadezimale Zahl.
  
Der Dateiname spielt übrigens für die Kennzeichnung einer Datei '''keine''' Rolle.
+
Der Dateiname spielt &uuml;brigens f&uuml;r die Kennzeichnung einer Datei '''keine''' Rolle.
  
 
== Warum erscheinen Dateien gleichen Namens als verschiedene Suchergebnisse? ==
 
== Warum erscheinen Dateien gleichen Namens als verschiedene Suchergebnisse? ==
Wer "Was ist ein Hash?" gelesen hat, wird das schnell verstehen. Wird eine Suche gestartet, schickt der Server dem Client die Namen und Dateihashes der Dateien, die den gegebenen Suchkriterien entsprechen. Wenn sich zwei Dateien, auch wenn sie den gleichen Namen tragen, in ihrem Inhalt unterscheiden, egal wie gering, werden sie als verschieden angesehen. Aus diesem Grund können zwei Dateien mit unterschiedlichem Namen gleich erscheinen - der Dateiname interessiert nicht, nur die Prüfsumme.
+
 
 +
Wer "Was ist ein Hash?" gelesen hat, wird das schnell verstehen. Wird eine Suche gestartet, schickt der Server dem Client die Namen und Dateihashes der Dateien, die den gegebenen Suchkriterien entsprechen. Wenn sich zwei Dateien, auch wenn sie den gleichen Namen tragen, in ihrem Inhalt unterscheiden, egal wie gering, werden sie als verschieden angesehen. Aus diesem Grund k&ouml;nnen zwei Dateien mit unterschiedlichem Namen gleich erscheinen - der Dateiname interessiert nicht, nur die Pr&uuml;fsumme.
  
 
== Was sind niedrige und hohe IDs? ==
 
== Was sind niedrige und hohe IDs? ==
Each client is assigned an identifying number, an ID, which will be unique and will distinguish him from any other client on the server. If this ID is below 16777216 (16 million) then you have a LowID. If it's over, then you have a HighID. To be given a high or low ID will only depend on having TCP port 4662 (or the one set up in Preferences) opened. If you understood "What is ED2K" you might understand that chances are that clients on LowID may be unable to connect to many other clients (all those on LowID) so will have a lower transfer rate. That's why having port 4662 TCP (or the one set in Preferences) is so important. Also, some bug servers refuse clients on LowID to connect to them since LowID clients have data transfered through the server and so, those big servers could be overcharged.<br>
 
For HighID clients, their ID is the result of a mathematical operation with their IP which corresponds to A + 256*B + 256*256*C + 256*256*256*D, where the IP is A.B.C.D. Also have in mind that this ID has identification purposes, nothing else, so apart from having and ID over or under the 16777216 number, it does not matter if the ID is bigger or smaller. This means a client with an ID like 50000000 isn't better than a client with an ID like 49999999.<br>
 
There's still an exception. Sometimes badly configured or very busy servers give LowID to some clients although the 4662 TCP port is opened. This are rare exceptions, but it might happen sometime.
 
  
 +
Jeder Client bekommt eine nur ihm zugeordnete Nummer, die ihn im ED2k-Netzwerk eindeutig identifiziert und von anderen mit einem Server verbundenen Clients unterscheidet. Wenn diese ID niedriger als 16777216 (2^24) ist, dann handelt es sich um eine niedrige ID, ansonsten um eine hohe. Ob man eine hohe oder niedrige ID bekommt, hängt einzig davon ab, ob der TCP-Port 4662 (bzw. der in den Einstellungen gewählte) von au&szlig;en erreichbar ist. Wer "Was ist ED2K?" gelesen hat, wei&szlig;, dass Clients mit niedriger ID sich zu bestimmten anderen (nämlich denen mit ebenfalls niedriger ID) nicht verbinden k&ouml;nnen und so niedrigere Transferraten zu erwarten haben. Daher ist Port 4662, bzw. der eingestellte, so wichtig. Au&szlig;erdem verweigern manche Server Clients mit niedriger ID den Verbindungsaufbau, da sie f&uuml;r die Daten&uuml;bertragung auf den Server angewiesen sind und gro&szlig;e Server so &uuml;berlastet werden k&ouml;nnten.
 +
 +
Eine hohe ID ist lediglich die dezimale Darstellung der IP des Clients als big-endian (aus der IP A.B.C.D wir A+2^8*B+2^16*C+2^24*D). Ansonsten dient die hohe ID nur der Identifikation, sonst nichts, es interessiert nur, ob die ID kleiner oder gr&ouml;&szlig;er als 2^24 ist, wie gro&szlig; oder klein genau, ist irrelevant. Eine hohe ID von 50000000 ist nicht besser als 49999999.
 +
 +
Es gibt eine Ausnahme, manchmal vergeben falsch konfigurierte oder &uuml;berlastete Server eine niedrige ID, obwohl der Port des Clients erreichbar ist. Das ist selten, kommt aber durchaus vor.
 +
 +
== Welche Ports m&uuml;ssen in einer Firewall oder einem Router f&uuml;r aMule konfiguriert werden? ==
 +
 +
Au&szlig;er f&uuml;r eine hohe ID, die Port 4662 (bzw. den eingestellten) f&uuml;r einkommende Verbindungen ge&ouml;ffnet voraussetzt, m&uuml;ssen keine speziellen Ports f&uuml;r aMule ge&ouml;ffnet werden.
 +
 +
Abgesehen davon sollten, um eine optimale Transferleistung zu erreichen, Port 4672 ge&ouml;ffnet werden. F&uuml;r ausgehende Verbindungen sollte der Router dynamische Regeln erstellen um eingehende TCP/UDP-Pakete einzulassen. Die meisten modernen Router/Firewalls machen das schon in der Standardkonfiguration.
 +
 +
ab Version 2.1.0: F&uuml;r eine komplette Kademliaunterst&uuml;tzung sollte sichergestellt werden, dass Port 4672 f&uuml;r ausgehende Pakete vom Router nicht geändert wird. Ansonsten kann es sein, dass 'Kad: firewalled' angezeigt wird. Das passiert vor allem, wenn NAT (Network Address Translation) genutzt wird, d.h. der Rechner eine eigene private Adresse hat (meist 10.?.?.? oder 192.168.?.?).
 +
 +
D.h. mit /sbin/ifconfig herausfinden, welche IP der Rechner hat und diese im Setup des Routers eintragen, wenn dort die entsprechenden Ports freigegeben werden.
 +
 +
== Wof&uuml;r sind die Ports jeweils da? ==
 +
 +
Da sich die meisten Ports einstellen lassen, werden hier die Vorgabewerte aufgef&uuml;hrt:
 +
 +
; 4662 TCP: Peer-to-Peer (Transfer zwischen den Clients)
 +
; 4672 UDP: erweitertes *Mule-Protokoll, Warteschlange, Dateinachfrage
 +
; 4661 TCP: Nur f&uuml;r Server notwendig, hierher verbinden sich die Clients
 +
; 4665 UDP: Auf dem Server ge&ouml;ffnet, f&uuml;r die Frage nach Quellen, ist immer TCP-Port+3
 +
; 4711 TCP: Port des *Mule WebServers
 +
; 4712 TCP: externe Verbindungen, wird f&uuml;r Programme, die sich mit aMule verbinden, z.B. WebServer oder aMuleCMD, ben&ouml;tigt.
 +
 +
Obwohl der zweite UDP-Port offiziell TCP-Port+4 ist, verwenden einige (die meisten?) Implementierungen es als TCP-Port+3. Aber dieser Port wird zumeist nicht verwendet (aMule benutzt ihn nicht, eMule hat ihn nicht).
 +
 +
== Gibt es Beschränkungen im eD2k-Netzwerk? ==
 +
 +
Ja, aber nicht viele. Zwei nat&uuml;rliche und eine "erzwungene":
 +
Die nat&uuml;rlichen wurden bereits erwähnt: Zuerst die Probleme mit niedrigen IDs (sie sind auf Transfers &uuml;ber Server angewiesen, und zwei Clients mit niedrigen IDs k&ouml;nnen keine Dateien untereinander austauschen) und zweitens, obwohl ED2k ein Peer-to-Peer-Protokoll ist, werden Server ben&ouml;tigt, um die P2P-Verbindung aufzubauen. Daraus resultieren viele Probleme, bezogen auf Flaschenhälse, Datenschutz, und Skalierbarkeit (wenn ein einziger Server wegbricht, wird mit ihm ein gro&szlig;er Teil des Netzes ebenfalls getrennt). Letzteres wird aber durch das neue Kademlia-Protokoll gel&ouml;st.
 +
 +
Zur "erzwungenen" Einschränkung: Sie dient dazu, sicherzustellen, dass die im ED2k-Netzwerk teilnehmenden Clients auch zu seinem Bestehen beitragen, und das Netz bestehenbleibt. Die Beschränkung wird &uuml;ber das Limit der Uploadbandbreite geregelt. Wenn dieses zwischen 0 und 3.99kB/s (beides inklusive) liegt, wird der Download auf das Dreifache dieses Wertes begrenzt. Liegt das Limit zwischen 4 und 9.99kB/s (ebenfalls inklusive) ist der Download auf das Vierfache beschränkt. Clients mit einem Uploadlimit von 10kB/s oder mehr unterliegen keinen Downloadbeschränkungen. Die Begrenzung wird im Clientprogramm vorgenommen, lie&szlig;e sich also durch dessen Veränderung umgehen, allerdings w&uuml;rde dies von den Servern mit einem Rauswurf quittiert.
 +
 +
Au&szlig;erdem bietet jeder Client mindestens drei Uploadplätze, es ist also nicht m&ouml;glich, mehr als Uploadlimit/3 kB/s pro Platz einzustellen.
 +
 +
Es gibt noch eine weitere Begrenzung: Die maximale Dateigr&ouml;&szlig;e im Netz beträgt 256GB (274877906944 bytes). Die ältere Begrenzung (bis zu eMule 0.46 und aMule 2.1.0) lag etwas unter ca. 4GB (genauer: 4294967295 bytes, obwohl aMule nur Dateigr&ouml;&szlig;en bis zu 4290048000 bytes unterst&uuml;tzte).
 +
 +
Zusätzlich, und zwar nicht als eD2k-Beschränkung, sondern als Begrenzung durch die Server, liefern diese nur 300 Ergebnisse pro Suchanfrage, von daher sollte man auch nicht mehr als 300 Ergebnisse erwarten.
 +
 +
Vom Client her werden Dateinamen normalerweise auf 161 [[character|Zeichen]] begrenzt.
 +
 +
== Gibt es Beschränkungen im Kademlianetzwerk? ==
 +
 +
*Weil es sich aus dem eD2k-Netz ableitet, gilt auch im Kademlianetzwerk zur Beibehaltung der Kompatibilität bei der einheitlichen Dateienbestimmung die Begrenzung der Dateigr&ouml;&szlig;e auf h&ouml;chstens 256GB.
 +
*Gleiches gilt f&uuml;r die Begrenzung auf 161 Zeichen.
 +
 +
== F&uuml;r welche Dateitypen stehen jeweils die einzelnen Filter im Suchfenster? ==
 +
 +
Es ist zu beachten, dass die Filter im Suchfenster nicht nach dem tatsächlicne Inhalt, sondern nach der Dateinamenserweiterung gehen. Die Zuordnung ist folgende:
 +
*'''Archive:''' ''.ace .arj .rar .tar.bz2 .tar.gz .zip .Z''
 +
*'''Audio:''' ''.aac .ape .au .mp2 .mp3 .mp4 .mpc .ogg .wav .wma''
 +
*'''CDImage:''' ''.bin .ccd .cue .img .iso .nrg .sub''
 +
*'''Bilder:''' ''.bmp .gif .jpeg .jpg .png .tif''
 +
*'''Programme:''' ''.com .exe''
 +
*'''Videos:''' ''.avi .divx .mov .mpeg .mpg .ogg .ram .rm .vivo .vob''
 +
 +
Ein Film, der fälschlicherweise "Geburtstag.gz" benannnt ist, wird also unter den Archiven und nicht unter Videos einsortiert.
 +
 +
== Was ist eine Quelle? ==
 +
 +
Eine Quelle ist ein Client, der einen noch nicht fertiggestellten Chunk einer Datei anbietet, die in der eigenen Downloadliste steht. Je mehr Quellen man f&uuml;r eine Datei bekommt, desto mehr M&ouml;glichkeiten zum Download hat man und um so schneller wird der Download wahrscheinlich beendet sein.
 +
 +
Zu ber&uuml;cksichtigen ist aber, dass es einen Unterschied zwischen "Quellen" und "nutzbaren Quellen" gibt, wenn man nur eine niedrige ID hat: "Quellen" sind Clients, die ein St&uuml;ck der Datei anbieten k&ouml;nnen, das man noch nicht hat, aber nur "nutzbare Quellen" sind solche, von denen man auch tatsächlich herunterladen kann (die also eine niedrige ID haben).
 +
 +
== Was hat es mit diesem ganzen Krempel (Credits, Bewertungen, Ratings, Warteschlangen) auf sich? ==
 +
 +
All diese Konzepte haben mit der Art und Weise zu tun, wie im ED2k-Netzwerk die Uploadwarteschlangenprioritäten ermittelt werden.
 +
 +
Die Bewertung ist der wichtigste Wert: Der Client mit der h&ouml;chsten Bewertung wird der nächste sein, der einen Uploadplatz bekommt. Die Bewertung wird wie folgt berechnet: Bewertung = (Rating * Wartezeit[s]) / 100
 +
 +
Um das zu verstehen, muss erstmal geklärt werden, was unter dem Rating zu verstehen ist:
  
== Which ports do I have to configure in a firewall or router to run aMule? ==
+
Das Rating ist eine objektive Bewertung. Also eine Bewertung unabhängig davon, wie lange ein Client bereits in der Uploadwarteschlange wartet. Wenn sich ein Client in die Uploadwarteschlange einreiht, bekommt er eine Rating von 100 zugewiesen. Danach wird dieser Wert wie folgt verändert:
No specific ports need to be opened for aMule to work, but yes to have HighID. As mentioned above, to be given a HighID, port 4662 TCP (or the one set in Preferences) must be listening.<br>
+
Apart from that port, to have an optimal ED2K experience, two more ports should be enabled too. First, the UDP port 4672 (which can be configured to any other number in Preferences too) and secondly, the secondary UDP port which can't be set in Preferences. This UDP port is your TCP port + 3 (i.e.: TCP=4662 then UDP=4665).
+
  
== What does each port do? ==
+
Abhängig von den Credits des Clients wird die Rating mit 1 bis 10 multipliziert. Entsprechend der Dateipriorität wird sie mit 0.2 bis 1.8 multipliziert (Release 1.8, Hoch 0.9, Normal 0.7, Niedrig 0.6, Sehr niedrig 0.2).
Well, since most ports can be configured to be set to any other number, the defaults will be listed:
+
  
; 4662 TCP: Client to client transfers.
+
Sehr alte Clients, die das Netzwerk zu sehr belasten, werden durch eine halbierte Bewertung gebremst.
; 4672 UDP: Extended eMule protocol, Queue Rating, File Reask Ping
+
; 4661 TCP: Opened on server. Allows connection to server.
+
; 4665 UDP: Opened on server. Allows asking for sources. It is always server TCP port + 3.
+
; 4711 TCP: WebServer listening port.
+
; 4712 TCP: External Connection port. Used to communicate aMule with other applications such as aMule WebServer or aMuleCMD.
+
  
Although officially the secondary UDP port is server TCP port + 4, some (most?) implementations use it as client TCP + 3. Any way, this port is mostly not used (aMule doesn't use it, eMule doesn't have it).
+
Verbannte Clients bekommen keine Bewertung (bzw. ihre Bewertung wird mit Null multipliziert).
  
== Gibt es Grenzen im ED2k-Netzwerk? ==
+
Diese Multiplikatoren werden als "Modifikatoren" bezeichnet. Clients mit einem Modifikator gr&ouml;&szlig;er als Eins werden mit einem gelben Stern im Icon gekennzeichnet.
Not much, but yes, there are: two natural limits and a "forced" limitation. The two natural limits have already been mentioned before. First, the issues on LowID users (their transfers involve data through the server and two LowID clients can't share between them). The second, although ED2K is a p2p protocol, it needs servers to establish the p2p connection. This latter one is solved in the Kademlia protocol.<br>
+
About the "forced" limitation, it's only a limit to make sure that clients share so that the ED2K network will not disappear: clients which have an upload limit of X KBps, where X is between 0 and 3.99 (both included) can download at a maximum of X*3 KBps. Clients which have an upload limit of Y KBps, where Y is Between 4 and 9.99 (both included) can download at a maximum of Y*4 KBps. Clients with an upload limit of 10KBps or more have no downloading limitations. This restriction is set in the client application so it could be by-passed by hacking the code, but that would probably result in being banned from the servers you connect to.<br>
+
Also, any client is forced to allow at least three upload slots, so it's not possible to allow more than upload_limit/3 KBps per slot.<br>
+
There is one last limit: Network file limit is 4Gb.
+
  
== In search window, what filter stands for which filetype? ==
+
Bleiben also nur die Credits. Credits sind die Belohnung, die man f&uuml;r den Upload an einen anderen Client bekommt. Credits werden jeweils zwischen zwei Clients ausgetauscht, nicht global. Die eigenen Credits kann man also nicht einsehen, wohl aber die aller anderen Clients (also die Credits, die man dem jeweiligen Client schuldet). Da Credits vom hochladenden Client verwaltet werden (sie sind in der clients.met zu finden), kann es passieren, dass man keine Credits bekommt, wenn der empfangende Client dies nicht unterst&uuml;tzt, dieser aber trotzdem beim eigenen Client welche bekommt, wenn er etwas hochlädt.
Have in mind that the filters in the search window don't depend on the file type, but on the extensions of the filenames, in the following way:<br>
+
<b>Archive:</b> <i>.ace .arj .rar .tar.bz2 .tar.gz .zip .Z</i><br>
+
<b>Audio:</b> <i>.aac .ape .au .mp2 .mp3 .mp4 .mpc .ogg .wav .wma</i><br>
+
<b>CDImage:</b> <i>.bin .ccd .cue .img .iso .nrg .sub</i><br>
+
<b>Picture:</b> <i>.bmp .gif .jpeg .jpg .png .tif</i><br>
+
<b>Program:</b> <i>.com .exe</i><br>
+
<b>Video:</b> <i>.avi .divx .mov .mpeg .mpg .ogg .ram .rm .vivo .vob</i><br>
+
So, a movie which's filename is "Birthday.zip" will appear in the Archive filter, but not in the Video filter.
+
  
== What is a source? ==
+
Der Credits Modifikator f&uuml;r das Rating ist der niedrigere dieser beiden Werte: (Gesamtupload[MB] * 2) / Gesamtdownload[MB] und Wurzel_aus(Gesamtupload[MB] + 2)
A source is a client which is sharing some chunk in some file you have in your downloading queue which you still have not completed. Obviously, the more sources you can get for a given file, the more possibilities you have to download the file and the quicker you'll download it. Have in mind that there's a difference between "sources" and "available sources" if you're on LowID, since "sources"s stands for clients sharing a chunk or file you still haven't completed, while "available sources" stands for clients sharing a chunk or file you still haven't completed and from who you can download (that is, a sources who is on LowID).
+
  
 +
Ist das Ergebnis kleiner als Eins, wird es auf Eins gesetzt und wenn es gr&ouml;&szlig;er als 10 ist, wird es auf 10 gesetzt. Zusätzlich wird, wenn der Gesamtupload kleiner als 1MB ist, der Modifikator auf Eins, wenn der Gesamtdownload Null ist, auf 10 gesetzt.
  
== Was hat es mit diesem ganzen Krempel (Credits, Bewertungen, Warteschlangen usw.) auf sich? ==
+
== Was ist ein Uploadplatz? ==
All three concepts have to do with the way in which the ED2K network establishes the uploading queues preferences.<br>
+
The score is the most important value: the client with the higher score will be the next client which you'll provide a slot to. The way in the score value is set is this: score = rate x time_waiting_in_seconds / 100
+
So, to understand this, we must known what rate is.<br>
+
Rate is can be understood as an objective preference. This is, the preference which a client is given without caring how much time it's been waiting. When a client is added to the uploading queue, it gets a rate of 100. This value is modified following according to this:<br>
+
According to the amount of credits, the rate will be multiplied by 1x to 10x.
+
Depending on the file priority, it will be multiplied by 0.2x to 1.8x (Release 1.8x, High 0.9x, Normal 0.7x, Low 0.6x, Very Low: 0.2x).<br>
+
Users on specific old clients which load too much the network traffic will get penalized by multiplying their rate by 0.5x.<br>
+
Banned clients will instantly get no rate (that is, their rate will by multiplied by 0).<br>
+
This multiplying values are known as "modifiers". Clients with a modifier value strictly bigger than 1 will be marked as yellow in the icon.<br>
+
So we only have credits left to known. Credits are a prize you get for uploading files to a specific user. Credits are exchanged between two specific clients, they are not global, so your own credits can't be viewed, although you can know the credits any other user has on you (that is, the credits you owe that client). Since credits are managed by the uploading client, you might be uploading to some client with no credits support, so you will gain no credits on him, although that client will actually get credits on you if it uploads to you, since you do have credits support. This credits are stored in clients.met file.<br>
+
The credits modifier used by rate is the lower between this to: <br>(upload_total x 2)/download_total or sqrt(upload_total+2) where both upload_total and download_total are measured in MBs.<br>
+
If the result is lower than 1, then it is set to 1 and if it is bigger than 10, it is set to 10. In addition, if the uploaded total is less than 1MB, the modifier is set to 1 and if the downloaded total is equal to 0, then the modifier is set to 10.<br>
+
  
==  What is a slot? ==
+
Wird ein Dateist&uuml;ck hochgeladen, wird die Uploadbandbreite (die von der verwendeten Verbindung und dem eingestellten Uploadlimit abhängt) f&uuml;r einzelne Plätze aufgeteilt, so dass mehrere Chunks zugleich an verschiedene Clients hochgeladen werden. Wie unter "Gibt es Grenzen im ED2k-Netzwerk?" nachzulesen, stellt jeder Client mindestens drei Uploadplätze zur Verf&uuml;gung.
When uploading files, your upload bandwidth (which may vary depending on the upload limit or the natural connection-type upload limit) will be divided into slots. So, each slot is an amount of KBps which will be assigned to each client who tries to download from you.
+

Latest revision as of 15:15, 25 September 2008

English | Deutsch | Español | Français | Italiano | Nederlands | [ Polish | Russian

Was ist ED2K?

ED2k ist ein Protokoll, das ursprünglich vom P2P (Peer-to-Peer) Client eDonkey2000 verwendet wurde, der ihm auch seinen Namen gab. Es ist ein Server/Client-Protokoll mit der Möglichkeit, Quellen zwischen den Clients auszutauschen.

Das ED2k-Netzwerk ist serverbasiert, im Gegensatz zu reinen P2P-Netzwerken wie Kazaa. Nach dem Start von aMule ist also das erste, sich mit einem Server zu verbinden (entweder manuell oder automatisch).

Sobald die Verbindung hergestellt wurde, kann der Client eine Suchanfrage an den verbundenen Server stellen, oder alle Server global absuchen. Die Antworten enthalten eine Liste aller Dateien, die den gegebenen Suchkriterien entsprechen.

Wird vom Nutzer ein Download initiiert, fragt der Clients den Server nach Quellen, was dieser mit einer Liste von IP Adressen anderer Clients beantwortet, die die gesuchte Datei (oder Teile davon) haben.


Sobald der eigene Client an der Spitze der Warteschlange des Gegenübers angekommen ist (siehe auch "Was hat es mit diesem ganzen Krempel (Credits, Bewertungen, Warteschlangen usw.) auf sich?"), beginnt dieser einen Chunk der Datei heraufzuladen und, wenn dieser vollständig ist, den eigenen Client wieder in die Warteschlange einzureihen. Auf diese Weise werden die verschiedenen Teile im ED2k-Netzwerk verteilt, so dass, auch wenn eventuell niemand zu einem bestimmten Zeitpunkt die vollständige Datei hat, diese dennoch durch Downloads von verschiedenen Leuten vollständig erhältlich sein kann (leider gibt es eine Menge Leute, die eine Datei nicht weiter freigeben, nachdem sie vollständig heruntergeladen wurde).

Zu berücksichtigen ist, dass Clients immer nur einen Chunk zur gleichen Zeit zu einem anderen Client hochladen. Auch wenn der Client für zwei verschiedene Dateien in der Warteschlange steht und an der Spitze ankommt, wird trotzdem nur eine der beiden an ihn hochgeladen werden (die andere, abhängig vom verwendeten ED2k-Client, bleibt eventuell an der Spitze stehen, bis der erste Download abgeschlossen ist, wird aber keinesfalls vorher beginnen).

Haben beide Clients eine Hohe ID (siehe Was sind niedrige und hohe IDs?) läuft der Transfer direkt zwischen den beiden ab (Peer-to-Peer), hat einer aber nur eine niedrige ID, wird die Verbindung mit Hilfe des Servers (des Clients mit der niedrigen ID) aufgebaut, da eine niedrige ID bedeutet, dass der Client keine eingehenden Verbindungen annehmen kann. Daraus ergibt sich, dass zwei Clients mit niedrigen IDs keine Verbindung zwischeneinander aufbauen können.

Was ist Kademlia?

Kademlia ist die logische Weiterentwicklung des ED2k-Netzwerkes. Kademlia ist die Zukunft. Siehe Gibt es Grenzen im ED2k-Netzwerk? für weitergehende Informationen und warum Kademlia notwendig ist.

Da Kademlia ein dezentrales Netzwerk ist, entfällt der Flaschenhals der Notwendigkeit von Servern (auch wenn Lugdunum sehr viel getan hat, diesen Flaschenhals breiter zu machen). Anstatt zu einem Server verbindet man sich einfach zu einem Client (mit bekannter IP-Adresse und Port), der das Kademlia-Netzwerk unterstützt. Diesen Vorgang nennt man "Bootstrapping".

Besteht die Verbindung, bekommt man, abhängig von der Fähigkeit, eingehende Verbindungen anzunehmen, den Status "offen" oder "hinter Firewall", die den hohen und niedrigen IDs des ED2k-Netzwerkes ähnlich sind. Dann erhält man eine ID.

Im Moment werden "hinter Firewall"-Clients noch nicht von Kademlia unterstützt und erhalten daher keine ID und keine Möglichkeit, sich mit dem Netzwerk zu verbinden. Dies wird aber später noch ermöglicht werden.

Bei der Suche fungiert jeder Client als kleiner Server und bekommt die Verantwortung für bestimmte Schlüsselwörter oder Quellen. Dies macht die Suche nach Quellen sehr viel komplexer, da es keine zentralen Server zum Fragen mehr gibt, sondern die Anfrage sich durch das Netzwerk arbeiten muss.

Seit dem 26.07.05 besteht in der CVS-Version die Möglichkeit, das KAD-Netzwerk zu nutzen, und ab Version 2.1.0 ist die Kademlia-Unterstützung offizieller Bestandteil des Clients.

Sind Kademlia und Overnet gleich?

Kurz und knapp: Nein. Overnet ist die natürliche serverlose Weiterentwicklung des eDonkey-Clients, während Kademlia jene der *Mule-Clients ist. Die Philosophie ist also die gleiche, aber die Regeln sind verschieden. Hier kann man mehr über die Arbeitsweise von Overnet erfahren, allerdings ist zu berücksichtigen, dass die Entwicklung von Overnet im geschlossenen Rahmen abläuft, bis es Version 1.0 erreicht, während Kademlia von Anfang an offen entwickelt wurde.

Was ist ein Chunk?

Im eD2k-Protokoll wird jede Datei in mehrere Teilstücke, auch "Chunks" genannt, zerlegt, und dann deren jeweils eigene Prüfsumme (Dateihash) ermittelt, um die Weitergabe schadhafter Dateien zu vermeiden (man beachte dazu auch Was ist ein Hash?). Jeder dieser Chunks ist 9.28MB groß, was bedeutet, daß eine 15MB große Datei in zwei Chunks (9.28MB + 5.72MB) aufgeteilt wird, eine Datei von 315KB in einem Stück bleibt, und eine Datei von 100MB wiederum in 11 Teile (10x9.28MB + 7.2MB).

(Anm.: Diese Teilstücke wurden früher auf Deutsch auch "Block" genannt, was aber zu Verwechslungen führen konnte, da ein Block wiederum ein 180KB grosses Teilstück eines Chunks ist. - Man beachte dazu auch diesen Beitrag.)

Was ist ein Hash?

Dateien in einzelne Stücke aufzuteilen (siehe Was ist ein Chunk?) verhindert zwar, komplett zerstörte Dateien herunterzuladen, aber dafür ist es nötig, beschädigte Chunks zu finden. Dafür werden MD4-Prüfsummen verwendet.

Eine MD4-Prüfsumme ist ein einzigartiger Wert für jeden einzelnen Chunk, der durch eine fortlaufende mathematische Berechnung unter Berücksichtigung jedes einzelnen Bits des Chunks entsteht. Schon durch Änderung nur eines Bits im Chunk ändert sich auch die Prüfsumme. Somit kann die Integrität jedes einzelnen Chunks nach dem Download überprüft werden.

Aber nicht nur für die Chunks werden Prüfsummen errechnet, sondern, um eine Prüfsumme für die gesamte Datei zu erhalten, werden die entstehenden Prüfsummen in der Reihenfolge der Chunks aneinandergehängt und für den entstehenden String wiederum die Prüfsumme gebildet. Auf diese Art und Weise bekommt jede Datei im ED2k-Netzwerk eine einzigartige Kennzeichnung. Die Dateiprüfsumme wird also nicht durch hashen der ganzen Datei, sondern aus den einzelnen Chunkprüfsummen gebildet.

Tatsächlich benötigt man aber die Prüfsumme und die Größe einer Datei, um sie zu identifizieren. Alle diese Informationen sind in den ominösen ED2k-URIs enthalten, die überall zu finden sind.

Hier ein Beispiel:

ed2k://|file|aMule-2.0.0rc7.tar.bz2|1877051|527CE82275B39AAB5D902DD945B43425|/

Die interessanten Teile sind der fünfte Teil, "1877051", die Größe der Datei in Bytes, und der letzte Teil, "527CE82275B39AAB5D902DD945B43425", was die Dateiprüfsumme der Datei ist, als 32 Stellige hexadezimale Zahl.

Der Dateiname spielt übrigens für die Kennzeichnung einer Datei keine Rolle.

Warum erscheinen Dateien gleichen Namens als verschiedene Suchergebnisse?

Wer "Was ist ein Hash?" gelesen hat, wird das schnell verstehen. Wird eine Suche gestartet, schickt der Server dem Client die Namen und Dateihashes der Dateien, die den gegebenen Suchkriterien entsprechen. Wenn sich zwei Dateien, auch wenn sie den gleichen Namen tragen, in ihrem Inhalt unterscheiden, egal wie gering, werden sie als verschieden angesehen. Aus diesem Grund können zwei Dateien mit unterschiedlichem Namen gleich erscheinen - der Dateiname interessiert nicht, nur die Prüfsumme.

Was sind niedrige und hohe IDs?

Jeder Client bekommt eine nur ihm zugeordnete Nummer, die ihn im ED2k-Netzwerk eindeutig identifiziert und von anderen mit einem Server verbundenen Clients unterscheidet. Wenn diese ID niedriger als 16777216 (2^24) ist, dann handelt es sich um eine niedrige ID, ansonsten um eine hohe. Ob man eine hohe oder niedrige ID bekommt, hängt einzig davon ab, ob der TCP-Port 4662 (bzw. der in den Einstellungen gewählte) von außen erreichbar ist. Wer "Was ist ED2K?" gelesen hat, weiß, dass Clients mit niedriger ID sich zu bestimmten anderen (nämlich denen mit ebenfalls niedriger ID) nicht verbinden können und so niedrigere Transferraten zu erwarten haben. Daher ist Port 4662, bzw. der eingestellte, so wichtig. Außerdem verweigern manche Server Clients mit niedriger ID den Verbindungsaufbau, da sie für die Datenübertragung auf den Server angewiesen sind und große Server so überlastet werden könnten.

Eine hohe ID ist lediglich die dezimale Darstellung der IP des Clients als big-endian (aus der IP A.B.C.D wir A+2^8*B+2^16*C+2^24*D). Ansonsten dient die hohe ID nur der Identifikation, sonst nichts, es interessiert nur, ob die ID kleiner oder größer als 2^24 ist, wie groß oder klein genau, ist irrelevant. Eine hohe ID von 50000000 ist nicht besser als 49999999.

Es gibt eine Ausnahme, manchmal vergeben falsch konfigurierte oder überlastete Server eine niedrige ID, obwohl der Port des Clients erreichbar ist. Das ist selten, kommt aber durchaus vor.

Welche Ports müssen in einer Firewall oder einem Router für aMule konfiguriert werden?

Außer für eine hohe ID, die Port 4662 (bzw. den eingestellten) für einkommende Verbindungen geöffnet voraussetzt, müssen keine speziellen Ports für aMule geöffnet werden.

Abgesehen davon sollten, um eine optimale Transferleistung zu erreichen, Port 4672 geöffnet werden. Für ausgehende Verbindungen sollte der Router dynamische Regeln erstellen um eingehende TCP/UDP-Pakete einzulassen. Die meisten modernen Router/Firewalls machen das schon in der Standardkonfiguration.

ab Version 2.1.0: Für eine komplette Kademliaunterstützung sollte sichergestellt werden, dass Port 4672 für ausgehende Pakete vom Router nicht geändert wird. Ansonsten kann es sein, dass 'Kad: firewalled' angezeigt wird. Das passiert vor allem, wenn NAT (Network Address Translation) genutzt wird, d.h. der Rechner eine eigene private Adresse hat (meist 10.?.?.? oder 192.168.?.?).

D.h. mit /sbin/ifconfig herausfinden, welche IP der Rechner hat und diese im Setup des Routers eintragen, wenn dort die entsprechenden Ports freigegeben werden.

Wofür sind die Ports jeweils da?

Da sich die meisten Ports einstellen lassen, werden hier die Vorgabewerte aufgeführt:

4662 TCP
Peer-to-Peer (Transfer zwischen den Clients)
4672 UDP
erweitertes *Mule-Protokoll, Warteschlange, Dateinachfrage
4661 TCP
Nur für Server notwendig, hierher verbinden sich die Clients
4665 UDP
Auf dem Server geöffnet, für die Frage nach Quellen, ist immer TCP-Port+3
4711 TCP
Port des *Mule WebServers
4712 TCP
externe Verbindungen, wird für Programme, die sich mit aMule verbinden, z.B. WebServer oder aMuleCMD, benötigt.

Obwohl der zweite UDP-Port offiziell TCP-Port+4 ist, verwenden einige (die meisten?) Implementierungen es als TCP-Port+3. Aber dieser Port wird zumeist nicht verwendet (aMule benutzt ihn nicht, eMule hat ihn nicht).

Gibt es Beschränkungen im eD2k-Netzwerk?

Ja, aber nicht viele. Zwei natürliche und eine "erzwungene": Die natürlichen wurden bereits erwähnt: Zuerst die Probleme mit niedrigen IDs (sie sind auf Transfers über Server angewiesen, und zwei Clients mit niedrigen IDs können keine Dateien untereinander austauschen) und zweitens, obwohl ED2k ein Peer-to-Peer-Protokoll ist, werden Server benötigt, um die P2P-Verbindung aufzubauen. Daraus resultieren viele Probleme, bezogen auf Flaschenhälse, Datenschutz, und Skalierbarkeit (wenn ein einziger Server wegbricht, wird mit ihm ein großer Teil des Netzes ebenfalls getrennt). Letzteres wird aber durch das neue Kademlia-Protokoll gelöst.

Zur "erzwungenen" Einschränkung: Sie dient dazu, sicherzustellen, dass die im ED2k-Netzwerk teilnehmenden Clients auch zu seinem Bestehen beitragen, und das Netz bestehenbleibt. Die Beschränkung wird über das Limit der Uploadbandbreite geregelt. Wenn dieses zwischen 0 und 3.99kB/s (beides inklusive) liegt, wird der Download auf das Dreifache dieses Wertes begrenzt. Liegt das Limit zwischen 4 und 9.99kB/s (ebenfalls inklusive) ist der Download auf das Vierfache beschränkt. Clients mit einem Uploadlimit von 10kB/s oder mehr unterliegen keinen Downloadbeschränkungen. Die Begrenzung wird im Clientprogramm vorgenommen, ließe sich also durch dessen Veränderung umgehen, allerdings würde dies von den Servern mit einem Rauswurf quittiert.

Außerdem bietet jeder Client mindestens drei Uploadplätze, es ist also nicht möglich, mehr als Uploadlimit/3 kB/s pro Platz einzustellen.

Es gibt noch eine weitere Begrenzung: Die maximale Dateigröße im Netz beträgt 256GB (274877906944 bytes). Die ältere Begrenzung (bis zu eMule 0.46 und aMule 2.1.0) lag etwas unter ca. 4GB (genauer: 4294967295 bytes, obwohl aMule nur Dateigrößen bis zu 4290048000 bytes unterstützte).

Zusätzlich, und zwar nicht als eD2k-Beschränkung, sondern als Begrenzung durch die Server, liefern diese nur 300 Ergebnisse pro Suchanfrage, von daher sollte man auch nicht mehr als 300 Ergebnisse erwarten.

Vom Client her werden Dateinamen normalerweise auf 161 Zeichen begrenzt.

Gibt es Beschränkungen im Kademlianetzwerk?

  • Weil es sich aus dem eD2k-Netz ableitet, gilt auch im Kademlianetzwerk zur Beibehaltung der Kompatibilität bei der einheitlichen Dateienbestimmung die Begrenzung der Dateigröße auf höchstens 256GB.
  • Gleiches gilt für die Begrenzung auf 161 Zeichen.

Für welche Dateitypen stehen jeweils die einzelnen Filter im Suchfenster?

Es ist zu beachten, dass die Filter im Suchfenster nicht nach dem tatsächlicne Inhalt, sondern nach der Dateinamenserweiterung gehen. Die Zuordnung ist folgende:

  • Archive: .ace .arj .rar .tar.bz2 .tar.gz .zip .Z
  • Audio: .aac .ape .au .mp2 .mp3 .mp4 .mpc .ogg .wav .wma
  • CDImage: .bin .ccd .cue .img .iso .nrg .sub
  • Bilder: .bmp .gif .jpeg .jpg .png .tif
  • Programme: .com .exe
  • Videos: .avi .divx .mov .mpeg .mpg .ogg .ram .rm .vivo .vob

Ein Film, der fälschlicherweise "Geburtstag.gz" benannnt ist, wird also unter den Archiven und nicht unter Videos einsortiert.

Was ist eine Quelle?

Eine Quelle ist ein Client, der einen noch nicht fertiggestellten Chunk einer Datei anbietet, die in der eigenen Downloadliste steht. Je mehr Quellen man für eine Datei bekommt, desto mehr Möglichkeiten zum Download hat man und um so schneller wird der Download wahrscheinlich beendet sein.

Zu berücksichtigen ist aber, dass es einen Unterschied zwischen "Quellen" und "nutzbaren Quellen" gibt, wenn man nur eine niedrige ID hat: "Quellen" sind Clients, die ein Stück der Datei anbieten können, das man noch nicht hat, aber nur "nutzbare Quellen" sind solche, von denen man auch tatsächlich herunterladen kann (die also eine niedrige ID haben).

Was hat es mit diesem ganzen Krempel (Credits, Bewertungen, Ratings, Warteschlangen) auf sich?

All diese Konzepte haben mit der Art und Weise zu tun, wie im ED2k-Netzwerk die Uploadwarteschlangenprioritäten ermittelt werden.

Die Bewertung ist der wichtigste Wert: Der Client mit der höchsten Bewertung wird der nächste sein, der einen Uploadplatz bekommt. Die Bewertung wird wie folgt berechnet: Bewertung = (Rating * Wartezeit[s]) / 100

Um das zu verstehen, muss erstmal geklärt werden, was unter dem Rating zu verstehen ist:

Das Rating ist eine objektive Bewertung. Also eine Bewertung unabhängig davon, wie lange ein Client bereits in der Uploadwarteschlange wartet. Wenn sich ein Client in die Uploadwarteschlange einreiht, bekommt er eine Rating von 100 zugewiesen. Danach wird dieser Wert wie folgt verändert:

Abhängig von den Credits des Clients wird die Rating mit 1 bis 10 multipliziert. Entsprechend der Dateipriorität wird sie mit 0.2 bis 1.8 multipliziert (Release 1.8, Hoch 0.9, Normal 0.7, Niedrig 0.6, Sehr niedrig 0.2).

Sehr alte Clients, die das Netzwerk zu sehr belasten, werden durch eine halbierte Bewertung gebremst.

Verbannte Clients bekommen keine Bewertung (bzw. ihre Bewertung wird mit Null multipliziert).

Diese Multiplikatoren werden als "Modifikatoren" bezeichnet. Clients mit einem Modifikator größer als Eins werden mit einem gelben Stern im Icon gekennzeichnet.

Bleiben also nur die Credits. Credits sind die Belohnung, die man für den Upload an einen anderen Client bekommt. Credits werden jeweils zwischen zwei Clients ausgetauscht, nicht global. Die eigenen Credits kann man also nicht einsehen, wohl aber die aller anderen Clients (also die Credits, die man dem jeweiligen Client schuldet). Da Credits vom hochladenden Client verwaltet werden (sie sind in der clients.met zu finden), kann es passieren, dass man keine Credits bekommt, wenn der empfangende Client dies nicht unterstützt, dieser aber trotzdem beim eigenen Client welche bekommt, wenn er etwas hochlädt.

Der Credits Modifikator für das Rating ist der niedrigere dieser beiden Werte: (Gesamtupload[MB] * 2) / Gesamtdownload[MB] und Wurzel_aus(Gesamtupload[MB] + 2)

Ist das Ergebnis kleiner als Eins, wird es auf Eins gesetzt und wenn es größer als 10 ist, wird es auf 10 gesetzt. Zusätzlich wird, wenn der Gesamtupload kleiner als 1MB ist, der Modifikator auf Eins, wenn der Gesamtdownload Null ist, auf 10 gesetzt.

Was ist ein Uploadplatz?

Wird ein Dateistück hochgeladen, wird die Uploadbandbreite (die von der verwendeten Verbindung und dem eingestellten Uploadlimit abhängt) für einzelne Plätze aufgeteilt, so dass mehrere Chunks zugleich an verschiedene Clients hochgeladen werden. Wie unter "Gibt es Grenzen im ED2k-Netzwerk?" nachzulesen, stellt jeder Client mindestens drei Uploadplätze zur Verfügung.