Wie ist das eigentlich mit dem benöen Space?
In der netten Googletech Präntation hat Dominik schörklä, dass es durch die Benutzung der erasure-codes ausreicht eine Datei 5,xx mal im p2p-Netzwerk zu lagern um einen stäigen Zugriff sicher zu stellen (anstatt 20-fach beim "normalen" Verfahren).
Das ist ja super, dass soviel Platz eingespart wird. Trotzdem müdoch demnach jedes File in wuala eben 5fach kopiert werden. Wenn wir jetzt mal kaufspace ausser Acht lassen und davon ausgehen, dass auf Dauer die am p2p teilnehmenden so im Schnitt auf 40-50% Onlinezeit kommen (was jetzt eine reine Hausnummer ist), dann düdem Netzwerk doch insgesamt maximal das doppelte an Speicherplatz in Relation zum Platz den die User verbrauchen düzur Verfüstehen.
Aber eigentlich müdoch der 5fach Platz benöt werden. Oder habe ich da irgend etwas komplett flasch verstanden? Wenn ich das richtig verstanden habe, wo kommt denn da der benöte Speicherplatz her?
The more people who ask this question, the more it gets noticed.
Get Satisfaction loves Zappos because they care about customer service.
-
Inappropriate?Unter anderem gehe ich davon aus, dass Dateien mit gleichem Hashwert erkannt werden, auch wenn sie in einem privaten Ordner liegen. Vielleicht optimiert Wuala im Hintergrund auch die Speicherstrategie, z.B. köe ein als zuverläig bekannter Node quasi füder 3 der 5 Kopien zäen.
Schafft man es z.B. eine Datei auf einem 99% Node und einem 90% Node unterzubringen hat man nur mehr eine 0,5% Wahrscheinlichkeit sie nicht zu finden - zum Vergleich: Fü gleiche Verfüeit müman sie (nach meiner Denkart) auf 28 oder 29 17% Nodes unterbringen.
Ich gehe aber davon aus, dass Wuala immer knapp an Speicherplatz sein wird und es nie schaffen wird säliche Dateien optimal zu verteilen, wenn jeder sein Speicherlimit ausnutzt. Ich nutze aber z.B. auch schon mal derzeit nicht 10 GB von meinem Speicherplatz also fallen damit sowohl die 5x,xxx GB Speicher auf anderen Computern weg sowie die dadurch entstehenden Speicherboni bei den Sharing Nodes (sorry Leute! ;-) Aber derzeit kriegt man meist eh nichts gutgeschrieben...)
Es ist wohl anzunehmen dass der Alphatest auch dazu da ist zu üüie stark Dateien wirklich verteilt werden mü(bei einer 95% Verteilung braucht man vermutlich nur mehr 3,1415... oder noch weniger Kopien), wie stark die Leute ihre Speicherlimits ausreizen und wie stabil das Netz an sich lät.
Eine offizielle Antwort von Dominik oder Luzius (oder anderen Devs!) wä aber natü trotzdem sehr interessant! -
Inappropriate?Merzi.
Igendwo wird sich das sicher statistisch mittel. Nur ob dass dann wirklich 1:1 aufgehen kann?
btw:
quote > Unter anderem gehe ich davon aus, dass Dateien mit gleichem Hashwert erkannt werden..
Das sollte es nicht geben, selbst wenn identische Dateien von mehreren Leuten hochgeladen werden. Da die Dateien auf den lokalen Rechnern verschlü werden, müdie verschlüen Dateien wegen der verschiedenen Schlüauch verschiedene Hashes haben.
(Wir sind alle Individuen. "Ich nicht")
I’m happy
-
Inappropriate?Naja, laut Luzius:
When inserting a file, it gets encrypted with a key that is generated from the hash (SHA-256, not MD5) of its content. That way, files with identical content will get encrypted the same way and we can still detect them as duplicates even after encryption. This saves storage, but it might allow others to find out if your computer is storing or accessing a file whose content is known.
Quelle: http://getsatisfaction.com/wuala/topi... -
Inappropriate?oha. Das ist gut fü Netzwerk. Dann müdas bei dem üen Verhalten der warezmenschen fast hinkommen mit 1:1. :D
Prinzipiell schlecht aus Sicherheitssicht. Aber der Artikel den Du gelinked hast beruhigt auch wieder. Das ist so genug Sicherheit fü üen gesetzestreuen Staatsbü
I’m happy
-
Inappropriate?sorry dass wir hier nie geantwortet haben. bin grad drüber gestolpert und gebe rasch zwei stichpunkte, beide bereits von bugreport erwähnt:
1. wie oben erwähnt werden files mit einem key verschlüsselt, der sich aus dem hash key des files ableitet. von daher können duplikate erkannt werden, ohne den inhalt zu kennen.
2. wie von bugreport schon erwähnt, wird beim upload und bei der maintenance darauf geschaut, wo die fragmente landen. wenn die auf computer landen, die öfters online sind (bessere uptime), wird weniger redundanz benötigt. es geht also nicht einfach davon aus dass bspw. alle 17% online sind, sondern schaut effektiv auf die online zeit.
gruss,
dominik -
Ist das dann nicht problematisch mit dem aktuellen Onlinezeitalgorithmus? Immerhin könnte ich meinen ~75% Supernode mal einige Zeit ausfallen lassen - bis der unter 50% fällt dauert es trotzdem seeeehr lange! -
Inappropriate?is des leicht schwizerisch wos ihr do schreibts? oda sand do nur zum spaß ob und zua ane bugstobn ausglosn?
Entschuldigt den off topic kommentar, aber das thema wurde ja jetzt ganz gut beantwortet ;-)
I’m kidding
-
den echte allemann (oder a ́de badener wie bei mir), den heasch immer raus. Au wenner nur schreibt. :D -
Hearst hot's di gschmissn, oida? I bin do koa Schwiizer nit! Im Ernst, ich nehme an das Forum hat ein paar Buchstaben gefressen, so oft vertippe ich mich auch wieder nicht.
Loading Profile...
EMPLOYEE




EMPLOYEE
EMPLOYEE

