- 2008年7月22日 00:44
- 研究
-
「Measurement, Modeling, and Analysis of a Peer-to-Peer File-Sharing Workload」という論文のアブストラクトを読みました。
■著者
K. Gummadi, R. Dunn, S. Saroiu, S. Gribble, H. Levy, and J. Zahorjan
■出典
In Proc. of SOSP ’03, Bolton Landing, Oct. 2003
以下、アブストラクト原文です。(少し長め)
Peer-to-peer (P2P) file sharing accounts for an astonishing volume of current Internet traffic.
This paper probes deeply into modern P2P file sharing systems and the forces that drive them.
By doing so, we seek to increase our understanding of P2P file sharing workloads and their implications for future multimedia workloads.
Our research uses a three-tiered approach.
First, we analyze a 200-day trace of over 20 terabytes of Kazaa P2P traffic collected at the University of Washington.
Second, we develop a model of multimedia workloads that lets us isolate , vary, and explore the impact of key system parameters.
Our model, which we parameterize with statistics from our trace, lets us confirm various hypotheses about file-sharing behavior observed in the trace.
Third, we explore the potential impact of localityawareness in Kazaa.Our results reveal dramatic differences between P2P file sharing and Web traffic.
For example, we show how the immutability of Kazaa's multimedia objects leads clients to fetch objects at most once; in contrast,a World-Wide Web client may fetch a popular page (e.g., CNN or Google) thousands of times.
Moreover, we demonstrate that:
(1) this “fetch-at-most-once” behavior causes the Kazaa popularity distribution to deviate substantially from Zipf curves we see for the Web, and
(2) this deviation has significant implications for the performance of multimedia file-sharing systems.
Unlike the Web, whose workload is driven by document change, we demonstrate that clients' fetch-at-mostonce behavior, the creation of new objects, and the addition of new clients to the system are the primary forces that drive multimedia workloads such as Kazaa.
We also show that there is substantial untapped locality in the Kazaa workload.
Finally, we quantify the potential bandwidth savings that locality-aware P2P file-sharing architectures would achieve.
以下、僕による日本語訳です(疲れた・・)
P2Pファイル共有は、現在のインターネットトラフィックのうち、驚くべき量を占めている。
本研究では、現在のP2Pファイル共有システムと、それらを後押しする影響力について深く調査する。
そうすることにより、P2Pファイル共有の負荷と、それらによって引き起こされる未来のマルチメディア負荷についての理解を深めることを目的とする。
我々の研究は3階層のアプローチを用いている。
第一に、ワシントン大学で200日間に渡って集められた、20テラバイト以上のKazaaトラフィックを分析する。
第二に、私たちを孤立・変化させるマルチメディア負荷のモデルを開発し、重要なシステムパラメータの影響を調査する。
調査による統計によってパラメータ化された我々のモデルは、調査で得られた様々なファイル共有の振る舞いに関する仮説を検証可能にするものである。
第三に、Kazaaにおける局所性認識の影響の可能性を調査する結果により、劇的な違いがP2Pファイル共有とWebトラフィックの間にあることが明らかになった。
たとえば、我々は、Kazzaのマルチメディアオブジェクトの普遍性が、クライアントが多くても一回だけオブジェクトを取得すればよい状況をどの用に生み出すかについて紹介する。
それとは対照的に、WWWクライアントは有名なページ(CNN、Googleなど)を何千回もダウンロードする。
さらに、私たちは以下を実演する。
(1)「fetch-at-most-once」という振る舞いが、私たちがWebで確認したZipf曲線を大幅に避けるためのKazaaの人気分散(?)を引き起こす。
(2)その結果が,マルチメディアファイル共有システムの性能に大きな影響をあたえる。
ドキュメントの変更によって負荷が引き起こされるWebと違い、クライアントの「fetch-at-most-once」の振る舞いと、新しいオブジェクトの生成、新しいクライアントの追加が、Kazaaのようなマルチメディア負荷を後押しする原因となることを実演する。
また、Kazaaの負荷において、かなりの未利用の局所性が存在することもしめす。
最後に、局所性に基づいたP2Pファイル共有アーキテクチャが実現する帯域節約の可能性を定量化する。
P2Pファイル共有システムとWebのトラフィックの間には大きな違いがあるようです。
Webのコンテンツはすぐに更新されるが、ファイル共有システムに一旦アップロードされたファイルはずっと一緒。
その結果、Webでは一部の有名なページがトラフィックの大部分を占めてしまうのですが(ジップ曲線:k番目に多い要素が全体の1/kを閉める)、P2Pファイルシステムではファイルの人気は一様に分布するそうです。
Kazaaは確かSkypeの前身にあたるファイル共有システム。
使ったことはないので「局所性」という言葉が何を指すのか、僕にはまだわかりませんでした。
Kazaaについて、今度少し調べてみようかと思います!