ハドゥープが意味するものは?(中編2)

前編 / 中編1 / 中編2 / 後編

So if you have 10 elements in your list, you can invoke the mapping function on all 10 elements on one computer. Or you can divide the list into two parts, and invoke the mapping function on five elements on each of the computers. Or you can divide the list into 10 parts, and invoking the mapping function once on each of 10 computers. The results will be the same, and will be combined intelligently by the "reduce" function.

もし、君のリストに10の要素があったら、1台のコンピュータで、10のすべての要素にマッピング機能を呼び出だすことができる。あるいはリストを2つに分けて、5の要素をそれぞれのコンピュータでマッピング機能を呼び出すこともできる。それとも、リストを10分割して、10台のコンピュータでそれぞれマッピング機能を1度呼び出してもいい。結果は同じになるだろう、それを「リデュース」機能をつかって、うまく結合させる。

Or if you're Google, you can invoke the mapping function once on each of their hundreds of thousands of computers. A Google employee doesn't need to specify which computers will invoke the function, or how many items are being invoked on each computer. However, that employee will discover that thanks to the magic of a huge server farm and MapReduce, operations execute very, very quickly.

あるいは、君がグーグルだったとしたら、10万台のパソコンで、それぞれマッピング機能を呼び出すこともできるね。グーグルの社員は、どのコンピュータでその機能を呼び出されるだろうか、それともそれぞれのコンピュータで、いくつのアイテムが使われているかを特定する必要はない。それでも、グーグルの社員は巨大なサーバー工場とマップリデュースのマジックのおかげで、操作するのが非常に、非常に早いことを発見するだろう。

Now, all of this is great news for Google employees, and bad news for all of us with only a few computers at our disposal. But it turns out that the Apache Software Foundation sponsors an open source version of MapReduce, known as Hadoop, named for the primary author's childhood stuffed elephant. Hadoop allows you to specify that one or more computers are ready and willing to perform a processing operation; when you invoke MapReduce on one computer, the others are drafted into service.

これらの全部はグーグルの社員にとってすばらしいニュースだ。それと同時に、我々が処理した数台のコンピュータだけで、我々すべてにとって悪いニュースになる。しかしそれで、アパッチ・ソフトウェア財団がマップリデュースのオープンソース版を支援していることがわかる。そのオープンソースはハドゥープと知られていて、制作者の子供の頃のいちばんのおもちゃの象からつけられている。ハドゥープは1台か、あるいは数台のコンピュータが、操作処理を実行する準備がすっかりできていることを明確にすることができる。そして、1台のコンピュータにマップリデュースを呼び出したときに、ほかの人はサービスを選び出す。


前編 / 中編1 / 中編2 / 後編