ハドゥープが意味するものは?(中編1)

前編 / 中編1 / 中編2 / 後編

After "map" has applied the function to each list element, MapReduce applies a second function, called (big surprise!) "reduce." The job of "reduce" is to transform the output from "map". This function might do nothing at all, or it might sum the resulting list of numbers, or it might remove those list elements that fail a particular test.

「マップ」をそれぞれのリスト要素のファンクションに適応させて、マップリデュースを次のファンクションに適用させるときに、(なんと驚いたことに!)「リデュース」と呼び出す。「リデュース」のジョブは「マップ」の出力に変換させるためのものだ。このファンクションは全く何もしないかもしれないし、数字の結果リストを合計するかもしれないし、もしくは特定のテストにあてはまらないリスト要素を取り除いてしまうかもしれない。

The key thing to remember with "map" is that it doesn't matter how many parameters are in the list to which it is applied: Each element is handled independently of every other element. This means that "map" can process each element in the order that it is given, or backwards, or even -- and here's where it gets amazing -- on multiple computers, with each computer processing one or more elements from map's input list.

「マップ」を覚えるときに大事になってくることは、「マップ」はリストの中にあるパラメーターが、どれだけの数が適用しているものなのか気にしなくてもいいということだ。というのは、それぞれの要素は、ぜんぶ異なっている要素して、独立して処理する。このことの意味は、「マップ」はそれぞれの要素を、与えられた順番や、その逆でも、もっと他の方法でもプロセスできるということでーーそして驚くべきところはーー複数のコンピュータにおいて、「マップ」の入力リスト中から、1つでも、複数の要素でも、それぞれのコンピュータを使って処理するところだ。


前編 / 中編1 / 中編2 / 後編