« 昨日付けの朝日新聞よ | メイン | ○んじゅう、牛丼、曙 »
2004年03月19日
平均年収じゃなくて、年収のモード(最頻値)
平均という言葉が世の中でよく使われるが、平均値というのは、おおまかにいうと代表値の一つにすぎない。代表値に関して、簡単に述べたページを見ていただくと、大きく分けて、「平均値」「最頻値」(モード)「中央値」の3つがあることがわかる。
平均値・・・全ての個体のデータを合計し、個体数で割った値
最頻値・・・データのなかで最大の度数をもつ、最も多く現れている値
中央値・・・n個のデータを大きさ順に並べたときのその真ん中の値
サイコロを多数回投げたときのような、全くランダムな場合には正規分布を描き、この3つの値は一致するが、左右対称性が崩れた分布では、3つの値は必ずしも一致しない。だから、使い方によっては平均値に全く意味がない場合が起こる。たとえば、閣僚資産の平均などそのいい例。一人おぼっちゃん閣僚がいると、その人一人のおかげで、平均値は大きく右にずれる。要は、平均値などの代表値をあまり「神格化」せず、全容を見ようとする努力が求められる。
『フルハウス~生命の全容 4割打者の絶滅と進化の逆説』(早川書房)は、平均値や最大値など分布の一部をあまりに重要視すると、現象を正しく判断できないよ、と説いた本である。「4割打者の消滅」というのは、アメリカのメジャーリーグで近年、4割打者が出ていないことの分析である。その結果は普通、「打撃力が落ちた」とか、「現代人はなよなよしてきた」とか、マイナスの結果としてとらえられると思う。しかし、そんな見方は、打率の最大値を過度に重視した間違った見方であると作者は指摘し、逆にプラスの結果であると導く。具体的なデータに基づいた論理は読んでいて気持ちがいいし、統計を見る際に気をつける点も網羅されている。

そういえば、就職四季報などに各企業の平均年収なんてものが載っているけど、実は僕らが知りたいのは、年収のモードではないだろうか。全社員の収入分布がわからないわけだから、分布が正規分布を描いているなんて保証はどこにもない。むしろ、右側に尾を引いた非対称分布であると思われる。そうすると、先ほどのページの下側をみていただけばわかるように、平均値は最頻値よりも右側にあるのだ。つまり、大半の人の収入、つまり、年収のモードよりも平均値は高めに出てくる。

「平均」という言葉を聞いたら、まず正規分布がどうか疑うことが必要であるということをつくづく感じた。
投稿者 zackie : 2004年03月19日 01:00
このエントリーのトラックバックURL:
http://www.zackie.biz/blog/mt-tb.cgi/900
