2015年6月15日月曜日

累積相対度数の用途

 昨日,介護職員の悲惨を報じた記事が目につきました。「お昼にコンビニ弁当食べるのが夢 年収230万円・独身44歳男性介護職員の嘆き」というタイトルです。
http://dmm-news.com/article/975585/

 私はこの記事に触発されて,介護職員の月収分布のグラフを2つ発信しました。1つは,単純な構成比(相対度数)の折れ線グラフです。あと一つは,低い階層から積み上げた累積相対度数のグラフです。

 今日の朝,メールを開いたら,後者のグラフの見方がよく分からない,という質問がきていました。「介護職員は,月収20円未満の者が全体の半分を占める」という点を強調するために,累積相対度数にしたのですが,一般には,あまり馴染みのない表現法なのでしょうか。

 グラフに使った元データは,以下です。2014年の厚労省「賃金構造基本統計」から計算した,10人以上の事業所に勤める一般労働者の月収分布です。全体(2216万人),介護職員(70万人),医師(7万人)の分布を明らかにしています。左側は相対度数,右側は低い層から積み上げた累積相対度数です。
http://www.mhlw.go.jp/toukei/list/chinginkouzou.html


 全体を100とした相対度数をみると,最頻階級(Mode)は,介護職員が18~19万円台,全体が20~21万円台,医師が120万円以上となっています。折れ線のグラフにすると,下図のようになります。分布の形状を表すのに使われる,最もポピュラーなグラフです。


 図から分かるのは,医師は高年収,介護職員は低年収のほうに著しく偏していることです。全体の曲線は,中央に山があるノーマルカーブになるかと思いましたが,女性や高齢者も含む分布ですので,介護職員ほどではありませんが,低い側に厚みが出ています。

 このグラフから,年収の大よその水準とバラつきは知ることができますが,「ここまでで全体の何%が占められる」ということは読み取れません。そこで効を発揮するのが,下から積み上げた累積相対度数のグラフです。上表の右欄の数値を折れ線のグラフにすると,こうなります。


 累積相対度数が50%と80%のラインを引きましたが,介護職員の場合,全体の半分が月収20万未満,8割が月収24万未満の層であることが分かります。月収30万になるとほぼ天井に達することから,この水準を超える者はほとんどいないことも知られます。

 簡単にいうと,半分が月収20万未満,8割が24万未満,ほぼ全員が30万未満,ということです。医師は逆に読んで,半分が月収60万以上,2割が月収100万以上と読むとよいかと思います。

 下から積み上げる累積相対度数は,「ここまでの層で全体の何%が占められる」という情報を読み取るのに適しています。タテに線を引いて,月収20万未満が介護職では半分,全体では3割弱を占める,という読み方をしてもよいでしょう。

 昨年の11月20日の記事では,このやり方にて,首都圏内における,情報通信産業(IT産業)従事者の地域集中度を明らかにしたのでした。

 累積相対度数は,中学校の数学の教科書にも載っていますが,こういう材料を使うと分かりやすいかと思っています。私の授業では,学生さんが興味を持ちそうな教材を使うことにしています。度数分布にせよ,教科書に載っているつまらない架空の点数分布のデータではなく,職業別の年収分布などのデータを与えてみると,目の色を変えてグラフを作るものです。