2015年2月22日日曜日

モザイク図の効用

 朝食を食べている子どもほど学力が高い。「朝食パワーで学力アップ!」。よく聞くところですが,両者の相関が疑似相関である可能性が高いことは,多くの人が見抜いているところでしょう。

 最新の全国学力テストのデータから,小6児童のクロス表をつくると下表のようです。横軸が朝食の摂取頻度の群,縦軸は算数Bの正答率の四分位群を意味します。A層は上位4分の1・・・D層は下位4分の1の児童です。ここでは,正答率の個人分散が大きい算数Bの成績に注目しています。


 朝食を食べているa群では学力上位のA層が最も多く,他の3群ではD層が最多です。D層の割合は,a群では18.3%,b群では30.7%,c群では41.2%,d群では47.7%となっています。朝食をまったく食べない群では,半分近くが正答率D層であることが知られます。言わずもがな,A層の比率はこれとは逆の傾向です。

 朝食摂取頻度と学力の間に明瞭な相関関係があるのは明らかですが,これが「朝食食べる→学力アップ」の因果関係を表すとは限りません。最下段の合計をみると,朝食を食べないc群やd群の児童はごくわずかです。ちゃんと勉強できる環境が整っていない貧困家庭の児童・・・。こんな疑いが持たれます。

 上表のデータをグラフにするときは,それぞれの群の量的規模,すなわち各群の置かれた文脈を考慮しなければなりますまい。ここで,最近私がハマっているモザイク図が役に立ちます。クロス表の各セルの量を四角形の面積で表現する図法です。


 上の①は,当局の白書などによく載っている普通の帯グラフですが,これをみるととてもクリアーな傾向で,朝食摂取と学力の間には明瞭な相関,ひいては因果関係までがあるかのように思えますね。

 しかし,下の②のモザイク図をみると,印象が変わります。調査対象児童のほとんどはa群であり,朝食を食べていないc群やd群の子どもはマイノリティーです。「朝食を食べない」と「正答率が低い」という特性は,家庭の貧困のような共通の地盤から出ているものと察せられます。ゆえに,両者の相関は「見かけ」のものであると。

 食育啓発のポスターでは①のグラフが載っていることが多いのですが,私は②のほうを載せたほうがいいのではないかと思います。それが無理なら,せめて各群のN(サンプル数)を添えるべきかと。

 師匠の松本良夫先生は,社会階層と非行親和性の関連を図示するにあたって,このモザイク図を使われています。たとえばブルーカラー層の子弟であっても,ブルーカラー多住地区とホワイトカラー多住地区では,意識や価値観を大きく異にするでしょう。こうした文脈効果に思いをはせる上でも,各群の量を表現するモザイク図は有効です。

 何から何までモザイク図にする必要はありませんが,Nが大きく違っている場合は,この図法にしたほうがよいでしょう。朝食と学力の関連のデータは,この点を教えてくれるよい題材です。