人生のメモ

琴線に触れた小さなことを、文章に。

ネット依存と飲酒・喫煙の因果関係

「ネット依存」が疑われる中高生は、飲酒や喫煙をよくする生徒ほど該当する割合が高い。そんな結果が、厚生労働省の分析でわかったそうだ。…本当にそうだろうか?

「ネット依存」の中高生、飲酒・喫煙傾向 厚労省が分析:朝日新聞デジタル

ネットをやるから酒タバコをやるのか?酒タバコをやるからネットをやるのか?客観的に見て、あまり因果関係があるとは思えない。厚生労働省の調査と言われると信じてしまいそうになるが、極めて怪しい。

この記事に対して多くの懐疑的コメントが寄せられているように、恐らくどちらでもないだろう。普通に考えれば、真面目に勉強するような学生はどっちも控えそうだし、怠け者はどっちも好きそうだ。

競馬で見つける因果関係

因果関係というものは、なかなかに難しい。僕は以前、競馬で儲けたいと思い、データ分析にチャレンジしたことがある。もう心から働きたくなくなったのだ。今もだが。

と言っても競馬もデータ分析も初心者なので、大した調査はできなかったし、儲けるところまではいかなかったのだが、調査自体はそれなりに面白かった。

競馬では、馬の人気、年齢、体重、出場回数、騎手、コースなどの様々な要素がある。利益(回収率)を最大化するためには、どの要素が関係するのかを調査する。統計的に見て因果関係がわかれば、儲かる買い方がわかるわけだ。

関係の有無を見分けるのは難しい

当時の記憶ベースになるが、例えば単勝回収率だと、人気が1位の馬より、4〜8位ぐらいの馬の方が回収率が高い。多くの人が人気の高い馬を好んで買うが、回収率目線で見れば間違っている。これは、人気がない馬の方がオッズが上がる一方で、勝率そのものは人気と必ずしも比例しないためだ。

他にも数年単位でデータを調べてみると、年齢が5歳の馬が回収率が安定していたり、前回の順位が4位ぐらいの回収率が良かったりした。中には、複数組み合わせると、直近5年では毎年回収率が120%近くなる要素もあった。

しかしそれらの傾向は、調査の期間次第でも大きく変わる。直近の5年で見れば因果関係がハッキリ出ているように見えても、10年で見るとそうでもなかったりする。

過去のデータ上はどんな魅力的な結果でも、未来で通用しなければ意味がない。このあたりのリスクを取れる人が本当のギャンブラーなのかもしれないが、社畜サラリーマンの僕には厳しく、断念した思い出がある。

思わぬところで繋がるものもある

そのように、パッと見では何と何が因果関係があるのかはわからないし、そもそも調査要素が足りているのか不足しているのか、それぞれの要素が独立しているのか相互作用を起こしているのかなど、人の目では正直わかりにくい。

有名な話で、「おむつを買った人はビールを買う傾向がある」というものがある。「子供のいる家庭では母親は紙おむつを買うように父親に頼み、店に来た父親はついでに缶ビールを購入していた。そこでこの2つを並べて陳列したところ、売り上げが上昇した」というものだ。

おむつとビールという、一見無関係に見えるものも、こうして繋がることもある。そういう意味では、調査する対象を見逃している可能性は十分にある。冒頭のネット依存と酒タバコの例で見ても、他の要素の調査が進めば、繋がりが見えてくるだろう。

今、IoTによる情報収集量の増加に加え、人工知能の発展も進んでいる。これらのテクノロジーの活躍により、今後は世の中の知られざる因果関係が、次々と明らかになっていくのかもしれない。