社会科学において衛星リモートセンシングはマイナーな手法であるが,その応用可能性は多大にある. 機械学習を架け橋として,衛星画像と既存の調査データを組み合わせることで,これまでにない粒度で社会を知ることができるようになる. 社会調査が行われていない地域の状況を知りたい場合や,既存の社会調査よりも細かい状況を知りたい場合は,衛星データが有用である.
社会を知るためのデータ収集法(社会調査)は,質問紙調査,実験,インタビュー調査などが主流です. 個人レベルの意識や思想,社会的地位,経歴を詳しく尋ねることができるという点において,これらの手法はとても有用だと考えられます. それに比べて,衛星リモートセンシングでは,それらのような個人レベルの細かい情報は測定することができません. 衛星リモートセンシングで知ることができるのは,地表の状態(光の反射や,マイクロ波の後方散乱)です. となると「衛星リモートセンシングを社会科学で用いるメリットってあるのか?」と思われるかもしれません. 衛星リモートセンシングによりデータ収集する意義は以下のようなものです.
まだまだ社会科学領域において,衛星画像を応用した研究は多くはありません.
とはいえHall (2010)や
Sherbinin et.al (2002)
のような社会科学におけるリモートセンシング応用に関するレビュー論文は存在します.
社会科学領域においてもリモートセンシングを用いた研究には一定の蓄積があるようです.
社会科学におけるリモートセンシングの応用例の一部を紹介します(以下).
衛星画像そのものには,あまり実社会的な意味がないと感じます.
たとえば,光学衛星が観測した近赤外線の画像があったとします.
この画像を見れば「地点Xでは赤外線がたくさん反射している」ということがわかります.しかし,その画像にはあまり解釈可能性がありません.
社会科学的な分析をしたい身としては嬉しくありません.
「地点Xでは赤外線がたくさん反射している」ということは,社会のどういう状況・状態を意味しているのか? という情報が知りたいわけです.
単体では解釈可能性が低い衛星画像が,実社会的な変数(たとえばコメの収穫量や水田耕作率)と結びつくことで,社会科学的な変数と結びつけて分析する意義が高まります.
「農業人口が1人増えると,近赤外線の反射はX変化する」といわれるよりも,「農業人口が1人増えると,コメの収穫量はX(kg/a)変化する」という方が圧倒的に意味深いでしょう.
現実社会で意味を持つ変数(地域レベルの所得や格差,営農状況など)と関連をもつ指標を衛星画像から作り上げることがとても重要だと感じています.
単体では解釈可能性の低い衛星画像を,解釈可能性の高い実社会的な変数に変換する架け橋として機械学習ないしは統計的モデリングがとても重要です.
私自身,社会科学においては解釈性の高い統計モデル(直線を引く回帰分析)さえ作れれば十分だと思っていました.
というのも,社会科学は「フィッティングの良さ」を追い求める学問ではないからです.
あくまでも「説明」に重きを置きている学問体質です(私はそう認識しています).
つまり,社会科学においては説明変数と目的変数の関連度合いに関心を知ることが目的なのであって,説明変数(入力特徴量)によって目的変数(出力)を予測することは目的ではないということです.
このように考えていたため,解釈可能性に乏しいフィッティング重視の機械学習手法(たとえばDNN)は社会科学には必要ないと考えていました.
しかし,衛星画像を社会科学に活かそうとすると,フィッティング重視の機械学習手法も必要になってきます.
衛星画像を使って,できるだけ高い精度で社会状況を予測したいというモチベーションの場合,解釈可能性はもはや重要ではなく,当てはまりの良さが最重要になります.
機械学習に関する知識を会得することは,リモートセンシングを研究に取り入れる上で必須スキルだと思います.
昨今の機械学習はとても複雑で,私自身「何が何だか」という部分も多いです.
しかし,目標とする水準が達成できさえすれば,古典的なモデルでも何も問題ありません.
実際,リモートセンシング関連論文において,新規的なモデルを使っている例はそこまで多くはない印象です.
また,難しそうなモデルと古典的なモデルで,あまり予測性能に差がないというものも見受けられます.
強そうなモデルを使うことで絶対的に成功するわけではないということです.
ただし.時代の潮流に取り残されないように,できるだけ食らいついていった方がいいかもしれません.
既存の社会調査の粒度は必ずしも高くはありません.
ここでいう粒度とは地域区分のことで,都道府県レベルだとか市区町村レベルだとか郵便番号レベルだとか,というものです.
「この変数,市区町村レベルのデータならあるけど,本当はもっと細かい地域区分のデータが欲しいなぁ」ということがしばしばあります(私の修論).
また,社会調査が行われていない地域の社会状況を明らかにしたいこともあるかもしれません(現時点で私は経験していない)
(発展途上国では社会調査がそれほど行われていない,もしくは,行われていても杜撰だったりすることがあるようです).
そんなときにリモートセンシングが役立ちます!
具体的な研究例としてMizra et.al (2020)を紹介します.
この研究の目的は,所得格差(ジニ係数)を予測する手段として夜間光画像を用いるというものです.
「所得が高い地域ほど1人あたりの放射光量が多い」と仮定し,所得と夜間光の関連に着目しています.
この研究では,まず,国ごとの夜間光と経済格差のトレンドに着目した分析を実施しています.
人口データと夜間光画像を組み合わせて各グリッドの1人あたりの放射光量を計算し,その値を用いて国ごとの放射光量のジニ係数を算出しました.
国ごとの夜間光のジニ係数を,それを同じく国家ごとの所得格差(所得にジニ係数)とマージして相関を見てみると,中程度の正の相関(r=.44)が得られました.
つまり,放射光量の格差が大きい国ほど,経済的な格差も大きいということです.
経済格差の代理変数として夜間光のジニ係数が有用である可能性を示しています(代理変数とするなら,もっと強い相関があった方がいいと思うが).
また「経済格差 ~ 夜間光格差 + 人口 + GDP」とした回帰モデルを作成したところ,決定係数は.73となり,経済格差の大部分が説明できるようになりました.
さらに,米国の州レベルでも,やはり,経済格差と夜間光のジニ係数との間には有意な正の相関があることが検出されました(r=.5).
このように夜間光は,所得格差を定量化するための手掛かりとして用いることができます.
夜間光データを駆使することで,調査が実施されていない地域レベルの格差を明らかにすることができます.
同時に,筆者らは,社会調査が行われていない地域の経済格差を予測できる可能性についても示唆しています.
Email: yuhei.yamaguchi.t1@dc.tohoku.ac.jp
𝕏
Instagram
Github
RPubs