バリアンの「計量経済学のための新しい方法」をアブストラクトだけ適当に訳してみた

BigData: New Tricks for Econometrics

http://people.ischool.berkeley.edu/~hal/Papers/2013/ml.pdf

 

アブストラクト

今日、コンピュータは最も経済的なトランザクションを仲介している。「このコンピュータに仲介されたトランザクション」はたくさんのデータを作り、新しいツールがこのデータを操作したり、分析したりすることに使われている。このエッセーではいくつかのツールや方法をまとめて紹介するものだ。

 

コンピュータはたくさんの経済のトランザクションを含み、トランザクションと関連したデータをとらえることができる。そのとき操作や分析が行われる。これまでの回帰分析のような統計や経済の技術は上手くいっていることが多かったけど、ユニークな異なるツールが求められることになるビッグデータのデータセットには問題が出てくる。

 

第一に、データの大きなサイズが含まれるとき、よりパワフルなデータを操作するツールが必要になる。第二に、予測に適切な変数の選択のようなものをする必要があるけれど、そんなものより潜在的な予測因子を得られる。第三に、巨大なデータは簡単な線形モデルより柔軟な関係を許す。決定木分析や、SVMSupport Vector Machine)、ニューラルネットなどの機械学習のテクニックは複雑な関係に対して、より効果的な方法を持つモデルを許可する。

 

このエッセーで、ビッグデータを操作したり、分析するツールを着ていこうと思う。このモデルはたくさんのものを提供するし、広範囲に知られているし、計量経済学にも使われている。事実、今日の大学院生へ普通にアドバイスするときは、「コンピュータ科学を学ぶ学部へ行け、そして機械学習の授業を取れ」と言っている。先の10年でのコンピュータ科学と統計学の実りあるコラボレーションであり、僕は将来的にコンピュータ科学と計量経済学もまた生産的なコラボレーションになることを期待している。

(以上)