【更新中】Rに関する個人的メモ

Published:

最終更新:2023年3月2日

以下、大幅に更新予定

はじめに

このメモはRの利用に関しての個人的な備忘録です。著者と似たような以下のバックグラウンドの方にも役立つ内容かもしれません。

  • STATAやMatlabを使ってきたものの、諸々の事情によりRを使う必要性が出てきた
  • 経済学においてマイクロデータを活用した実証研究を行っている。特に因果推論や構造推定など。

あくまで備忘録ですので、リンクやメモの羅列になっています。気が向いたら整理してもう少しノートらしくするかもしれません。

この資料に従って発生した損害等についてはいかなる責任も負いませんのでご了承ください。

不完全な点、誤り、そしてSuggestionなどあれば、メール頂けると大変喜びます。

Rリソースへのリンク集

データの加工

  • To be added.

記述統計

  • To be added.
  • 著者はstargazerをずっと使ってましたが、最近Updateされない&tibble()を受け付けないので、他のものに移ろうかなと思っています。オススメがあればこっそり教えて下さい。

回帰分析

RCPP

並列計算

  • “Using Rstudio Jobs for training many models in parallel”
    • Rstudio のJob Panelを使うと、Script複数を同時に回せる。
  • 【加筆予定】foreachで乱数を使う際にはdoRNGを使いましょう。
    • https://htmlpreview.github.io/?https://github.com/berkeley-scf/tutorial-parallel-basics/blob/master/parallel-basics.html の Section 5.1.2を参照
    • https://s3.amazonaws.com/assets.datacamp.com/production/course_6245/slides/chapter4.pdf from Parallel Programming in R

SQL

Rmarkdown

RCPPをパッケージ化する。

RCPPをパッケージ化し、インストールする方法です。RCPPで書いた関数を並列計算(例えばforeachのループの中)で使うためには必須です。

  1. 下準備として以下のものをインストールする。
    • Windowsの場合は Rtoolをインストールします。
    • Rcpp パッケージをインストールします。
    • devtoolsパッケージをインストールする。
  2. Rcpp::Rcpp.package.skeleton("PackageName") をコンソールにタイプする。そうすると、PackageNameという名前のフォルダができる。
  3. 当該フォルダの中にあるsrcフォルダに行く。そこに.cppファイルを追加する。もしくは、rcpp_hello_world.cppファイルを編集する。
  4. R上で、Rcpp::compileAttributes("PackageName") をする。
  5. R上でdevtools::build("PackageName")を実行する。そうすると、PackageName_XXX.tar.gzファイルができる。XXXにはバージョン番号が入る。この圧縮ファイルはポータブル。
  6. devtools::install_local("PackageName_XXX.tar.gz")として自作パッケージをインストールする。使う際には、require()library()で通常のパッケージと同様に扱ってやればOK。