R

broomパッケージを使ってみる

R

broomパッケージの上手な使い方を考えてる。 library(stargazer) library(broom) library(dplyr) library(ggplot2) res1 <- lm(yield ~ block + N + P + K, npk) res2 <- lm(yield ~ block + N + P * K, npk) # res <- res1 res <- res2 anova(res) res %>% …

続々・複数のファイルを一度に読みこむ方法

r

過去2回の続きでこれが最後(多分)。 複数のファイルを一度に読みこむ方法 - bob3’s blog 続・複数のファイルを一度に読みこむ方法 - bob3’s blog前回、data.table::fread() を foreach で並列化したパターンを追加したのだけど、data.table::fread() はそ…

続・複数のファイルを一度に読みこむ方法

r

前々回の続編。前々回の記事を書いた後の反応にこんなのがありました。foreach (i=list.files)%dopar%fread(i) 的な処理はよくやる https://t.co/x4H4sLqh2E— kato.kohaku.0 (@kato_kohaku) July 7, 2019なるほど、並列化という手があったか。ということで、…

base と Tidyverse と data.table と

r

「恋しさと せつなさと 心強さと」といえば『ストリートファイターII MOVIE』の挿入歌ですね。さて、初心者にRを教えるとき、base準拠にすべきか、Tidyverse準拠にすべきか、という議論があります。 これは私も悩むところでありまして、さらに言えば data.ta…

複数のファイルを一度に読みこむ方法

r

Rで複数のファイルを一度に読み込みたい場合がたまにある。 例えば、売り上げのデータが日付ごとに分かれたファイルに収められているような場合。 しょっちゅう発生するわけでもなく、いつも忘れてしまって調べるのに時間がかかるのでここにメモしておく。こ…

R本体のアップデート時に入れるパッケージ

r

まず最初に必ず入れるパッケージ。 あとは必要になったときに入れれば大丈夫。 install.packages( c( "tidyverse", "data.table", "psych", "vegan", "plotly", "devtools", "colourpicker", # RStudio Addin "ggThemeAssist", # RStudio Addin "styler" # R…

lavaanで作ったモデルからパス図を描く関数

R

Rで構造方程式モデリング(共分散構造分析)を実行する場合、semパッケージかlavaanパッケージを使うことが多いです。socialsciences.mcmaster.calavaan.ugent.be構造方程式モデリングを実施したらパス図が書きたくなります。 semパッケージやlavaanパッケー…

Tunnels and Trolls における TARO、DAROの出目の確率

昔、トンネルズ&トロールズ(Tunnels & Trolls, T&T)というTRPGがあって、最近「完全版」も出たんだけど、この中にTARO, DARO と呼ばれるルールがある。トンネルズ & トロールズ 完全版出版社/メーカー: cosaic発売日: 2016/09/24メディア: おもちゃ&ホビ…

Rで表情解析

R

Rで表情解析をします。Microsoft の Emotion API をRから動かす形になります。azure.microsoft.com Emotion API は画像の中の人物の表情を入力として取り、Face API を使って画像の中の顔それぞれについて一連の感情の信頼度と、顔の境界ボックスを返します…

Rでコンジョイント分析

R

Rにはコンジョイント分析用のパッケージが無いなー、とずいぶん前から思っていましたがいつの間にやら登録されていたようです。 コンジョイント分析とは何か?についてはアルベルト社の解説が分かりやすいと思います。 install.packages("conjoint") #パッケ…

ggplot2の練習中

R

ggplot2は記法が独特なので敬遠してきたのですが、最近ggplot2を使うと良さそうな事案に遭遇したので勉強中です。 library(ggplot2) p1 <- ggplot(iris, aes(Petal.Length, fill=Species)) p1 + geom_histogram() + opts(title="積み重ねヒストグラム") p1 +…

R

ネットワーク分析の再勉強。 # snaパッケージ library(sna) el.sna <- matrix(c( 1, 2, 1, 2, 1, 1, 1, 3, 1, 3, 1, 1, 1, 4, 1, 4, 1, 1, 5, 2, 1, 5, 6, 1, 6, 5, 1, 6, 2, 1, 7, 2, 1, 8, 2, 1, 9, 2, 1, 10, 2, 1, 11, 2, 1, 12, 2, 1, 13, 2, 1, 14, 3,…

Rで「ガチャとは心の所作」 #TokyoSciPy #rstatsj

R

Tokyo.SciPy#3で id:AntiBayesian さんがLTされていた「ガチャとは心の所作」が非常に興味深かったのでRでもやってみました。 (もっとも、ustがなかったので私は発表資料を読んだだけですが…) 「ガチャとは心の所作」 d:id:AntiBayesian:20120318 Rで書い…

Rでコレスポンデンス分析

R

ちょっとリクエストがあったのでRでコレスポンデンス分析(対応分析)の例。 メジャーなのはMASSパッケージに入っているcorresp関数を使うもので『S-PLUSによる統計解析』『Rによる統計解析』『R言語逆引きハンドブック』などでも紹介されています。金先生の…

Rで共分散構造分析 {lavaan}パッケージ編 #rstatsj

R

Rで共分散構造分析を行うにはこれまでは John Fox さんの{sem}パッケージを使うのが普通でした。 私も以前、{sem}パッケージの使い方についてエントリーを書いています。 id:bob3:20091226 id:bob3:20091227 id:bob3:20100530 しかし最近は{OpenMX}や{lavaan…

Tokyo.R#06

R

今回の会場は歌舞伎町のど真ん中、なかなかディープな場所にありました。 このときは準備中でそれほど人がいませんが、開始時には後ろの椅子だけの席までびっしり参加者で埋まりました。 1. Rによるやさしい統計学 第16章 : 因子分析 ([twitter:@holidaywork…

Tokyo.Webmining#5で使うコード

R

明日のデータマイニング+WEB 勉強会@東京 (Tokyo.Webmining)の発表で使っているコードです。発表資料はこちら→ http://bit.ly/bupfT1Twitterをしている現役国会議員をネットワーク分析してクラスタリング。 無駄に長いです。 library(twitteR) library(igra…

RでSEM(共分散構造分析/構造方程式モデリング)3

r

半年ぐらい前にR言語のsemパッケージで共分散構造分析の練習をしました。 id:bob3:20091226#p1 id:bob3:20091227#p1 このたび、次々回のTokyo.R#7で『Rによるやさしい統計学』の第17章「共分散構造分析」パートを担当することになったので復習中。 Rによる…

第3回R勉強会@東京に参加してきました

R

R言語の勉強会、第3回R勉強会@東京(Tokyo.R#03)に参加してきました。 第1回、第2回と比べるととても大きな会場でびっくりしました。 Togetter - まとめ「第3回R勉強会@東京 TokyoR3」 1.分散分析「 R によるやさしい統計学」の7章 発表者 : @yokkuns(id:y…

因子分析からクラスター分析までの流れ

r

マーケティングの基本的な考え方のひとつであるSTP戦略。 STPとはsegmentation、targeting、positioningの頭文字をとったものです。 消費者をニーズの異なるいくつかのグループに分類し、商品開発の対象を絞り込み、消費者から見た競合他社の商品との相対的…

クラスター分析手法の比較

r

昨日の続きをすこしだけ。 クラスター分析の手法による結果の違いを確認してみたいと思います。 ウォード法、K-means法と{cluster}パッケージに入っているPAM(Partitioning Around Medoids)という手法を比較してみます。 data(iris) # 結果を2次元で観察し…

第2回データマイニング+WEB 勉強会@東京 (Tokyo.Webmining)

R

id:hamadakoichiさん主催の第2回データマイニング+WEB 勉強会@東京 (Tokyo.Webmining)に参加してきました。 今回はクラスター分析のお話が中心でした。 発表資料はこちら。 はじめてでもわかる R言語によるクラスター分析 - 似ているものをグループ化する-…

Rで最適なクラスタ数の探索のメモ

R

R言語で最適なクラスタ数を探索するための関数。 {vegan}のcascadeKM()、{cclust}のclustIndex()、{clusterSim}のcluster.Sim()。

Rでグループごとのヒストグラムの表示

r

文系でのRの利用した統計解析: グループごとのヒストグラムの表示トラックバックできないので伝わらないかもしれませんが……あやめのデータを例にして。 data(iris) summary(iris) 一番単純なのはbyかtapplyを使う方法。 しかしこれは如何せん見栄えがしない…

R AnalyticFlow1.0

R

R AnalyticFlow バージョン1.0.0 公開RのIBM SPSS Modeler風GUI?であるところの R AnalyticFlow の最新版がリリースされました。 ただし、Rの最新版2.10.1には対応していないようなので注意。

RでSEM(共分散構造分析/構造方程式モデリング)2

r

昨日はGraphVizが上手く動かなかったのでパス図の描画は割愛しましたが、EasyGraphVizで描画に成功したので記録しておきます。 library(sem) 勉強量a <- c( 5, 4, 4, 5, 4, 5, 5, 6, 4, 4, 3, 6, 5, 8, 5, 5, 6, 4, 3, 4, 6, 4, 3, 3, 6, 3, 5, 5, 3, 3) 勉…

RでSEM(共分散構造分析/構造方程式モデリング)

R

RでSEM(共分散構造分析/構造方程式モデリング)をやってみる。 SEMのツールといえばメジャーなのはなんといってもAmosでしょう。他にもCALIS(SAS)、EQS、 LISRELなどがよく使われているようです。 そしてRにもでもsemパッケージというのがあります。(実は…

社会ネットワーク分析の練習

r

Mathematicaフォーラムに載っている事例で練習してみる。 # この図を再分析してみる # http://www.mathforum.jp/uservisit/05seijikeizai/zu1.gif library(igraph) adjm <- matrix(c(0,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0, 1,0,0,1,1,0,0,0,0,0,0,…

igraphでTwitterのネットワークを描いてみる3

r

こんどは違うコミュニティに属する(と思われる)人々を種にして、うまくクラスタを分割できるか試してみる。 account <- c("kazuyo_k", #勝間和代 "kohmi", #広瀬香美 "takapon_jp", #堀江貴文 "hmikitani", #三木谷浩史 "kirakira954", #TBSキラキラ "shak…

igraphでTwitterのネットワークを描いてみる2

r

昨日の続き。 次数(矢印が出入りする数)でノードの数を制限した。 ページランクでノードの大きさを変えた。 クラスタごとにノードの色を変えた。 少しは見通しが良くなったかな。 水色は中核であるYMOメンバー本人と直接の関係者のクラスタ、ピンクは漫画…