R

Rでサンタクロース

R

ふぉっふぉっふぉっ、みんな今年も良い子にしてたかな? 特にプレゼントはありません。 メリークリスマス! library(conflicted) library(tidyverse) library(aplpack) library(palmerpenguins) pen_mean <- penguins |> select(bill_length_mm, bill_depth_…

正則化項付き線形回帰は真の偏回帰係数を推定しているのか?

R

最近、正則化項付き線形回帰についてちょっと調べてます。 それで以下の記事が気になりました。qiita.comdropout009.hatenablog.comどちらも人工データを用いて、真の偏回帰係数を正則化項付き線形回帰で推定できるか?というシミュレーションをされています…

湿度の変化はどうなっているのか?

R

前回の記事の補足です。X(旧Twitter)でこんなコメントをいただきました。沖縄がキツいのは湿度と日差しの強さなので、そういう比較のグラフも見てみたいけど。夏の気温だけでいうと埼玉や新潟の方が高いのは実感としてある。 https://t.co/1Zg9Q2mzOo— ◤◢N…

「昔はこんなに暑くなかった」をR言語で可視化する

R

2023年の8月もそろそろ終わります。 しかし、まだまだ暑くて秋の気配はまだまだ来ないようです。さてここ数年、7月に入ったころから「昔はこんなに暑くなかった」「いや、そんなことはない」といった話題がSNSをにぎわせています。 私も数年前にこんなグラフ…

マハラノビスの距離を応用したクラスタリングの話

R

つい先日、日本マーケティング・リサーチ協会(JMRA)のリサーチ・イノベーション委員会より「マハラノビス研究会報告」というレポートがひっそりと出ています。 www.jmra-net.or.jpこれはタイトルの通り、マハラノビス距離について、マーケティングリサーチ…

Tidymodelsをシンプルに使う

R

R言語で教師あり機械学習系の手法を使うときはこれまでcaretを使っていたのだけど、最近はTidymodelsの方が機能面で充実してきているので、そろそろ手を出さねばなるまいかと思い勉強を始めています。本記事は現状ではTidymodelsをこんな風に使ってるよ、と…

複数回答(multiple answer, MA)の集計表をコレスポンデンス分析にかけて大丈夫?

R

複数回答(multiple answer, MA)の集計表をコレスポンデンス分析にかけて大丈夫? 結論から言うと、大きな問題はなさそうです。 複数回答とは? ブランドのイメージなどを聞くアンケートでは、「○○ブランドのイメージとして、あてはまるものをすべて選んでく…

R上のデータフレームをDBにテーブルとして書き込む

R

Tokyo.Rで質問があったので。 # R上のデータフレームをDBに書き込む方法 library(RSQLite) library(nycflights13) #サンプルデータ # サンプルデータの確認 # これらのデータフレームをDBにテーブルとして書き込む head(airlines) head(airports) head(fligh…

コレスポンデンス分析の同時布置図は本当に使えないのか?(点と点の距離の話)

前回、前々回のコレスポンデンス分析についての話を目にした何人かから、「そもそもコレポンの同時布置図を点の距離で解釈しちゃいけないなんて聞いてない。どうしてダメなのか教えてほしい。」という声をいただきました。 bob3.hatenablog.com bob3.hatenab…

コレスポンデンス分析の同時布置図は本当に使えないのか?(の続き)

R

座標の重みづけの話が中心です。

コレスポンデンス分析の同時布置図は本当に使えないのか?

R

コレスポンデンス分析の同時布置図は本当に使えないのか?

SQLを学ぼう(Rで)

R SQL

はじめに 今回扱うこと、扱わないこと RとRStudioを使ったSQL学習環境の構築 RSQLiteパッケージのインストール 練習用サンプルデータの準備 RStudioでSQLを書く SELECT文を学ぼう サンプルデータについて SELECTとFROM WHEREによる条件付け フィールドの加工…

キング・クリムゾンのセットリストを分析する

キング・クリムゾンのセットリストを分析してみました。

R に Intel MKL を導入する

R

Rを高速化する方法として、Rblas.dllを入れ替えるという手法は以前からあった。 ATLASとかGotoBLASとか。 BLASの高速化 - RjpWiki今回、Microsoft R Openで使われている Intel MKL をRblas.dllとして利用する方法が紹介されていたので ここにメモをしておく…

broomパッケージを使ってみる

R

broomパッケージの上手な使い方を考えてる。 library(stargazer) library(broom) library(dplyr) library(ggplot2) res1 <- lm(yield ~ block + N + P + K, npk) res2 <- lm(yield ~ block + N + P * K, npk) # res <- res1 res <- res2 anova(res) res %>% …

続々・複数のファイルを一度に読みこむ方法

r

過去2回の続きでこれが最後(多分)。 複数のファイルを一度に読みこむ方法 - bob3’s blog 続・複数のファイルを一度に読みこむ方法 - bob3’s blog前回、data.table::fread() を foreach で並列化したパターンを追加したのだけど、data.table::fread() はそ…

続・複数のファイルを一度に読みこむ方法

r

前々回の続編。前々回の記事を書いた後の反応にこんなのがありました。foreach (i=list.files)%dopar%fread(i) 的な処理はよくやる https://t.co/x4H4sLqh2E— kato.kohaku.0 (@kato_kohaku) July 7, 2019なるほど、並列化という手があったか。ということで、…

base と Tidyverse と data.table と

r

「恋しさと せつなさと 心強さと」といえば『ストリートファイターII MOVIE』の挿入歌ですね。さて、初心者にRを教えるとき、base準拠にすべきか、Tidyverse準拠にすべきか、という議論があります。 これは私も悩むところでありまして、さらに言えば data.ta…

複数のファイルを一度に読みこむ方法

r

Rで複数のファイルを一度に読み込みたい場合がたまにある。 例えば、売り上げのデータが日付ごとに分かれたファイルに収められているような場合。 しょっちゅう発生するわけでもなく、いつも忘れてしまって調べるのに時間がかかるのでここにメモしておく。こ…

R本体のアップデート時に入れるパッケージ

r

まず最初に必ず入れるパッケージ。 あとは必要になったときに入れれば大丈夫。 install.packages( c( "tidyverse", "data.table", "psych", "vegan", "plotly", "devtools", "colourpicker", # RStudio Addin "ggThemeAssist", # RStudio Addin "styler" # R…

lavaanで作ったモデルからパス図を描く関数

R

Rで構造方程式モデリング(共分散構造分析)を実行する場合、semパッケージかlavaanパッケージを使うことが多いです。socialsciences.mcmaster.calavaan.ugent.be構造方程式モデリングを実施したらパス図が書きたくなります。 semパッケージやlavaanパッケー…

Tunnels and Trolls における TARO、DAROの出目の確率

昔、トンネルズ&トロールズ(Tunnels & Trolls, T&T)というTRPGがあって、最近「完全版」も出たんだけど、この中にTARO, DARO と呼ばれるルールがある。トンネルズ & トロールズ 完全版出版社/メーカー: cosaic発売日: 2016/09/24メディア: おもちゃ&ホビ…

Rで表情解析

R

Rで表情解析をします。Microsoft の Emotion API をRから動かす形になります。azure.microsoft.com Emotion API は画像の中の人物の表情を入力として取り、Face API を使って画像の中の顔それぞれについて一連の感情の信頼度と、顔の境界ボックスを返します…

Rでコンジョイント分析

R

Rにはコンジョイント分析用のパッケージが無いなー、とずいぶん前から思っていましたがいつの間にやら登録されていたようです。 コンジョイント分析とは何か?についてはアルベルト社の解説が分かりやすいと思います。 install.packages("conjoint") #パッケ…

ggplot2の練習中

R

ggplot2は記法が独特なので敬遠してきたのですが、最近ggplot2を使うと良さそうな事案に遭遇したので勉強中です。 library(ggplot2) p1 <- ggplot(iris, aes(Petal.Length, fill=Species)) p1 + geom_histogram() + opts(title="積み重ねヒストグラム") p1 +…

R

ネットワーク分析の再勉強。 # snaパッケージ library(sna) el.sna <- matrix(c( 1, 2, 1, 2, 1, 1, 1, 3, 1, 3, 1, 1, 1, 4, 1, 4, 1, 1, 5, 2, 1, 5, 6, 1, 6, 5, 1, 6, 2, 1, 7, 2, 1, 8, 2, 1, 9, 2, 1, 10, 2, 1, 11, 2, 1, 12, 2, 1, 13, 2, 1, 14, 3,…

Rで「ガチャとは心の所作」 #TokyoSciPy #rstatsj

R

Tokyo.SciPy#3で id:AntiBayesian さんがLTされていた「ガチャとは心の所作」が非常に興味深かったのでRでもやってみました。 (もっとも、ustがなかったので私は発表資料を読んだだけですが…) 「ガチャとは心の所作」 d:id:AntiBayesian:20120318 Rで書い…

Rでコレスポンデンス分析

R

ちょっとリクエストがあったのでRでコレスポンデンス分析(対応分析)の例。 メジャーなのはMASSパッケージに入っているcorresp関数を使うもので『S-PLUSによる統計解析』『Rによる統計解析』『R言語逆引きハンドブック』などでも紹介されています。金先生の…

Rで共分散構造分析 {lavaan}パッケージ編 #rstatsj

R

Rで共分散構造分析を行うにはこれまでは John Fox さんの{sem}パッケージを使うのが普通でした。 私も以前、{sem}パッケージの使い方についてエントリーを書いています。 id:bob3:20091226 id:bob3:20091227 id:bob3:20100530 しかし最近は{OpenMX}や{lavaan…

Tokyo.R#06

R

今回の会場は歌舞伎町のど真ん中、なかなかディープな場所にありました。 このときは準備中でそれほど人がいませんが、開始時には後ろの椅子だけの席までびっしり参加者で埋まりました。 1. Rによるやさしい統計学 第16章 : 因子分析 ([twitter:@holidaywork…