R

igraphでTwitterのネットワークを描いてみる

R

先行事例を参考にigraphでTwitterのネットワークを描いてみる。 参考にしたのは、 iGraphでTwitterのネットワークを表してみる Rとigraphでなんちゃってネットワーク解析 twitter's social network analysis Dr. MATSUDA, N. 今回はtwitteRを使って、誰をフ…

TwitterをRで遊ぶ。

R

TwitteRパッケージを使ってみたくて、Twitterのアカウントを取りました。 Bob#3 (bob3bob3) on Twitter。 myuheさんの記事を参考にして、自分がフォローさせていただいている40名の人たちの分布を見てみたいと思います。 まずはフォロー数、被フォロー数、つ…

同順位がある場合の中央値のメモ

R

同順位(タイ)がある場合の厳密な中央値の出し方については、青木先生のところや中澤先生のところに解説があり、どちらも自作関数(青木先生版、中澤先生版)を公表されていいます。 CRANに登録されているpsychパッケージにもinterp.median()という関数があ…

Rで潜在クラス分析

R

以前書いたメモにトラックバックを頂戴しました。 id:kosugitti:20091203 本当にただのメモだったのでなんとも申し訳ない。 なのでお詫びに、lca() と poLCA() と randomLCA() の簡単な比較でもしてみましょう。 # 潜在クラス分析のパッケージいろいろ libra…

感想

R

Rcmdrによる教育用パッケージの開発 品質管理の場合

R

荒木孝治さんによる講演。 Rcmdrの日本語化に尽力された方ですね。 日本独自のQCの“作法”に対応したRcmdrのプラグインや教育用のプラグインのお話。 こちらも高橋メソッド。 RやWekaがニュージーランドで生まれたのは、充実した統計教育の賜物。 日本でも産…

インタラクティブPDF作成ライブラリPDF2の紹介

R

id:tadakadoさんの講演。 Rで出力するPDFファイルにハイパーリンクを埋め込むパッケージ。 ポップアップで説明を表示させることができたり、なかなか使えそう。 高橋メソッドでの発表って、実際にやってるのは始めて見ました。

 パッケージccgarchによる多変量GARCHモデルの推定

R

北海道大学の中谷朋昭さんの講演。 正直、私には難しすぎてチンプンカンプンでした。 GARCHは「がーち」と読むのですね。

Tsukuba.Rの活動

R

今回のRユーザー会で楽しみにしていた講演のひとつです。 はてな界隈でも活発に活動されているid:syou6162さんのお話。 Tsukuba.RはRについて関心のある若者の集いと言う感じでしょうか。 大学生のサークル活動の延長と言った雰囲気で非常に楽しそうに活動さ…

R running on mobile gadgets

R

こちらも続けて岡田昌史さんの講演。 RjpWikiの該当ページはこちら シャープのNetWalkerはubuntuで動いているそうでまったく問題なくRが動くそうです。 もちろん速度はそれなりのようですが。 通勤中の電車の中でコードをいじりたくなるときなんかは実際ある…

RとFOSS4G

R

岡田昌史さんの講演。RjpWikiの中の人ですね。 FOSS4G(Free and Open Source Software for Geospatial)というのはオープンソースな地理情報ソフトウェアの総称ということでした。 まずはGRASSというソフトとRを組み合わせる話。 Rのspgrass6パッケージを使…

オープンなビジネスデータ分析環境

R

エフプライムの鈴木了太さん。 まずは第3回Rユーザー会で発表されたR AnalyticFlowのバージョンアップの話。 R AnalyticFlowは、まぁ要するにRをClementineのように使おうというツール。 オブジェクトブラウザとコードエディタが便利そう。 R Foundationに…

13:00-13:30 HTMLアプリケーションを用いた簡易Rツールの作成

R

毎度おなじみR-Tipsの船尾さん。 発表資料はここにあります。 本当にプレゼンテーションの上手い方だと思います。 きっちり笑いも組み込んでくるし。 疑わしいスクリプト 疑わしいスクリプト 疑わしいスクリプト できれば、R2PPTパッケージのお話も伺いたか…

11:05-11:35 Rによる環境疫学・大気汚染の健康影響

R

谷村晋さんのRを使った研究事例の発表。 季節変動、週間変動などを組み込んだモデル作り。 それでも当てはまりが良くならないので、交絡因子を探索する。フェイラー変換(?)。気温?

10:30-11:00 RExcelパッケージの紹介

R

石田基広さんの発表。 一見、“裸の大将”的な風貌の方ですが、話し方も話の組み立ても上手いなぁ。 プレゼンの仕方を見習いたいです。 準備中のデスクトップにはWordMinerやTextMiningStudioのアイコンも見えて、個人的には親近感を覚えました。 R in Emacs o…

09:00-10:25 KMLとR

R

okinawaさんこと牧山文彦さんによるGoogleEarthなお話。第2回のRユーザー会でもGoogleEarthでRを使うお話をされていましたが、今回はもう一段突っ込んでGoogleEarthで使われるXMLベースのマークアップ言語であるKMLをRで扱うというテーマ。 KMLはプロフェ…

第4回Rユーザー会

R

結論から言うと、今回のRユーザー会の個人的なキーワードは、 「現実をしっかり見据えましょう。 統計で最も広く使われているソフトウェアは Excel なのです。」 でした。 それと講演中に“なう”なヤングたちがtwitterでtsudaってる姿も、これまでには無かっ…

統計数理研究所

R

統計数理研究所の外見はこんな感じです。 ……嘘です。 こんな感じ。 ……こっちは嘘じゃないですが、多少誇張しております。 実際はこんな感じ。天気が悪いのが残念でした。 国立極地研究所と国文学研究資料館も同じ建物に入居しています。 そんなわけで1階で…

マクネマー検定の多重比較

R

pairwise.prop.test関数やpairwise.t.test関数、pairwise.wilcox.test関数みたいなことをマクネマー検定でやりたい。 クラスカル・ウォリス検定やフリードマン検定からの多重比較については群馬大の青木先生の関数が存在するけど、マクネマー検定版は無いみ…

Rで直交計画

R

以前、Rで直交表に基づいた実験計画を立てる関数はないかと探したことがあって、そのときは S-Plus に oa.design() という関数があるというところまでしかわからなかった。 で、偶然さきほどDoE.baseパッケージに oa.design() という関数が含まれているのを…

3.4 デンドログラムを描く

R

クラスタリングが終わっていれば、樹形図を描くのは至極簡単。 plot(blog.hc, main="ブログのクラスタのデンドログラム", cex=0.75, hang=-1) サンプルサイズが99もあるのでちょっと見にくいですね。 普通、階層型クラスタリングを使うのはサンプルサイズが5…

3.3 階層的クラスタリング

R

「3.3.2 フィード中の単語を数える」は省略。 tmパッケージあたりを使えば良さそうですが。 Rを使ったテキストマイニングについていえば、近々本も出版されるみたいです。Rによるテキストマイニング入門作者: 石田基広出版社/メーカー: 森北出版発売日: 2008…

2.8 MovieLensのデータセットを使う

R

MovieLens Data Sets | GroupLens Researchから「100,000 Data Set (.zip)」をダウンロード。 解凍したら、Rのワーキング・ディレクトリに「u.data」「u.item」を置く。 とりあえずファイル全体を読み込んでから必要な列だけを取り出すことにする。 u.item.l…

2.7.2 推薦を行う

R

事前に用意した映画の類似度行列に基づいて、任意のユーザーに次に見るべき映画を推薦する。 ここで評価と類似度を乗算したものを類似度の合計で割るという計算をしているのだけど、これも納得がいかないので算術平均を使うことにする。 前述したように評者…

2.7.1 アイテム間の類似度のデータセットを作る

R

この項では先に作ったtopMatches関数を使って作品ごとに類似性スコア高いほかの作品のリストを作っている。 だけど、R言語では作品ごとに処理するよりも行列として処理したほうが簡単なので、topMatches関数は使わずに類似性スコアの行列を直接作ってみる。 …

2.3.2 ピアソン相関によるスコア

R

相関係数はcor()で。 # 相関係数の算出(ピアソンの積率相関係数) (critics.cor.pea <- cor(critics, use="pairwise.complete.obs")) # 出力 # Lisa.Rose Gene.Seymour Michael.Phillips Claudia.Puig Mick.LaSalle Jack.Matthews Toby # Lisa.Rose 1.00000…

2.3.1 ユークリッド距離によるスコア

R

距離はdist()を使えば算出できる # 類似性スコアの算出(ユークリッド平方距離に基づく) (critics.dist.euc <- 1/(1+dist(t(critics))^2)) # 出力 # Lisa.Rose Gene.Seymour Michael.Phillips Claudia.Puig Mick.LaSalle Jack.Matthews # Gene.Seymour 0.14…

『集合知プログラミング』をR言語で書く

R

集合知プログラミング作者: Toby Segaran,當山仁健,鴨澤眞夫出版社/メーカー: オライリージャパン発売日: 2008/07/25メディア: 大型本購入: 91人 クリック: 2,220回この商品を含むブログ (277件) を見るといっても、実は発注したばかりで手元に届いていない…

Rでブートストラップ

R

単純なものですが、半分お遊びで。 boot.mean <- function(x,times=1000){ set.seed(101) b <- numeric(times) for(i in 1:times){ c <- sample(x,replace=T) b[i] <- mean(c) } cat("回数",times,"\n") cat("bootstrap平均",mean(b),"\n") cat("bootstrap標…

データフレームを丸ごとT得点化

R

試しに、データフレームを丸ごとT得点化する関数を作ってみた。 T.score <- function(x) { result <- NULL for (nn in names(x)){ result <- cbind(result, 100-(qnorm(1-((rank(x[, nn])-0.5)/length(x[, nn])))*10+50)) } result <- data.frame(result) n…