R

Tokyo.Webmining#5で使うコード

R

明日のデータマイニング+WEB 勉強会@東京 (Tokyo.Webmining)の発表で使っているコードです。発表資料はこちら→ http://bit.ly/bupfT1Twitterをしている現役国会議員をネットワーク分析してクラスタリング。 無駄に長いです。 library(twitteR) library(igra…

RでSEM(共分散構造分析/構造方程式モデリング)3

r

半年ぐらい前にR言語のsemパッケージで共分散構造分析の練習をしました。 id:bob3:20091226#p1 id:bob3:20091227#p1 このたび、次々回のTokyo.R#7で『Rによるやさしい統計学』の第17章「共分散構造分析」パートを担当することになったので復習中。 Rによる…

第3回R勉強会@東京に参加してきました

R

R言語の勉強会、第3回R勉強会@東京(Tokyo.R#03)に参加してきました。 第1回、第2回と比べるととても大きな会場でびっくりしました。 Togetter - まとめ「第3回R勉強会@東京 TokyoR3」 1.分散分析「 R によるやさしい統計学」の7章 発表者 : @yokkuns(id:y…

因子分析からクラスター分析までの流れ

r

マーケティングの基本的な考え方のひとつであるSTP戦略。 STPとはsegmentation、targeting、positioningの頭文字をとったものです。 消費者をニーズの異なるいくつかのグループに分類し、商品開発の対象を絞り込み、消費者から見た競合他社の商品との相対的…

クラスター分析手法の比較

r

昨日の続きをすこしだけ。 クラスター分析の手法による結果の違いを確認してみたいと思います。 ウォード法、K-means法と{cluster}パッケージに入っているPAM(Partitioning Around Medoids)という手法を比較してみます。 data(iris) # 結果を2次元で観察し…

第2回データマイニング+WEB 勉強会@東京 (Tokyo.Webmining)

R

id:hamadakoichiさん主催の第2回データマイニング+WEB 勉強会@東京 (Tokyo.Webmining)に参加してきました。 今回はクラスター分析のお話が中心でした。 発表資料はこちら。 はじめてでもわかる R言語によるクラスター分析 - 似ているものをグループ化する-…

Rで最適なクラスタ数の探索のメモ

R

R言語で最適なクラスタ数を探索するための関数。 {vegan}のcascadeKM()、{cclust}のclustIndex()、{clusterSim}のcluster.Sim()。

Rでグループごとのヒストグラムの表示

r

文系でのRの利用した統計解析: グループごとのヒストグラムの表示トラックバックできないので伝わらないかもしれませんが……あやめのデータを例にして。 data(iris) summary(iris) 一番単純なのはbyかtapplyを使う方法。 しかしこれは如何せん見栄えがしない…

R AnalyticFlow1.0

R

R AnalyticFlow バージョン1.0.0 公開RのIBM SPSS Modeler風GUI?であるところの R AnalyticFlow の最新版がリリースされました。 ただし、Rの最新版2.10.1には対応していないようなので注意。

RでSEM(共分散構造分析/構造方程式モデリング)2

r

昨日はGraphVizが上手く動かなかったのでパス図の描画は割愛しましたが、EasyGraphVizで描画に成功したので記録しておきます。 library(sem) 勉強量a <- c( 5, 4, 4, 5, 4, 5, 5, 6, 4, 4, 3, 6, 5, 8, 5, 5, 6, 4, 3, 4, 6, 4, 3, 3, 6, 3, 5, 5, 3, 3) 勉…

RでSEM(共分散構造分析/構造方程式モデリング)

R

RでSEM(共分散構造分析/構造方程式モデリング)をやってみる。 SEMのツールといえばメジャーなのはなんといってもAmosでしょう。他にもCALIS(SAS)、EQS、 LISRELなどがよく使われているようです。 そしてRにもでもsemパッケージというのがあります。(実は…

社会ネットワーク分析の練習

r

Mathematicaフォーラムに載っている事例で練習してみる。 # この図を再分析してみる # http://www.mathforum.jp/uservisit/05seijikeizai/zu1.gif library(igraph) adjm <- matrix(c(0,1,1,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0, 1,0,0,1,1,0,0,0,0,0,0,…

igraphでTwitterのネットワークを描いてみる3

r

こんどは違うコミュニティに属する(と思われる)人々を種にして、うまくクラスタを分割できるか試してみる。 account <- c("kazuyo_k", #勝間和代 "kohmi", #広瀬香美 "takapon_jp", #堀江貴文 "hmikitani", #三木谷浩史 "kirakira954", #TBSキラキラ "shak…

igraphでTwitterのネットワークを描いてみる2

r

昨日の続き。 次数(矢印が出入りする数)でノードの数を制限した。 ページランクでノードの大きさを変えた。 クラスタごとにノードの色を変えた。 少しは見通しが良くなったかな。 水色は中核であるYMOメンバー本人と直接の関係者のクラスタ、ピンクは漫画…

igraphでTwitterのネットワークを描いてみる

R

先行事例を参考にigraphでTwitterのネットワークを描いてみる。 参考にしたのは、 iGraphでTwitterのネットワークを表してみる Rとigraphでなんちゃってネットワーク解析 twitter's social network analysis Dr. MATSUDA, N. 今回はtwitteRを使って、誰をフ…

TwitterをRで遊ぶ。

R

TwitteRパッケージを使ってみたくて、Twitterのアカウントを取りました。 Bob#3 (bob3bob3) on Twitter。 myuheさんの記事を参考にして、自分がフォローさせていただいている40名の人たちの分布を見てみたいと思います。 まずはフォロー数、被フォロー数、つ…

同順位がある場合の中央値のメモ

R

同順位(タイ)がある場合の厳密な中央値の出し方については、青木先生のところや中澤先生のところに解説があり、どちらも自作関数(青木先生版、中澤先生版)を公表されていいます。 CRANに登録されているpsychパッケージにもinterp.median()という関数があ…

Rで潜在クラス分析

R

以前書いたメモにトラックバックを頂戴しました。 id:kosugitti:20091203 本当にただのメモだったのでなんとも申し訳ない。 なのでお詫びに、lca() と poLCA() と randomLCA() の簡単な比較でもしてみましょう。 # 潜在クラス分析のパッケージいろいろ libra…

感想

R

Rcmdrによる教育用パッケージの開発 品質管理の場合

R

荒木孝治さんによる講演。 Rcmdrの日本語化に尽力された方ですね。 日本独自のQCの“作法”に対応したRcmdrのプラグインや教育用のプラグインのお話。 こちらも高橋メソッド。 RやWekaがニュージーランドで生まれたのは、充実した統計教育の賜物。 日本でも産…

インタラクティブPDF作成ライブラリPDF2の紹介

R

id:tadakadoさんの講演。 Rで出力するPDFファイルにハイパーリンクを埋め込むパッケージ。 ポップアップで説明を表示させることができたり、なかなか使えそう。 高橋メソッドでの発表って、実際にやってるのは始めて見ました。

 パッケージccgarchによる多変量GARCHモデルの推定

R

北海道大学の中谷朋昭さんの講演。 正直、私には難しすぎてチンプンカンプンでした。 GARCHは「がーち」と読むのですね。

Tsukuba.Rの活動

R

今回のRユーザー会で楽しみにしていた講演のひとつです。 はてな界隈でも活発に活動されているid:syou6162さんのお話。 Tsukuba.RはRについて関心のある若者の集いと言う感じでしょうか。 大学生のサークル活動の延長と言った雰囲気で非常に楽しそうに活動さ…

R running on mobile gadgets

R

こちらも続けて岡田昌史さんの講演。 RjpWikiの該当ページはこちら シャープのNetWalkerはubuntuで動いているそうでまったく問題なくRが動くそうです。 もちろん速度はそれなりのようですが。 通勤中の電車の中でコードをいじりたくなるときなんかは実際ある…

RとFOSS4G

R

岡田昌史さんの講演。RjpWikiの中の人ですね。 FOSS4G(Free and Open Source Software for Geospatial)というのはオープンソースな地理情報ソフトウェアの総称ということでした。 まずはGRASSというソフトとRを組み合わせる話。 Rのspgrass6パッケージを使…

オープンなビジネスデータ分析環境

R

エフプライムの鈴木了太さん。 まずは第3回Rユーザー会で発表されたR AnalyticFlowのバージョンアップの話。 R AnalyticFlowは、まぁ要するにRをClementineのように使おうというツール。 オブジェクトブラウザとコードエディタが便利そう。 R Foundationに…

13:00-13:30 HTMLアプリケーションを用いた簡易Rツールの作成

R

毎度おなじみR-Tipsの船尾さん。 発表資料はここにあります。 本当にプレゼンテーションの上手い方だと思います。 きっちり笑いも組み込んでくるし。 疑わしいスクリプト 疑わしいスクリプト 疑わしいスクリプト できれば、R2PPTパッケージのお話も伺いたか…

11:05-11:35 Rによる環境疫学・大気汚染の健康影響

R

谷村晋さんのRを使った研究事例の発表。 季節変動、週間変動などを組み込んだモデル作り。 それでも当てはまりが良くならないので、交絡因子を探索する。フェイラー変換(?)。気温?

10:30-11:00 RExcelパッケージの紹介

R

石田基広さんの発表。 一見、“裸の大将”的な風貌の方ですが、話し方も話の組み立ても上手いなぁ。 プレゼンの仕方を見習いたいです。 準備中のデスクトップにはWordMinerやTextMiningStudioのアイコンも見えて、個人的には親近感を覚えました。 R in Emacs o…

09:00-10:25 KMLとR

R

okinawaさんこと牧山文彦さんによるGoogleEarthなお話。第2回のRユーザー会でもGoogleEarthでRを使うお話をされていましたが、今回はもう一段突っ込んでGoogleEarthで使われるXMLベースのマークアップ言語であるKMLをRで扱うというテーマ。 KMLはプロフェ…