Rユーザー会に行ってきました。
会場は広尾の統計数理研究所。
赤池情報規準(AIC)で有名な赤池さんが所長を務めていらっしゃったところですね。
外国の大使館が立ち並ぶ上品で落ち着いた街の中に統計数理研究所の建物はありました。
開始時間の9時半で参加者はざっと40〜50名程度だったと思います。
SASやSPSS、S-plusのユーザー会とは比べるべくもありませんが、手作り感に溢れて良い雰囲気でした。
09:30-10:15「Rでデータハンドリング 〜 データフレーム 30 分クッキング〜」
まずは「The R Tips」の著者である舟尾さんの発表。
Rを使う上で基本中の基本となるデータフレームの扱い方についてのお話。
私の場合はもっぱらExcelからCSVかタブ区切りのテキストに落として、Rcmdrを使うか、read.csvやread.delimで読み込むんですが、他にもいろいろ便利な方法があるようです。
他にもデータフレームの様々なハンドリング方法が紹介されていました。
データ量が多いときはこれらの方法を使いこなせると便利そうです。
The R Tips―データ解析環境Rの基本技・グラフィックス活用集
- 作者: 舟尾暢男
- 出版社/メーカー: 九天社
- 発売日: 2005/02
- メディア: 単行本
- 購入: 3人 クリック: 20回
- この商品を含むブログ (34件) を見る
11:00-11:45「Rで起業!フリーソフトウェアとデータ分析ビジネスの現在」
個人的に一番興味深かったのが株式会社ef-prime鈴木さんの発表。
pvclustパッケージの開発者の一人で、最近データ分析ビジネスの会社を興したんだそうです。
エスミみたいな会社なのかな、という印象を受けました。
発表の内容は「データ分析ビジネスの現在」といった感じで、私も身近な話題で面白く聴くことができました。
で、特に興味深かったのが鈴木さんがフリーソフトとして公開されているNatto。
これは発想として、リコー廣野元久さんのL-GM/G-GMや東京大学大澤さんのKeyGraph、あるいはSPSS社のClementineに搭載されているWebグラフ、数理システム社のText Mining Studioに搭載されていることばネットワークなどに似たようなものですが、インターフェイスがとても洗練されていて使いやすそうです。
リンクの係数の出し方など詳細はまだ理解しきれていせんが、とりあえずAUTOCODEのサンプルデータからコーディングした結果をNattoに食わせてみたらこんな絵が描けました。
おお、なんか面白そうだぞ。
通常のテキストマイニングの結果だと変数が100を越えるのですが、それでもちゃんと動くようなら結構使えるかも知れませんね。
なお、Nattoのインストールには.NET Framework Version 2.0 再頒布可能パッケージのインストールが必要な場合があるようです。(私のWindows2000のマシンでは必要でした。)
13:00-13:45「R graphical manualsの開発と今後の展開」
驚異のR graphical manuals、とりわけ驚愕のImage Browserの開発秘話(?)。
国立遺伝学研究所小笠原さんと株式会社情報数理研究所服部さんによる発表。
前半は小笠原さんからマクロアレイのデータを扱うことの難しさといったようなお話で、後半は服部さんからのR graphical manuals開発についてのお話でした。
いや、それにしてもImage Browserは凄過ぎます。
私も重宝してます。
13:45-14:30「GoogleEarth とR言語」
RjpWikiのokinawaさんこと牧山さんによる発表。
これも興味深かったです。
Rでいかに複雑な統計計算をするかという話ではなく、どうやってその結果を人に伝えるかというお話でした。
ただそれゆえに、会場のR魔人な方々からの反応はいまいちだったような気がします。
ですが、個人的には自分が抱えている問題と共通する部分があって勉強になりました。
統計数理研究所って上から見るとこんななんですねぇ。
14:50-15:35「地理空間分析のためのベクタデータモデル共通基盤−spパッケージのクラスとメソッド−」
長崎大学の谷村さんの発表。
これは難しかった。
最後の方の「直線距離じゃないクラスタリング」みたいな話は興味深く聴けました。