Rユーザー会
昨年(id:bob3:20061209)に続いて今年も覗いてきましたRユーザー会。日本全国からR言語の猛者たちが集う会です。
昨年は小雨降る寒空の下で行われましたが、今回は天候にも恵まれ空気の澄んだ気持ちの良い一日でした。
開会の辞
間瀬先生のお言葉でスタート。そろそろ「Rの限界」という問題も出てきたのではないかというようなお話。私の仕事で扱うデータは多くてもせいぜい数万件程度、数十変数程度なので問題ないのですが、バイオ系など巨大なデータを扱う世界ではいろいろと課題も出ているようです。
09:40-10:30「R+M=?−Rとオブジェクトデータベースの新次元−」
okinawaさんこと牧山文彦さんによる医療系のシステムの中にRを組み込んだ、というようなお話。私にはちょっと難しいところもありました。お話の本筋とは関係ないのですがTnn-Rの使い方がカッコよかったです。なるほどあんな風に使えばいいのか。
10:30-11:20「Bioconductorの概要とその利用方法」
「統計解析環境Rによるバイオインフォマティクスデータ解析」の著者である樋口千洋さんによる熱の入った講演。超早口でビックリしましたが、ご本人はあのスピードで思考してるんだろうなぁ。すごい。
紹介されていたrgraphvizパッケージにはWindows版が無いようでちょっと残念。
TABキーでコンプリーション機能のようなことができるというのも初めて知りました。
バイオとは縁もゆかりも無い私の仕事ではBioConductorのお世話になることはほとんど無いのですが、見栄えのする散布図を描きたい時にsmoothScatter{geneplotter}をsunflowerplot{graphics}の代わりに使うことが稀にあります。
どうしても順序尺度の変数を便宜上連続尺度として扱うことが多い業界なので、普通の散布図では役に立たず、smoothScatterやsunflowerplotは重宝してます。
統計解析環境Rによるバイオインフォマティクスデータ解析−Bioconductorを用いたゲノムスケールのデータマイニング−〔CD-ROM付〕
- 作者: 樋口千洋,石井一夫
- 出版社/メーカー: 共立出版
- 発売日: 2007/09/26
- メディア: 単行本
- 購入: 1人 クリック: 21回
- この商品を含むブログ (7件) を見る
11:20-12:10「ビジネスデータ分析の現場から」
昨年続いて登場したef-primeの鈴木了太さん。昨年はNattoの紹介をされて個人的には大きな収穫だったのですが、今年はさらに衝撃的なツールの紹介をされました。
そのR AnalyticFlowは、要するにRにClementineやVisual Mining StudioやWekaのKnowledgeFlowのようなビジュアルプログラミング環境を提供するものでした。
コレはちょっと凄いかも。
12月中旬にWindowsXP対応のプレビュー版公開の予定だそうですが、個人的にはWindows2000にも対応していただけると嬉しいな、と思ったり。
12:10-13:20 昼休み
天気がよかったので有栖川宮記念公園でお弁当を食べました。
本当にこのあたりは外国人の方が多いですね。子供たちが降り積もった落ち葉で遊んでいました。
13:20-14:10「今日からあなたも統計ソフト開発者! 〜 R Commander の概要,改造,数式処理機能の実装例 〜」
RのGUIの代表R Commanderに独自の機能を追加する方法の紹介。
すでにハンドアウトを公開されています。
よく使うグラフの描画などを追加して他の人にも使えるようにするといいかもしれないと思いました。
舟尾暢男さんは昨年も登場されていて、そのときも思ったのですがプレゼンが本当に上手い。ぜひお手本にしたいところですが、あのスタイルは他の人に真似できるものではないかもしれませんね。
R Commanderハンドブック―A Basic‐Statistics GUI for R
- 作者: 舟尾暢男
- 出版社/メーカー: 九天社
- 発売日: 2007/08
- メディア: 単行本
- 購入: 1人 クリック: 14回
- この商品を含むブログ (11件) を見る
14:10-15:00「Rと自然言語研究」
石田基広さんからは
実はRにもtmとかlanguageRとかlsaとかzipfRとかテキストマイニング系のパッケージが結構あるんですね。
でも、日本語の分析には使えないよなぁ……と思いながら聞いていましたが、最後のほうで茶筅と組み合わせて青空文庫の作品(118点)を分析した事例を紹介されていて驚きました。
いままではテキストマイニングにRを使うなんて思いもよらなかったけど、試しにやってみようかという気になりました。
15:20-16:10「疫学におけるRの活用」
谷村晋さんの講演。留学生に対する統計教育にあたって、SASやSPSSを使うと母国に帰ったときに入手が困難だったり海賊版に手を出さざるを得ない状況があるのでRを使うべきだというお話はとても興味深かったです。
公演時間が足りなくて後半のスライドに見えた条件付きロジスティック回帰のお話がスキップされたのがちょっと残念でした。個人的に今関心を持っている手法だったので。
16:10-16:50「R Graphical Manualのつかいかた」
恐るべきR Graphical Manualsの中の人、小笠原理さんのお話。Kubuntuかっちょいい。マニュアルの更新時には1週間もかかるというのは驚きましたが、考えてみればそれくらいはかかるよなぁ。
16:50-17:20「グリッドコンピューティングとR」
NTT西日本のサービスひかりグリッドの紹介。個人的には縁のなさそうな世界ですが、グリッドコンピューティングが気楽に行えるというのはなかなかパワフルな感じです。
とまぁ、こんな感じでした。
次回は2009年の初旬になりそうというお話でした。