ユークリッド平方距離
『集合知プログラミング』のサンプルコードについて、疑問点があげられています。
id:ksmemo:20080731:p1
と、サンプルコードを移植していて思ったのですが、ユークリッド距離だと差の二乗和の平方根をとったものなので、戻り値が
return 1/(1 + sqrt($sum_of_squares));になりそうな気がするのですが、「ユークリッド距離を基にした類似性スコア」と書いているのでこれでいいのかな、という感じですが。
id:shrkw:20081113:cloud_on_pci_1
最後で、X軸とY軸の違いを2乗した値の合計をした最後に、平方をとってないのが不思議。
これ、私は勝手に「あー、ユークリッド平方距離を使ってるのか」と解釈してました。クラスタリング(クラスター分析)をするときなどはユークリッド距離そのままよりもユークリッド平方距離を使うことのほうがなじみがあるので。
それならそれで一言書いておいて欲しいですけどね。
全然外してたらゴメンナサイ。