ユークリッド平方距離

集合知プログラミング』のサンプルコードについて、疑問点があげられています。

id:ksmemo:20080731:p1

と、サンプルコードを移植していて思ったのですが、ユークリッド距離だと差の二乗和の平方根をとったものなので、戻り値が

return 1/(1 + sqrt($sum_of_squares));

になりそうな気がするのですが、「ユークリッド距離を基にした類似性スコア」と書いているのでこれでいいのかな、という感じですが。


id:shrkw:20081113:cloud_on_pci_1

最後で、X軸とY軸の違いを2乗した値の合計をした最後に、平方をとってないのが不思議。

これ、私は勝手に「あー、ユークリッド平方距離を使ってるのか」と解釈してました。クラスタリングクラスター分析)をするときなどはユークリッド距離そのままよりもユークリッド平方距離を使うことのほうがなじみがあるので。
それならそれで一言書いておいて欲しいですけどね。
全然外してたらゴメンナサイ。