homeへのリンクです。

flashでAmazonECS 18

2006年09月02日

もともとこの作業は、flashでAmazonECS 2で書いたように、抽出されていない情報も見たいという欲求から始めた事だ。

アンビエントファインダビリティのP62情報検索のところで、適合率と再現率という話があった。

適合率=検索結果内の適合データの数/検索結果のデータの総数
再現率=検索結果内の適合データの数/実際の適合データの総数

全文検索の場合、母集団が膨大になると、再現率が著しく低下するらしい。

言葉があいまいさを持っているため、べき法則分布を取ることになるためらしい。

例えば、"flash"で全文検索したとして、サンプルが少ない場合は、"flash"という言葉は使っているけれど、flashには関係ない話や、"flash"という用語は使っていないが、実はflashの話である記事の検索漏れは、無視できるぐらいなのだが、サンプルが多くなると、無視できない量になるということだろう。

Amazonには膨大な量の蔵書があるはずなので、検索漏れがあるのではないかという直感は多分、そこそこ当たっていそうだ。

Amazonのカテゴリ分けが、どのように行われているかわからないが、普通に考えれば、カテゴリが全蔵書をカバーしているなら、カテゴリの対象からもれている本はないわけだから、全ての蔵書を確認したいという欲求を満たすインターフェイスの取っ掛かりとしては、カテゴリを軸にするというのは悪くないのかもしれない。

カテゴリは抽象化された本棚という考え方は、結構、的を射ていると思う。

遠目から見ると、本棚は棚1つというアウトラインで、近くによって本の背表紙が読めるようになると、カテゴライズされた本の集合体になる。

Flashで視覚化してカテゴリを表示するとき、そのアナロジーは上手く利用できるのではないかと思う。

それで、久しぶりに作業を進めてゆくモチベーションがわきあがってきた。

ズームアップ・ズームダウンで表現されているコンテンツとして、googlemapがある。

太平洋上に仮想に作り出した浮島に、延々、本棚を並べて、その中にAmazonの蔵書を収めていったらどうだろうか?

引きで見ているときは、アウトライン的な情報しか必要ではなく、よったときによった分の情報だけが必要になるなので、表示に必要なメモリ的な問題もクリアできるはずだし。