「情報の仕分け」についての思考実験

| | コメント(0) | トラックバック(0) この記事をはてなブックマークに追加

仕事でもプライベートでも情報の仕分けは重要になっている昨今、みなさんいかがお過ごしでしょうか。なんだこりゃ。
えーと、ここのところプライベート、というかぶっちゃけ同人活動を始めた関係で一日にはいってくる情報がものすごく増えた。
まあ代表なんぞをやってるからなんだろうけど、外部の方とやり取りすることもあるし。

まあメールが主な連絡手段なんですけど、もうメールボックスがすごいことに。
で、この大抵のメーラーが取ってるツリー状態の分類方法って、まったくもって万全じゃない。

だって、メールっていろんなこと書いてあったり、一概に一種類に分類できなかったりするじゃないですか。
グラフィックの発注かと思いきやシナリオにも触れてたり。そうすると単純にツリーの1ノード収めるのに抵抗があるものが出てくる。

そこでまあ何か良い方法はと考えると、まずタグってのが良さそうだと思うじゃないですか。
つまり、はてなブックマークとかGmailとか。よくある形式ですね。
上の例だと単純に「シナリオ」「グラフィック」の両方のタグをつけて、どっちの検索にもひっかかるようにしておく。

ただこれだと、タグがあふれるんですよねー。
違うプロジェクトが始まったりしたときに、昔の情報まで検索で引っ張ってきちゃう。
じゃあプロジェクト名のタグもつけておくかってなるけど、そうこうしてるうちにタグ自体がすんごい増えて、どのタグが何を意味するんだっけか...? なんてことになる。
この点に関してはツリー構造のほうがわかりやすい。

なーんかうまい方法ないかなあ。
ツリー構造のいいところは絞り込み。細分化とまとめができること。
タグのいいところは分類。インデックスがつけられること。
これって似てるようでちょっと違う。

理想はこの両方ができること。
人間はわがままなのでツリーがいいのかタグがいいのかは、同じデータ集合であってもその時々で変化するのです。

ならば、表示形態が自在に変化すればいいじゃないかと。そう思ったわけです。

そんなのどうやって実装するんだよ...ってことで、ちょっと考えた。
タグをツリー化してやればいんじゃね?
それも動的に変化するツリー。

1件のメールに大して同時につけられたタグ同士にはリンク情報として重み付けをしておく。必要なパラメータはこれだけ。

例えば、あるメールに「シナリオ」「プロジェクト固有名」とかのタグを付けたとする。
別のメールには「グラフィック」「プロジェクト固有名」と付けたとする。
また、さらに別のメールでは「サウンド」「シナリオ」「プロジェクト固有名」と付けたとする。
リンクの重みは
「プロジェクト固有名」が3。
「シナリオ」が2
「サウンド」と「グラフィック」がそれぞれ1となる。

タグツリーの生成のルールはこうだ。
1. 「ルート」という特別なタグを用意し、このタグには全てのタグがリンクしている
2. タグを選択したらそのタグとリンクしているタグを子ノードとして扱う
3. 重みの数値が多いほど表示位置が(並列表示で)上となる

上の例での表示がどうなるかというと、
まず「ルート」では

 プロジェクト固有名
 シナリオ
 サウンド
 グラフィック

となる。
ここでプロジェクト固有名を選択すると
 プロジェクト固有名
 ├シナリオ
 ├サウンド
 └グラフィック
 シナリオ
 サウンド
 グラフィック

となる。サウンドとグラフィックは同位だけど、まあ別途ソートルールとかあればいいでしょ。
さらに、プロジェクト固有名 以下の シナリオ を選択すると
 プロジェクト固有名
 ├シナリオ
 │├プロジェクト固有名
 │└サウンド
 ├サウンド
 └グラフィック
 シナリオ
 サウンド
 グラフィック

となる。
さらに深くツリーを掘っていくことももちろん可能だけど、構造的にかならず無限階層となるので無駄。

同じ名前のタグがツリーの中で何度も出てくることになるわけだ。
しかしツリーのどの階層にいるか、でリーチできる情報は違う。

もうわかるでしょ。
ツリーを掘り下げた経路にあるタグをAND検索することによって絞込みをするわけだね。

つまり、ルートにある「シナリオ」タグを選択すると「シナリオ」タグがついている情報はすべて検索される。
「プロジェクト固有名」以下の「シナリオ」タグを選択すると、「プロジェクト固有名」と「シナリオ」の両方のタグが付けられている情報が検索される。
と、まあこういう寸法だ。

これで分類と絞込みという良いとこ取りの仕分けができた。
ただ、まあ机上の空論なので、ちょっと実装してみてどういう挙動をするか見てみないことには何とも言えないけど、試してみる価値はありそう。
グループウェアを自作してサークル内で運用しているんですが、ここで試してみようかなと思ったりしています。

それとももしかして情報処理系の大学ではこういうのって「そこは我々が100年前に通ってきたところだ」的な感じだったりするのかな。
我流の叩き上げプログラマなので事情に疎い......ってそりゃただの勉強不足だな。

まあいいや。
そんな感じでーす。

トラックバック(0)

このブログ記事を参照しているブログ一覧: 「情報の仕分け」についての思考実験

このブログ記事に対するトラックバックURL: http://www.studio-wiz.com/mt/mt-tb.cgi/178

コメントする

このブログ記事について

このページは、マピロが2009年12月11日 13:53に書いたブログ記事です。

ひとつ前のブログ記事は「今週の『嘘喰い』」です。

次のブログ記事は「PHPで配列データをツリー構造で見やすく出力する処理」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

ウェブページ

Powered by Movable Type 4.14