はてブのタグでシソーラスっぽいものはできそう、だけど……

●betaグループ - 別冊はてな話 - タグサービスの増加でシソーラス展開は?
http://beta.g.hatena.ne.jp/sugio/20060124/p3


タグのシソーラスについては、特定タグがべつのあるタグと重複している数値でランク付けすれば、シソーラスっぽいものはできるんじゃない? とちょっと思ったもので。
つまり

  • タグ[はてな]が含まれるエントリすべてにつけられた[はてな]以外のタグのなかで一番多いものはおそらく「はてな」と同意の言葉

なのではないか、ということです。
上記の例で30件ぐらいのエントリについて調べてみると

タグ
[hatena] **************
[ウェブ論] ******
[はてブ] ****
[ライブドア] ***
[laiso] ***
[sbm] ***
[web] ***
[ブックマーク] **
[ネタ] **

ということになるので、「はてな」と「hatena」がほぼ同意だという自動抽出はできるんじゃないかなあと。


だからまぁシソーラスというと語弊があるかもしれないので、

検索オプション:このタグに近いと推測されるタグも含める

みたいなのでいいと思うんですが、あるいは「検索窓にタグ入れたら下に「近い」タグ候補が出てくる」というのでもいいし。
ただ問題はサンプルの少ないマイナーな単語(moroccoとか)の場合なんですが……。


[ダメじゃん][ぐだぐだ]

今日のタグ速報:珍スポハンターひとやすみ

はてなブックマークで使われている「奇妙な味わい」タグをピックアップ。
今日に限らないけど。



[とりあえず][つづけるかも]