コトバノウタカタ

よしなしごとをつらつらとつづるばしょ。

はてなダイアリーキーワードの表記揺らぎ

たまに表記揺らぎや省略語のキーワードを登録する*1言及日記が引っかかるように、例えば「クーロンズ・ゲート」という既存のキーワードに対して「クーロンズゲート」を登録したり。その場合後から追加したキーワードには、元キーワードへのリンクを張るくらいの内容しか書かない。これは複数キーワードにカブった内容を書き込むと混乱を招くしメンテし辛くなるだろうと考てのこと。

そうなると、その表記揺らぎのキーワードの内容スコアが「参考にならない」と評価されることが多い。リンクだけなのだから内容がないのは確かにそうなのだ。仕方ないのだけれど、ちょっとヘコむ。内容はなくてもキーワードとしての価値がないのとはまた違うと思うのだけれどね。そちらはリンクスコアとして評価されるのかな。


キーワードにはいろいろなタイプがあって、必ずしも内容が詰まってリンクする価値があるものばかりではない。どちらもないものはダメだけれど、どちらか一方があれば存在する意味があると思う。

たとえば誤爆の多い語はリンクしたくないこともあるけれど、その語の意味がきちんと書かれているのであれば価値がある。実際に省略語の意味がわからなくて調べることは少なくない。

また先に書いた表記揺らぎのように内容は薄いについても、それを言及した日記をつかまえる、検索時に多少の表記揺らぎが吸収できる、という価値はあると思う。

なので誤爆キーワードはともかく、「表記揺らぎ」と明言していあるキーワードについて内容スコアにマイナス入れるのは手加減して欲しいなあ、と。じゃないと表記揺らぎを登録しても内容スコアの平均値が下がるだけ、ってことになってバカバカしくなってしまう。

ただ表記揺らぎは細かくやっていくと再現がないし、そういう中身のないキーワードを嫌う人がいるっていうのもわからないでもない。平仮名やら漢字やらカタカナやらで同じ語をいくつもいくつも登録するというのは確かにスマートではないと思うし。難しいな。

*1:ただし省略語は誤ヒットが多くないかどうか確かめてからやるようにしている。