アーカイブ: 6月 2009

2009/06/04

パーマリンク 10:51:41, 著者: Charlie

Yahoo!デベロッパーネットワーク - テキスト解析 - キーフレーズ抽出

固有表現 (Named Entity) の抽出かな? (非WebAPIのツールだとCaboChaとか) と思って
「ただの名詞より東京タワーのような固有名詞の方が点数が高見沢」
で試してみたら

固有名詞 100
高見沢 92
東京タワー 59
点数 53

だった。(TF・)IDF?

パーマリンク 00:31:42, 著者: Charlie

海外のサイトで、「zip code (必須)」の入力欄に7桁入力できなくて困ることない?

アイトラッキングから検証した、使いやすいフォームの10のポイント @ コリス

電話や郵便番号の入力は、ユーザーを悩ませます。(略)
あらゆるフォーマットの入力を受け付けるように設定してください。

「あらゆる入力を受け付ける」は難しいとしても、未だに「住所の番地は全角で入力してください」とかほざくシステムが多いのは以下のような打算がサービス提供者に働くからだと思う。

  • 入力の許容度を上げるのは、エラーにしてしまうよりコストがかかる。
  • 住所の入力等はサービスの主要機能ではない。たいてい住所や電話番号を入力するのは、買い物の精算中とか会員登録なんかの「ここまで来たのに今さらやめられるか」というタイミングなので、多少面倒でも続ける人がほとんど。
  • コストをかけても売上げに良い影響はない(だろう) → それなら別に凝らなくていいや。

表現の許容度が高いオープンソースの入力用ライブラリが定石として普及すればいいんでしょうが、日本語・日本の制度向けのは寡聞にして知らないですね。
「01/02/03」って日付の解釈はいろいろできるとか(平成元年のつもりかもしれない)いうのは情報処理・言語処理の分野で長年研究されているようですが(分野名としては情報抽出; Information Extraction)。形態素解析のライブラリはあるのにね。

関連記事

2009/06/02

パーマリンク 11:08:55, 著者: Charlie

あなたにもできる!?身体能力を一時的に高めるためのテクニック集 @ IDEA*IDEA

「しゃっくりを止める」とかは「身体能力向上」のカテゴリなのかどうか怪しいけれど、どれも日常的に役立ちそう。伊東家の食卓?

<< 1 2

6月 2009
 << < 現在> >>
  1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30        

リンク

最近の記事

アーカイブ

検索

XMLフィード

powered by b2evolution free blog software