mixiの「メールアドレスを入力して探す」機能が割と危ない件 @ tokikawase
mixi「メアドでユーザー検索」取り下げ 反発受け3日で見直し @ ITmedia News
反発というより「悪用の報告もあった」(ITmedia)ことが取り下げの判断につながったのでは? 危険性はリリース前に内部で気付きそうなものなので、気付いてもなお一旦リリースしてしまったmixiの決定ロジックにどんな問題があるのか興味深い。
NoSQLの成功は1:10問題にかかっている:Kenn's Clairvoyance @ CNET Japan
「(オン・メモリを前提とするアーキテクチャのDBで)実メモリを超えたデータをどうやって扱うのか?」という問題に『1GBの物理メモリで10GBのデータを扱う』という意味で「1:10問題」と命名している。だけど、これって「ワン・テン」が語呂がいいからという理由かしらん? 意図としては1:2でも1:1000でも1:256でもよいはずで。
メモリを増やして対処するというアプローチの実例として、64GBだか96GBのメモリを積んだサーバでsuffix arrayを処理しているというのを聞いたことがある。だいぶ大容量かつ安価になってきたSSDを使った構成とで、速度やコストの比較を知りたいなぁ。
かなり使えるPerl正規表現のまとめ @ TokuLog 改めB日記
URI, メールアドレス, 電話番号など、よく使われるパターンのバリデータは自分で書かないでRegexp::Commonなんかのモジュールを使いましょう、というお話。
Number::Phoneモジュールは日本の電話番号パターンなど国・地域固有のものが用意されているからよい。
紹介記事中にはなかったが、「昭和五十二年」を西暦に変換できるDate::Japanese::Eraなんてのもある。
日本の郵便番号用モジュールは紹介されていなかった。CPANで探してみると幾つか存在する。古いデータを扱う関係で5桁のものを処理するケースもあると思うのだが、5桁に対応していることを明示しているモジュールは見付からなかった。
年号にしても「五十二」ではなく「五二」や「一○」はokか、ということも気になる。ドキュメントを読んでも分からないと、結局コードを解析する=自分の考えた正規表現と照合することになる点がもったいない。
中世ヨーロッパでは理髪師は外科などの医療業務も行っていたようで、
その名残が理髪店の赤青白のくるくる回る「三色ねじり棒」だそうです。
⇒散発屋さんの店の前にある 赤と青の斜めストライプでくるくる回ってる物はなんという名前ですか?また、どういう意味があるのですが? @ Yahoo!知恵袋
床屋は時代と共に仕事の内容が減ったわけですが、 Web屋さんは逆に仕事の内容が増えてきているようですね。