NoSQLの成功は1:10問題にかかっている:Kenn's Clairvoyance @ CNET Japan
「(オン・メモリを前提とするアーキテクチャのDBで)実メモリを超えたデータをどうやって扱うのか?」という問題に『1GBの物理メモリで10GBのデータを扱う』という意味で「1:10問題」と命名している。だけど、これって「ワン・テン」が語呂がいいからという理由かしらん? 意図としては1:2でも1:1000でも1:256でもよいはずで。
メモリを増やして対処するというアプローチの実例として、64GBだか96GBのメモリを積んだサーバでsuffix arrayを処理しているというのを聞いたことがある。だいぶ大容量かつ安価になってきたSSDを使った構成とで、速度やコストの比較を知りたいなぁ。
Ajax - Goodbye, JSONP. Hello, Access-Control-Allow-Origin @ 404 Blog Not Found
IE6,7, Fx3.0なんかを切り捨てられるサイトなら、Access-Control-Allow-Originを使った方がスマートというお話。
やる気は「お金」では買えない @ 日経ビジネスオンライン
単純作業なら報酬で動機付けができるが、クリエイティブな仕事は熟達への願望がポイントとのこと。仕事が苦行になっていて、苦行を我慢する対価として報酬をもらっているんだという意識にさせてしまう環境ではダメなんでしょうな。
なお、「本人が好きなことをやってるんだからお金は要らんだろう」という話ではない点に注意。報酬が必要十分に提供されているという前提です。
直径約2メートルもある世界最大のティーケーキ「クッキーキング」 @ GIGAZINE
実物の写真は、不思議の国のアリスのイメージなのか、うさぎさんの被りものをした人がいます。あんまり可愛くないけれど。右奥の特大ティーカップは微妙に歪んでいるところをみると、ボール紙か何かでしょうか。
ところでこれ、どのくらいのカロリーなんでしょう。計算してみました。
ファンタやコーラを自作しよう。ソフトドリンクレシピ集 @ TuiTui
オレンジジュースからファンタオレンジ(風)を作るのってあまり意外性がない。
逆にコーラ(風)やカルピス(風)は材料の種類が多いので、
もともとお菓子を大量に作るようなご家庭なら安上がりで、
子供も自分で作れて喜ぶかもしれないけれど
それ以外では材料はこれ専用になってしまうし、手間もかかるので
あまりメリットが感じられないかも。大量生産は偉大だった。
Baidu.jp 不自然言語処理コンテスト間違っていても読める、読みづらく書きづらいのに使われている、あるいは短くて書きやすいけど知らない人には伝わらない表現-このような不自然なことばは、検索エンジンを作るBaiduにとっては、ちょっと厄介な存在です。
そこで、最良の検索エンジンの提供を志すBaiduでは、このような言葉を「不自然言語」と名付け、これによりまっすぐ向き合うべく、「Baidu.jp 不自然言語処理コンテスト」を開催いたします。
検索避けで「//」を間に入れるとか、「ネ申」とか書いているのを、検索サービス側としては何とか検索できるようにしたい、と考えているわけですが、そのための知恵を公募しちゃおうというもののようです。
(2010-06-29追記)
コンテストのサイトで紹介されている「ァタシ」の例はWikipediaでギャル文字として紹介されているもので、「みさなん こんちには!」は/.-Jで
にんんげ は もじ を にしんき する とき その さしいょ と さいご の
もさじえ あいてっれば じばんゅん は めくちちゃゃ でも ちんゃと
よめる という けゅきんう に もづいとて
わざと もじの じんばゅん を いかれえて あまりす。
と紹介されているもののようです。Charlieが勉強した頃には情報検索というとまだ図書館の蔵書検索のようなものがメインだったので、「検索対象の情報は誤字脱字が少ない」という前提の処理ばかりでした。当時からあったのは、送り仮名の揺れとか平仮名を「ひらがな」と書いたりといった表記の揺れを吸収する研究とか、OCR(スキャナなんかで画像にした文書からテキスト・データに変換)処理したときに認識誤り(ゼロとオーとか、漢字の「くち」とカタカナの「ろ」とか)があっても検索できるようにする研究とかですね。後者を発展させれば「ネ申」とかギャル文字を検索できるようになってるはずなんですが、今はまだそこまでたどり着けていないようですね。