タグ

2008年3月24日のブックマーク (11件)

  • SQLite Full Text Search with MeCab - mynote

    はじめに† SQLiteの全文検索の拡張FTSは、まだ実験的な段階でfts1, fts2と作っては破棄(?)してきて、今はfts3が最新のようです。(sqlite3.5.1)。ただし、コンパイル済みバイナリの配布は止めてしまったようです。実験段階なので欲しい人は自分でコンパイルしてね♥みたいな。このftsで日語が使えないとか色々言われているのに加えて、ちょっとプロトタイプをでっち上げるのに必要になりそうな雰囲気なので、日語でもftsが使えるようにしてみました。 ↑ そもそもの動機† 『SQLite の全文検索を Python から使ってみる (3)』を読んだ。ここでftsのデフォルトの英文用のtokenizer(空白で単語を区切る)で日語を無理やり使うためにMeCabを使って分かち書きをして、その文字列を挿入し、取り出したあとに連結とかしてた・・・。誰も知らないようだが、実はfts2

    toton
    toton 2008/03/24
    fts sqlite fts3_tokenizer.h "SELECT load_extension() ...: CREATE VIRTUAL TABLE t USING FTS3"
  • ブーンはチベットについて何も知らないようです(^ω^ ):ハムスター速報 2ろぐ

    1 :以下、名無しにかわりましてVIPがお送りします。:2008/03/23(日) 11:00:38.90 ID:vzMZS17P0 チュン・・・チュン・・・ ( ^ω^)「ふわぁ・・・眠いお・・・昨日遅くまでVIPやりすぎたお・・・」 ( ^ω^)「こういう爽やかな朝は天気予報お姉さんでも見るお」 ポチッ 『中国政府は、チベット人による暴動を・・・』 ( ^ω^)「・・・・せっかく爽やかだった朝なのに、暴動とか台無しだお」 『チベット側の、平和的に対話するという標榜は嘘だった、と中国の温首相は非難し・・・』 ( ^ω^)「んー?つまりチベットとやらが反乱を起こして中国が困ってるわけだお?」 (#^ω^)「チベットひどいお!暴力に訴えるとかテロじゃないかお!中国カワイソス」 3 :以下、名無しにかわりましてVIPがお送りします。:2008/03/23(日) 11:01:31.29 ID

    toton
    toton 2008/03/24
    勉強になりました
  • Winnyで地図ソフトを“ダウンロード”して公衆送信権侵害、2人が送検

    Windows

    toton
    toton 2008/03/24
    これ裁判ではどう判断されるのだろう。 "なお、地方公務員の男性は、兵庫県警の警察官だった。"
  • Slope One - Wikipedia

    Slope One is a family of algorithms used for collaborative fiemire and Anna bly, it is the item-based collaborative fiity makes it especially easy to implement them efficiently while their accuracy is often on par with more complicated and computationally expensive

    Slope One - Wikipedia
    toton
    toton 2008/03/24
  • luminis - the art of software engineering

    Andere blog items 30-sep-2008 Falen is goed 29-aug-2008 Persistence in OSGi with OpenJPA -- part 2 11-jun-2008 The Component Framework, a report from the OSGi Community Event in Berlin 11-apr-2008 ApacheCon EU 2008 24-mrt-2008 JPA persistence in OSGi with openJPA 10-mrt-2008 OSGi DevCon/EclipseCon and OSGi Security 04-mrt-2008 Generics, code duplication and type safety 26-nov-2007 O

    toton
    toton 2008/03/24
    協調フィルタリングtasteの使い方
  • SONY BMG、MP3をAmazonで提供――4大レーベルすべてがDRMフリーに

    Amazonは1月10日、米SONY BMG MUSIC ENTEAmazonからDRMフリーのAmazonEMI、Universal Music GroupとはMusicとは2007年12月に提携を発表した。今回のSONY BMGとの発表で、Amazonは4大レーベルすべてとAmazonによれば、3万3000の独立系レーベルもDRMフリーで楽曲を提供しているという。 SONY BMGのグローバルデジタル事業部社長トーマス・ヘッセ氏は「当社は消費者に対し、物理的に、インターネットを経由して、そして携帯を通じて提供する方法を模索している。この新しい取り組みは、音楽ファンがどこにいようとそこに届けることができるものだ」と述べ

    SONY BMG、MP3をAmazonで提供――4大レーベルすべてがDRMフリーに
    toton
    toton 2008/03/24
  • 行列 - Wikipedia

    横に並んだ一筋を行(row)、縦に並んだ一筋を列(column)と呼ぶ。 例えば、下記のような行列 は2つの行と3つの列によって構成されているため、(2,3)型または2×3型の行列と呼ばれる。 書き並べられた要素は行列の成分と呼ばれ、行列の第 i 行目、j 列目の成分を特に行列の (i, j) 成分と言う。行列の (i, j) 成分はふつう ai j のように二つの添字を単に横並びに書くが、誤解を避けるために添字の間にコンマを入れることもある。また略式的に、行列 A の (i, j) 成分を指定するのに Ai j という記法を用いることもある。

    行列 - Wikipedia
    toton
    toton 2008/03/24
    行列
  • ウノウラボ Unoh Labs: 自己学習で分類精度を向上させるベイジアンフィルタ

    20070201勉強会_ベイジアンフィルタ posted by (C)フォト蔵 ベイジアンフィルタを自己学習を行う事で文書を高精度にフィルタリングすることができるシステムです。 SpamassassinやPOPFileのようなspamメール振り分けソフトに使用されているのでご存知の方も多いと思います。 ベイジアンフィルタというとspamメールの処理で広く使われているイメージがありますが、 これをwebの世界でも応用してみれば面白いものができるんじゃないかと思っていろいろ開発してたのですが、 結局実現には至りませんでした。 このままではもったいないので、これまで勉強してわかってきたことを勉強会で発表しました。 勉強会の様子の動画と資料を公開します。 bayes.

    toton
    toton 2008/03/24
    ベイジアンフィルタ
  • ゆーすけべー日記: YouTube動画のお気に入りをPodcast化してiTunesやiPod で見れるサービス「ListPod」をリリースしました

    サキとは彼女の自宅近く、湘南台駅前のスーパーマーケットで待ち合わせをした。彼女は自転車で後から追いつくと言い、僕は大きなコインパーキングへ車を停めた。煙草を一吸ってからスーパーマーケットへ向かうと、ひっきりなしに主婦的な女性かおばあちゃんが入り口を出たり入ったりしていた。時刻は午後5時になる。時計から目を上げると、待たせちゃったわねと大して悪びれてない様子でサキが手ぶらでやってきた。 お礼に料理を作るとはいえ、サキの家には材が十分足りていないらしく、こうしてスーパーマーケットに寄ることになった。サキは野菜コーナーから精肉コーナーまで、まるで優秀なカーナビに導かれるように無駄なく点検していった。欲しい材があると、2秒間程度それらを凝視し、一度手に取ったじゃがいもやら豚肉やらを迷うことなく僕が持っているカゴに放り込んだ。最後にアルコール飲料が冷やされている棚の前へ行くと、私が飲むからとチ

    ゆーすけべー日記: YouTube動画のお気に入りをPodcast化してiTunesやiPod で見れるサービス「ListPod」をリリースしました
  • Web 2.0 時代の TOEIC 900点超え英語勉強法 9ヶ条: blog.bulknews.net

    Web 2.0 時代の TOEIC 900点超え英語勉強法 9ヶ条 と、はてブで人気エントリになりそうなタイトル をつけてみましたが。 こないだ 10/23 に TOEIC ってやつを受けてみたんです。ちょうど外資系でマジメに仕事として英語を使うようになって10ヶ月、ある程度できるようになったなという印象はあったんですが、客観的に評価できる数字がほしいなぁと。 結果は、970点 (Listening: 495 / Reading: 475) というなかなか想像を超える数字でした。 受けた感じである程度の手ごたえはあったんですが、Listening 満点というのは結構驚きでした。思えば1年前までアメリカ行ったことない(そもそもパスポート持ってない)状態で、1年弱でここまで来たとも言えるわけです。せっかくなので、ここに至るまでの僕の英語勉強法を Tips 的にまとめてみます。 (R = Rea

  • グーグルが無敵ではないことはエンジニアだけが知っている:江島健太郎 / Kenn's Clairvoyance - CNET Japan

    ウェブ人間論 梅田 望夫 / 平野 啓一郎 梅田望夫と平野啓一郎の対談集である「ウェブ人間論」を読了した。基的な感想は、この書籍の元になった新潮に対談が掲載されたときに「新潮6月号の梅田望夫×平野啓一郎の対談を読んで」にもすでに書いたし、ここやここでは平野啓一郎人が登場するというハプニングがあったことも記憶に新しいところだ。その後に平野はほんとうに公式ブログを開設したりもした。これら一連のできごとは、とても楽しいものだった。 だけど、いやだからこそ、この件を引っ張る形でこれ以上書評を続けると知人友人ばかり持ち上げる内輪やらせブロガー的なダークサイドに堕ちてしまう気がするので、この機会に大きく踏み外してみようと思う。 ぼくが今の今まで注意深く避けてきた、グーグル技術論について、この機会にとうとう語ってしまおうと思う。 ■「過去7年におけるグーグル成功の最大の要素は『運』だった」(Se