だまんです。

プログラミングや写真や本や読書会のことや、日常のこと。

SQLiteじゃだめかも…

[広告]

まあ、気になりつつ、見て見ぬふりしていたのだけど、すくなくとも現状の俺の知識or俺のアルゴリズムの範囲だとSQLiteじゃだめっぽい。

  • SQLiteに、重複しないように一度クエリ飛ばして、なければINSERT…とかやったら終わらかったらしいのでkill
  • ていうかcsvファイルの状態で持ってるデータぜんぶいれても最大数百MBなので、オンメモリでもプロセスが死んだりはしないだろうという
  • ならば http://www11.atwiki.jp/kenichiro/pages/28.html を参考にできる。というかほぼそのまんまである。
    • 100ノードならサクッと。
    • 1000で、scoreがnilとか、score>1になるとか、ちょっとうまくいかないときがあった。
    • 妥当性はなんとも。結果がpmidだけじゃ見づらい。
    • あと、くりかえし回数については、-log(n)/log(alpha)でlog(n)桁が保証される
    • ちょうどおととい「pagerankの数理」で見たので
  • todo 表示方法を考える
  • todo ファイルハッシュ or…

Except for the interface below, methods compatible with the `Hash' class are also provided; `', `=', `store', `delete', `fetch', `has_key?', `has_value?', `key', `clear', `length', `empty?', `each', `each_key', `each_value', and `keys'.

Creative Commons License ©2007-2016 IIDA Munenori.