プログラマーになりたい。

プログラミングや写真や本や読書会のことや、日常のこと。

バイト

論文誌のPersonalized PageRankであるEigenfactorというものを見つけてしまった

今回はEigenfactorのことを調べた。あとそのまえにWordPressのアップデートとか、WordPressに載せるの忘れてた前の2回分の作業ログを載せたりとかした。 「Eigenfactor」というのは、前回の出勤のときに、トムソンのインパクトファクターを実際みたことがな…

MEDLINEの引用関係からPageRankを計算した件、一部、外から見れる感じにした

前回までの作業では、1980年以降の論文の引用関係グラフから、各論文についてのPageRankスコアを計算した。暫定的に、現在このスコアはSQLite 3形式で蓄えてあったので、きょうはこれをすこし見やすくするためにCakePHPでUIをきせてみた。UIというか、HTMLの…

オンメモリで計算できちゃった

あのSQLとの格闘はなんだったのか…。

SQLiteじゃだめかも…

まあ、気になりつつ、見て見ぬふりしていたのだけど、すくなくとも現状の俺の知識or俺のアルゴリズムの範囲だとSQLiteじゃだめっぽい。 SQLiteに、重複しないように一度クエリ飛ばして、なければINSERT…とかやったら終わらかったらしいのでkill ていうかcsv…

計算時間が非現実的。

当月の出欠勤簿記入done。 SQLiteに隣接行列のうち、非ゼロであるi,j要素の(i,j,値)をいれておいて、いちいちこれを参照すれば…と考えていたが、話にならないほど遅い。設計ミスである。 初期化がすでに十分遅い。16時現在まだべき乗法にいきついてない。 遅…

どーにかこーにか。

SQLの、?とか:name使うの、バインド値、プレースホルダというのかー。 リンク元ノード数: sqlite> SELECT count(id) FROM papers WHERE id IN(SELECT id FROM papers GROUP BY pmid); N=396732…却下。 とりあえず、これ: SELECT DISTINCT cited_pmid as pmid…

SQLの日になってしまった

無線LAN、DHCPがとれない。有線でやった。 重複が取り除けない DELETE FROM papers p1 WHERE id > ( SELECT MIN(id) FROM papers p2 WHERE p1.pmid == p2.pmid AND p1.cited_pmid == p2.cited_pmid ); これが実行できない。DELETEでは何かのSELECTで使える文…

CSVを前処理してSQLiteににいれる

これ、SQLiteとかkey-value strage(いじったことないけど)にすべき規模かも…。 ってことで、yagさんにもらった、 論文1のPMID, 論文1の参考文献1のPMID, 論文1の参考文献2のPMID… … 形式のCSVを 論文1のPMID, 論文1の参考文献1のPMID 論文1のPMID, 論文1の参…

対大データに徒手空拳…

DBCLS2回目。辞令を拝命(拝命でいいのかな?)。 次回までのTODO: シャチハタ用意、通勤区間・距離・手段要調査。 kazusa… (便所先生の領域。わざわざ手を出するだけの強力なアルゴリズムは、思い当たる節が無い…。) PubMed内でインパクトファクタ的な 「イン…

Creative Commons License ©2007-2021 IIDA Munenori.