前回までの作業では、1980年以降の論文の引用関係グラフから、各論文についてのPageRankスコアを計算した。暫定的に、現在このスコアはSQLite 3形式で蓄えてあったので、きょうはこれをすこし見やすくするためにCakePHPでUIをきせてみた。UIというか、HTMLの表にしただけなのだが…。
で、その前に、全体のランキング結果について少し説明しておく。計算のために、引用されているものの、1980年以前の論文で内容のデータを取り出していなかったものは、ぶら下がりノード(なにも引用していないノード)として処理した。
ところが、その結果、Top 3をふくむ上位の多くが、そのような1980年以前発表の論文(それぞれ1970年、51年、76年発表)となってしまった。これらはいま使っているDBの中にデータを入れていないので、手動でPubMedからコピペである。
- Laemmli UK. Cleavage of structural proteins during the assembly of the head of bacteriophage T4. Nature. 1970 227(5259):680-5. PMID: 5432063 [PubMed - indexed for MEDLINE]
- LOWRY OH, ROSEBROUGH NJ, FARR AL, RANDALL RJ. Protein measurement with the Folin phenol reagent. J Biol Chem. 1951 Nov;193(1):265-75. PMID: 14907713 [PubMed - indexed for MEDLINE]
- Bradford MM. A rapid and sensitive method for the quantitation of microgram quantities of protein utilizing the principle of protein-dye binding. Anal Biochem. 1976 May 7;72:248-54. PMID: 942051 [PubMed - indexed for MEDLINE]
このような事情から、DB内の情報だけで満足するような見せ方をしようとするとランキング表がスカスカになる懸念があった。かといって、1980年以降のものだけを取って表示するというのは、理由なく1980年以前だけを切り落とすことになって、あまり感じがよろしくないだろう(なんで1980年以降だけなの?という疑問が残る。もちろん単なるデータ削減のためだったわけだが…)。
そこで、まずきょうは、DBから「ある年」の論文だけを取り出してランキング形式で見せるウェブサービスをつくってみることにしたわけです。
結果は末尾の表のようになるが、正直なところまったくわからないので、上記の3点とあわせて1980年の結果をお見せしつつ、小野さんに聞いた。メモしそこなったので、おぼえている要点だけ書くと:
- よくつかわれる手法の論文が上にきているようだ
- たとえばDNAの2重らせん構造を示したような論文は不利なのではないか
- 全体のTop 3にも、(下記の)80年のトップにも、見覚えのある著者がいて、それなりにもっともらしい
- スコアによって(ロングテールの尾を)切り落として「信頼できるかどうか」を示すことはできないか?
- MeSHとよばれるタグ付け(仲里さんの方面)があり、そのタグごとでのランキング
というようなコメントをいただき、それから、
- 年ごとのランキングは、あまり実用的ではないですが、雑誌のトピックスをみるという意味では、まあそれなりに、まったく無意味ということもないかなと思います…とか
- ジャーナルごとの平均スコアはIFと比較できますね
- 直接的には検索結果のならべかえに使えますね
- MeSHのようなものに頼らずに、ある程度自動的にクラスタリングとかもできたらすごいですよねー
などと、お話をした。
あと
- 全体の分布のうち、各年ごとに色分けして、占める面積をしめせないか
- あるいはもっと直接的に、平均スコアの時系列変化、スコア合計の時系列変化
- これにより、「ライフサイエンス分野で重要な発見が会った年」をしめせないか
というようなことできるかなと考えている。
ただ、前も思ったんだけど、既存の研究とかサービスのサーベイをちゃんとしてないので、だれでも考えそうな話だし、論文としてはあるんじゃねーかというのが怖い…。
とりあえず、基本的には下記のカラムのデータで絞り込む程度でよければ簡単だろうと思われる(カラムを追加するのは手間がかかるのである)。ジャーナルごと、あるいはジャーナル平均などは比較的軽く、かつインパクトファクタと直接比較できるという利点もあるので、1980年以前の過去方向の拡充とあわせて作業をすすめていきたい所存。
結果の一例(1980年に発表された論文だけを表示)
authors | article | journal | date published | PMID | pagerank score |
---|---|---|---|---|---|
AM. Maxam,W. Gilbert, | Sequencing end-labeled DNA with base-specific chemical cleavages. | Methods in enzymology 65(1): 499-560 | 1980 | 6246368 | 2.96686338446656e-06 |
D. Botstein,RL. White,M. Skolnick,RW. Davis, | Construction of a genetic linkage map in man using restriction fragment length polymorphisms. | American journal of human genetics 32(3): 314-31 | 1980 May | 6247908 | 2.59435518897648e-06 |
M. Kimura, | A simple method for estimating evolutionary rates of base substitutions through comparative studies of nucleotide sequences. | Journal of molecular evolution 16(2): 111-20 | 1980 Dec | 7463489 | 1.56167923343033e-06 |
NL. Brown,M. Smith, | A general method for defining restriction enzyme cleavage and recognition sites. | Methods in enzymology 65(1): 391-404 | 1980 | 6246360 | 1.19093524602294e-06 |
PS. Thomas, | Hybridization of denatured RNA and small DNA fragments transferred to nitrocellulose. | Proceedings of the National Academy of Sciences of the United States of America 77(9): 5201-5 | 1980 Sep | 6159641 | 1.1499044605879e-06 |
RF. Furchgott,JV. Zawadzki, | The obligatory role of endothelial cells in the relaxation of arterial smooth muscle by acetylcholine. | Nature 288(5789): 373-6 | 1980 Nov | 6253831 | 1.03594994675103e-06 |
FJ. Ingelfinger, | Arrogance. | The New England journal of medicine 303(26): 1507-11 | 1980 Dec | 7432420 | 9.0974978749425e-07 |
JF. Fries, | Aging, natural death, and the compression of morbidity. | The New England journal of medicine 303(3): 130-5 | 1980 Jul | 7383070 | 8.55730396924697e-07 |
W. Szmuness,CE. Stevens,EJ. Harley,EA. Zang,WR. Oleszko,DC. William,R. Sadovsky,JM. Morrison,A. Kellner, | Hepatitis B vaccine: demonstration of efficacy in a controlled clinical trial in a high-risk population in the United States. | The New England journal of medicine 303(15): 833-41 | 1980 Oct | 6997738 | 7.98143115302387e-07 |
RW. Smithells,S. Sheppard,CJ. Schorah,MJ. Seller,NC. Nevin,R. Harris,AP. Read,DW. Fielding, | Possible prevention of neural-tube defects by periconceptional vitamin supplementation. | Lancet 1(8164): 339-40 | 1980 Feb | 6101792 | 7.47002806634747e-07 |