几个关于癌症基因的数据库(TCGA) 3

突变数据:
http://www.tumorportal.org/

癌基因相关:
Cancer Gene Census (CGC)

3 thoughts on “几个关于癌症基因的数据库(TCGA)

  1. Reply R初学者 6月 24,2014 9:38 上午

    博主您好:
    我买了您编写的“R与bioconductor…”的书,最近在弄TCGA的数据,有一个问题非常困惑。我下载了TCGA的miRNA的3级数据,里面包括“read_count”和“reads_per_million_miRNA_mapped”,我只想从每个样本的数据中选出一个我研究的miRNA的RPKM值,但是在挑选我想要的RPKM值之前要对数据做标准化,请问博主应该用什么方法做标准化?是对“read_count”还是对“reads_per_million_miRNA_mapped”做标准化?非常感谢博主。

    • Reply admin 6月 26,2014 6:10 上午

      直接使用RPKM值既可。它是一个已经标准化过的值。如果你需要使用自己的标准化办法,请使用read_count,并且需要收集整个基因组的read_count,然后再自己行标准化。这时可以使用DEseq/DEseq2或者edgeR来进行标准化。

Leave a Reply

  

  

  

%d 博主赞过: