Bioconductor软件包下载统计

bioconductor有它自己的统计,在http://bioconductor.org/packages/stats/index.html。其中有top50的统计。但是这是全部下载的统计,体现不出一些新的软件包的快速成长。所以本人制作了一个统计表。本着本表,本博客会逐步介绍一些使用率高的软件包。

Package
Maintainer
Title
last Month down[……]

Read more

多版本R并存

如果你现在安装了R 3.0.1,你还需要安装R development version的时候,应该怎么做呢?

http://r.research.att.com/提供了每日更新的R-dev版本。但是如果你直接使用它编译好的文件,可能会让你在后期的工作中有无穷的困扰,我就深入其害。我的做法是下载R-dev的原代码,然后通过:

./configure
make
make install[......]

Read more

为R/Bioconductor开发调整RStudio

RStudio默认的是R。但是在很多情况下,我们需要使用到R-dev的这样的开发版本,应该怎么办呢?本文就讲解如何指定RStudio调用R-dev版本。

如果你安装的是windows,那么你只能重新安装一个新的RStudio,在安装的过程中,选择不同的R版本。
versions_windows

如果你的系统是MAC OSX,那么你的任务就简单得多了。首先你需要安装好开发版本的RFramework。可以从http:/[……]

Read more

使用bioconductor的BiocStyle书写package vignettes

Bioconductor core推出了BiocStyle软件包,很快这一规范会应用至大多数的bioconductor的软件包。

vignettes文件就很好地示例了如何使用及其显示结果。

BiocStyle提供了一些很好的宏,这其中就包括在Rd文件中常常使用到的\Rpackage, \Rfunction等。BiocStyle还为插入图象提供了很好的支持,我们只需要使用

48559[……]

Read more

短序比对工具简介bowtie vs BWA vs Subread vs SOAP vs NovoAlign

有趣的是,大部分的short read比对工具都是由中国人写出来的。因此可以说华大基因(BGI, Beijing Genomics Institute, Chinese Academy of Science)是中国NGS测序技术的摇篮。

速度上较有优势的short read(短序)比对工具最早出现的是SOAP(表1)。它很好地解决了一个问题,那就是如何在小内存(4G)的机器上将短序比对至人类[……]

Read more

使用pathview图形化显示KEGG富集结果

pathview是一个新推出的Bioconductor软件包,可以用于图形化显示KEGG富集分析的结果。

这里我就来示例一下如何使用pathview以及其输出图形的效果:

> library("org.Hs.eg.db")
> frame <- toTable(org.Hs.egPATH)
> keggframeData <- data.frame(frame$path_id, frame$gene_id)
> keggFrame=KEGGFrame(keggframeData,organism="Homo sapiens")
> library("GSEABase")
> library("GOstats")
> gsc <- GeneSetCollection(keggFrame, setType = KEGGCollection())
> universe = Lkeys(org.Hs.egGO)
> library(GeneAnswers)
> data("humanExpr")
> genes <- as.character(humanExpr$GeneID)
> kparams <- GSEAKEGGHyperGParams(name="My Custom GSEA based annot Params",
+  geneSetCollection=gsc,
+  geneIds = genes,
+  universeGeneIds = universe,
+  pvalueCutoff = 0.05,
+  testDirection = "over")
> kOver <- hyperGTest(kparams)
> kOver <- summary(kOver)
> library(pathview)
> gene.data <- humanExpr$Ctrl1
> names(gene.data) <- humanExpr$GeneID
> pv.out <- pathview(gene.data=gene.data, pathway.id=kOver$KEGGID[1], species="hsa", out.suffix="pathview.hsa04110.Ctrl1", kegg.native=TRUE)

hsa04110.pathview.hsa04110.Ctrl1

使用xps分析affymetrix genechip

在之前的博文《使用xps和oligo分析Affymetrix Exon/Gene ST Arrays》中有介绍如何使用xps来分析affymetrix GeneChip的部分。写本文的目的是为了更好的给出如何使用xps的方法。

使用xps的基础是root。root有它的优点,也有它的缺点。其优势是一旦生成了root文件,就可以反复使用。其缺点就是文件的前期整理制作让新手会因为陌生而产生抵抗,[……]

Read more

升级完R后如何快速安装所有安装过的包

R3.0已经发布了。很多人在升级前最担心的是安装了很多包,每次大版本升级都需要一个一个全新安装一遍,很是折磨人啊。

如果你在安装升级之前就看到这里,那么你可以按照如下操作完成自动安装所有安装过的包:
首先在旧版本下运行

##-run in the old version of R 
setwd("path/to/save/the/package/list/") 
olib <- installed.packages()[,"Package"] 
save(olib, file="oldRpackages")

这一步是为了把所有的包都保存下来。然后在安装了新版本后运行

485594095b68457[……]

Read more

使用HOMER分析CLIP-SEQ数据

HOMER是一个使用perl和C写成的motif分析工具。之前在分析clip-seq分析时,按照文献中材料和方法所写的流程进行分析,却无法得到与文献一致的结果。想来多半是文章发表时,并没有把所有的细节写清楚,导致我在重复时参数选择方面并没有与原作者保持一致。另一个原因是基因组几经修改,原本的hg17的数据无法下载到,只能下载到liftover到hg18的数据。为此,进行了一下google rese[……]

Read more