编辑中文的Rnw文件

如果您想出一本关于R或者Bioconductor的书,那么使用Sweave来写作无疑可以利用到latex中的诸多优势,同时还可以让系统自动检查和导出你的代码。那么如何使Rnw兼容中文体系统,尤其是简体中文呢?其实这并不难。

首先需要解决的是中文兼容问题。有几种选择,CJK, xeCJK,或者ctex,这决定于你的工作平台。如果你使用的是pdfLaTeX的话,可能需要CJK,如果是XeLaTe[……]

Read more

Bioconductor基础ExpressionSet介绍

在Biobase基础包中,ExpressionSet是非常重要的类,因为Bioconductor设计之初是为了对基因芯片数据进行分析,而ExpressionSet正是Bioconductor为基因表达数据格式所定制的标准。它是所有涉及基因表达量相关数据在Bioconductor中进行操作的基础数据类型,比如affyPLM, affy, oligo, limma, arrayMagic等等。所以当我[……]

Read more

illumina NGS常见问题

1. 毫无经验,从哪里开始呢?
答:待回答

2. NGS需要多少样品?
答:一般要求25ul,10nM的library溶液,片段长度为50-bp(+/- 25-nt)。对于Pacific Bioscience (PacBio)需要大于1ug样品

3. 如果确认样品质量呢?
答:有三种方式:

  1. Standard sequence analysis of library ali[……]

Read more

Bioconductor简介

源:Bioconductor: open software development for computational biology and bioinformatics,Genome Biology 2004, 5:R80

Bioconductor的产生是计算生物学及生物信息学(computational biology and bioinformatics, CBB)发展的产物,其目的[……]

Read more

R扩展包的写作规范

这一规范并不是硬性要求,但是可以帮助我们写出方便和他人交流的代码。

使用命名空间namespaces

除了R的基础包(Base packages)中的函数,其它函数在调用时最好加上命名空间,以方便阅读。

  1. 如果需要调用包中的私有函数,需要写成mypackage:::.somePrivateFunc()的形式。最初,人们习惯私有函数的写法是以.起始的匈牙利命名法的函数名。但是新的R[……]

Read more

R中的逻辑运算符&, &&, |, ||

在R中,逻辑运算符(logical operator)有!, &, &&, |, ||, xor, isTRUE等等。

问题:&与&&, |与||有什么区别呢?它们是否是一致的呢?

答:否。我们将&和|称为短逻辑符,&&及||称为长逻辑符。长逻辑符只比较左边和右边的第一个元素,而短逻辑符会比较所以的。我们来看示例:

dc16110bd0e04b192f08d08b5296a16101[……]

Read more

在R中为histogram增加拟合曲线

有一个前题,那就是,这里我们并不需要真实的数据分布曲线,只是希望得到一条曲线,可以拟合柱状图的高度就可以了。如果知道分布公式了,可以直接使用分布公式计算出拟合曲线。

我们使用的办法是使用loess回归后计算出一条拟合曲线。

> h<-hist(mtcars$mpg, breaks=12)
> lo <- loess(h$counts~h$mids)
> x<- seq(min(h$breaks), max(h$breaks), (max(h$breaks)-min(h$breaks))/1000)
> lines(x, predict(lo, x), col="red")

如何创建一个R扩展包

名词解释;

  • 包(Package): 基于R系统的标准化的代码,数据及文档的文件集合
  • 库(Library): 安装包的文件路径
  • 安装源(Repository): 提供可用于安装的带有版本控制的包的网站
  • 源码(Source): 人类可读的源代码或者文档组合而成的包的一种形式
  • 二进制文件(Binary): 依据指定操作平台经过编译形成的机器可读的二进制形式代码或者文档组合而成的包[……]

Read more