如何使用biomaRt做hg19注释

因为现在ensembl已经更新了human的注释库,所以当你直接使用

library("biomaRt")
database <- listDatasets(useMart("ensembl"))
database[database[,1]=='hsapiens_gene_ensembl',]
                 dataset                 description version
32 hsapiens_gene_ensembl Homo sapiens genes (GRCh38)  GRCh38

你会得到的是GRCh38(hg38)的注释库。
那么如何转换至hg19注释库呢?
使用

mart <- useMart("ENSEMBL_MART_ENSEMBL", host="grch37.ensembl.org", path="/biomart/martservice")
database <- listDatasets(mart)
database[database[,1]=='hsapiens_gene_ensembl',]

[……]

Read more

R/Bioconductor开发中import和depend的区别

import:将命名空间载入

depends:将命名空间载入,并且放入搜索目录。

两者在使用上的区别是:import只载入对开发者有用的,而depends需要载入对用户有用的。比如说GenomicRanges,
如果你开发的包使用到了GRanges类,并且它会成为结果返回给用户,那么你就必须使用depends了,如果你只是用了GenomicRanges中的类或者函数,比如说GRang[……]

Read more

生物信息学生R入门教程–前言

本教程版权为《糗世界》所有,任何组织或个人不得未经书面许可转载。

本教程主要针对的对象为R/Bioconductor零基础的一线科研人员,生物信息学在读学生,以及想系统学习与掌握Bioconductor的专业信息分析人员。

如果你已经有了一定的R基础,你可以忽略本教程的学习。但是笔者还是建议有R基础的读者有机会反过头来了解一下本教程的内容。

为什么R

R是基于S的脚本式语言[……]

Read more

生物信息学生R入门教程–R的数据结构

本教程版权为《糗世界》所有,任何组织或个人不得未经书面许可转载。

在阅读本节前请自测,如果全部都知道正确答案,则可跳过本节。

  • 什么是atomic vector的常用基本类型?
  • list和atomic vector有哪些不同?
  • matrix和data frame有什么不同?
  • data frame的列可以保存list吗?
  • data frame的每一行或者每一列的长度可以不一致吗?
  • 如何将factor正确地转换为数字?

[……]

Read more

生物信息学生R入门教程–输入与输出

本教程版权为《糗世界》所有,任何组织或个人不得未经书面许可转载。

在阅读本节前请自测,如果全部都知道正确答案,则可跳过本节。

  • 如何变更工作目录?
  • 文本输入时如何只读取前五行?
  • 读取xls文件需要调用什么软件包?
  • 读写数据库文件有哪些软件包?
  • 保存R数据时如何达到最大压缩比?
  • 使用Excel读取R输出的文本文件时有哪些潜在的错误可能?

[……]

Read more