生物信息学生R入门教程–前言

本教程版权为《糗世界》所有,任何组织或个人不得未经书面许可转载。

本教程主要针对的对象为R/Bioconductor零基础的一线科研人员,生物信息学在读学生,以及想系统学习与掌握Bioconductor的专业信息分析人员。

如果你已经有了一定的R基础,你可以忽略本教程的学习。但是笔者还是建议有R基础的读者有机会反过头来了解一下本教程的内容。

为什么R

R是基于S的脚本式语言[……]

Read more

生物信息学生R入门教程–R的数据结构

本教程版权为《糗世界》所有,任何组织或个人不得未经书面许可转载。

在阅读本节前请自测,如果全部都知道正确答案,则可跳过本节。

  • 什么是atomic vector的常用基本类型?
  • list和atomic vector有哪些不同?
  • matrix和data frame有什么不同?
  • data frame的列可以保存list吗?
  • data frame的每一行或者每一列的长度可以不一致吗?
  • 如何将factor正确地转换为数字?

[……]

Read more

生物信息学生R入门教程–输入与输出

本教程版权为《糗世界》所有,任何组织或个人不得未经书面许可转载。

在阅读本节前请自测,如果全部都知道正确答案,则可跳过本节。

  • 如何变更工作目录?
  • 文本输入时如何只读取前五行?
  • 读取xls文件需要调用什么软件包?
  • 读写数据库文件有哪些软件包?
  • 保存R数据时如何达到最大压缩比?
  • 使用Excel读取R输出的文本文件时有哪些潜在的错误可能?

[……]

Read more

生物信息学生R入门教程–绘图基础

本教程版权为《糗世界》所有,任何组织或个人不得未经书面许可转载。

在阅读本节前请自测,如果全部都知道正确答案,则可跳过本节。

  • 如何保存一个图像?
  • 如何绘制散点图?
  • 如何绘制饼图?
  • 如何绘制箱线图?
  • 如何绘制线图?
  • 如何绘制柱状图?

[……]

Read more

生物信息学生R入门教程–R编程

本教程版权为《糗世界》所有,任何组织或个人不得未经书面许可转载。

在阅读本节前请自测,如果全部都知道正确答案,则可跳过本节。

  • 常用函数是否全部掌握(见下表)?
  • 请编写一个函数并达到自己的设计要求。
  • 为什么R应该尽量避免for循环?
  • 什么是引用类(refference class)

[……]

Read more

如何得到exon numbering

以前,NCBI的genomic browser中是可以得到一个所谓的exon number的。其规则为同一个基因内所有exon按5′->3’排序,用排序序号来做为exon number。对于有重叠的exon使用同一序号,以排序先后为其加上a,b,c…的后缀。
art9-cc-figure-1(fix)
但是这其实是一个很不靠谱的表达方式,因为随着基因的转录本的变化,有可能会新增加exon。所以一些文章中使用exon number来标[……]

Read more

使用Rcurl提交表单

有时候需要向在线工具批量提交申请。手动操作非常繁琐,使用curl工具提交会非常方便。

Rcurl已经整合好了相关代码,使用简便。下面就给出一个示例:

library(RCurl) #调用curl
curl <- getCurlHandle() #虚拟一个浏览器
curlSetOpt(cookiejar=tempfile(), curl=curl) #生成cookie
getURL("http://some.webpage.com/index.php", curl=curl) #填充cookie
response <- postForm("http://some.webpage.com/form.handle.page.php", style="HTTPPOST", data=data, file=fileUpload(filename="tobeuploadedfile.txt", contentType="text/plain"), curl=curl) #提交表单,表单对应的网址写在第一个参数中,具体帮助请使用?postForm查看。