博客内所有文字、录相及图片,除声明转载外,本人拥有此博客内所有资料的版权。未经本人的明确许可,任何人不得复制或者转载或者制作镜像。如需授权,请以留言的形式与本人取得联系。
如果想留下你的博客(主题必须与生物信息,统计,计算机等相关),请留言。
友情链接
欢迎来到糗糗的世界
博客内所有文字、录相及图片,除声明转载外,本人拥有此博客内所有资料的版权。未经本人的明确许可,任何人不得复制或者转载或者制作镜像。如需授权,请以留言的形式与本人取得联系。
如果想留下你的博客(主题必须与生物信息,统计,计算机等相关),请留言。
友情链接
您好,我是高山,在堪萨斯大学做博士后,在您百忙之中打扰,其实就是想邀请您加入我们的讨论群。该群建立在http://groups.google.com/group/chinese-bioinformatics,有时打不开,可以去google搜索一下,就可以找到链接。也可以直接发信到chinese-bioinformatics@googlegroups.com,所有人都可以看到。
您的通信方式是我通过bioinformatics各类会议搜集的,如果您觉得不妥,可以回信,我立刻删除,以免日后打扰。
针对学术会议在对于我们学术研究的提高起到很大作用的同时,也存在一些问题:1.学术会议流于形式,大部分传播一些概念,不求甚解,国内学者大部分精力忙于四处开会,真正得到吸收的知识有限;2.各实验室人力资源过于分散,各干各的,效率很低,无法真正形成交流。因此希望此群作为学术会议的有益补充,可以便于共享各种资源:大家自己的学习心得,研究成果,特别需要detail;大家参加会议讲座的视频,内部资料,手稿;组织讨论班,暑期学校的通知,接待,访问等等。这个群建立已经有1年了,得到了很多国内外生物信息学界前辈的支持,在此表示感谢,目前已有人数324人,是国内最大的。
不想参加的可以回复,我保证绝不再次打扰,但请不要举报垃圾邮件,会影响很多人加入并交流
当前我们群的主要任务是通过网络合作,建立自己的下一代测序数据挖掘平台,这将是未来生物信息学乃至整个生命科学的发动机。
身处美国,亲身感受到下一代测序技术带来的影响,绝对是革命性变化。这么巨大的数据量,使我们可以用统计方法,更加准确的确定潜在靶点
很多生物信息专家都转到了这一领域,现在主要瓶颈就是数据的标准化和后续处理,我们在硬件上是拼不过美国了,希望同行努力,一起在数据挖掘方面赶上来
谢谢
希望保持联系。
高山
又来请教您一个问题。我在用AnnotationForge包生成primeview.db后,发现后续将expressionset中probeID与gene symbol对应上时,有很多probeID无法对应到相应的gene symbol,仍然显示probeID。而实际上在原始的注释文件中该probeID是有对应的gene symbol的。请问是怎么回事呢?
如果你自己动手做桥联文件,会好一些,因为你可以做出多个不同数据库的桥联文件,然后把它们得到的结果都累加起来。你查看一下,对于primeview,有至少四至五种数据来源吧,我记不清了,你可以都做一遍,然后整合。
您好!请教您一个问题。
单位的服务器不能连接外网,如果我安装package,如何避免不用下载源包自行安装的方法,(您也知道各个包的相互依赖关系太复杂了)?
是否可以在我自己的电脑上建立一个镜像,然后服务器连接我电脑的镜像呢?
谢谢
请教您一个问题,单位的服务器不能连接外网,如何给R装package呢?(不想下载了再一个个装,互相依赖关系搞不定)
是否可以在我自己的电脑上建立一个镜像,然后服务器引用我这个镜像呢?谢谢
您好。请教不敢当。您的这个问题答案是肯定的。您需要设置两个镜像,一个是R的,一个是Bioconductor的。镜像的制作都非常简单,使用http://cran.r-project.org/mirror-howto.html, 及http://www.bioconductor.org/about/mirrors/mirror-how-to/上的帮助即可。设置好镜像之后,你在安装时调整安装镜像即可。
^_^
你好!我最近想用R软件做一个heatmap图来显示基因的表达差异,但之前没用过这个软件,不知道从哪开始着手,希望你能给我指点一二,谢谢!
您可以参见博文:http://pgfe.umassmed.edu/ou/archives/2477
不错,哈哈 加油!
circos R/BioConductor alignment 都是干货啊
谢谢。
请问我按照R语言与Bioconductor生物信息学应用书上编写的程序为什么出错
> source(“http://Bioconductor.org/biocLite.R”)
> biocLite(“limma”)
> library(limma)
> biocLite(“affy”)
> library(affy)
载入需要的程辑包:BiocGenerics
载入需要的程辑包:parallel
载入程辑包:‘BiocGenerics’
下列对象被屏蔽了from ‘package:parallel’:
clusterApply, clusterApplyLB, clusterCall, clusterEvalQ,
clusterExport, clusterMap, parApply, parCapply, parLapply,
parLapplyLB, parRapply, parSapply, parSapplyLB
下列对象被屏蔽了from ‘package:limma’:
plotMA
下列对象被屏蔽了from ‘package:stats’:
xtabs
下列对象被屏蔽了from ‘package:base’:
anyDuplicated, append, as.data.frame, as.vector, cbind,
colnames, do.call, duplicated, eval, evalq, Filter, Find, get,
intersect, is.unsorted, lapply, Map, mapply, match, mget, order,
paste, pmax, pmax.int, pmin, pmin.int, Position, rank, rbind,
Reduce, rep.int, rownames, sapply, setdiff, sort, table, tapply,
union, unique, unlist
载入需要的程辑包:Biobase
Welcome to Bioconductor
Vignettes contain introductory material; view with
‘browseVignettes()’. To cite Bioconductor, see
‘citation(“Biobase”)’, and for packages ‘citation(“pkgname”)’.
> affybatch tb disease disease
design TALL BALL
1 GSM336974 1 0
2 GSM336975 1 0
3 GSM336976 1 0
4 GSM336977 1 0
5 GSM336978 1 0
6 GSM336979 1 0
7 GSM336980 1 0
8 GSM336981 1 0
9 GSM336982 1 0
10 GSM336983 1 0
11 GSM337071 0 1
12 GSM337072 0 1
13 GSM337073 0 1
14 GSM337074 0 1
15 GSM337075 0 1
16 GSM337076 0 1
17 GSM337077 0 1
18 GSM337078 0 1
19 GSM337079 0 1
20 GSM337080 0 1
> eset disease design contrast.matrix fit<-lmFit (eset,design)
错误于as.vector(x, mode) :
cannot coerce type 'closure' to vector of type 'any'
你的最后一行是什么?怎么会是这样子呢?你贴上来的代码很混乱啊。
您好!看了您的博客觉得您非常专业,想请问一个问题,谢谢!
我在做基因芯片分析过程中,做到GO和KEGG分析时,发现需要给基因加上GO和KEGG注释,我是按下面这个网址上的代码进行的:http://seuzsl.blog.163.com/blog/static/218798052013491049169/?latestBlog
按照里面的做法,
使用这个函数和下列代码就可以获得AGI、GO和KEGG注释:
library(plyr)
results.anno <- results.sig[,1:2]
for(i in 1:3){
anno <- switch(i, hgu133plus2ACCNUM, hgu133plus2GO, hgu133plus2PATH)
anno.label <- switch(i, "AGI", "GO", "PATH")
mapped.probes <- mappedkeys(anno)
mapped.present <- intersect(genes.sig, mapped.probes)
mapped.anno <- as.list(anno[mapped.present])
if(anno.label=="GO") mapped.anno <- get.GO(mapped.present, mapped.anno)
mapped.anno <- llply(mapped.anno, unique)
mapped.anno <- ldply(mapped.anno, paste, collapse="; ")
colnames(mapped.anno) <- c("probe_id" , anno.label)
results.anno <- merge(results.anno, mapped.anno, by.x = "probe_id", all = TRUE)
}
但是运行后出现:
错误于`colnames<-`(`*tmp*`, value = c("probe_id", "AGI")) :
'names'属性的长度[2]必需和矢量的长度[0]一样
请您帮忙看一下是哪里出了问题可以吗?谢谢!
谢谢你的谬赞。因为信息太少,我无法重复。在遇到问题时,您可以试着先使用traceback()来查看问题所在的具体行。然后step-by-step查看。我怀疑你的错误在于mapped.anno出来的结果并不是一个两列的data.frame,而你却试图给它两个列名。
您说的很对,因为我是按照网上查到的代码复制过来做的,遇到问题不知道该怎么修改代码。非常感谢您的认真回复!
不知是否可以再麻烦您一下,哪里可以找到用R软件给探针序列加上GO和KEGG注释的操作指南,您可以告知一下吗?我好去找来认真学习,多谢您!
博主,你好!
看了的文章,觉得非常有帮助,非常感谢!
博主您好,想请教您一个问题,(我是初学者,如果问题很小白请不要见怪LOL)
> .libPaths(“D:\\R-Projects\\R\\library”)
> source(“http://bioconductor.org/biocLite.R”)
>library(rae230a.db)
错误提示是:
载入需要的程辑包:org.Rn.eg.db
Error : loadNamespace()里算’org.Rn.eg.db’时.onLoad失败了,详细内容:
调用: sqliteNewConnection(drv, …)
错误: RS-DBI driver: (could not connect to dbname:
unable to open database file
)
错误: 无法载入程辑包‘org.Rn.eg.db’
然后我就去载入org.Rn.eg.db了,但是还是错误
> biocLite(“org.Rn.eg.db”)
> library(org.Rn.eg.db)
错误提示还是一样的:
Error : loadNamespace()里算’org.Rn.eg.db’时.onLoad失败了,详细内容:
调用: sqliteNewConnection(drv, …)
错误: RS-DBI driver: (could not connect to dbname:
unable to open database file
)
错误: ‘org.Rn.eg.db’程辑包或名字空间载入失败
网上找不到类似的案例,没有头绪了请楼主帮忙解答,谢谢!
请将org.Rn.eg.db包下载至本地,然后再安装试试。如果还是有相同的错误提示再告知。
您好,我在安装新版本的cufflinks-2.2.1时遇到如下问题,解压输入
./configure
后,出现:
checking for bamlib… configure: error: We could not detect the bam libraries (version or higher). If you have a staged bam library (still not installed) please specify $BAM_ROOT in your environment and do not give a PATH to –with-bam option. If you are sure you have bam installed, then check your version number looking in . See http://randspringer.de/bam for more documentation.
我的samtools的版本是1.0,换成0.1.19也会出现该问题,我之前安装的cufflinks版本是1.3.0,运行正常。我的系统是ubuntu13.04。您能指导我一下这是什么原因吗?如何才能安装新版本得cufflinks吗?之前google得到的信息不足以解决该问题。
请按照http://cufflinks.cbcb.umd.edu/tutorial.html中Installing the SAM tools的步骤一步一步完成安装。
您好,我想使用Circos来做一个link的图,但是按照您的教程,一直有错误产生。
我构建了两个文件
1:circos.conf
含有两个物种染色体的数目长度信息
2:link.txt
含有对应的染色体位置信息
每次运行都是错误,请给点意见!
示例中的例子能跑起来吗?
刚刚发现这个博客,博主实乃高人也。
你好,请问我在运行下面的代码时,为什么会出现下面的错误信息makeDBPackage(“HUMANCHIP_DB”,affy=TRUE,prefix=”primeviewdb”,fileName=”PrimeView.na32.annot.csv”,baseMapType=”eg”,outputDir=”primeviewdb”,version=”1.0.0″,manufacture=”affymetrix”,chipName=”PrimeViewHumanGeneExpressionArray”,manufacturerUrl=”http://www.affymetrix.com”)
Error in readLines(con) : cannot open the connection
In addition: Warning message:
In readLines(con) :
cannot open file ‘PrimeView.na32.annot.csv’: Permission denied
提示说因为权限的原因无法打开PrimeView.na32.annot.csv文件。先查一下是不是权限的原因。
你好,我是一名肿瘤科临床医生,目前研究的课题遇到困难,想通过生物信息学方法初步筛选出目的基因的上游调控基因,然后再体外验证,最后临床验证,现在生物信息学可否初步对目的基因的上游调控基因进行初步筛选?如果可能,不知是否可指导该如何下手?
对于上游调控基因筛选,我也几乎没有接触过。以前一般通过酵母双杂交(Y2H),酵母单杂交(Y1H),(这两者都是蛋白质水平), 细菌单杂交(B1H)(蛋白质与基因间相互作用)等手段筛选。因为很久没有做过实验了,所以对这方面的进展也不是很了解。
欧老师,你好,请问R语言与Bioconductor生物信息学应用书中的代码可以在哪下载呢?160685613已经关了,而263733906也不加人。
此类问题请与高山联系。263733906应该是还有位置的。
This is an awesome blog. And the host is really a professional. I am new to R and bioconductor, however I would like to analyze the data myself. I got 15 microarray files from illumina humanHT 12v4 platform. There are 3 kinds, each kind has 5 files. For example in one kind, there are:
nonorm_bkgdsubtracted.ppj
nonorm_bkgdsubtracted.txt
nonorm_bkgdsubtracted_AVGSignal.txt
nonorm_bkgdsubtracted_AVGSignal.txt.fmt
nonorm_bkgdsubtracted_HumanHT12.annotation.txt
The other 2 are nonorm_nobkgdsubtract and Quantile-normalized_bkgdsubtracted.
I wonder which one should I open in R and with which package? If there is any link for more information, I appreciate. Thank you again!
我想你可以从Quantile-normalized_bkgdsubtracted入手。因为它是normalized数据,不需要自己再做normalization.
还是要有个独立域名啊
独立域名容易被盾,我已经试过好多次了。还是挂在教育网比较安全。
我们h都是交流学术的合法公民,不怕。
我是被墙了好多次了,非常影响与朋友交流。
你好,是否能互相添加博客链接?这是我的博客地址,http://yulongniu.bionutshell.org/,主要记录生物信息学和Linux使用,谢谢。
非常欢迎。已经添加。
您好!
我非常欣赏你的博客,这里有很多NGS的知识和R语言等编程技巧.
我做了一个BJC( bioinformatics Journal club)的博客和论坛.http://bio985.com/
我想通过大家交流一些最新的生物信息paper,抓住前沿.
希望可以交换友情链接.我的邮箱:hujinyutju@gmail.com
非常感谢您的留言以及友情链接交换的提议。因为您的网站运行时间过短,暂时我不能肯定您是否会坚持下去。所以,我希望您在网站运行三个月之后再次留言,至时我会非常欢迎交换链接。因此造成的不便希望您能理解。谢谢。
感谢博主的分享,能问下是什么原因要关闭这个网站而要转到新浪博客上去呢?
还有你是用什么搭建的这个网站啊,好像不是wordpress啊,我也好希望自己也有一个这样干净的网站啊。
嗯,老板担心中文资料会被人误会资源滥用。所以小心为妙,还是搬走。
还有,这个站就是用的wordpress啊。只是选了一个简单的模板。
多谢您的回复!我也想将我的笔记做成这样的博客,也方便自己查阅。以后有什么不懂的再来请教。
博主您好,想请教您一个关于笔记的问题。您这里所有的文章应该都是整理过的吧,想问下你平时都是怎样来记录你的笔记的啊,到什么程度才将笔记整理到您博客上来的呢?
随心所欲。你觉得可以拿来和人分享就可以了。分享以后还可以慢慢纠正修改的。反正是个人博客,又不是静止的书。
欧老师您好,请问通过转录组测序获得的目的基因序列,怎么确定这个基因的CDS区?通过orffinder预测出的完整最长的这个orf可否认为是这个基因的CDS区?
可以试一下cufflinks.
您好,可否互相添加博客。博客地址为https://shanguangyu.com/,主要关于生物信息与数据挖掘,多谢。
很不错的博客。请努力坚持。
不好意思,我是计算机系的学生。毕业设计和生物信息学有关但之前没有基础。想参考您的生物信息学笔记进行学习,能否行个方便。谢谢
如果你觉得入门有困难的话,可以找相关的书籍来看,看书应该是最系统的。我的笔记早已经不知道在哪里了。
那个我自己有找到一些,但我没那个需要和时间系统性学习。有搜索到你的部分笔记刚好符合我的需求
老师您好,请教一个问题,实在是不知道问谁了,我们在一篇文章中做基因差异表达分析时需要用到moderated t-tests ,DNASTAR中的ArrayStar可以做moderated t-tests 。看您有没有用过ArrayStar?我们在官网上下载的软件只能试用DNASTAR Lasergene中的子软件Molecular Biology,而Genomics中的ArrayStar却不能用,需要填写一个ArrayStar 的product key,希望您能提供一下帮助,非常感谢
不好意思,我没有使用过ArrayStar。帮不上您的忙。
博主您好,这几年在您这学到了很多东西,非常感谢~
建议您开个公众号,我相信很多人会给您进行打赏。
谢谢您的赞赏。以后有可能会开公众号。大家欣赏是我前进的动力。
老师您好!我最近想分析Affymetrix mirna 4.0的一个芯片,但readaffy后不能qc也不能标准化,显示缺少cdf。 我到affymetrix官网下了miRNA-4_0-st-v1_CDF文件,用makecdfenv包把内含的cdf文件做成package。我把这个package压缩成zip格式,但发现install完始终不能library这个包。希望您能提供一下帮助,非常感谢!
我假设你的包是成功做好了。安装的话,请在R中使用
library(BiocInstaller)
biocLite(“path/to/your/package”, repos=NULL, type=”source”)
如果还是不能成功,再来问我。
这个网站简直是太好了;学习到了很多东西;
我刚刚开始学习R语言,已经学习到了nanoSTRING,博主如果方便的时候可否简单写点这方面的知识
nanoSTRING我没有做过啊,所以写不了啊。
你好,是否有使用过mummer比较两个基因组序列,我想知道一个assembly在另一个complete genome上的coverage,弄了一会儿,没搞出来。
我也没做过啊。
新博客不能留言。。。《生物信息学与R入门教程》博主还在写么。希望能把几个没写完的章节早日完成。博主辛苦了,谢谢分享!
谢谢鼓励。实在是太忙了。