在选择性剪接事件描述中的外显子序数是如何得来的?How are exons numbered when people describe alternative splicing events

我们在文章中经常看到某一个外显子被选择性剪接掉了时它所使用的描述并不是外显子的位置或者其它,而是一个数字,比如说exon6, exon2, exon4a 这样子。那么这些序数是如何得来的呢?我们又如何才能通过这些数字准确地找到其所描述的外显子呢?

通常,这种描述都来自于refSeq的定义。在refSeq的定义中,是这样描述的:(http://www.ncbi.nlm.nih.gov/books/NBK50679/#RefSeqFAQ.how_are_exons_numbered_on_refs)

refSeq会将一个基因中已知的所有的外显子按其在gene上出现的顺序排序,如果遇到重叠的外显子,就以出现的先后顺序加注a,b,c…。

假设我们有一个基因有四个外显子,那么它的计数就会如下所示:

Exon1--------Exon2--------Exon3--------Exon4       gene level
Exon1---------------------Exon3--------Exon4       variant 1
Exon1--------Exon2---------------------Exon4       variant 2

如果在Exon2的位置出现的两个重叠的exon,那么,先出现的一个会被定义为exon2a, 后出现的一个被定义为exon2b。

发表评论

电子邮件地址不会被公开。 必填项已用*标注