和记娱乐网赌场

在线交流“转录组、miRNA以及两者贯穿分析”问答集锦

随着高通量测序技术的成熟,转录组测序为基因组学研究提供了全新的角度。比如转录组测序可以用来预测基因结构、可变剪切、SNP检测、CDS预测以及基因融合鉴定等等。从而越来越多的科研人员开始做转录组测序项目;但另一方面,在转录组测序越来越热门的同时,很多科研工作者在数据分析上也遇到了诸多问题。

为此,基迪奥生物特邀两位在转录组测序与数据解读方面非常有经验的技术工程师,在基迪奥生物信息交流QQ群与大家进行在线交流(群号:67185986),在线探讨转录组数据分析及与miRNA贯穿分析的相关问题。

  • 【Unigene与转录本】请问下转录组测序中,组装后的unigene和转录本这两个东西该怎么理解?是一样的吗?

    和记娱乐网赌场 本质上区别不大。triniy组装出来的视为转录本(mRNA),之后去除冗余后(比如挑最长的转录本),统一命名为unigene。Unigene视为转录本的子集。 

  • 【Unigene与转录本】挑最长的转录本 自己写脚本吗?

    写程序。 

  • 【Unigene与转录本】既然是子集,可否找出和子集序列相关的其他unigene?

    trinity 的根据组装过程可以区分出来全部的转录本和最后的unigene的,不用后面再分子集。 

  • 【Unigene与转录本】在文章中用unigene还是转录本?

    和记娱乐网赌场 无参物种使用 Unigene,有参物种使用用转录本比较好。 

  • 【Unigene与转录本】无参的转录组分析组装出来的fa文件怎么得到unigene?

    unigene概念很宽泛,我们是取最长转录本来作为unigene。 

  • 【Unigene与转录本】转录组分析中新转录本和可变剪接怎么分析?

    如果是无参考的,新转录本和可变剪接的分析方法基本没有区别,如果是有参考的话,两者分析方法就不一样,前者分析功能,表达量,后者分析结构上的变化等等。
    具体实现方法的目的有很多,但全部说的话会很久。我们假设一个分析目的是有参考的可变剪切,可以用asprofile来分析可变剪切的结构。

     

  • 【靶基因问题】真菌中预测miRNA比较好的软件有哪些?

    我们也没有好的方法,mirBase里面都没有,目前也只有在酵母中发现极少数的miRNA 

  • 【靶基因问题】小RNA 测序数据初步处理时PDF里给出了两种软件,cutadapt,fastx-toolkit,用哪个比较好还是两个都需要用?

    两个都可以。 

  • 【靶基因问题】在预测新的miRNA时,你们给出的思路是先预测其二级结构再用mireap,这个是专门针对植物还是动物啊,有没有别的可以推啊?

    和记娱乐网赌场 没有针对性,这个方法是通用的。 

  • 【靶基因问题】miRNA测序结果怎么去掉一些其他的RNA,诸如rRNA,tRNA之类的,我看到有的文献里会展示出来?

    和记娱乐网赌场 比对Rfam数据库,比对到的为rRNA或者tRNA,去掉即可。 

  • 【靶基因问题】是对RFAM下载到的数据直接BLAST吗?

    是的。 

  • 【靶基因问题】可是我用的Fastx_toolkit之中出问题,去接头的话只能去掉4%的数据,这样是不是出错了?

    不一定是软件的问题,你先看看你去完接头之后的长度分布,一般动物的峰值在22,植物在21和24,你先看下有没有问题。比如最好画个长度分布,这样验证最准确。如果接头没去干净,峰会右偏;如果接头去过头了,峰会左偏。 

  • 【靶基因问题】你能给我看个去接头质量比较好的峰图吗?

     

  • 【靶基因问题】我看到预测新的miRNA的时候,有的是先预测出来成熟的miRNA序列在预测二级结构,例如MiRDeep-P,这个与cutadapt,fastx-toolkit比较,哪个更好一些?

    不同的文献有不同的方法,不能确定哪个方法更好,跟你的样本,试验方法等等相关。 

  • 【靶基因问题】可是如果不知道用哪个怎么选择呢?

    和记娱乐网赌场 基于发卡结构的新micorRNA不管用什么方法预测,假阳性都较高,不用纠结。 

  • 【靶基因问题】预测miRNA靶基因最好的方法是多个软件预测去交集对吧,我看到也有好多文献就用一个的,这是怎么回事。不是最好多个软件么?

    植物不需要用多个软件,因为其作用方式与动物的不一样,本来靶基因就少,取交集就更少了。另外,miranda 、targetscan 等都是针对动物的,最好不要用来预测植物的。 

  • 【靶基因问题】可是用一个的话有的miRNA会出现4-5个靶基因,到时候实验验证增大了工作量啊。那这样的话实验验证工作怎么做?

    如果你为了实验验证量小点,可以取交集,当然这样做会增加假阴性。或者可以查查文献,再选选别的取交集。 

  • 【靶基因问题】miRNA植物预测的最好软件是什么,我看到用什么的都有。以及miRNA预测的靶基因做GO分析应该怎么做?

    和记娱乐网赌场 没有“最好”。GO分析只有富集分析,下文有具体说明。 

  • 【靶基因问题】怎么分析miRNA在其他物种的保守性?怎么比对呢?在什么网址blast,是mibase?

    和记娱乐网赌场 和mirbase比对。在其他物种中找些保守miRNA,自己研究的物种找些保守的miRNA,blast比对就可以。推荐你一个简单的工具,mirdeep,你只要有小RNA测序数据,最后保守的novel的都会出来啊。 

  • 【蛋白家族问题】基因家族怎么分析?

    和记娱乐网赌场 我们的做法是,先做序列比对,找出每个基因家族中保守的区域;然后进行聚类,我们用orthomcl 来进行基因家族分析。 

  • 【蛋白家族问题】是不是PRAM值一样的,就是一个蛋白家族?

    这个不一定啊,蛋白家族是通过序列来做的。 

  • 【蛋白家族问题】请问两者是一样的吗?

    问题中的图,这是搜索的保守结构域的结果:

    下面是 PFAm的结果

    和记娱乐网赌场 请问是一样的吗?

    答:位点不一样,结构域应该是一样的。 

  • 【蛋白家族问题】可是这是同一条氨基酸序列比对的,同样都是保守结构域,怎么体现出位点不一样。

    这两段都是一样的结构。  

  • 【蛋白家族问题】为啥名称是不一样的,这样就很容易认为是别的家族的基因啊?

    和记娱乐网赌场 NCBI和pfam的预测算法有差异,所以结果有时候会有差异。不过你有没有查过这两个家族是什么关系? 

  • 【蛋白家族问题】我不会查,不知道有没有关系,该怎么查啊?

    和记娱乐网赌场 你搜下wiki 

  • 【GO\KEGG富集分析】我已经对unigene进行了nr、nt数据库的注释,接下来怎么从中挑出差异基因的注释结果进行GO富集和Pathway 分析?

    用R软件里面的超几何检验。 

  • 【GO\KEGG富集分析】对于无参考基因组的物种而言,用什么方法进行GO富集和Pathway 分析?

    和记娱乐网赌场 用超几何检验的方法,在R中有包 。 

  • 【GO\KEGG富集分析】啊,天啊。那若不会编程语言,是不是就不能做富集分析?

    和记娱乐网赌场 有些网站可以做,但是只能做有参考的物种。  

  • 【GO\KEGG富集分析】那无参的物种怎么办?

    无参需要先对unigene进行GO和KEGG的数据库注释,之后利用超几何检验来进行富集分析。 

  • 【GO\KEGG富集分析】转录组数据测序回来的不是已经有GO和KEGG注释了吗?

    如果要一些个性分析,就需要根据具体的基因集,比如客户挑出来的基因集,来做富集分析。不过,自己来做富集分析还是需要先学习R。 

  • 【GO\KEGG富集分析】GO pathway分析后结果数据太多,如何挑选比较有意义的数据进行后面的实验?

    优先挑取富集显著的,比如Q值小于0.05的通路;其次要结合你自己的生物学问题,来讲故事。  

  • 【GO\KEGG富集分析】 比如说我想了解咖啡碱合成的代谢通路分析,我应该怎么做?

    如果是有转录组的数据,这个应该已经有这个pathway的结果,你现在的情况是结果中没有发现关心的问题,还是跟预期不一致?  

  • 【GO\KEGG富集分析】我是想做一个关于咖啡碱合成途径的代谢通路,然后在pathway中体现出哪些基因上调 或者下调。

    重新绘制通路,还是在已有的通路上绘制上下调关系?  

  • 【GO\KEGG富集分析】重新绘制。kegg网站的通路图都太庞杂,要缩小范围重新画怎么画?

    推荐你个工具 pathway builder tool ,可以绘制很高大上的通路。在群共享可下载此工具。  

  • 【GO\KEGG富集分析】能不能系统的讲解一下转录组数据分析的基本思路和方法?看了很多相关的回答或是文献也还是昏的,不晓得咋入手。

    这个问题请见群文件“转录组测序技术介绍”。 

  • 【GO\KEGG富集分析】能否讲解一下KEGG富集分析,聚类分析 ?

    这个问题是想了解具体的分析方法还是这个分析的意义? 

  • 【GO\KEGG富集分析】分析方法,聚类分析我不知道选择何种聚类算法。

    和记娱乐网赌场 常用的层次聚类聚类方法,h-cluste。 

  • 【GO\KEGG富集分析】那你如何计算你的P值和Q值呢,这是KEGG富集分析里面最重要的东西。

    R直接给出来P值,(phyper)Q值用FDR 。 

  • 【GO\KEGG富集分析】这个看不懂,请问这个P和Q怎么出来的?

    问:

    和记娱乐网赌场 答:富集分析本质上是检验你的第二列和第三列这两个百分比的差异是否显著,就是你的差异基因在那些通路中更多。  

     

  • 【GO\KEGG富集分析】请问做外遗传学瞬时效应应该做什么数据分析,是RNA-seq还是做表达谱?

    和记娱乐网赌场 外遗传学瞬时效应,我们不了解这个……RNASeq和表达谱基本上是一样的结果。

  • 【GO\KEGG富集分析】 我看过去年CELL上的一篇文章,它的是延时效应,它比较两个不同处理的RNA变化。

    请问老师,你研究的什么内容,打算在什么物种上做研究?

  • 【GO\KEGG富集分析】我研究的是线虫。

    传统的表达谱(SE50)技术逐渐的会被淘汰,建议你用RNA-seq。

  • 【GO\KEGG富集分析】请问信号通路图有什么软件可以画呢?

    和记娱乐网赌场 信号通路如工具,见群共享“pathway builder tool”。  

  • 【GO\KEGG富集分析】无参和有参的具体差别在哪里,现在转录组都可以测序,但是后续分析有什么差别?

    可以参考这张流程图:

  • 【GO\KEGG富集分析】转录组和表达谱测序中,编码酶的unigene有多个,而且有上调也有下调;这个怎么理解?UNigene都验证吗?

    这是很正常的。可能有两个原因:1)注释有假阳性;2)有可能是同一基因的多个转录本。  

  • 【GO\KEGG富集分析】无近缘基因组测序的无参转录组如何通过Qpcr验证转录组测序结果?

    你可以从组装得到转录本序列,对你感兴趣的功能序列可以设计相应的引物进行qpcr的验证。 

  • 【GO\KEGG富集分析】如何运用转录数据进行SNP分析?

    组装转录本,把reads贴回转录本,然后call snp,然后分析它们的碱基型等等。 

  • 【GO\KEGG富集分析】有没有专门的软件进行分析?

    和记娱乐网赌场 GATK、samtools、soapsnp。 

  • 【GO\KEGG富集分析】 转录组、小RNA和蛋白质组整合分析有什么比较成熟的方法么?

    和记娱乐网赌场 两组比较一般选用差异上下调分开找交集,如果样本较多,可以考虑用相关系数,也要结合靶向预测的关系,比如miRNA和mRNA的调控,找出关键的调控途径。  

  • 【GO\KEGG富集分析】 那就是只能依靠表达量之间的关系来确定?

    和记娱乐网赌场 一般来说有1)表达量 2)靶向关系。这两个经常是一起来找。 

  • 【GO\KEGG富集分析】最后的结果能关联多少?

    和记娱乐网赌场 不同项目可能会有区别,找到了以后其实可以做些网络调控图。如下:

  • 【GO\KEGG富集分析】那蛋白质组的数据呢?

    蛋白组可以用来判断miRNA转录后调控的结果。 

  • 【GO\KEGG富集分析】非模式物种做这个的关联效果能有多少?30%

    我们有的结果有20%,也有10%的。 

  • 【QPCR问题】有了转录组数据,一般还需要做哪些验证试验?

    和记娱乐网赌场 一般要做QPCR来验证表达量的一致性。 

  • 【QPCR问题】用定量PCR验证miRNA表达模式跟测序分析的不同,测序的是上调,定量的是下调,这种该如何分析,什么原因?

    如果你只是挑了一个基因的话,这个情况会经常遇到,如果你确定QPCR没有问题的,那就以他为准。 

  • 【QPCR问题】以定量结果为准么?

    和记娱乐网赌场 如果你挑了20个基因,结果都不一致的话,那要看下测序数据的分析是否有无问题。 

  • 【QPCR问题】我定量做了9个,只有一个和测序分析的规律一样,怎么搞?

    上下调模式还是差异倍数?

  • 【QPCR问题】上下调,就是我找了三个处理统一下调和上调的miRNA,定量后,只有一个符合规律。

    你的表达量有归一化处理么?

  • 【QPCR问题】有的。

    用的什么值,TPM?

  • 【QPCR问题】rpkm

    miRNA表达量,用rpkm?miRNA的表达量不会用RPKM值。

  • 【QPCR问题】请问表达量的归一化怎么去做?

    和记娱乐网赌场 有很多种方法,tmm、3/4等等有,具体方法要去看文献或者找软件来做。 

  • 【QPCR问题】对照组基因的相对表达量怎么计算?是2的负的deltaCt吗?

    不是的,2的负的deltaCt是以对照组为基础算出实验组的表达量。 

  • 【QPCR问题】那怎么计算对照的一个基因的相对表达量呢?

    用相对表达量的算法,对照一般都为1吧,不知道你用的是哪个版本的qpcr仪器? 

  • 【QPCR问题】iq5,有两个品种的对照要做比较。

    你选用一个作为对照就OK了,其他样本跟对照来比。  

  • 【其他问题】我在转录组里找到一条目的序列,但是我想看看库里(自己的无参考转录组)有没有和它有重叠序列的片段,该如何着手?

    用本地blast的方法可以实现。 

  • 【其他问题】本地blast,我该upload什么数据呢?假如是转录组所有的数据,岂不是很大?

    和记娱乐网赌场 以你的转录组建库,然后用你的目的序列去query。 

  • 【其他问题】可是转录组建库数据量很大,电脑可以运行的了吗?

    和记娱乐网赌场 可以。 

  • 【其他问题】用MEME网站进行motif预测时,可以单条序列粘贴进去吗?

    可以。  

  • 【其他问题】它只会有邮箱的形式告诉结果吗

    和记娱乐网赌场 是的。 

分享到:

留言