trinity RNA-seq
目的:不利用参考基因组,重建全长转录组。
这项工作面临的挑战:
- 转录本表达量的差异性:即不同转录本之间的表达有高有低。
- 测序的偏倚:读段可能并未覆盖某些转录本的全长。
- 如何平衡不同转录本之间因为表达量的差异而引入的测序误差的差异。(测序的错误)
- 由邻近基因座编码的的转录本是可相互重叠的,那么可能导致转录本错误的融合。(由基因组结构导致的,算法需要消除这种错误。)
- 为了满足可变剪切,必须要调整数据结构。(算法调整数据结构满足可变剪切)
- 不同的基因的重复序列会产生歧义。
关于转录组重建的策略:
1.通过Mapping first方法,比如Scriputure,cufflinks等。
首先是将所有的读段回贴到参考基因组上
然后利用重叠区域,融合形成序列
利用读段生成剪切位点
2.