<html><head><meta http-equiv="Content-Type" content="text/html; charset=utf-8"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">Hi all,<div class=""><br class=""></div><div class="">From the downloadable data on <font color="#0069d9" class=""><span style="caret-color: rgb(0, 105, 217);" class=""><u class=""><a href="ftp://ftp.ensembl.org/pub/release-92/gtf/" class="">ftp://ftp.ensembl.org/pub/release-92/gtf/</a> </u></span></font>I can see one gtf file for download (I’m using v92 at the moment): Homo_sapiens.GRCh38.92.chr.gtf </div><div class=""><br class=""></div><div class="">Are the transcripts in here a superset / subset or the identical to the combined transcripts in the sum of these two fasta files under <a href="ftp://ftp.ensembl.org/pub/release-92/fasta/homo_sapiens/:" class="">ftp://ftp.ensembl.org/pub/release-92/fasta/homo_sapiens/:</a></div><div class="">Homo_sapiens.GRCh38.cdna.all.fa  </div><div class="">Homo_sapiens.GRCh38.ncrna.fa</div><div class=""><br class=""></div><div class="">Of course, I could resolve the IDs and do a simple comparison :-) I was hoping someone could point me at docs (along with a nudge to RTFM) or supply some motivation for the split. Both types of files are needed at different points of an RNAseq pipeline.</div><div class=""><br class=""></div><div class="">Thanks,</div><div class=""><br class=""></div><div class="">Vivek</div></body></html>