<div dir="ltr">Hi Hans,<div><br></div><div>This isn't something that has been requested before. It's not a simple task as the the gzipped files you have observed are serialized Perl objects, and there are issues such as duplications across coordinate boundaries to resolve. It's something we can look at including in future versions.</div><div><br></div><div>You should be able to get a good approximation by looking at the counts on the species summary page: <a href="http://plants.ensembl.org/Triticum_aestivum/Info/Annotation/#assembly">http://plants.ensembl.org/Triticum_aestivum/Info/Annotation/#assembly</a> (or look at the archive version of this page as appropriate)</div><div><br></div><div>I wouldn't guarantee these would represent the exact same counts as those in VEP, as there may be slightly different inclusion criteria.</div><div><br></div><div>Hope that helps</div><div><br></div><div>Will McLaren</div><div>Ensembl Variation</div></div><div class="gmail_extra"><br><div class="gmail_quote">On 8 April 2016 at 11:12, Hans Vasquez-Gross <span dir="ltr"><<a href="mailto:havasquezgross@ucdavis.edu" target="_blank">havasquezgross@ucdavis.edu</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">I'm using VEP to annotate some VCF files using an offline cache database.  The summary file lets me know the number of overlapped genes/transcripts. However, it doesn't say how many total genes/transcripts in the database which would be useful for some calculations.<div><br></div><div>To annotate, I use the following command to run VEP:</div><div>./<a href="http://variant_effect_predictor.pl" target="_blank">variant_effect_predictor.pl</a> -species triticum_aestivum -i input.vcf -o output.vep.vcf --fork 4 --offline --db_version 22<br></div><div><br></div><div>I've been to the cache directory: .~/vep/triticum_aestivum/22, and tried looking at the storage structure. I saw these are gzipped files within directories for each contig.</div><div><br></div><div>Is there an easy way to get a list of all transcripts/genes in this database? Thank you.</div><div><br></div><div>Cheers</div><span class="HOEnZb"><font color="#888888"><div>-Hans</div></font></span></div>
<br>_______________________________________________<br>
Dev mailing list    <a href="mailto:Dev@ensembl.org">Dev@ensembl.org</a><br>
Posting guidelines and subscribe/unsubscribe info: <a href="http://lists.ensembl.org/mailman/listinfo/dev" rel="noreferrer" target="_blank">http://lists.ensembl.org/mailman/listinfo/dev</a><br>
Ensembl Blog: <a href="http://www.ensembl.info/" rel="noreferrer" target="_blank">http://www.ensembl.info/</a><br>
<br></blockquote></div><br></div>