Hi Jan,<div><br></div><div>External users are probably better off sticking to using the "--add_tables transcript_variation" option.</div><div><br></div><div>It is possible (though currently experimental/beta) to vastly speed up this process by using a VEP cache file to retrieve transcript information.</div>
<div><br></div><div>To do this, you would need to have a VEP cache unpacked (as described here <a href="http://www.ensembl.org/info/docs/variation/vep/vep_script.html#pre">http://www.ensembl.org/info/docs/variation/vep/vep_script.html#pre</a>), and a FASTA file (as described here <a href="http://www.ensembl.org/info/docs/variation/vep/vep_script.html#fasta">http://www.ensembl.org/info/docs/variation/vep/vep_script.html#fasta</a>, though note you should use the "primary_assembly" rather than "toplevel" FASTA file).</div>
<div><br></div><div>You then add the following options when running <a href="http://import_vcf.pl">import_vcf.pl</a>:</div><div><br></div><div>--fasta /path/to/fasta/file.fa --cache ~/.vep/homo_sapiens/69/</div><div><br></div>
<div>assuming you unpacked your cache file to the recommended directory. The unpacked cache file could be either one of the pre-built ones, or one you have created from your own core database using "--build all" in the VEP.</div>
<div><br></div><div>If you want SIFT and PolyPhen predictions, you will also need a copy of the protein_function_predictions and translation_md5 tables from the current human variation DB in the database you are populating. Note that these will still work even if you have custom transcripts as the predictions are based on translated sequence rather than any stable ID.</div>
<div><br></div><div>There is currently no way to limit which transcripts are picked up; you'd have to root around in Utils/VEP.pm (sub whole_genome_fetch_transcript) to manually skip.</div><div><br></div><div>Hope this helps</div>
<div><br></div><div>Will McLaren</div><div>Ensembl Variation</div><div class="gmail_extra"><br><br><div class="gmail_quote">On 18 December 2012 17:53, Jan Vogel <span dir="ltr"><<a href="mailto:jan.vogel@gmail.com" target="_blank">jan.vogel@gmail.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><br>
<br>
Hello,<br>
<br>
I have imported a VCF-file into a ensembl-variation database which I created from scratch - but i failed to link the variations / alleles / variation features to transcript_variations.<br>
<br>
The documentation on the <a href="http://import_vcf.pl" target="_blank">import_vcf.pl</a> script can be found here:<br>
<br>
 <a href="http://uswest.ensembl.org/info/docs/variation/import_vcf.html#transcript_variation" target="_blank">http://uswest.ensembl.org/info/docs/variation/import_vcf.html#transcript_variation</a><br>
<br>
In the documentation ("transcript_variation" section) it says:<br>
<br>
"It may also be faster to do this once the VCF import is finished using the standard transcript_variation pipeline."<br>
<br>
Can someone point me to some documentation on the standard transcript-variation pipeline and how to run it?<br>
<br>
I've tried to use the <a href="http://parallel_transcript_variation.pl" target="_blank">parallel_transcript_variation.pl</a> script but it seems that this is working with some old schema (v58?).<br>
<br>
Any hint or draft of some documentation / command history is welcome. Also, is there a way to limit the linking of variations to genes /transcripts to specific logic-names ? I have various gene-sets in my core db and like to limit the consequence / transcript variation to only the canonical transcripts of one gene set.<br>

<br>
<br>
Thanks,<br>
<br>
   Jan<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
<br>
_______________________________________________<br>
Dev mailing list    <a href="mailto:Dev@ensembl.org">Dev@ensembl.org</a><br>
Posting guidelines and subscribe/unsubscribe info: <a href="http://lists.ensembl.org/mailman/listinfo/dev" target="_blank">http://lists.ensembl.org/mailman/listinfo/dev</a><br>
Ensembl Blog: <a href="http://www.ensembl.info/" target="_blank">http://www.ensembl.info/</a><br>
</blockquote></div><br></div>