<div dir="ltr">Hi Joey,<div><br></div><div>VEP treats each individual ALT allele from an input VCF separately; this applies to calling consequence types and to handling the data in plugins like the ExAC one.</div><div><br></div><div>The ExAC plugin will only report the frequency of the currently processed allele (if available in the ExAC VCF). This can involve a bit of internal gymnastics when insertions or deletions are being considered; see <a href="http://www.ensembl.org/info/docs/tools/vep/vep_formats.html#vcf">http://www.ensembl.org/info/docs/tools/vep/vep_formats.html#vcf</a> for how VEP handles VCF unbalanced variants. Within the ExAC plugin the same allele/coord transformation is applied, so if for example your input is:</div><div><br></div><div>chr1 1000 ins1 A AC</div><div><br></div><div>and in the ExAC VCF you have</div><div><br></div><div>chr1 1000 var1 A AC,ACTT ....</div><div><br></div><div>the VEP will convert both to an insertion of "C" internally and match the alleles to report the frequencies.</div><div><br></div><div>However, I can foresee situations where this will slip up; the VEP only does the transformation if the first base of each ALT/REF allele is the same. So if one individual in the ExAC had a SNP at that position, e.g.</div><div><br></div><div>chr1 1000 var1 A AC,G</div><div><br></div><div>the transformation wouldn't happen, and the alleles wouldn't get matched up.</div><div><br></div><div>We do actually have a command line flag to attempt to deal with this sort of scenario, --minimal (see <a href="http://www.ensembl.org/info/docs/tools/vep/script/vep_options.html#opt_minimal">http://www.ensembl.org/info/docs/tools/vep/script/vep_options.html#opt_minimal</a>). This converts each ALT allele to its minimal representation before processing by comparing with the REF allele, independently of any other ALTs, before the results are merged back together on the same VCF output line. This option was created in collaboration with the guys from ExAC to deal with some of the more horrendous VCF lines that appear from the project. However, currently the ExAC plugin is not configured to take advantage of this, though in theory I believe it could be.</div><div><br></div><div>Anyway, hope all that is of some help.</div><div><br></div><div>Regards</div><div><br></div><div>Will McLaren</div><div>Ensembl Variation</div></div><div class="gmail_extra"><br><div class="gmail_quote">On 17 August 2015 at 16:20, Joseph A Prinz <span dir="ltr"><<a href="mailto:jp102@duke.edu" target="_blank">jp102@duke.edu</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi Ensembl-dev!<br>
<br>
I am curious to know how VEP handles annotating multiple alternative alleles when processing a VCF file. Specifically, I am interested in knowing more about the workings of the ExAC plugin in this regard; but more broadly, I am interested to know how VEP deals with the potential ambiguities inherent in dealing with VCF formatted multiple alternatives. Did I miss this in the documentation?<br>
<br>
My apologies if this subject has been discussed before.<br>
<br>
Thanks!<br>
Joey<br>
_______________________________________________<br>
Dev mailing list    <a href="mailto:Dev@ensembl.org">Dev@ensembl.org</a><br>
Posting guidelines and subscribe/unsubscribe info: <a href="http://lists.ensembl.org/mailman/listinfo/dev" rel="noreferrer" target="_blank">http://lists.ensembl.org/mailman/listinfo/dev</a><br>
Ensembl Blog: <a href="http://www.ensembl.info/" rel="noreferrer" target="_blank">http://www.ensembl.info/</a><br>
</blockquote></div><br></div>