<div dir="ltr">Hi Jessica,<div><br></div><div>The * allele is not annotated because there is nothing to annotate; it represents the absence of any allele due to an upstream deletion. The upstream deletion will of course be annotated.</div><div><br></div><div>Example:</div><div><br></div><div><font face="monospace, monospace">REF:  ACGGTAGC</font></div><div><font face="monospace, monospace">S1 :  ACG----C</font></div><div><font face="monospace, monospace">S2 :  ACGGCAGC</font></div><div><font face="monospace, monospace"><br></font></div><div><font face="arial, helvetica, sans-serif">There are two mutations here; one deletion in S1, and one SNP in S2. Because the sequence containing the SNP is absent in S1, the genotype calls for this site in individuals with the deletion are otherwise impossible to annotate, unless you use the * notation.</font></div><div><font face="arial, helvetica, sans-serif"><br></font></div><div><font face="arial, helvetica, sans-serif">So the VCF looks like this:</font></div><div><br></div><div><font face="monospace, monospace">chr1 3 GGTAG G   ... 1/1 0/0</font></div><div><font face="monospace, monospace">chr1 5 T     C,* ... 2,2 1/1</font></div><div><font face="monospace, monospace"><br></font></div><div><font face="arial, helvetica, sans-serif">VEP will annotate the deletion as normal, but will only annotate the C ALT allele for the SNP; the * represents the absence of an allele, so no annotation is added - the deleted sequence is annotated for the variant on the previous line.</font></div><div><font face="arial, helvetica, sans-serif"><br></font></div><div><font face="arial, helvetica, sans-serif">Hopefully that makes sense!</font></div><div><font face="arial, helvetica, sans-serif"><br></font></div><div><font face="arial, helvetica, sans-serif">If you can provide an example of where you think VEP is doing something wrong then of course please do let us know.</font></div><div><font face="arial, helvetica, sans-serif"><br></font></div><div><font face="arial, helvetica, sans-serif">Regards</font></div><div><font face="arial, helvetica, sans-serif"><br></font></div><div><font face="arial, helvetica, sans-serif">Will McLaren</font></div><div><font face="arial, helvetica, sans-serif">Ensembl Variation</font></div></div><div class="gmail_extra"><br><div class="gmail_quote">On 13 November 2015 at 21:35, JESSICA X. CHONG <span dir="ltr"><<a href="mailto:jxchong@uw.edu" target="_blank">jxchong@uw.edu</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><a href="http://gatkforums.broadinstitute.org/discussion/6240/what-means-is-in-alternative-allele" rel="noreferrer" target="_blank">http://gatkforums.broadinstitute.org/discussion/6240/what-means-is-in-alternative-allele</a><br>
<br>
Apparently GATK now uses * to represent long “upstream deletions.”<br>
<br>
It looks like as of v82, VEP cannot handle annotation of * alleles. The lines in the resulting VCF completely lack VEP’s CSQ field.<br>
<br>
<br>
_______________________________________________<br>
Dev mailing list    <a href="mailto:Dev@ensembl.org">Dev@ensembl.org</a><br>
Posting guidelines and subscribe/unsubscribe info: <a href="http://lists.ensembl.org/mailman/listinfo/dev" rel="noreferrer" target="_blank">http://lists.ensembl.org/mailman/listinfo/dev</a><br>
Ensembl Blog: <a href="http://www.ensembl.info/" rel="noreferrer" target="_blank">http://www.ensembl.info/</a><br>
</blockquote></div><br></div>