<div dir="ltr">Hi Katherine,<div><br></div><div>As you've observed, currently the custom annotation feature does not take the allele from the VCF into account when reporting annotations.</div><div><br></div><div>If you are particularly interested in adding the ExAC data, we have available an ExAC plugin that does this while taking into account the alleles:</div><div><br></div><div><a href="https://github.com/ensembl-variation/VEP_plugins/blob/master/ExAC.pm">https://github.com/ensembl-variation/VEP_plugins/blob/master/ExAC.pm</a><br></div><div><br></div><div>Regards</div><div><br></div><div>Will McLaren</div><div>Ensembl Variation</div></div><div class="gmail_extra"><br><div class="gmail_quote">On 14 May 2015 at 20:45, Katherine Smith <span dir="ltr"><<a href="mailto:katherine.smith@genomicsengland.co.uk" target="_blank">katherine.smith@genomicsengland.co.uk</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Dear ENSEMBL developers,<br>
<br>
Is there any way to make VEP custom annotation against a VCF file allele-specific?<br>
<br>
The custom annotation help page says "Users should note that the VEP will only look for overlaps (both exact and inexact) with these annotations; for example, any sequence in a GTF file will not be taken into account." (<a href="http://www.ensembl.org/info/docs/tools/vep/script/vep_custom.html" target="_blank">http://www.ensembl.org/info/docs/tools/vep/script/vep_custom.html</a>)<br>
<br>
I am using VEP 79 to annotate a VCF against allele counts from two VCF files using --custom. One VCF file is the ExAC r0.3 file (<a href="ftp://ftp.broadinstitute.org/pub/ExAC_release/release0.3/ExAC.r0.3.sites.vep.vcf.gz" target="_blank">ftp://ftp.broadinstitute.org/pub/ExAC_release/release0.3/ExAC.r0.3.sites.vep.vcf.gz</a>); this can contain multiple alternate alleles separated by a comma, e.g.<br>
<br>
1       20395401        rs11573185      C       A,G,T   6372227.62      PASS    AC=7149,3,1<br>
<br>
The second VCF file is 'normalised' so that a variant location with two alternate alleles is represented as two separate lines, each with only one alternate allele.<br>
<br>
1       20395401        .       C       A       709     .       AC=2154<br>
1       20395401        .       C       G       95      .       AC=1<br>
<br>
I have a sample with a heterozygous C/A genotype. The INFO tag added for ExAC is "ExAC.r0.3_AC=7149,3,1", i.e. it adds the allele count for all alternate alleles, although only one is observed in this sample. The tag AC=1 is added for the other database, i.e. it adds the allele count for the G allele, which is not observed, rather than the A allele, which is.<br>
<br>
Is there a way to make VEP only report the annotations for the alternate allele(s) observed in the input VCF?<br>
<br>
I am running <a href="http://variant_effect_predictor.pl" target="_blank">variant_effect_predictor.pl</a> with options `--check_existing` and `--check_alleles` and custom annotation is performed using e.g. `--custom ExAC.r0.3.sites.vep.vcf.gz,ExAC.r0.3,vcf,exact,0,AF,AC,AN`<br>
<br>
Many thanks for your advice,<br>
<br>
Katherine<br>
_______________________________________________<br>
Dev mailing list    <a href="mailto:Dev@ensembl.org">Dev@ensembl.org</a><br>
Posting guidelines and subscribe/unsubscribe info: <a href="http://lists.ensembl.org/mailman/listinfo/dev" target="_blank">http://lists.ensembl.org/mailman/listinfo/dev</a><br>
Ensembl Blog: <a href="http://www.ensembl.info/" target="_blank">http://www.ensembl.info/</a><br>
</blockquote></div><br></div>