<html><body style="word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class=""><span class="">Hi David,</span><span class=""><br class=""></span><span class=""><br class=""></span><span class=""></span><span class="">I’ve taken a look at this issue this morning and I think I can see what’s going on. I can reproduce this issue with the query: </span><span class="">perl vep -id 'TP53:p.E285V' --database --force_overwrite --hgvs --port 3337</span><span class=""><br class=""></span><span class=""><br class=""></span><span class="">VEP guesses the genomic location based on this HGVS input (17:7565261), and identifies that overlapping transcript ENST00000413465 has a protein product. However, the 285th amino acid of this transcript is not E, but Y. The alternate allele is guessed by VEP from a collection of options that it has. For example, with the input HGVS 'TP53:p.M237I’, then VEP has 3 potential alternate alleles it can use to do this, by converting the given ATG to one of ATA, ATC or ATT.<br class=""></span><span class=""><br class=""></span><span class="">While VEP supports HGVS input, due to the complexity of HGVS and the variety of ways in which people use it, then we require that input HGVS is relative to genomic or transcript coordinates. In protein cases, we give a best guess where we can, but this is not guaranteed.<br class=""></span><span class=""><br class=""></span><span class="">Sorry that I couldn’t be of more help.<br class=""></span><span class=""><br class=""></span><div class=""><span class="">Kind Regards,</span></div><div class=""><span style="background-color: rgb(255, 255, 255);" class="">Andrew<br class=""></span><br class=""><br class=""><blockquote type="cite" class="">On 14 Dec 2018, at 18:00, David Tamborero <<a href="mailto:david.tamborero@gmail.com" class="">david.tamborero@gmail.com</a>> wrote:<br class=""><br class="">Hi there, <br class=""><br class="">regarding the conversion from protein to genomic representation supported by VEP, I ve found a funny case; if I input <br class=""><br class="">TP53:p.E285V<br class=""><br class="">VEP gives as output (vcf format)<br class=""><br class="">17    7565261    TP53:p.E285V    T    A<br class=""><br class="">And then if I input to VEP that vcf entry,  I obtain  two TP53 protein annotations:<br class=""><br class="">downstream_gene_variant for ENST00000359597<br class="">missense_variant for ENST00000413465<br class=""><br class="">However, the missense variant is annotated as 285 Y/F   (and not the E/V that I had at the start !)<br class=""><br class="">so it looks that some inconsistency happened here, not sure why. Am I missing some point ?<br class=""><br class="">thanks in advance!<br class="">d<br class=""><br class=""><br class=""><br class="">_______________________________________________<br class="">Dev mailing list    <a href="mailto:Dev@ensembl.org" class="">Dev@ensembl.org</a><br class="">Posting guidelines and subscribe/unsubscribe info: <a href="http://lists.ensembl.org/mailman/listinfo/dev" class="">http://lists.ensembl.org/mailman/listinfo/dev</a><br class="">Ensembl Blog: <a href="http://www.ensembl.info/" class="">http://www.ensembl.info/</a><br class=""></blockquote><br class=""></div></body></html>