<html dir="ltr">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
<style type="text/css" id="owaParaStyle"></style>
</head>
<body fpstyle="1" ocsi="0">
<div style="direction: ltr;font-family: Tahoma;color: #000000;font-size: 10pt;">Hi 
<div>Could you please kindly remove my address from your mailing list?</div>
<div>Thank you</div>
<div>Katarzyna<br>
<div><br>
<div style="font-family:Tahoma; font-size:13px">
<div style="font-family:Tahoma; font-size:13px">
<div style="font-family:Tahoma; font-size:13px">
<div style="font-family:Tahoma; font-size:13px">
<div class="BodyFragment"><font size="2">
<div class="PlainText">Katarzyna Hutnik<br>
University of Oxford<br>
Department of Oncology<br>
Old Road Campus Research Building<br>
OX3 7DQ<br>
Oxford<br>
<span style="font-size:13px">01865 617 423</span></div>
</font></div>
</div>
</div>
</div>
</div>
</div>
<div style="font-family: Times New Roman; color: #000000; font-size: 16px">
<hr tabindex="-1">
<div id="divRpF417503" style="direction: ltr;"><font face="Tahoma" size="2" color="#000000"><b>From:</b> Dev [dev-bounces@ensembl.org] on behalf of Will McLaren [wm2@ebi.ac.uk]<br>
<b>Sent:</b> 01 June 2017 4:04 PM<br>
<b>To:</b> Ensembl developers list<br>
<b>Subject:</b> Re: [ensembl-dev] VEP Alleles and ALTs<br>
</font><br>
</div>
<div></div>
<div>
<div dir="ltr">Hi Nicolas,
<div><br>
This is a long-standing issue with converting between variants as they are described in VCF and how they are described in Ensembl and therefore VEP. It's discussed in part in [1].</div>
<div><br>
</div>
<div>By default, the leading base is trimmed from all alleles (with the start coordinate adjusted accordingly) if and only if it is the same across all REF and ALTs; otherwise it remains. You may force VEP to treat each REF/ALT pair as a separate variant and
 trim identical sequence from both (which may be more than one base) using --minimal [2]. This is not the default behaviour as it may lead to some confusing coordinate changes.</div>
<div><br>
</div>
<div>To track which allele ends up where, the best solution is to use --allele_number; this adds the index for the relevant allele from your input to the output, regardless of how it is modified by VEP.</div>
<div><br>
</div>
<div>HTH</div>
<div><br>
Will McLaren</div>
<div>Ensembl Variation</div>
<div><br>
</div>
<div>[1]: <a href="http://www.ensembl.org/info/docs/tools/vep/vep_formatshtml#vcf" target="_blank">
http://www.ensembl.org/info/docs/tools/vep/vep_formats.html#vcf</a></div>
<div>[2]: <a href="http://www.ensembl.org/info/docs/tools/vep/script/vep_options.html#opt_minimal" target="_blank">http://www.ensembl.org/info/docs/tools/vep/script/vep_options.html#opt_minimal</a></div>
<div>[3]: <a href="http://www.ensembl.org/info/docs/tools/vep/script/vep_options.html#opt_allele_number" target="_blank">
http://www.ensembl.org/info/docs/tools/vep/script/vep_options.html#opt_allele_number</a></div>
</div>
<div class="gmail_extra"><br>
<div class="gmail_quote">On 1 June 2017 at 15:53, Nicolas Thierry-Mieg <span dir="ltr">
<<a href="mailto:Nicolas.Thierry-Mieg@univ-grenoble-alpes.fr" target="_blank">Nicolas.Thierry-Mieg@univ-grenoble-alpes.fr</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex; border-left:1px #ccc solid; padding-left:1ex">
Hello,<br>
<br>
I am trying to systematically match VEP consequences (based on the VEP Allele" field) to the correct ALT allele. This is a lot harder than it sounds, and gets really tricky with indels and/or when the VCF has several ALT alleles (on a single line).<br>
<br>
Here is an example input VCF:<br>
<br>
#CHROM  POS     ID      REF     ALT     QUAL    FILTER  INFO<br>
1       69469   .       ACAATT  A,ACA   .       PASS    <br>
1       69469   .       ACAATT  A,ACA,T .       PASS    <br>
<br>
For the first line, VEP uses "-" and "CA" for "Allele"; but for the second line they are "A", "ACA" and "T", although the first two ALT alleles are the same as in line 1! This shows that the content of the "Allele" field depends on the whole list of ALT alleles
 in the VCF...<br>
<br>
<br>
To make a long story short, I end up with the following rule to construct the "Allele" field from VEP's CSQ:<br>
if the first nucleotides of the REF allele and of all the ALT alleles are the same, then this nucleotide is omitted from VEP's "Allele" field.<br>
<br>
Is this correct?<br>
<br>
Note that for reverse-engineering and testing this, I used an older VEP release (v81). Perhaps my rule is no longer valid... I wanted to test with the latest VEP version, but I'm having issues installing it, as discussed in another thread.<br>
<br>
Regards,<br>
Nicolas<br>
<br>
<br>
______________________________<wbr>_________________<br>
Dev mailing list    <a href="mailto:Dev@ensembl.org" target="_blank">Dev@ensembl.org</a><br>
Posting guidelines and subscribe/unsubscribe info: <a href="http://lists.ensembl.org/mailman/listinfo/dev" rel="noreferrer" target="_blank">
http://lists.ensembl.org/mailm<wbr>an/listinfo/dev</a><br>
Ensembl Blog: <a href="http://www.ensembl.info/" rel="noreferrer" target="_blank">
http://www.ensembl.info/</a><br>
</blockquote>
</div>
<br>
</div>
</div>
</div>
</div>
</div>
</body>
</html>