<div dir="ltr">Hello,<div><br></div><div>This is a not uncommon situation on GRCh37 particularly, where the reference allele is the least frequently observed. In situations like this VEP doesn't currently deal well with consistently reporting frequencies.</div><div><br></div><div>The minor_allele and minor_allele_freq are just that; they represent the least frequently observed allele and the frequency of that allele.</div><div><br></div><div>For the ExAC data (and other data sources like 1000 genomes), the exac_allele represents the non-reference allele (regardless of its minor/major status), and any frequencies refer to this allele.</div><div><br></div><div>The fields really should not be named *_maf, rather *_af, and should consistently refer to the non-reference allele as typically this is the one of interest to users. We are working on correcting these behaviours in a future VEP release.</div><div><br></div><div>Hopefully that clarifies things!</div><div><br></div><div>I can't really explain what's going on with the ClinVar page - possibly this is a consequence of the RefSeq transcript sequence differing from the reference genome.</div><div><br></div><div>Regards</div><div><br></div><div>Will McLaren</div><div>Ensembl Variation</div><div><br></div></div><div class="gmail_extra"><br><div class="gmail_quote">On 31 August 2016 at 15:39, Wolf Beat <span dir="ltr"><<a href="mailto:Beat.Wolf@hefr.ch" target="_blank">Beat.Wolf@hefr.ch</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hello,<br>
<br>
i stumbled uppon an issue i don't really know how to solve right now.<br>
<br>
When looking at rs4784677:<br>
<a href="http://grch37.ensembl.org/Homo_sapiens/Variation/Explore?r=16:56548001-56549001;v=rs4784677;vdb=variation;vf=105727621" rel="noreferrer" target="_blank">http://grch37.ensembl.org/<wbr>Homo_sapiens/Variation/<wbr>Explore?r=16:56548001-<wbr>56549001;v=rs4784677;vdb=<wbr>variation;vf=105727621</a><br>
<br>
We see an MAF of < 0.01 and its pathogenic.<br>
The Variant is C>T.<br>
<br>
Then we look at clinvar for this variant:<br>
<a href="http://www.ncbi.nlm.nih.gov/clinvar/variation/4576/" rel="noreferrer" target="_blank">http://www.ncbi.nlm.nih.gov/<wbr>clinvar/variation/4576/</a><br>
<br>
The same variant, but now its C>C, looks like some reference problem/mismatch.<br>
<br>
Looking at exac:<br>
<a href="http://exac.broadinstitute.org/variant/16-56548501-C-T" rel="noreferrer" target="_blank">http://exac.broadinstitute.<wbr>org/variant/16-56548501-C-T</a><br>
<br>
We get an MAF of 0.9938, so its clearly a reference sequence problem.<br>
<br>
The problem arrises now when using VEP:<br>
<br>
<a href="http://grch37.rest.ensembl.org/vep/human/id/rs4784677?content-type=application/json" rel="noreferrer" target="_blank">http://grch37.rest.ensembl.<wbr>org/vep/human/id/rs4784677?<wbr>content-type=application/json</a><br>
<br>
There we find:<br>
"minor_allele_freq":0.0036<br>
"allele_string":"C/T"<br>
as well as:<br>
"minor_allele":"C"<br>
"exac_allele":"T"<br>
"exac_maf":0.994<br>
<br>
So both the "general" maf and the exac maf seem to talk about the same rs number, but in reality they are not.<br>
<br>
How do i solve this? Can i solve this? Its not the first time i have seen this but i never really investigated the reasons before.<br>
<br>
Should i take the higher MAF between the two? Should i take the exac one? I'm afraid by using such a workaround i will just run into trouble elsewhere where the situation is reversed.<br>
<br>
Thank you for your help<br>
<br>
Kind regards<br>
<span class="HOEnZb"><font color="#888888"><br>
Beat Wolf<br>
______________________________<wbr>_________________<br>
Dev mailing list    <a href="mailto:Dev@ensembl.org">Dev@ensembl.org</a><br>
Posting guidelines and subscribe/unsubscribe info: <a href="http://lists.ensembl.org/mailman/listinfo/dev" rel="noreferrer" target="_blank">http://lists.ensembl.org/<wbr>mailman/listinfo/dev</a><br>
Ensembl Blog: <a href="http://www.ensembl.info/" rel="noreferrer" target="_blank">http://www.ensembl.info/</a><br>
</font></span></blockquote></div><br></div>