Hi Stuart,<div><br></div><div>I'm not 100% sure what's happening here, but we have the variation on our website as having alleles C/G, not C/T.</div><div><br></div><div><a href="http://www.ensembl.org/Homo_sapiens/Variation/Mappings?r=11:76370918-76371918;v=rs79525962;vdb=variation;vf=1164142">http://www.ensembl.org/Homo_sapiens/Variation/Mappings?r=11:76370918-76371918;v=rs79525962;vdb=variation;vf=1164142</a></div>
<div><br></div><div>This data comes from dbSNP, however, if you look on the population genetics page, we have imported data directly from 1000 genomes VCF files, and there the alleles are given as C/T. So there is some disagreement between the dbSNP alleles and the 1000 genomes alleles. This may well be resolved in some future release of dbSNP - in fact if you look at the record on dbSNP, they also show the C/T alleles being reported under the 1000 genomes submissions.</div>
<div><br></div><div><a href="http://www.ncbi.nlm.nih.gov/SNP/snp_ref.cgi?rs=rs79525962">http://www.ncbi.nlm.nih.gov/SNP/snp_ref.cgi?rs=rs79525962</a></div><div><br></div><div>but for some reason they haven't added the "T" to the list of alleles.</div>
<div><br></div><div>Basically, the results are OK for the alleles given - C/T gives a peptide change of A/T, whereas C/G gives a peptide change of A/P. So neither is necessarily "correct", it just depends what you want to interpret as being the observed alleles at that position. Of course, there is also the possible situation where in fact three alleles have genuinely been observed (C/G/T) at that position, which means they would both be correct!</div>
<div><br></div><div>Hope this helps</div><div><br></div><div>Will</div><div><br><div class="gmail_quote">On 25 February 2011 09:23, Stuart Meacham <span dir="ltr"><<a href="mailto:sm766@cam.ac.uk">sm766@cam.ac.uk</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">Hi list (Will!),<br>
<br>
I have been using the Variant Consequence predictor in whole genome mode and have (at least one) anomalous results. For example:<br>
<br>
Transcript: ENST00000260061<br>
<br>
SNP Residue Major Minor AA_Replacement Consequence<br>
<br>
rs79525962 407 C T A/P NON_SYNONYMOUS_CODING<br>
11_76371418_C/T 407 C T A/T NON_SYNONYMOUS_CODING<br>
<br>
top line is data in Ensembl<br>
second line is data (1000 Genomes) using the predictor. You can see the Consequence predictor shows an amino acid change (A/T) at the same position as Ensembl shows A/P.<br>
<br>
Is one just wrong? And if so how do I check which one?<br>
<br>
Cheers<br>
<br>
Stuart<br>
<br>
_______________________________________________<br>
Dev mailing list<br>
<a href="mailto:Dev@ensembl.org" target="_blank">Dev@ensembl.org</a><br>
<a href="http://lists.ensembl.org/mailman/listinfo/dev" target="_blank">http://lists.ensembl.org/mailman/listinfo/dev</a><br>
</blockquote></div><br></div>