<div dir="ltr">Hello,<div><br></div><div>Differences in scores can be accounted for by two main factors:</div><div><br></div><div>1) the version of SIFT used to generate the score</div><div>2) the sequence set used to generate the alignments behind the scores</div><div><br></div><div>This also applies to PolyPhen scores.</div><div><br></div><div>It is not clear to me from the dbNSFP README (1) which version of SIFT they use - they say "ensembl 66" as you noted, so perhaps they extracted the SIFT scores from Ensembl v66.</div><br>For release 66, Ensembl ran SIFT version 4.0.5 using UniProtKB (release 2012_01, both the SwissProt and TrEMBL sets) (2); for release 75, we ran SIFT version 5.0.2 with UniRef90 (release 2012_11) (3).<div><br></div><div>So it seems the scores presented by dbNSFP are generated by an older version of SIFT, and with a different protein DB.</div><div><br></div><div>Hopefully this explains the differences for you</div><div><br></div><div>Regards</div><div><br></div><div>Will McLaren</div><div>Ensembl Variation</div><div><br>1: <a href="https://drive.google.com/file/d/0B60wROKy6OqccXV4UXNyNkJwNUk/view">https://drive.google.com/file/d/0B60wROKy6OqccXV4UXNyNkJwNUk/view</a><br>2: <a href="http://may2012.archive.ensembl.org/info/docs/variation/predicted_data.html#sift">http://may2012.archive.ensembl.org/info/docs/variation/predicted_data.html#sift</a><br></div><div>3: <a href="http://feb2014.archive.ensembl.org/info/genome/variation/predicted_data.html#sift">http://feb2014.archive.ensembl.org/info/genome/variation/predicted_data.html#sift</a></div></div><div class="gmail_extra"><br><div class="gmail_quote">On 8 January 2016 at 05:59, binit treesa <span dir="ltr"><<a href="mailto:binit.treesa@gmail.com" target="_blank">binit.treesa@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr"><div>Hi team,<br><br></div><div>Recently we found a source dbNSFP which is similar to VEP result.<br><br></div><div>Usually we run VEP with variants to get the SIFT and polyphen score and its prediction.<br></div><div>While comparing these two files, I noted that there is slight difference in the sift and polyphen score but the prediction remains same:<br><br></div><div>The version we compared :<br>dbNSFP  : it support ensembl v66<br></div><div>VEP result  : VEP tool v75 (ensembl v75)<br><br></div><div>It will be good if you can point out the reasons behind this score differences.<br></div><div>Also please share the procedure to calculate the SIFT and Polyphen.<br><br></div><div>Thanks,<br></div><div>Treesa Binit<br><br></div></div>
<br>_______________________________________________<br>
Dev mailing list    <a href="mailto:Dev@ensembl.org">Dev@ensembl.org</a><br>
Posting guidelines and subscribe/unsubscribe info: <a href="http://lists.ensembl.org/mailman/listinfo/dev" rel="noreferrer" target="_blank">http://lists.ensembl.org/mailman/listinfo/dev</a><br>
Ensembl Blog: <a href="http://www.ensembl.info/" rel="noreferrer" target="_blank">http://www.ensembl.info/</a><br>
<br></blockquote></div><br></div>