<div dir="ltr">Hello,<div><br></div><div>Correct, the plugin was intended to work with the whole_genome_SNVs.tsv file, which only contains data for SNVs.</div><div><br></div><div>I've modified the plugin so that it should be able to cope with indel data files such as you have; please do let me know if you have any problems as I've only sparingly tested it on made-up data!</div>
<div><br></div><div>Regards</div><div><br></div><div>Will McLaren</div><div>Ensembl Variation</div></div><div class="gmail_extra"><br><br><div class="gmail_quote">On 7 May 2014 15:37, Genomeo Dev <span dir="ltr"><<a href="mailto:genomeodev@gmail.com" target="_blank">genomeodev@gmail.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">Hi,<div><br></div><div>There seem to be a discrepancy between the CADD score calculated using VEP with the CADD.pm plugin and the tabix direct output:</div>
<div><br></div><div>For example using this 1000G variant:</div>
<div><br></div><div><div>#CHROM<span style="white-space:pre-wrap">        </span>POS<span style="white-space:pre-wrap">     </span>ID<span style="white-space:pre-wrap">      </span>REF<span style="white-space:pre-wrap">     </span>ALT<span style="white-space:pre-wrap">     </span>QUAL<span style="white-space:pre-wrap">    </span>FILTER<span style="white-space:pre-wrap">  </span>INFO</div>

<div>7<span style="white-space:pre-wrap"> </span>86214932<span style="white-space:pre-wrap">        </span>rs140931361<span style="white-space:pre-wrap">     </span>TTACTC<span style="white-space:pre-wrap">  </span>T<span style="white-space:pre-wrap">       </span>.<span style="white-space:pre-wrap">       </span>PASS<span style="white-space:pre-wrap">    </span>.</div>

<div><br></div><div><a href="http://variant_effect_predictor.pl" target="_blank">variant_effect_predictor.pl</a> -i input.txt --format vcf --plugin CADD,/media/sf_D_DRIVE/Projects/Databases/CADD/v1.0/1000G.tsv.gz<br></div>
<div>does not return any CADD score</div>
<div><br></div><div>whereas </div><div><div>$ tabix -p vcf 1000G.tsv.gz 7:86214932-86214932</div><div>7<span style="white-space:pre-wrap">       </span>86214932<span style="white-space:pre-wrap">        </span>TTACTC<span style="white-space:pre-wrap">  </span>T<span style="white-space:pre-wrap">       </span>-0.420243<span style="white-space:pre-wrap">       </span>2.040</div>

</div><div><br></div><div>This seems to affect indels and not SNVs. I could see in the plugin that there is a rule to ignore indels. Any suggestions please how to safely change that?</div><div><br></div><div>Also, in the plugin, I assume there is a test to ensure the alleles are identical between the input file and the 1000G.tsv.gz file. Is this correct?</div>

<div><br></div><div>Thanks.</div><span class="HOEnZb"><font color="#888888"><div><br></div>-- <br><div dir="ltr">G.</div>
</font></span></div></div>
<br>_______________________________________________<br>
Dev mailing list    <a href="mailto:Dev@ensembl.org">Dev@ensembl.org</a><br>
Posting guidelines and subscribe/unsubscribe info: <a href="http://lists.ensembl.org/mailman/listinfo/dev" target="_blank">http://lists.ensembl.org/mailman/listinfo/dev</a><br>
Ensembl Blog: <a href="http://www.ensembl.info/" target="_blank">http://www.ensembl.info/</a><br>
<br></blockquote></div><br></div>