Dear Ketyan,<div><br></div><div>Are you able to send me the input lines that are causing these errors? It is difficult for me to diagnose the problem without seeing the data.</div><div><br>Thanks</div><div><br></div><div>Will<br>
<br><div class="gmail_quote">On 16 February 2011 13:08, ketan padiya <span dir="ltr"><<a href="mailto:ketanmicro@gmail.com">ketanmicro@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">
Thanks for reply, It worked well.<br><br>One more question for INDEL, variant_effect_predictor perl script don't recognize INDEL string and gives warning like,<br><br>WARNING: Invalid allele string atggtccaatggtccaa/atggtccaa on line 92<br>

WARNING: Invalid allele string aaaa/aaa on line 1249<br>WARNING: Invalid allele string cc/c on line 1378<div><div></div><div class="h5"><br><br><br><div class="gmail_quote">On Tue, Feb 15, 2011 at 6:37 PM, Will McLaren <span dir="ltr"><<a href="mailto:wm2@ebi.ac.uk" target="_blank">wm2@ebi.ac.uk</a>></span> wrote:<br>

<blockquote class="gmail_quote" style="margin:0pt 0pt 0pt 0.8ex;border-left:1px solid rgb(204, 204, 204);padding-left:1ex">Dear Ketyan,<div><br><div class="gmail_quote"><div>On 15 February 2011 20:13, ketan padiya <span dir="ltr"><<a href="mailto:ketanmicro@gmail.com" target="_blank">ketanmicro@gmail.com</a>></span> wrote:<br>

<blockquote class="gmail_quote" style="margin:0pt 0pt 0pt 0.8ex;border-left:1px solid rgb(204, 204, 204);padding-left:1ex">
I have downloaded variant effect predictor and EnsEMBL API for that my problems are,<br><br>1) After every reboot of system i have to give the PERL5LIB path, Why?<br></blockquote><div><br></div></div><div>You can configure your system to load this PERL5LIB automatically every time it starts. How you do this depends on what type of system you are using. For example, if you are using the CSH shell system, you can edit the file named ".cshrc" in your home directory, then add lines like:</div>


<div><br></div><div><div>setenv PERL5LIB ${PERL5LIB}:${HOME}/src/ensembl/modules</div><div>setenv PERL5LIB ${PERL5LIB}:${HOME}/srcl/ensembl-compara/modules</div><div>setenv PERL5LIB ${PERL5LIB}:${HOME}/src/ensembl-functgenomics/modules</div>


<div>setenv PERL5LIB ${PERL5LIB}:${HOME}/src/ensembl-variation/modules</div></div><div><br></div><div>Or, if you use Bash, you can add the lines to ".bashrc", also in your home directory:</div><div><br></div><div>


<span style="color:rgb(85, 85, 85);font-family:'Luxi Sans',Helvetica,Arial,Geneva,sans-serif;font-size:13px"><pre style="font-family:'Courier New',Courier,monospace;font-size:1em;margin-left:1em">PERL5LIB=${PERL5LIB}:${HOME}/src/bioperl-live
PERL5LIB=${PERL5LIB}:${HOME}/src/ensembl/modules
PERL5LIB=${PERL5LIB}:${HOME}/src/ensembl-compara/modules
PERL5LIB=${PERL5LIB}:${HOME}/src/ensembl-variation/modules
PERL5LIB=${PERL5LIB}:${HOME}/src/ensembl-functgenomics/modules
export PERL5LIB</pre></span></div><div><div> </div><blockquote class="gmail_quote" style="margin:0pt 0pt 0pt 0.8ex;border-left:1px solid rgb(204, 204, 204);padding-left:1ex">2) Variant effect predictor is taking too long to process given vcf file (~2000 line of SNP/INDELs)<br>


</blockquote><div><br></div></div><div>For this and point 3), I recommend you try adding the following flags to your command:</div><div><br></div><div>perl <a href="http://variant_effect_predictor.pl/" target="_blank">variant_effect_predictor.pl</a> -i ../samtools-0.1.12a/samfiles/q20/vcf/GKUNU9Q04_chr1_q20_sort.vcf -o chr1.txt -format vcf -s cow -w -b 5000</div>


<div><br></div><div>Using -format forces the program to read your file as a VCF.</div><div><br></div><div>Using -w means the script runs in "whole-genome" mode, which is better suited to large data sets that cover, for example, one chromosome. You should make sure when you use this that the VCF input file is sorted by chromosome and then position.</div>


<div><br></div><div>Setting a larger buffer size with -b helps whole genome mode work faster.</div><div><br></div><div>Please note that the -w option is only available from version 61 of Ensembl.</div><div><br></div><div>


Thanks and good luck!</div><div><br></div><div>Will McLaren</div><div>Ensembl Variation</div><div><br></div><div> </div><blockquote class="gmail_quote" style="margin:0pt 0pt 0pt 0.8ex;border-left:1px solid rgb(204, 204, 204);padding-left:1ex">

<div><div></div><div>

3) In the end it gives error, <br><br>[orf@localhost variant_effect_predictor]$ perl <a href="http://variant_effect_predictor.pl" target="_blank">variant_effect_predictor.pl</a> -i ../samtools-0.1.12a/samfiles/q20/vcf/GKUNU9Q04_chr1_q20_sort.vcf -o chr1.txt -s cow<br>



WARNING: Start 5959615 or end . coordinate invalid on line 92                                           <span style="color:rgb(255, 0, 0)">/ INDEL</span><br>WARNING: Start 30571012 or end . coordinate invalid on line 572                                        <span style="color:rgb(255, 0, 0)">/ INDEL</span><br>



WARNING: Start 64306203 or end . coordinate invalid on line 819                                        <span style="color:rgb(255, 0, 0)">/ INDEL</span><br>WARNING: Start 76575493 or end . coordinate invalid on line 895<span style="color:rgb(255, 0, 0)">                                        / INDEL</span><br>



DBD::mysql::st execute failed: Lost connection to MySQL server during query at /home/orf/EnsEMBL/src/ensembl/modules/Bio/EnsEMBL/DBSQL/BaseAdaptor.pm line 521, <GEN0> line 1006.<br><br>-------------------- EXCEPTION --------------------<br>



MSG: Detected an error whilst executing SQL 'SELECT  vf.variation_feature_id, vf.seq_region_id, vf.seq_region_start, vf.seq_region_end, vf.seq_region_strand, vf.variation_id, vf.allele_string, vf.variation_name, vf.map_weight, <a href="http://s.name" target="_blank">s.name</a>, s.somatic, vf.validation_status, vf.consequence_type, vf.class_so_id<br>



FROM ( (variation_feature vf, source s) <br>  LEFT JOIN failed_variation fv ON fv.variation_id = vf.variation_id ) <br> WHERE s.somatic = 0 AND <br>    (<br>        fv.variation_id IS NULL OR<br>        fv.subsnp_id IS NOT NULL<br>



    )<br>     AND vf.seq_region_id = 142972 AND vf.seq_region_start <= 23402307 AND vf.seq_region_end >= 23402307 AND vf.seq_region_start >= 23401807  AND<br>       vf.source_id = s.source_id <br>': DBD::mysql::st execute failed: Lost connection to MySQL server during query at /home/orf/EnsEMBL/src/ensembl/modules/Bio/EnsEMBL/DBSQL/BaseAdaptor.pm line 521, <GEN0> line 1006.<br>



<br>STACK Bio::EnsEMBL::DBSQL::BaseAdaptor::generic_fetch /home/orf/EnsEMBL/src/ensembl/modules/Bio/EnsEMBL/DBSQL/BaseAdaptor.pm:522<br>STACK Bio::EnsEMBL::DBSQL::BaseFeatureAdaptor::_slice_fetch /home/orf/EnsEMBL/src/ensembl/modules/Bio/EnsEMBL/DBSQL/BaseFeatureAdaptor.pm:495<br>



STACK Bio::EnsEMBL::DBSQL::BaseFeatureAdaptor::fetch_all_by_Slice_constraint /home/orf/EnsEMBL/src/ensembl/modules/Bio/EnsEMBL/DBSQL/BaseFeatureAdaptor.pm:316<br>STACK Bio::EnsEMBL::Variation::DBSQL::VariationFeatureAdaptor::fetch_all_by_Slice_constraint /home/orf/EnsEMBL/src/ensembl-variation/modules/Bio/EnsEMBL/Variation/DBSQL/VariationFeatureAdaptor.pm:121<br>



STACK Bio::EnsEMBL::Variation::DBSQL::VariationFeatureAdaptor::fetch_all_by_Slice /home/orf/EnsEMBL/src/ensembl-variation/modules/Bio/EnsEMBL/Variation/DBSQL/VariationFeatureAdaptor.pm:175<br>STACK main::print_consequences <a href="http://variant_effect_predictor.pl:318" target="_blank">variant_effect_predictor.pl:318</a><br>



STACK toplevel <a href="http://variant_effect_predictor.pl:289" target="_blank">variant_effect_predictor.pl:289</a><br>Ensembl API version = 61<br>---------------------------------------------------<br><font color="#888888"><br clear="all">


<br>-- <br>Ketan Padiya<div>
Research Fellow<br>Anand Veterinary College<br>Gujarat<br>India.<br>+91 9428969448</div><div style="display:inline"></div><br>
<br><div></div>
</font><br></div></div>_______________________________________________<br>
Dev mailing list<br>
<a href="mailto:Dev@ensembl.org" target="_blank">Dev@ensembl.org</a><br>
<a href="http://lists.ensembl.org/mailman/listinfo/dev" target="_blank">http://lists.ensembl.org/mailman/listinfo/dev</a><br>
<br></blockquote></div><br></div>
</blockquote></div><br><br clear="all"><br>-- <br>Ketan Padiya<div>Research Fellow<br>Anand Veterinary College<br>Gujarat<br>India.<br>+91 9428969448</div><div style="display:inline"></div><br>
</div></div><br>_______________________________________________<br>
Dev mailing list<br>
<a href="mailto:Dev@ensembl.org">Dev@ensembl.org</a><br>
<a href="http://lists.ensembl.org/mailman/listinfo/dev" target="_blank">http://lists.ensembl.org/mailman/listinfo/dev</a><br>
<br></blockquote></div><br></div>