<div dir="ltr">Hi Will<div><br></div><div>Many thanks for your explanations.<br></div><div>However, the tools claims that it cannot find the --variant_class option</div><div><br></div><div> perl <a href="http://variant_effect_predictor.pl" target="_blank">variant_effect_predictor.pl</a> --no_progress --variant_c rass --biotype --numbers --offline --custom ../ref/pao1.gff.gz,pao1-genes,gff,overlap,0 --format vcf -i ./test.vcf -o ./test.txt --species pao1 --dir_cache ./variant_effect_predictor_version79/cache_files<br></div><div><div><span style="background-color:rgb(255,255,0)">Unknown option: variant_class</span></div><div>ERROR: Failed to parse command-line flags</div></div><div><br></div><div>I am using version 79, is this a version issue?</div><div><br></div><div>Also, I could not find the gtf/gff specifications via the given second link?</div><div><br></div><div>Thanks for help!</div><div><br></div><div>Best,</div><div>R.</div></div><div class="gmail_extra"><br><div class="gmail_quote">On Mon, Jun 8, 2015 at 10:38 AM, Will McLaren <span dir="ltr"><<a href="mailto:wm2@ebi.ac.uk" target="_blank">wm2@ebi.ac.uk</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">Hi Roland,<div><br></div><div>You can ignore that warning message; when you specify --everything, it switches on a few options which tell the VEP to expect to find cache files containing co-located variants. Since you generated your cache yourself, these files don't exist, which is why the code is complaining. You can either continue to ignore the warnings, or substitute --everything for the list of flags specified here:<br></div><div><br></div><div><a href="http://www.ensembl.org/info/docs/tools/vep/script/vep_options.html#opt_everything" target="_blank">http://www.ensembl.org/info/docs/tools/vep/script/vep_options.html#opt_everything</a><br></div><div><br></div><div>In fact in your case only the following will work with a user-generated cache anyway: --variant_class, --biotype, --numbers</div><div><br></div><div>Regarding the lack of protein-changing results, there is every chance that the cache has not been generated correctly from the GTF. I notice you converted a GFF; it's worth checking that the requirements on the input GTF are quite strict, see <a href="http://www.ensembl.org/info/docs/tools/vep/script/vep_options.html#opt_everything" target="_blank">http://www.ensembl.org/info/docs/tools/vep/script/vep_options.html#opt_everything</a></div><div><br></div><div>It is on our to-do list to make this script compatible with a wider spectrum of GFF/GTF formatting.</div><div><br></div><div>Regards</div><div><br></div><div>Will</div></div><div class="gmail_extra"><br><div class="gmail_quote"><div><div class="h5">On 5 June 2015 at 13:52, Schmucki, Roland <span dir="ltr"><<a href="mailto:roland.schmucki@roche.com" target="_blank">roland.schmucki@roche.com</a>></span> wrote:<br></div></div><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div><div class="h5"><div dir="ltr">Dear Will<div><br></div><div>Thank you very much for the quick response.</div><div>I would like to post this issue to the public Ensembl mailing list.</div><div>Here is a brief description of the problem I encountered:</div><div><br></div><br>When running VEP with ensembl annotation files I get errors of the form "Could not find variation cache for Chromosome..."<br><br>I downloaded a  genome (i.e. pao1, $name.fa) and annotation ($name.gff3) from Ensembl ftp and then created the cache files according to the VEP tutorial:<br><br><br>sort -k1,1 -k4,4n $name.gff | bgzip > $name.gff.gz<br>tabix -p gff $name.gff.gz<br>./cufflinks/gffread $name.gff -T -o $name.gtf<br>perl <a href="http://gtf2vep.pl/" target="_blank">gtf2vep.pl</a> -i $name.gtf -f $name.fa -d 79 -s $name --dir variant_effect_predictor_version79/cache_files_<br>and move the cache files to the correct location manually.<br><br>This all seem to have worked fine without any error or warning messages.<br>Then I mapped the reads to the genome, ran Freebayes (variants.vcf with 2700 variants) and at the very end applied VEP with the following command:<br><br><br>perl <a href="http://variant_effect_predictor.pl/" target="_blank">variant_effect_predictor.pl</a> --everything --offline --custom $name.gff.gz,$name-genes,gff,overlap,0 --format vcf -i variants.vcf -o variants.txt --species $name --dir_cache $VEP_DATA<br><br><br>The variable VEP_DATA points to the corresponding cache file:<div>with the following files (creation date and file size) there in: $VEP_DATA/pao1/79/Chromosome/</div><div><div>292135 Jun  5 09:10 3000001-4000000.gz</div><div>294904 Jun  5 09:10 1000001-2000000.gz</div><div>290186 Jun  5 09:10 1-1000000.gz</div><div>290763 Jun  5 09:10 5000001-6000000.gz</div><div>284789 Jun  5 09:10 2000001-3000000.gz</div><div>292462 Jun  5 09:10 4000001-5000000.gz</div><div>78483 Jun  5 09:10 6000001-7000000.gz<br></div><div><br></div></div><div><br></div><div>When I run VEP I get the following errors and warnings (See attached log file for all details):</div><div><div>WARNING: Could not find variation cache for Chromosome:1-1000000</div><div>WARNING: Could not find variation cache for Chromosome:5000001-6000000</div></div><div>etc.</div><div><br></div><div><br></div><div><span style="font-size:12.8000001907349px">I don't understand why I got this errors/warnings?</span><div style="font-size:12.8000001907349px">Thanks a lot for any advice!</div><div style="font-size:12.8000001907349px"><br></div><div style="font-size:12.8000001907349px">Best,</div><div style="font-size:12.8000001907349px"><br></div><div style="font-size:12.8000001907349px">R.</div><div style="font-size:12.8000001907349px"><br></div><div style="font-size:12.8000001907349px"><br></div><div style="font-size:12.8000001907349px">PS: there is an output file generated with variant annotations of the form:</div><div style="font-size:12.8000001907349px"><br></div><div style="font-size:12.8000001907349px"><div>#Uploaded_variation     Location        Allele  Gene    Feature Feature_type    Consequence     cDNA_position   CDS_position    Pro</div><div>tein_position        Amino_acids     Codons  Existing_variation      Extra</div><div>Chromosome_2415_G/T     Chromosome:2415 T       gene:PA0005     transcript:AAG03395     Transcript      downstream_gene_variant -</div><div>       -       -       -       -       -       IMPACT=MODIFIER;pao1-genes=gene:PA0002,exon_Chromosome:2056-3159,CDS:AAG03392,transc</div></div><div style="font-size:12.8000001907349px"><br></div><div style="font-size:12.8000001907349px">However, no amino acid changes are found which is unlikely.</div></div><div><br></div>
</div>
<br></div></div>_______________________________________________<br>
Dev mailing list    <a href="mailto:Dev@ensembl.org" target="_blank">Dev@ensembl.org</a><br>
Posting guidelines and subscribe/unsubscribe info: <a href="http://lists.ensembl.org/mailman/listinfo/dev" target="_blank">http://lists.ensembl.org/mailman/listinfo/dev</a><br>
Ensembl Blog: <a href="http://www.ensembl.info/" target="_blank">http://www.ensembl.info/</a><br>
<br></blockquote></div><br></div>
<br>_______________________________________________<br>
Dev mailing list    <a href="mailto:Dev@ensembl.org">Dev@ensembl.org</a><br>
Posting guidelines and subscribe/unsubscribe info: <a href="http://lists.ensembl.org/mailman/listinfo/dev" target="_blank">http://lists.ensembl.org/mailman/listinfo/dev</a><br>
Ensembl Blog: <a href="http://www.ensembl.info/" target="_blank">http://www.ensembl.info/</a><br>
<br></blockquote></div><br><br clear="all"><div><br></div>-- <br><div class="gmail_signature"><div dir="ltr"><div><div dir="ltr"><p style="margin-bottom:0.0001pt"><a name="UNIQUE_ID_SafeHtmlFilter__GoBack"></a><span style="font-size:10pt;font-family:Imago;background-image:initial;background-repeat:initial">Roland Schmucki, PhD</span><span style="font-size:10pt;font-family:Imago"><br>
<span style="background-image:initial;background-repeat:initial">Computational Biologist, Pharmaceutical
Sciences</span><br>
<span style="background-image:initial;background-repeat:initial">Roche Pharma Research and Early Development</span></span><span style="font-size:12.0pt;font-family:Imago"></span></p>

<p style="margin-bottom:12pt;background-image:initial;background-repeat:initial"><span style="font-size:10pt;font-family:Imago"><br>
Roche Innovation Center Basel</span></p>

<p style="margin-bottom:0.0001pt;background-image:initial;background-repeat:initial"><span style="font-size:10pt;font-family:Imago">F. Hoffmann-La Roche Ltd<br>
Grenzacherstrasse 124<br>
4070 Basel</span></p>

<p style="margin-bottom:0.0001pt;background-image:initial;background-repeat:initial"><span style="font-size:10pt;font-family:Imago">Switzerland<br>
Phone +41 61 687 13 30</span></p>

<p style="margin-bottom:0.0001pt;background-image:initial;background-repeat:initial"><span style="font-size:10pt;font-family:Imago"> </span></p>

<p style="margin-bottom:0.0001pt;background-image:initial;background-repeat:initial"><span style="font-size:10pt;font-family:Imago"><br>
Confidentiality Note: This message is intended only for the use of the named
recipient(s) and may contain confidential and/or proprietary information. If
you are not the intended recipient, please contact the sender and delete this
message. Any unauthorized use of the information contained in this message is
prohibited.</span></p></div></div></div></div>
</div>