<div dir="ltr">Thanks, I'll get the link updated.<div><br></div><div>Will</div></div><div class="gmail_extra"><br><br><div class="gmail_quote">On 9 October 2013 11:52, Tjaart de Beer <span dir="ltr"><<a href="mailto:tjaart@ebi.ac.uk" target="_blank">tjaart@ebi.ac.uk</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi Will,<br>
<br>
Thanks for the answers. I'll look at the two options and see which one<br>
suits me best for now. By the way the link for installing a local mirror<br>
from this page<br>
<br>
<a href="http://www.ensembl.org/info/docs/tools/vep/script/vep_cache.html#local" target="_blank">http://www.ensembl.org/info/docs/tools/vep/script/vep_cache.html#local</a><br>
<br>
"...installing a local mirror, see HERE."<br>
<br>
which points to<br>
<br>
<a href="http://www.ensembl.org/info/docs/webcode/install/ensembl-data.html" target="_blank">http://www.ensembl.org/info/docs/webcode/install/ensembl-data.html</a><br>
<br>
results in an error.<br>
<br>
Thanks again,<br>
<br>
Tjaart<br>
<div class="HOEnZb"><div class="h5"><br>
> Hi Tjaart,<br>
><br>
> Firstly, thanks for finding this, there was an odd bug with patched<br>
> chromosome regions that was causing this error. I've fixed it on the CVS<br>
> branch for 73 - if you update your ensembl-variation checkout, or rerun<br>
> the<br>
> installer if you used that, you should pick up the fixed code.<br>
><br>
> Secondly, while it is possible to use rsIDs as input, I wouldn't recommend<br>
> doing this on such a large scale. Each rsID has to be looked up in the<br>
> database to find its genomic location and alleles. So even though you are<br>
> using the cache, the VEP will be querying the public Ensembl database for<br>
> each rsID, and then using the cache for it's consequence predictions.<br>
><br>
> If you do need to query in this way, I'd suggest setting up a local mirror<br>
> of the Ensembl variation database, see<br>
> <a href="http://www.ensembl.org/info/docs/tools/vep/script/vep_cache.html#local" target="_blank">http://www.ensembl.org/info/docs/tools/vep/script/vep_cache.html#local</a><br>
><br>
> Another alternative would be to extract the corresponding VCF entries for<br>
> your rsIDs from our VCF dumps (<br>
> <a href="ftp://ftp.ensembl.org/pub/release-73/variation/vcf/homo_sapiens/" target="_blank">ftp://ftp.ensembl.org/pub/release-73/variation/vcf/homo_sapiens/</a>), using<br>
> something like vcftools (and the --snps flag). You can either get the<br>
> version of the VCF with consequences, which may save you running the VEP<br>
> at<br>
> all, or get the version without consequences and run this through the VEP<br>
> if you need more than the basic consequence information.<br>
><br>
> Hope that helps<br>
><br>
> Will McLaren<br>
> Ensembl Variation<br>
><br>
><br>
> On 8 October 2013 16:55, Tjaart de Beer <<a href="mailto:tjaart@ebi.ac.uk">tjaart@ebi.ac.uk</a>> wrote:<br>
><br>
>> Hi all,<br>
>><br>
>> I just installed VEP to have a look at some human variant data. I have<br>
>> about 550,000 rsids. As far as I understand from the documentation an<br>
>> rsid<br>
>> on its own should be enough. When I run my rsids I get the following<br>
>> error:<br>
>><br>
>> -------------------- EXCEPTION --------------------<br>
>> MSG: SEQ_REGION_NAME argument is required<br>
>> STACK Bio::EnsEMBL::Slice::new<br>
>> /home/tjaart/my_genes/variant_effect_predictor/Bio/EnsEMBL/Slice.pm:149<br>
>> STACK Bio::EnsEMBL::Variation::Utils::VEP::get_slice<br>
>><br>
>> /home/tjaart/my_genes/variant_effect_predictor/Bio/EnsEMBL/Variation/Utils/VEP.pm:3306<br>
>> STACK Bio::EnsEMBL::Variation::Utils::VEP::cache_transcripts<br>
>><br>
>> /home/tjaart/my_genes/variant_effect_predictor/Bio/EnsEMBL/Variation/Utils/VEP.pm:3596<br>
>> STACK Bio::EnsEMBL::Variation::Utils::VEP::fetch_transcripts<br>
>><br>
>> /home/tjaart/my_genes/variant_effect_predictor/Bio/EnsEMBL/Variation/Utils/VEP.pm:2837<br>
>> STACK Bio::EnsEMBL::Variation::Utils::VEP::vf_list_to_cons<br>
>><br>
>> /home/tjaart/my_genes/variant_effect_predictor/Bio/EnsEMBL/Variation/Utils/VEP.pm:1180<br>
>> STACK Bio::EnsEMBL::Variation::Utils::VEP::get_all_consequences<br>
>><br>
>> /home/tjaart/my_genes/variant_effect_predictor/Bio/EnsEMBL/Variation/Utils/VEP.pm:1125<br>
>> STACK main::main <a href="http://variant_effect_predictor.pl:360" target="_blank">variant_effect_predictor.pl:360</a><br>
>> STACK toplevel <a href="http://variant_effect_predictor.pl:198" target="_blank">variant_effect_predictor.pl:198</a><br>
>> Date (localtime)    = Tue Oct  8 16:43:28 2013<br>
>> Ensembl API version = 73<br>
>><br>
>> As far as I could make out this means that the variant is not in<br>
>> Ensembl.<br>
>> In my test set I have traced it to rs7289804 which does not occur in<br>
>> Ensembl (doing a web search).<br>
>><br>
>> I was wondering if there is a way around this with some kind of flag to<br>
>> ignore rsids for which there is not enough data or it not being present?<br>
>> I<br>
>> couldn't find such a flag in the documentation.<br>
>><br>
>> My command is:<br>
>><br>
>> perl <a href="http://variant_effect_predictor.pl" target="_blank">variant_effect_predictor.pl</a> -i ../test.dat --cache --coding_only<br>
>> --filter coding_change --force_overwrite<br>
>><br>
>> My input file contains no extra line breaks or any strange characters.<br>
>><br>
>> Any help would be appreciated. Thanks!<br>
>><br>
>><br>
>> --<br>
>> Dr. Tjaart de Beer<br>
>> Thornton group<br>
>> European Bioinformatics Institute (EMBL-EBI)<br>
>> European Molecular Biology Laboratory<br>
>> Wellcome Trust Genome Campus<br>
>> Hinxton<br>
>> Cambridge CB10 1SD<br>
>> United Kingdom<br>
>><br>
>><br>
>><br>
>> _______________________________________________<br>
>> Dev mailing list    <a href="mailto:Dev@ensembl.org">Dev@ensembl.org</a><br>
>> Posting guidelines and subscribe/unsubscribe info:<br>
>> <a href="http://lists.ensembl.org/mailman/listinfo/dev" target="_blank">http://lists.ensembl.org/mailman/listinfo/dev</a><br>
>> Ensembl Blog: <a href="http://www.ensembl.info/" target="_blank">http://www.ensembl.info/</a><br>
>><br>
><br>
<br>
<br>
--<br>
Dr. Tjaart de Beer<br>
Thornton group<br>
European Bioinformatics Institute (EMBL-EBI)<br>
European Molecular Biology Laboratory<br>
Wellcome Trust Genome Campus<br>
Hinxton<br>
Cambridge CB10 1SD<br>
United Kingdom<br>
<br>
<br>
</div></div></blockquote></div><br></div>