<div dir="ltr">Hi Matt,<div><br></div><div>I assume you're already using a FASTA file (<a href="http://www.ensembl.org/info/docs/tools/vep/script/vep_cache.html#fasta">http://www.ensembl.org/info/docs/tools/vep/script/vep_cache.html#fasta</a>).</div><div><br></div><div>There does seem to be some issue with the sequence fetching code, however. If you are using the VEP's --offline flag then the issue doesn't appear (at least for me). If you use --cache (which asks the code to prefer use of offline resources including the FASTA file but still allows connections to the DB) then in this particular case calling that method seems to bypass the code that fetches sequence from the FASTA file and instead fetches it from the DB.</div><div><br>While we look into this issue, can you possibly try using --offline if you aren't already?</div><div><br></div><div>Regards</div><div><br></div><div>Will McLaren</div><div>Ensembl Variation</div></div><div class="gmail_extra"><br><div class="gmail_quote">On 13 November 2014 07:39, Matt Wood <span dir="ltr"><<a href="mailto:matt.wood@codifiedgenomics.com" target="_blank">matt.wood@codifiedgenomics.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">I'm working on a VEP plugin where I need to look at a section of cDNA around the variant.<div><br></div><div>In a previous plugin, where I needed to do something similar with genomic DNA, I was able to get a slice from the VariationFeature and subslice it like this:</div><div><br></div><div>my $subseq = $vf->slice->sub_Slice($start, $end)->seq;<br></div><div><br></div><div>That worked really well and performed really well.</div><div><br></div><div>I can't find anything similar for the cDNA so I'm getting the spliced sequence from the transcript and then using substr() to do what sub_Slice did above.</div><div><br></div><div><div>my $cdna_seq = $transcript->spliced_seq;</div><div>my $subseq = substr($cdna_seq, $start, $end);</div></div><div><br></div><div>It works well enough, but performance is too poor to be useful, taking 2 or 3 seconds to get $subseq per transcript. I'm wondering if I'm going about things the wrong way and am skipping a cache or something with the methods I'm using.</div><div><br></div><div>Any ideas for how I can get better performance? Is there a better way to get a chunk of a transcript's spliced sequence?</div><div><br></div><div>Thanks,</div><div>Matt Wood</div><div>Codified Genomics</div></div>
<br>_______________________________________________<br>
Dev mailing list    <a href="mailto:Dev@ensembl.org">Dev@ensembl.org</a><br>
Posting guidelines and subscribe/unsubscribe info: <a href="http://lists.ensembl.org/mailman/listinfo/dev" target="_blank">http://lists.ensembl.org/mailman/listinfo/dev</a><br>
Ensembl Blog: <a href="http://www.ensembl.info/" target="_blank">http://www.ensembl.info/</a><br>
<br></blockquote></div><br></div>