<html dir="ltr"><head>
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1">
<style title="owaParaStyle"><!--P {
        MARGIN-TOP: 0px; MARGIN-BOTTOM: 0px
}
--></style>
</head>
<body ocsi="x">
<p>Hi Stephen,<br>
<br>
Thanks a lot. The basic_ma.pl<a></a><a></a> you attached worked great for downloading small regions. I need to download genome-wide EPO_LOW_COVERAGE<a></a><a></a> alignments for some analyses we are trying to do on the gibbon genome. I was hoping to be able
 to use the script to download alignments for each chromosome, but when I tried that with chr22<a></a><a></a> I got a "DBD<a></a><a></a>::mysql<a></a><a></a>::st<a></a><a></a> execute failed: Lost connection to MySQL<a></a><a></a> server during query" error.
 It looks like whole chromosomes cannot easily be download via the API. Is there somewhere that I can download the EPO_LOW_COVERAGE<a></a><a></a> alignments as text files? I googled<a></a><a></a> around and I have not been able to find a place to download them.</p>
<p> </p>
<p><font face="times new roman">Thanks,</font></p>
<p> </p>
<p><font face="times new roman">Alan</font> <br>
________________________________________<br>
From: dev-bounces@ensembl.org<a></a><a></a> [dev-bounces@ensembl.org<a></a><a></a>] On Behalf Of Stephen Fitzgerald [stephenf@ebi.ac.uk<a></a><a></a>]<br>
Sent: Thursday, June 14, 2012 9:36 AM<br>
To: Ensembl<a></a><a></a> developers list<br>
Subject: Re: [ensembl<a></a><a></a>-dev] Problem with DumpAlignedGenes.pl<a></a><a></a> script<br>
<br>
Hi Alan, I've commited<a></a><a></a> some changes to the DumpAlignedGenes.pl<a></a><a></a> in cvs<a></a><a></a><br>
(head) which should make it easier to use for retrieving multiple<br>
alignments. The --set_of_species<a></a><a></a> flag is used to find alignments<br>
consisting of that particular set of species (this is why you see the<br>
exception below as the EPO_LOW_COVERAGE<a></a><a></a> alignments consists of 35 species<br>
and not just human:rat:mouse<a></a><a></a>).<br>
I've added a new flag "--species_set_name<a></a><a></a>" which will make it easier to<br>
get alignments from the EPO_LOW_COVERAGE<a></a><a></a> set.<br>
<br>
eg<a></a><a></a>.<br>
perl<a></a><a></a> DumpAlignedGenes.pl<a></a><a></a>  --alignment_type<a></a><a></a> EPO_LOW_COVERAGE<a></a><a></a><br>
--species_set_name<a></a><a></a> mammals --seq_region<a></a><a></a> 8 --seq_region_start<a></a><a></a> 21180813<br>
--seq_region_end<a></a><a></a> 21188452 --species rat --genes_from<a></a><a></a> chimp<br>
<br>
I've also attahed<a></a><a></a> a basic script which will allow you to get all the<br>
alignments from the EPO_LOW_COVERAGE<a></a><a></a> when you define a reference species<br>
and coordinates (I've hard-coded "sus_scrofa<a></a><a></a>" as the reference).<br>
<br>
You may also find some parts of this script of use:<br>
http://www.ebi.ac.uk/~stephenf/Workshops/Cambridge_march2012/Exercises/Solutions/align_slice.txt<br>
<br>
(It prints the nucleotide bases and assembly positions for both the pig<br>
myostatin<a></a><a></a> (MSTN<a></a><a></a>) gene and it's bovine ortholog<a></a><a></a> where the aligned sequences<br>
differ)<br>
<br>
and the output from it is here:<br>
http://www.ebi.ac.uk/~stephenf/Workshops/Cambridge_march2012/Exercises/Solutions/align_slice.out.txt<br>
<br>
If you have any more questions, get back in touch.<br>
<br>
All the best,<br>
Stephen.<br>
<br>
<br>
<br>
<br>
On Wed, 13 Jun 2012, Harris, Ronald Alan wrote:<br>
<br>
> Hi Kathryn and Stephen,<br>
><br>
> Thanks for helping me out with DumpAlignedGenes.pl<a></a><a></a>. The scripts that both of you sent me now work, but there is another problem. According to the help,<br>
> you can get alignments from multiple species using this:<br>
><br>
> [--set_of_species<a></a><a></a> species1:species2:species3<a></a><a></a>:...]<br>
><br>
> I ran both of your scripts with this command line<br>
><br>
> perl<a></a><a></a> DumpAlignedGenes.pl<a></a><a></a> --set_of_species<a></a><a></a> "human:rat:mouse<a></a><a></a>"<br>
><br>
> but I get this error (line numbers based on the script Kathryn sent):<br>
><br>
> -------------------- WARNING ----------------------<br>
> MSG: No Bio::EnsEMBL<a></a><a></a>::Compara<a></a><a></a>::MethodLinkSpeciesSet<a></a><a></a> found for<br>
>   <EPO_LOW_COVERAGE<a></a><a></a>> and homo_sapiens<a></a><a></a>(GRCh37<a></a><a></a>), rattus_norvegicus<a></a><a></a>(RGSC3.4<a></a><a></a>), mus_musculus<a></a><a></a>(NCBIM37<a></a><a></a>)<br>
> FILE: Compara<a></a><a></a>/DBSQL<a></a><a></a>/MethodLinkSpeciesSetAdaptor.pm<a></a><a></a> LINE: 508<br>
> CALLED BY: DumpAlignedGenes.kathryn.pl<a></a><a></a>  LINE: 385<br>
> Ensembl<a></a><a></a> API version = 67<br>
> ---------------------------------------------------<br>
> -------------------- EXCEPTION --------------------<br>
> MSG: The database do not contain any EPO_LOW_COVERAGE<a></a><a></a> data for human:rat:mouse<a></a><a></a>!<br>
> STACK toplevel<a></a><a></a> DumpAlignedGenes.kathryn.pl:389<a></a><a></a><br>
> Ensembl<a></a><a></a> API version = 67<br>
> ---------------------------------------------------<br>
><br>
> This is after setting the alignment_type<a></a><a></a> to "EPO_LOW_COVERAGE<a></a><a></a>" which is what I want to use, but I get a similar error if I use the default alignment_type<a></a><a></a><br>
> of BLASTZ_NET<a></a><a></a>.<br>
><br>
> What I ultimately want to do is pull out multiple alignments for all species in the 35 eutherian<a></a><a></a> mammals EPO_LOW_COVERAGE<a></a><a></a> for a set of genes that I am<br>
> interested in analyzing. Can I do that with this script?<br>
><br>
> Thanks,<br>
><br>
> Alan<br>
><br>
><br>
><br>
> _________________________________________________________________________________________________________________________________________________________<br>
> From: dev-bounces@ensembl.org<a></a><a></a> [dev-bounces@ensembl.org<a></a><a></a>] On Behalf Of Kathryn Beal [kbeal@ebi.ac.uk<a></a><a></a>]<br>
> Sent: Thursday, May 31, 2012 5:24 AM<br>
> To: Ensembl<a></a><a></a> developers list<br>
> Subject: Re: [ensembl<a></a><a></a>-dev] Problem with DumpAlignedGenes.pl<a></a><a></a> script<br>
><br>
> Hi Alan, As you may have noticed, this script has not been updated for some time. I've made various updates and the script now works. I've committed this<br>
> to the cvs<a></a><a></a> ensembl-compara<a></a><a></a> HEAD code. I'll send a separate email with this attached for you.<br>
><br>
> Cheers<br>
> Kathryn<br>
><br>
>       Hi,<br>
><br>
> I am trying to use the DumpAlignedGenes.pl<a></a><a></a> in version 67 of the ensembl-compara<a></a><a></a> API. I have made the following necessary changes to the script<br>
> (attached script has these changes):<br>
><br>
> 1. When running the script without arguments as a test I get this error:<br>
><br>
> ------------------ DEPRECATED ---------------------<br>
> Deprecated method call in file DumpAlignedGenes.pl<a></a><a></a> line 365.<br>
> Method Bio::EnsEMBL<a></a><a></a>::DBSQL<a></a><a></a>::MetaContainer<a></a><a></a>::get_Species<a></a><a></a> is deprecated.<br>
> Call is deprecated. Use $self->get_common_name<a></a><a></a>() / $self->get_classification<a></a><a></a>() / $self->get_scientific_name<a></a><a></a>() instead<br>
> Ensembl<a></a><a></a> API version = 67<br>
> ---------------------------------------------------<br>
> -------------------- EXCEPTION --------------------<br>
> MSG: No matches found for name 'Homininae<a></a><a></a> Homo sapiens' and assembly '--undef<a></a><a></a>--'<br>
> STACKBio<a></a><a></a>::EnsEMBL<a></a><a></a>::Compara<a></a><a></a>::DBSQL<a></a><a></a>::GenomeDBAdaptor<a></a><a></a>::fetch_by_name_assembly<a></a><a></a> /home/rharris1<a></a><a></a>/work/ensembl<a></a><a></a>/api<a></a><a></a>/ensembl-compara<a></a><a></a>/modules/Bio/EnsEMBL<a></a><a></a>/Compara<a></a><a></a>/DBSQL<a></a><a></a>/<br>
> GenomeDBAdaptor.pm:131<a></a><a></a><br>
> STACK toplevel<a></a><a></a> DumpAlignedGenes.pl:369<a></a><a></a><br>
> Ensembl<a></a><a></a> API version = 67<br>
><br>
> I changed line 365 from<br>
><br>
> my $this_binomial_id<a></a><a></a> = $this_meta_container_adaptor<a></a><a></a>->get_Species<a></a><a></a>->binomial;<br>
><br>
> to<br>
><br>
> my $this_binomial_id<a></a><a></a> = $this_meta_container_adaptor<a></a><a></a>->get_scientific_name<a></a><a></a>;<br>
> $this_binomial_id<a></a><a></a> =~ s/\s/_/;<br>
><br>
> which fixes this error.<br>
><br>
> 2. I also get this similar error:<br>
><br>
> ------------------ DEPRECATED ---------------------<br>
> Deprecated method call in file DumpAlignedGenes.pl<a></a><a></a> line 436.<br>
> Method Bio::EnsEMBL<a></a><a></a>::DBSQL<a></a><a></a>::MetaContainer<a></a><a></a>::get_Species<a></a><a></a> is deprecated.<br>
> Call is deprecated. Use $self->get_common_name<a></a><a></a>() / $self->get_classification<a></a><a></a>() / $self->get_scientific_name<a></a><a></a>() instead<br>
> Ensembl<a></a><a></a> API version = 67<br>
> ---------------------------------------------------<br>
> -------------------- EXCEPTION --------------------<br>
> MSG: No matches found for name 'Murinae<a></a><a></a> Rattus<a></a><a></a> norvegicus<a></a><a></a>' and assembly '--undef<a></a><a></a>--'<br>
> STACKBio<a></a><a></a>::EnsEMBL<a></a><a></a>::Compara<a></a><a></a>::DBSQL<a></a><a></a>::GenomeDBAdaptor<a></a><a></a>::fetch_by_name_assembly<a></a><a></a> /home/rharris1<a></a><a></a>/work/ensembl<a></a><a></a>/api<a></a><a></a>/ensembl-compara<a></a><a></a>/modules/Bio/EnsEMBL<a></a><a></a>/Compara<a></a><a></a>/DBSQL<a></a><a></a>/<br>
> GenomeDBAdaptor.pm:131<a></a><a></a><br>
> STACK toplevel<a></a><a></a> DumpAlignedGenes.pl:440<a></a><a></a><br>
> Ensembl<a></a><a></a> API version = 67<br>
> ---------------------------------------------------<br>
><br>
> I changed line 436 from<br>
><br>
> my $source_binomial_id<a></a><a></a> = $meta_container_adaptor<a></a><a></a>->get_scientific_name<a></a><a></a>;<br>
><br>
> to<br>
><br>
> my $source_binomial_id<a></a><a></a> = $meta_container_adaptor<a></a><a></a>->get_scientific_name<a></a><a></a>;<br>
> $source_binomial_id<a></a><a></a> =~ s/\s/_/;<br>
><br>
> which fixes this error.<br>
><br>
> ---------------------------------------------------------------------<br>
><br>
> Now I am getting this error:<br>
><br>
> Can't call method "get_all_Genes<a></a><a></a>" on unblessed reference at DumpAlignedGenes.pl<a></a><a></a> line 463.<br>
><br>
> Here is line 463:<br>
><br>
> my $mapped_genes<a></a><a></a> = $align_slice<a></a><a></a>->{'slices'}->{$source_genome_db<a></a><a></a>->name}->get_all_Genes<a></a><a></a>(<br>
><br>
> >>>How do I fix this error?<<<<br>
><br>
><br>
> Thank you for your time.<br>
><br>
> Alan<br>
><br>
><br>
> R. Alan Harris, Ph.D.<br>
> Assistant Professor<br>
> Bioinformatics Research Laboratory<br>
> Epigenomics<a></a><a></a> Data Analysis and Coordination Center<br>
> Department of Molecular and Human Genetics<br>
> Baylor College of Medicine<br>
> Houston, TX 77030<br>
> 713-798-7695<br>
> <DumpAlignedGenes.pl<a></a><a></a>>_______________________________________________<br>
> Dev mailing list    Dev@ensembl.org<a></a><a></a><br>
> List admin (including subscribe/unsubscribe): http://lists.ensembl.org/mailman/listinfo/dev<br>
> Ensembl<a></a><a></a> Blog: http://www.ensembl.info/<br>
><br>
><br>
><br>
></p>
</body>
</html>