Hi Sebastien,<div><br></div><div>I think it will solve some of the failed cases. </div><div><br></div><div>The issue with nomenclature for genes, transcripts & translations will always be there. When you code against the Ensembl project databases (vertebrate species) all of the identifiers are consistent as they are all assigned by the Ensembl team. When you code against the Ensembl Genomes (Metazoa or other divisions) you will be working with identifiers assigned by many different groups/projects who do not necessarily use the same nomenclature. The -RA, -PA system originated with the Drosophila community and is used for most insect/arthropod genomes.</div>
<div><br></div><div>You may want to retrieve the translation protein ID for a gene ID before calling the gene tree leaf. That would be the scalable solution.</div><div><br></div><div>regards</div><div>Dan</div><div><br></div>
<div><br></div><div><br><br><div class="gmail_quote">On 18 December 2012 10:43, Moretti Sébastien <span dir="ltr"><<a href="mailto:sebastien.moretti@unil.ch" target="_blank">sebastien.moretti@unil.ch</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi Matthieu<br>
<br>
you mean I can do something like<br>
    $tree->find_leaf_by_name($seq_<u></u>name) || $tree->find_leaf_by_name($seq_<u></u>name.'-PA');<br>
<br>
In other words, adding -PA in all failed cases will fix my problem ?<div class="HOEnZb"><div class="h5"><br>
<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Hi Sébastien<br>
<br>
This happens because the names of the gene tree leaves are protein IDs<br>
and ADAR011299 is a gene ID. In your case, it should work with<br>
ADAR011299-PA.<br>
<a href="http://metazoa.ensembl.org/Anopheles_darlingi/Gene/Compara_Tree?db=core;g=ADAR011299" target="_blank">metazoa.ensembl.org/Anopheles_<u></u>darlingi/Gene/Compara_Tree?db=<u></u>core;g=ADAR011299</a><br>
<br>
<br>
For some species, gene IDs and protein IDs are often identical, which<br>
can be quite confusing.<br>
<br>
Best regards,<br>
Matthieu<br>
<br>
On 18/12/12 10:12, Moretti Sébastien wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
Hi<br>
<br>
with ensembl API 69, or previous APIs, I used to get a leaf object with<br>
this function:<br>
     my $leaf = $tree->find_leaf_by_name($seq_<u></u>name);<br>
     print $leaf->node_id;<br>
<br>
I've never got problems with ensembl vertebrate data.<br>
<br>
<br>
I tried the same script with Ensembl Metazoa and got this error message:<br>
     Can't call method "node_id" on an undefined value<br>
or<br>
     Use of uninitialized value $leaf in concatenation<br>
$leaf appears to be undefined, find_leaf_by_name returns undef.<br>
<br>
<br>
Do you have an explanation for this ?<br>
Regards<br>
<br>
e.g.<br>
     my $leaf = $tree->find_leaf_by_name('<u></u>ADAR011299');<br>
     in EMGT00050000000001 gene family<br>
</blockquote></blockquote></div></div><div class="im HOEnZb">
-- <br>
Sébastien Moretti<br>
Department of Ecology and Evolution,<br>
Biophore, University of Lausanne,<br>
CH-1015 Lausanne, Switzerland<br>
Tel.: +41 (21) 692 4221/4079<br>
<a href="http://selectome.unil.ch/" target="_blank">http://selectome.unil.ch/</a> <a href="http://bgee.unil.ch/" target="_blank">http://bgee.unil.ch/</a><br>
<br></div><div class="HOEnZb"><div class="h5">
______________________________<u></u>_________________<br>
Dev mailing list    <a href="mailto:Dev@ensembl.org" target="_blank">Dev@ensembl.org</a><br>
Posting guidelines and subscribe/unsubscribe info: <a href="http://lists.ensembl.org/mailman/listinfo/dev" target="_blank">http://lists.ensembl.org/<u></u>mailman/listinfo/dev</a><br>
Ensembl Blog: <a href="http://www.ensembl.info/" target="_blank">http://www.ensembl.info/</a><br>
</div></div></blockquote></div><br><br clear="all"><div><br></div>-- <br>Ensembl Genomes | VectorBase | i5K insect genome initiative<br>
</div>