<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=Windows-1252">
</head>
<body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;">
Dear Sunita
<div><br>
</div>
<div>You can check the activity on the list in here: <a href="http://lists.ensembl.org/pipermail/dev/2013-November/thread.html#9446">
http://lists.ensembl.org/pipermail/dev/2013-November/thread.html#9446</a>. You will see that your last two emails have been received correctly.</div>
<div><br>
</div>
<div>I will try to answer some of your questions, but please have a look at this page:
<a href="http://www.ensembl.org/info/genome/compara/homology_method.html">http://www.ensembl.org/info/genome/compara/homology_method.html</a> where you will find a few details about the methodology used to build the phylogenetic trees.</div>
<div><br>
</div>
<div>The trees are typically rooted using outgroups. This is done internally by TreeBeST, the software developed by the Heng Li (TreeFam) and currently used in Ensembl. The branch lengths represent an estimate of the number of mutations based on the back-translated
 alignment, using the HKY model in PHYML. Therefore, the trees are phylograms. As far as I remember, the bootstrap support comes from a 100 resampling replicates (i.e. Felsenstein 1985).</div>
<div><br>
</div>
<div>The alignments are available in any of the other files in the same FTP directory. The file you have downloaded is smaller because it only lists the trees.</div>
<div><br>
</div>
<div>As a general rule, the orthologs in Ensembl do not have a confidence value as of now. There is a low-confidence set of orthologs call “possible orthologs” which represents the closest homolog when no other ortholog is found. Please refer to the aforementioned
 URL for more details on this.</div>
<div><br>
</div>
<div>Kind regards</div>
<div><br>
</div>
<div>Javier</div>
<div><br>
</div>
<div>
<div>
<div>On 15 Nov 2013, at 20:26, Kumari, Sunita <<a href="mailto:kumari@cshl.edu">kumari@cshl.edu</a>> wrote:</div>
<br class="Apple-interchange-newline">
<blockquote type="cite">Hi Ensembl team,<br>
<br>
I will really appreciate if someone can answer my questions quickly. <br>
<br>
I did not get any response so far. I am not sure even if you are getting my emails.
<br>
<br>
Thanks much.<br>
<br>
Sunita<br>
<br>
<br>
<br>
<br>
========================<br>
<br>
From: Kumari, Sunita<br>
Sent: Thursday, November 14, 2013 3:47 PM<br>
To: <a href="mailto:dev@ensembl.org">dev@ensembl.org</a><br>
Subject: quick questions for gene trees<br>
<br>
Hi Ensembl compara team,<br>
<br>
I am using this ensemble ftp site to get alignment files and gene<br>
trees in newick format:<br>
<br>
<a href="ftp://ftp.ensemblgenomes.org/pub/plants/release-20/emf/ensembl-compara/homologies/">ftp://ftp.ensemblgenomes.org/pub/plants/release-20/emf/ensembl-compara/homologies/</a><br>
<br>
I am using  Compara.gene_trees.20.emf.gz and Compara.newinck_trees.20.emf.gz files<br>
<br>
I have couple of questions. I would appreciate if you can please provide me some information.<br>
<br>
1. metadata information on gene trees:<br>
<br>
a) Are the trees outgroup OR midpoint rooted?<br>
<br>
b) The branch length unit is replacements per position, arbitrary<br>
units or million years?<br>
<br>
c) Tree style is cladogram, phylogram, or phenogram?<br>
<br>
d) bootstrap type is felsenstein 1985, aLRT SH-like branch support, or<br>
bayesian posterior probability?<br>
<br>
<br>
2. For alignments (Compara.gene_trees.20.emf.gz):<br>
<br>
Where can I get the alignment ID, i.e. the 'source DB alignment ID'?<br>
e.g. What is the unique identifier for the alignment at the source<br>
database?<br>
<br>
<br>
3. InParanoid7 provides scoring values to orthologs. e.g.<br>
http://inparanoid.sbc.su.se/cgi-bin/e.cgi?species1=93&species2=98&clusters_per_page=50&.submit=Submit+Query&clusterlowerlimit=1<br>
<br>
Do we also provide scoring value to orthologs using Compara pipeline?<br>
If not, any plan to provide this value in next release?<br>
<br>
Looking forward to your reply.<br>
<br>
Thanks.<br>
<br>
Sunita<br>
________________________________________<br>
<br>
Sunita Kumari, PhD<br>
Bioinformatics Scientist,<br>
Ware Lab,<br>
Cold Spring Harbor Labs,<br>
Cold Spring Harbor, NY -11724<br>
<br>
________________________________________<br>
From: Kumari, Sunita<br>
Sent: Tuesday, November 12, 2013 3:37 PM<br>
To: dev@ensembl.org<br>
Subject: Question on compara gene trees<br>
<br>
Dear Ensembl compara team,<br>
<br>
<br>
I have couple of questions on metadata for gene trees. I am using this ensemble ftp site to get alignment files and gene trees in newick format:<br>
ftp://ftp.ensemblgenomes.org/pub/plants/release-20/emf/ensembl-compara/homologies/<br>
<br>
Q1.  For each tree, can we get the following information; pl confirm the answer given below each comment.<br>
<br>
a) If the tree is Outgroup_OR_Midpoint rooted;<br>
-----Probably Outgroup<br>
<br>
b) branch_length        unit is "Replacements per position" OR "Arbitrary units" OR "Million years";<br>
---Probably arbitrary<br>
<br>
c) tree style is "Cladogram" OR "Phylogram" OR "Phenogram";<br>
-- Phylogram<br>
<br>
d) bootstrap_type       is "Felsenstein 1985" OR "aLRT SH-like branch support" OR "Bayesian posterior probability"<br>
<br>
please provide the correct bootstrap type.<br>
<br>
<br>
Q2. Is it possible to get conservation score in next compara release for Ensembl plant genomes?<br>
What will be the probable timeline to get scoring available?<br>
<br>
<br>
Thanks.<br>
<br>
Sunita<br>
<br>
Sunita Kumari, PhD<br>
Bioinformatics Scientist,<br>
Ware Lab,<br>
Cold Spring Harbor Labs,<br>
Cold Spring Harbor, NY - 11724<br>
<br>
_______________________________________________<br>
Dev mailing list    Dev@ensembl.org<br>
Posting guidelines and subscribe/unsubscribe info: http://lists.ensembl.org/mailman/listinfo/dev<br>
Ensembl Blog: http://www.ensembl.info/<br>
</blockquote>
</div>
<br>
<div>
<div style="color: rgb(0, 0, 0); font-family: Helvetica;  font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-align: -webkit-auto; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; ">
<div>--</div>
<div>Javier Herrero, PhD</div>
<div>Comparative Genomics Project Leader</div>
<div>TGAC, Norwich Research Park</div>
<div>Norwich, NR4 7UH, UK</div>
</div>
</div>
<br>
</div>
</body>
</html>