<div dir="ltr">Dear Sam,<div><br></div><div>You should look at measures of completeness in the assembly based on conserved 1:1 orthologs across species.</div><div><br></div><div>Older small scale set CEGMA (Korf lab, <a href="http://bioinformatics.oxfordjournals.org/content/23/9/1061.full#sec-2">http://bioinformatics.oxfordjournals.org/content/23/9/1061.full#sec-2</a>)</div>
<div>Latest large scale BUSCO (Waterhouse NAR 2012 OrthoDB paper <a href="http://nar.oxfordjournals.org/content/41/D1/D358.long">http://nar.oxfordjournals.org/content/41/D1/D358.long</a>)</div><div><br></div><div>regards</div>
<div>Dan</div><div><br></div></div><div class="gmail_extra"><br><br><div class="gmail_quote">On 11 September 2013 15:21, Sam Seaver <span dir="ltr"><<a href="mailto:samseaver@gmail.com" target="_blank">samseaver@gmail.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">Dear Ensembl,<div><br></div><div>It's recently come to my somewhat naive attention that many eukaryotic genomes are not fully sequenced. In other words, for the list of genes that I download for any species, I should expect that there is a fraction of genes missing.  What I'm trying to discover is whether I can reliably find an estimate of this for each of the plant species I'm exploring.</div>

<div><br></div><div>I suspect that I would have to go back to each of the papers describing the original genome, to see if the authors give an estimate.  Indeed, I understand that this estimate is probably based on a comparative analysis with other genomes.  Regardless, I'm hoping that somewhere within Ensembl, there is a set of statistics that I can use directly, to declare how "complete" a genome is for any given plant.  Does this exist?</div>

<div><br></div><div>Thanks</div><div>Sam Seaver</div><div><div><br></div>-- <br>Postdoctoral Fellow<br>Mathematics and Computer Science Division<br>Argonne National Laboratory<br>9700 S. Cass Avenue<br>Argonne, IL 60439<br>

<br><a href="http://www.linkedin.com/pub/sam-seaver/0/412/168" target="_blank">http://www.linkedin.com/pub/sam-seaver/0/412/168</a><br><a href="mailto:samseaver@gmail.com" target="_blank">samseaver@gmail.com</a><br><a href="tel:%28773%29%20796-7144" value="+17737967144" target="_blank">(773) 796-7144</a><br>

<br>"We shall not cease from exploration<br>And the end of all our exploring<br>Will be to arrive where we started<br>And know the place for the first time."<br>    --T. S. Eliot
</div></div>
<br>_______________________________________________<br>
Dev mailing list    <a href="mailto:Dev@ensembl.org">Dev@ensembl.org</a><br>
Posting guidelines and subscribe/unsubscribe info: <a href="http://lists.ensembl.org/mailman/listinfo/dev" target="_blank">http://lists.ensembl.org/mailman/listinfo/dev</a><br>
Ensembl Blog: <a href="http://www.ensembl.info/" target="_blank">http://www.ensembl.info/</a><br>
<br></blockquote></div><br><br clear="all"><div><br></div>-- <br>Ensembl Genomes | VectorBase | i5K insect genome initiative
</div>