Thank you, Bronwen.<br><br>Actually I'm not only interested in learning the annotation system, but have such an project at hand as well. As I mentioned before, I have been trying to use the pipeline myself for a year. By now, I have done some analyses, such as raw compute, Exonerate2genes, Similarity annotation, and also have tried whole genome alignment projection. I'm not sure if I did them in the best way, or even the right way as you guys would do. So now, any advice? <div>
<br></div><div>And another two questions: May I just use my own annotation in a paper, or it is better to wait for Ensembl to complete the analyses? If I want to upload my genome to Ensembl, to whom should I contact?<div>
<br></div><div><br></div><div><div><br><div><div><div class="gmail_quote">On Tue, Jan 22, 2013 at 11:35 PM, Bronwen Aken <span dir="ltr"><<a href="mailto:ba1@sanger.ac.uk" target="_blank">ba1@sanger.ac.uk</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Good afternoon,<br>
<br>
The assemblies that we annotate in Ensembl are always produced by other groups. After the external group has finished sequencing and assembly, the assemblies are deposited into the INSDC public database (ENA, NCBI, DDBJ) where we can download it. (Ensembl doesn't generate genome assemblies.)<br>

<br>
The Ensembl gene annotation team is responsible for downloading the genome assemblies, importing them into an Ensembl core database, and then running the annotation system eg. repeat-masking, cdna and protein alignments, RNAseq-based models, and finally the Ensembl gene set. Each person in the team will take one species for annotation, and do all the work from downloading the assembly to producing the final gene set. These are big projects; each genebuild takes on average 2 - 4 months. You're right, there are a lot of analyses - especially now that we are routinely using RNAseq data in our genebuilds.<br>

<br>
If you are interested in learning more about the Ensembl gene annotation system, please look out for our mini genebuild workshops. We usually hold one just before the Genome Informatics conference. These workshops introduce participants to the basics of the rulemanager and pipeline. Also, you could contact <a href="mailto:helpdesk@ensembl.org">helpdesk@ensembl.org</a> about our geek-for-a-week program.<br>

<br>
Kind regards,<br>
Bronwen<br>
<div><div class="h5"><br>
<br>
On 16 Jan 2013, at 11:26, Zhang Di wrote:<br>
<br>
> Hi,<br>
><br>
>    I have been trying to annotate a de novo sequenced genome with the ensembl pipeline for about a year. The more analyses I did, the more I was confused. They seemed too complicate to be done by one person.<br>
>    So, how are are these projects usually handled? Do the labs who sequenced the genome always annotate it themselves, or they can cooperate with the ensembl team, and ensembl annotate the genome?<br>
><br>
> Reguards,<br>
><br>
> --<br>
</div></div>> Zhang Di _______________________________________________<br>
> Dev mailing list    <a href="mailto:Dev@ensembl.org">Dev@ensembl.org</a><br>
> Posting guidelines and subscribe/unsubscribe info: <a href="http://lists.ensembl.org/mailman/listinfo/dev" target="_blank">http://lists.ensembl.org/mailman/listinfo/dev</a><br>
> Ensembl Blog: <a href="http://www.ensembl.info/" target="_blank">http://www.ensembl.info/</a><br>
<br>
<br>
_______________________________________________<br>
Dev mailing list    <a href="mailto:Dev@ensembl.org">Dev@ensembl.org</a><br>
Posting guidelines and subscribe/unsubscribe info: <a href="http://lists.ensembl.org/mailman/listinfo/dev" target="_blank">http://lists.ensembl.org/mailman/listinfo/dev</a><br>
Ensembl Blog: <a href="http://www.ensembl.info/" target="_blank">http://www.ensembl.info/</a><br>
</blockquote></div><br><br clear="all"><div><br></div>-- <br>Zhang Di
</div></div></div></div></div>