<html><head></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; ">Hi Henrikki<div><br></div><div>Y<span class="Apple-style-span" style="background-color: transparent;">ou can use the fetch_all</span>_by_chr_name method in Bio::EnsEMBL::DBSQL::KaryotypeBandAdaptor to get all KaryotypeBand objects for a chromosome and iterate through the objects until you get 2 objects with stain = 'acent'. Their coordinates will give you the location of a chromosome's centromere. </div><div><br></div><div>More information on the above objects can be found in the Core API documentation:</div><div><br></div><div><a href="http://www.ensembl.org/info/docs/Doxygen/core-api/classBio_1_1EnsEMBL_1_1KaryotypeBand.html">http://www.ensembl.org/info/docs/Doxygen/core-api/classBio_1_1EnsEMBL_1_1KaryotypeBand.html</a></div><div><br></div><div><br></div><div><br></div><div>This is an example MySQL query to get the centromere for chromosome X<div><br></div><div>select seq_region_start, seq_region_end from karyotype k inner join seq_region sr on k.seq_region_id = sr.seq_region_id inner join coord_system cs on sr.coord_system_id = cs.coord_system_id  where <a href="http://cs.name/">cs.name</a> = 'chromosome' and cs.version = 'GRCh37' and <a href="http://sr.name/">sr.name</a> = 'X' and stain = 'acen' order by seq_region_start;</div><div><br></div><div><div>+------------------+----------------+</div><div>| seq_region_start | seq_region_end |</div><div>+------------------+----------------+</div><div>|         58100001 |       60600000 | </div><div>|         60600001 |       63000000 | </div><div>+------------------+----------------+</div><div>2 rows in set (0.00 sec)</div></div><div><br></div><div>the seq_region_start in the first row is the start co-ordinate of the centromere (58100001), the seq_region_end in the 2 row is the end co-ordinate (63000000)</div></div><div><br></div><div><br></div><div>Hope this helps</div><div><br></div><div>Monika</div><div><br><div><div>On 14 Feb 2012, at 11:27, Daniel Lawson wrote:</div><br class="Apple-interchange-newline"><blockquote type="cite">Dear Henrikki,<div><br></div><div>Centromeres are amongst the hardest part of a genome to sequence and assemble as they tend to be highly repetitive. I do not have personal knowledge of the availability of centromeres in the vertebrate assemblies but my expectation is that they will be poorly represented. Someone from the genebuild team or helpdesk may be able to provide more information.</div>
<div><br></div><div>regards</div><div>Dan<br><br><div class="gmail_quote">On 14 February 2012 10:18, Henrikki Almusa <span dir="ltr"><<a href="mailto:henrikki.almusa@helsinki.fi">henrikki.almusa@helsinki.fi</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi all,<br>
<br>
I would like to retrieve centromere areas for ensembl genomes, but can't seem to find anything how they are marked in database. I will use perl api to retrieve them from local copy. How are these marked in the database?<br>

<br>
Regards,<span class="HOEnZb"><font color="#888888"><br>
-- <br>
Henrikki Almusa<br>
<br>
______________________________<u></u>_________________<br>
Dev mailing list    <a href="mailto:Dev@ensembl.org" target="_blank">Dev@ensembl.org</a><br>
List admin (including subscribe/unsubscribe): <a href="http://lists.ensembl.org/mailman/listinfo/dev" target="_blank">http://lists.ensembl.org/<u></u>mailman/listinfo/dev</a><br>
Ensembl Blog: <a href="http://www.ensembl.info/" target="_blank">http://www.ensembl.info/</a><br>
</font></span></blockquote></div><br><br clear="all"><div><br></div>-- <br>Ensembl Genomes | VectorBase | i5K insect genome initiative<br>
</div>
_______________________________________________<br>Dev mailing list    <a href="mailto:Dev@ensembl.org">Dev@ensembl.org</a><br>List admin (including subscribe/unsubscribe): <a href="http://lists.ensembl.org/mailman/listinfo/dev">http://lists.ensembl.org/mailman/listinfo/dev</a><br>Ensembl Blog: <a href="http://www.ensembl.info/">http://www.ensembl.info/</a><br></blockquote></div><br><div>
<div style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><div style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><span class="Apple-style-span" style="border-collapse: separate; color: rgb(0, 0, 0); font-family: Helvetica; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-border-horizontal-spacing: 0px; -webkit-border-vertical-spacing: 0px; -webkit-text-decorations-in-effect: none; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px; font-size: medium; "><div style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><div>Monika Komorowska</div><div>EnsEMBL Software Developer</div><div><br></div><div>European Bioinformatics Institute (EMBL-EBI)<br></div><div>tel: +44(0) 1233 494 409</div></div></span></div></div>
</div>
<br></div></body></html>