<html><head></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; "><div>Hi Devs,</div><div><br></div>Of course, I should have googled the question before posting it to the list.<div><br></div><div>For anyone wanting to know the answer, it is discussed here:</div><div><a href="http://uswest.ensembl.org/info/docs/genebuild/assembly.html">http://uswest.ensembl.org/info/docs/genebuild/assembly.html</a></div><div><br></div><div>It says:</div><div><br></div><div>The pseudoautosomal regions (PAR), where chromosome X and Y share 
homologous sequence, are defined for human. In Ensembl, the full-length Y
 chromosome is displayed on our browser. However, within our core human 
database, the Y chromosome is divided into four regions:</div><div> 

<ul>
<li>chromosome:GRCh37:Y:1 - 10000 is unique to Y but is a string of 10000 Ns</li> 
<li>chromosome:GRCh37:Y:10001 - 2649520 is shared with X (PAR1)</li> 
<li>chromosome:GRCh37:Y:2649521- 59034049 is unique to Y</li>
<li>chromosome:GRCh37:Y:59034050 - 59373566 is shared with X (PAR2)</li> 
</ul><p>We store sequence for only the two unique regions of Y in our 
database. The DNA for PAR1 and PAR2 are loaded only for chromosome X. 
The full-length chromosome Y can be generated on-the-fly by our API, 
where we stitch in the shared sequence from X.</p><div>Nicole</div></div><div><br></div><div><div><div>On Feb 26, 2013, at 11:07 AM, Nicole Washington wrote:</div><br class="Apple-interchange-newline"><blockquote type="cite"><div style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; ">Hi,<br><br>I'm just starting out learning the ENSEMBL API.  I've written a simple script to fetch the human chromosomes and print out a count of the genes for each one.  I am not a human-genome expert, so the answer to my question may very well be due to nuances in the human genome.<br><br>Quite simply, I do:<br><br>my $slice_adaptor = $registry->get_adaptor( 'Human', 'Core', 'Slice' );<br>my $slices = $slice_adaptor->fetch_all('chromosome');<br><br>and then iterate over the list of slices, printing out some details about each.<br><br>Chr Y behaves differently than the rest of the human chromosomes.  All other chromosomes (1..22, X, MT) go from 1-max_length.  But, it seems that there are two chrY toplevel elements retrieved, neither of which extends the complete length from 1..59,373,566.  They only span 1..10,000 and 2,649,521..59,034,049, completely skipping over the range 10,000..2,649,52.  It also seems that chrY is the only chromosome that is split into two toplevel features.<br><br>Does anyone know why this is?  Am I missing something very simple here?<br><br>Here the output from my script for ChrY:<br><br>Fetching genes for Y...Properties for this chromosome<br> ID: chromosome:GRCh37:Y:1:10000:1<br> Length: 59373566<br> Build: 27507<br> Coords: 1..10000<br>found 0 genes.<br>Fetching genes for Y...Properties for this chromosome<br> ID: chromosome:GRCh37:Y:2649521:59034049:1<br> Length: 59373566<br> Build: 27507<br> Coords: 2649521..59034049<br>found 501 genes.<br><br><br>Thanks for any help you can provide.<br><br>Nicole<br><br><br>Nicole Washington<br>Research Scientist<br>Lawrence Berkeley National Laboratory<br>Genomics Division<br>1 Cyclotron Rd. MS64-121<br>Berkeley, CA 94720<br>510-486-6836<br><a href="mailto:NLWashington@lbl.gov">NLWashington@lbl.gov</a><br></div></blockquote></div><br></div></body></html>