<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40"><head><META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=us-ascii"><meta name=Generator content="Microsoft Word 14 (filtered medium)"><style><!--
/* Font Definitions */
@font-face
        {font-family:PMingLiU;
        panose-1:2 2 5 0 0 0 0 0 0 0;}
@font-face
        {font-family:PMingLiU;
        panose-1:2 2 5 0 0 0 0 0 0 0;}
@font-face
        {font-family:Tahoma;
        panose-1:2 11 6 4 3 5 4 4 2 4;}
@font-face
        {font-family:"\@PMingLiU";
        panose-1:2 2 5 0 0 0 0 0 0 0;}
@font-face
        {font-family:Consolas;
        panose-1:2 11 6 9 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";
        color:black;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
pre
        {mso-style-priority:99;
        mso-style-link:"HTML Preformatted Char";
        margin:0in;
        margin-bottom:.0001pt;
        font-size:10.0pt;
        font-family:"Courier New";
        color:black;}
p.MsoAcetate, li.MsoAcetate, div.MsoAcetate
        {mso-style-priority:99;
        mso-style-link:"Balloon Text Char";
        margin:0in;
        margin-bottom:.0001pt;
        font-size:8.0pt;
        font-family:"Tahoma","sans-serif";
        color:black;}
p.MsoNoSpacing, li.MsoNoSpacing, div.MsoNoSpacing
        {mso-style-priority:1;
        margin:0in;
        margin-bottom:.0001pt;
        font-size:10.0pt;
        font-family:"Arial","sans-serif";
        color:black;}
p.MsoListParagraph, li.MsoListParagraph, div.MsoListParagraph
        {mso-style-priority:34;
        margin-top:0in;
        margin-right:0in;
        margin-bottom:0in;
        margin-left:.5in;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Times New Roman","serif";
        color:black;}
span.HTMLPreformattedChar
        {mso-style-name:"HTML Preformatted Char";
        mso-style-priority:99;
        mso-style-link:"HTML Preformatted";
        font-family:Consolas;
        color:black;}
span.BalloonTextChar
        {mso-style-name:"Balloon Text Char";
        mso-style-priority:99;
        mso-style-link:"Balloon Text";
        font-family:"Tahoma","sans-serif";
        color:black;}
span.EmailStyle23
        {mso-style-type:personal;
        font-family:"Arial","sans-serif";
        color:#1F497D;}
span.EmailStyle24
        {mso-style-type:personal;
        font-family:"Arial","sans-serif";
        color:#1F497D;}
span.EmailStyle25
        {mso-style-type:personal;
        font-family:"Arial","sans-serif";
        color:#1F497D;}
span.EmailStyle26
        {mso-style-type:personal-reply;
        font-family:"Arial","sans-serif";
        color:#1F497D;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-size:10.0pt;}
@page WordSection1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
        {page:WordSection1;}
/* List Definitions */
@list l0
        {mso-list-id:809329217;
        mso-list-type:hybrid;
        mso-list-template-ids:-1317630470 67698705 67698713 67698715 67698703 67698713 67698715 67698703 67698713 67698715;}
@list l0:level1
        {mso-level-text:"%1\)";
        mso-level-tab-stop:none;
        mso-level-number-position:left;
        text-indent:-.25in;}
@list l0:level2
        {mso-level-number-format:alpha-lower;
        mso-level-tab-stop:none;
        mso-level-number-position:left;
        text-indent:-.25in;}
@list l0:level3
        {mso-level-number-format:roman-lower;
        mso-level-tab-stop:none;
        mso-level-number-position:right;
        text-indent:-9.0pt;}
@list l0:level4
        {mso-level-tab-stop:none;
        mso-level-number-position:left;
        text-indent:-.25in;}
@list l0:level5
        {mso-level-number-format:alpha-lower;
        mso-level-tab-stop:none;
        mso-level-number-position:left;
        text-indent:-.25in;}
@list l0:level6
        {mso-level-number-format:roman-lower;
        mso-level-tab-stop:none;
        mso-level-number-position:right;
        text-indent:-9.0pt;}
@list l0:level7
        {mso-level-tab-stop:none;
        mso-level-number-position:left;
        text-indent:-.25in;}
@list l0:level8
        {mso-level-number-format:alpha-lower;
        mso-level-tab-stop:none;
        mso-level-number-position:left;
        text-indent:-.25in;}
@list l0:level9
        {mso-level-number-format:roman-lower;
        mso-level-tab-stop:none;
        mso-level-number-position:right;
        text-indent:-9.0pt;}
ol
        {margin-bottom:0in;}
ul
        {margin-bottom:0in;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]--></head><body bgcolor=white lang=EN-US link=blue vlink=purple><div class=WordSection1><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'>Dear Thibaut,<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'><o:p> </o:p></span></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'>Many thanks for all the details and explanations, it is very clear and helpful.<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'><o:p> </o:p></span></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'>Best,<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'>Ying<o:p></o:p></span></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'><o:p> </o:p></span></p><div><div style='border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0in 0in 0in'><p class=MsoNormal><b><span style='font-size:10.0pt;font-family:"Tahoma","sans-serif";color:windowtext'>From:</span></b><span style='font-size:10.0pt;font-family:"Tahoma","sans-serif";color:windowtext'> dev-bounces@ensembl.org [mailto:dev-bounces@ensembl.org] <b>On Behalf Of </b>Thibaut Hourlier<br><b>Sent:</b> Thursday, February 16, 2012 9:46 AM<br><b>To:</b> dev@ensembl.org<br><b>Subject:</b> Re: [ensembl-dev] FW: Download human body map 2.0 transcript coordinates<o:p></o:p></span></p></div></div><p class=MsoNormal><o:p> </o:p></p><p class=MsoNormal>Dear Ying,<br><br>On 15/02/12 18:23, Li, Ying L wrote: <o:p></o:p></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'>Dear Thibaut,</span><o:p></o:p></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'> </span><o:p></o:p></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif"'>Thanks a lot for your detailed reply, I really appreciate it.   So, you would suggest to use API, instead of mysql, correct?  If I use mysql, </span><o:p></o:p></p><p class=MsoNormal>Yes we recommend the API instead of MySQL queries. <o:p></o:p></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif"'>it looks like I will end up with many ENSG_ids for each ROUGHG_id?  And how do I know which one is which? How did API decides </span><o:p></o:p></p><p class=MsoNormal>The API look for all the genes that overlap the region of interest. On the example in my previous email,<br>only ENSG00000107249 is overlapping the RNASeq gene. The MySQL query returns these extra genes, because ENSG00000107249 is long and overlaps other genes which don't overlap the RNASeq gene.<br><br>I'm posting again the perl code I put on the previous email because it couldn't work<br><br>$rnaseqdb = new Bio::EnsEMBL::DBSQL::DBAdaptor(<br>    -host => 'ensembldb.ensembl.org',<br>    -port => 5306,<br>    -user => 'anonymous',<br>    -dbname => 'homo_sapiens_rnaseq_65_37');<br>$ga = $rnaseqdb->get_GeneAdaptor();<br>$rnaseqgene = $ga->fetch_by_stable_id("ROUGHG00000203265-v5.1-74-747-3-NC-0--1");<br><br>$db = new Bio::EnsEMBL::DBSQL::DBAdaptor(<br>    -host => 'ensembldb.ensembl.org',<br>    -port => 5306,<br>    -user => 'anonymous',<br>    -dbname => 'homo_sapiens_core_65_37');<br><br>$sa = $db->get_SliceAdaptor();<br>$rnaseqslice = $rnaseqgene->slice->sub_Slice($rnaseqgene->start, $rnaseqgene->end, $rnaseqgene->strand);<br>$slice = $sa->fetch_by_name($rnaseqslice->name);<br>@genes = @{$slice->get_all_Genes()};<br>foreach my $gene (@genes) {<br>#Skip the gene on the negative strand because the strand is relative to the slice strand.<br>    next if ($gene->strand == -1);<br>    print STDOUT $gene->display_id, "\n";<br>    foreach $xref (@{$gene->get_all_DBEntries('HGNC')}) {<br>        print STDOUT $xref->description, ' ; ', $xref->display_id, "\n";<br>    }<br>}<br><br>Regards<br>Thibaut<br><br><br><o:p></o:p></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'>then?</span><o:p></o:p></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'> </span><o:p></o:p></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'>Best,</span><o:p></o:p></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'>Ying</span><o:p></o:p></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'> </span><o:p></o:p></p><div><div style='border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0in 0in 0in'><p class=MsoNormal><b><span style='font-size:10.0pt;font-family:"Tahoma","sans-serif";color:windowtext'>From:</span></b><span style='font-size:10.0pt;font-family:"Tahoma","sans-serif";color:windowtext'> <a href="mailto:dev-bounces@ensembl.org">dev-bounces@ensembl.org</a> [<a href="mailto:dev-bounces@ensembl.org">mailto:dev-bounces@ensembl.org</a>] <b>On Behalf Of </b>Thibaut Hourlier<br><b>Sent:</b> Wednesday, February 15, 2012 11:27 AM<br><b>To:</b> <a href="mailto:dev@ensembl.org">dev@ensembl.org</a><br><b>Subject:</b> Re: [ensembl-dev] FW: Download human body map 2.0 transcript coordinates</span><o:p></o:p></p></div></div><p class=MsoNormal> <o:p></o:p></p><p class=MsoNormal>Dear Ying,<br><br>On 13/02/12 16:15, Li, Ying L wrote: <o:p></o:p></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'>Dear Thibaut,</span><o:p></o:p></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'> </span><o:p></o:p></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'>Thanks a lot for your reply.  </span><o:p></o:p></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'> </span><o:p></o:p></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif"'>I would like to try with your ‘easiest’ way by downloading the ensembl human database.   I need more details on how to do the mapping between RNAseq and the core?</span><o:p></o:p></p><p class=MsoNormal>At that point I will recommend you to use the API as I showed you in the previous email. Also it's better to use the entire database (you will need it for the API) and not only the gene/transcript/seq_region because you can get more information quite easily.<br><br><br><o:p></o:p></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'> </span><o:p></o:p></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'>Here is what I have: </span><o:p></o:p></p><p class=MsoListParagraph style='text-indent:-.25in;mso-list:l0 level1 lfo2'><![if !supportLists]><span style='mso-list:Ignore'>1)<span style='font:7.0pt "Times New Roman"'>      </span></span><![endif]><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'>I have home_sapiens_rnaseq_65_37 (<a href="ftp://ftp.ensembl.org/pub/release-65/mysql/homo_sapiens_rnaseq_65_37/">ftp://ftp.ensembl.org/pub/release-65/mysql/homo_sapiens_rnaseq_65_37/</a>)  data from ENSEMBL (all the mysql files), and I had the table created with all the data files, including gene, transcript tables.  In gene and transcript tables, we have gene_id as one of their columns.  </span><o:p></o:p></p><p class=MsoListParagraph style='text-indent:-.25in'><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'>I downloaded the home_sapiens-core_65_37 (<a href="ftp://ftp.ensembl.org/pub/release-65/mysql/homo_sapiens_core_65_37/">ftp://ftp.ensembl.org/pub/release-65/mysql/homo_sapiens_core_65_37/</a> ) <b>gene/transcript/seq_region</b> tables. I was hoping to find the stable_id like ‘ROUGHG00000203265-v5.1-74-747-3-NC-0—1’ in </span><o:p></o:p></p><p class=MsoNormal>The core database and the rnaseq database have different source of information and different methods were used to generate the models. So even if sometime the models from both databases are the same, the stable_id will always be different. The only way to link them together is with their coordinates. <o:p></o:p></p><p class=MsoListParagraph style='text-indent:-.25in'><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'>the core tables, but did not find any. I also tried to map seq_region_id/seq_region_start/seq_region_end/ to the core_gene seq_region_id/seq_region_start/seq_region_end witout success.</span><o:p></o:p></p><p class=MsoNormal>If you looked for a perfect match for the start and end, it won't work. You will need to use 2 separates queries. One to get the coordinates of the transcript in the rnaseq database, the second one to get all the gene in the core database between these coordinates and you might need to widen the range.<br><br><br><o:p></o:p></p><p class=MsoListParagraph style='text-indent:-.25in;mso-list:l0 level1 lfo2'><![if !supportLists]><span style='mso-list:Ignore'>2)<span style='font:7.0pt "Times New Roman"'>      </span></span><![endif]><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'>Here are my questions:</span><o:p></o:p></p><p class=MsoListParagraph style='margin-left:1.0in;text-indent:-.25in'><span style='font-size:10.0pt;font-family:"Arial","sans-serif"'>which tables should I use to map the RNASEQ_gene to the core_gene?</span><o:p></o:p></p><p class=MsoNormal>homo_sapiens_rnaseq_65_37 >select seq_region_id, seq_region_start, seq_region_end, seq_region_strand from gene where stable_id = "ROUGHG00000203265-v5.1-74-747-3-NC-0--1";<br>+---------------+------------------+----------------+-------------------+<br>| seq_region_id | seq_region_start | seq_region_end | seq_region_strand |<br>+---------------+------------------+----------------+-------------------+<br>|         27518 |          3823417 |        3879600 |                -1 |<br>+---------------+------------------+----------------+-------------------+<br>homo_sapiens_core_65_37 >select stable_id, seq_region_id, seq_region_start, seq_region_end, seq_region_strand from gene where seq_region_id = 27518 and seq_region_start > 3822417 and seq_region_end < 4480600 and seq_region_strand = -1;<br>+-----------------+---------------+------------------+----------------+-------------------+<br>| stable_id       | seq_region_id | seq_region_start | seq_region_end | seq_region_strand |<br>+-----------------+---------------+------------------+----------------+-------------------+<br>| ENSG00000107249 |         27518 |          3824127 |        4348392 |                -1 |<br>| ENSG00000230001 |         27518 |          4070906 |        4071884 |                -1 |<br>| ENSG00000221730 |         27518 |          4378423 |        4378494 |                -1 |<br>| ENSG00000200941 |         27518 |          4386410 |        4386556 |                -1 |<br>+-----------------+---------------+------------------+----------------+-------------------+<br><br>As the boundaries will differ it will be a bit hard to find the right one easily.<br><br><br><o:p></o:p></p><p class=MsoListParagraph style='margin-left:1.0in;text-indent:-.25in'><span style='font-size:10.0pt;font-family:"Arial","sans-serif"'>What is the best way to map core_gene “ENSG000….’ To hugo gene?</span><o:p></o:p></p><p class=MsoNormal>You will need the xref tables and the external_db table<br>homo_sapiens_core_65_37 >select x.display_label, x.description from gene g left join object_xref ox on g.gene_id = ox.ensembl_id left join xref x on x.xref_id = ox.xref_id left join external_db e on e.external_db_id = x.external_db_id where e.db_name = "HGNC" and g.stable_id = "ENSG00000107249";<br>+---------------+---------------------------+<br>| display_label | description               |<br>+---------------+---------------------------+<br>| GLIS3         | GLIS family zinc finger 3 |<br>+---------------+---------------------------+<br><br>Regards,<br>Thibaut<br><br><br><o:p></o:p></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'>Many thanks for your help.</span><o:p></o:p></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'> </span><o:p></o:p></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'>Best,</span><o:p></o:p></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'>Ying</span><o:p></o:p></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'> </span><o:p></o:p></p><div><div style='border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0in 0in 0in'><p class=MsoNormal><b><span style='font-size:10.0pt;font-family:"Tahoma","sans-serif";color:windowtext'>From:</span></b><span style='font-size:10.0pt;font-family:"Tahoma","sans-serif";color:windowtext'> Thibaut Hourlier [<a href="mailto:th3@sanger.ac.uk">mailto:th3@sanger.ac.uk</a>] <br><b>Sent:</b> Monday, February 13, 2012 6:53 AM<br><b>To:</b> Li, Ying L {PXTP~Nutley}<br><b>Cc:</b> <a href="mailto:dev@ensembl.org">dev@ensembl.org</a><br><b>Subject:</b> Re: [ensembl-dev] FW: Download human body map 2.0 transcript coordinates</span><o:p></o:p></p></div></div><p class=MsoNormal> <o:p></o:p></p><p class=MsoNormal>Dear Ying,<br>The easiest would be to use the Ensembl Human database which you can download from the ftp site: <a href="http://www.ensembl.org/info/data/ftp/index.html">http://www.ensembl.org/info/data/ftp/index.html</a>, then the mapping will work because you will have the Ensembl coordinates.<br><br>If you are trying to map directly Ensembl data from the Human body map to a UCSC database it won't work because the internal id like seq_region_id are different.<br>You will need to use the seq_region names which you can found in the seq_region table (Ensembl schema). As we are also using GRCh37, the seq_region names will be the same, but for the chromosome, it will be "chr1" in UCSC and "1" in Ensembl for the chromosome 1.<br><br>In the perl code of my previous message, I was getting the coordinates of a known gene in the human database. Then using the coordinates of the genes, I was fetching all the transcripts from the RNASeq database that are overlapping the region. This is why I used a stable id like "ENSG00....".<br><br>Regards,<br>Thibaut<br><br>On 10/02/12 18:36, Li, Ying L wrote: <o:p></o:p></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'>Dear Thibaut,</span><o:p></o:p></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'> </span><o:p></o:p></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'>Thanks for your reply.  I am not using the API at this moment.  The stable Id from the ‘gene’ table is more starting with ENSG, but ‘ROUGHG00000203265-v5.1-74-747-3-NC-0—1’. So, I tried to map the seq_region(_id/_start/_end/_strand) USCS ‘gene coord’ of GRch37 without any success. Did I use the wrong coord (USCS)?</span><o:p></o:p></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'> </span><o:p></o:p></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'>Thanks a lot for your help,</span><o:p></o:p></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'>Best,</span><o:p></o:p></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'>Ying</span><o:p></o:p></p><p class=MsoNormal><span style='font-size:10.0pt;font-family:"Arial","sans-serif";color:#1F497D'> </span><o:p></o:p></p><div><div style='border:none;border-top:solid #B5C4DF 1.0pt;padding:3.0pt 0in 0in 0in'><p class=MsoNormal><b><span style='font-size:10.0pt;font-family:"Tahoma","sans-serif";color:windowtext'>From:</span></b><span style='font-size:10.0pt;font-family:"Tahoma","sans-serif";color:windowtext'> Thibaut Hourlier [<a href="mailto:th3@sanger.ac.uk">mailto:th3@sanger.ac.uk</a>] <br><b>Sent:</b> Monday, January 30, 2012 9:44 AM<br><b>To:</b> Li, Ying L {PXTP~Nutley}<br><b>Cc:</b> <a href="mailto:dev@ensembl.org">dev@ensembl.org</a><br><b>Subject:</b> Re: [ensembl-dev] FW: Download human body map 2.0 transcript coordinates</span><o:p></o:p></p></div></div><p class=MsoNormal> <o:p></o:p></p><p class=MsoNormal style='margin-bottom:12.0pt'>Dear Ying,<br>As I said on the link you are quoting, we recommend people to use the perl API : <a href="http://www.ensembl.org/info/docs/Doxygen/core-api/index.html">http://www.ensembl.org/info/docs/Doxygen/core-api/index.html</a><br><br>The only way you can map the reads with a gene is with the seq_region(_id/_start/_end/_strand) information.<br>If you know the stable id (ENSG000....) of the gene you are interested in, it's quite simple with the API:<o:p></o:p></p><pre>$db = new Bio::EnsEMBL::DBAdaptor(<o:p></o:p></pre><pre>                -host => 'ensembldb.ensembl.org',<o:p></o:p></pre><pre>                -port => 5306,<o:p></o:p></pre><pre>                -user => 'anonymous',<o:p></o:p></pre><pre>                -dbname => 'homo_sapiens_core_65_37');<o:p></o:p></pre><pre>$ga = $db->get_GeneAdaptor();<o:p></o:p></pre><pre>$gene = $ga->fetch_by_stable_id("ENSG000XXXX");<o:p></o:p></pre><pre>$slice = $gene->slice;<o:p></o:p></pre><pre>$rnaseqdb = new Bio::EnsEMBL::DBAdaptor(<o:p></o:p></pre><pre>                -host => 'ensembldb.ensembl.org',<o:p></o:p></pre><pre>                -port => 5306,<o:p></o:p></pre><pre>                -user => 'anonymous',<o:p></o:p></pre><pre>                -dbname => 'homo_sapiens_rnaseq_65_37');<o:p></o:p></pre><pre>$rnaseqsa = $rnaseqdb->get_SliceAdaptor();<o:p></o:p></pre><pre>$rnaseqslice = $rnaseqsa->fetch_by_name($slice->name);<o:p></o:p></pre><pre>@transcripts = @{$rnaseqslice->get_all_Transcripts('skeletal_rnaseq')};<o:p></o:p></pre><pre>foreach my $transcript (@transcripts) {<o:p></o:p></pre><pre>   foreach my $sf (@{$transcript->get_all_supporting_features()}) {<o:p></o:p></pre><pre>        #We print the number of reads that spanned accross the intron<o:p></o:p></pre><pre>        print STDOUT $sf->hit_name, ' :', $sf->score, "\n";<o:p></o:p></pre><pre>   }<o:p></o:p></pre><pre>}<o:p></o:p></pre><p class=MsoNormal>The number of reads that span the introns is the score you can find in the dna_align_feature table of the rnaseq database.<br><br>Regards,<br>Thibaut<br><br><br>On 27/01/12 19:09, Li, Ying L wrote:<br><br><br><br><br><o:p></o:p></p><pre>Dear Thibaut,<o:p></o:p></pre><pre> <o:p></o:p></pre><pre> <o:p></o:p></pre><pre> <o:p></o:p></pre><pre>I am trying to get the ensemble human bodymap with gene or transcript.  And I followed your instruction at the this blog site: <a href="http://lists.ensembl.org/pipermail/dev/2011-August/001593.html">http://lists.ensembl.org/pipermail/dev/2011-August/001593.html</a><o:p></o:p></pre><pre> <o:p></o:p></pre><pre> <o:p></o:p></pre><pre> <o:p></o:p></pre><pre>I am able to setup an oracle schema to do the following query:<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>SELECT t.* , sr.name<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>FROM rnaseq37_analysis a, rnaseq37_transcript t<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>LEFT JOIN rnaseq37_seq_region sr<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>ON sr.seq_region_id = t.seq_region_id<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>WHERE t.analysis_id = a.analysis_id<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>AND a.logic_name = 'skeletal_rnaseq'<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>;<o:p></o:p></pre><pre> <o:p></o:p></pre><pre> <o:p></o:p></pre><pre> <o:p></o:p></pre><pre>TRANSCRIPT_ID<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>GENE_ID<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>ANALYSIS_ID<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>SEQ_REGION_ID<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>SEQ_REGION_START<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>SEQ_REGION_END<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>SEQ_REGION_STRAND<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>DISPLAY_XREF_ID<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>BIOTYPE<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>STATUS<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>DESCRIPTION<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>IS_CURRENT<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>CANONICAL_TRANSLATION_ID<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>STABLE_ID<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>VERSION<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>CREATED_DATE<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>MODIFIED_DATE<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>NAME<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>840249<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>585754<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>8244<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>27517<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>184298181<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>184300196<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>1<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>\N<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>protein_coding<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>PREDICTED<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>\N<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>1<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>593641<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>ROUGHT00000241809<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>1<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>2011-01-12 10:33:07<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>2011-01-12 10:33:07<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>3<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>840251<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>585756<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>8244<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>27523<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>74332013<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>74659111<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>-1<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>\N<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>protein_coding<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>PREDICTED<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>\N<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>1<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>593643<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>ROUGHT00000241811<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>1<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>2011-01-12 10:33:07<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>2011-01-12 10:33:07<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>8<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>840252<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>585758<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>8244<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>27523<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>74702071<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>74742711<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>-1<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>\N<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>protein_coding<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>PREDICTED<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>\N<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>1<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>593644<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>ROUGHT00000241812<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>1<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>2011-01-12 10:33:07<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>2011-01-12 10:33:07<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>8<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>840254<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>585759<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>8244<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>27523<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>74857620<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>74885297<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>-1<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>\N<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>protein_coding<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>PREDICTED<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>\N<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>1<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>593646<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>ROUGHT00000241814<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>1<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>2011-01-12 10:33:07<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>2011-01-12 10:33:07<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>8<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>840256<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>585761<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>8244<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>27523<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>74887723<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>74895618<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>1<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>\N<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>protein_coding<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>PREDICTED<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>\N<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>1<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>593648<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>ROUGHT00000241816<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>1<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>2011-01-12 10:33:07<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>2011-01-12 10:33:07<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>8<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>840257<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>585762<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>8244<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>27523<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>74903474<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>74917165<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>1<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>\N<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>protein_coding<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>PREDICTED<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>\N<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>1<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>593649<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>ROUGHT00000241817<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>1<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>2011-01-12 10:33:07<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>2011-01-12 10:33:07<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>8<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>840259<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>585764<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>8244<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>27523<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>74921628<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>74941367<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>1<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>\N<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>protein_coding<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>PREDICTED<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>\N<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>1<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>593651<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>ROUGHT00000241819<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>1<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>2011-01-12 10:33:07<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>2011-01-12 10:33:07<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>8<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>840261<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>585766<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>8244<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>27523<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>75015772<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>75019126<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>1<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>\N<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>protein_coding<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>PREDICTED<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>\N<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>1<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>593653<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>ROUGHT00000241820<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>1<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>2011-01-12 10:33:07<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>2011-01-12 10:33:07<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>8<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>840264<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>585768<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>8244<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>27519<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>15260701<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>15375468<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>-1<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>\N<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>protein_coding<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>PREDICTED<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>\N<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>1<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>593656<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>ROUGHT00000241821<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>1<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>2011-01-12 10:33:07<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>2011-01-12 10:33:07<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>12<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>840266<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>585770<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>8244<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>27519<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>15742384<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>15751506<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>1<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>\N<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>protein_coding<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>PREDICTED<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>\N<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>1<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>593658<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>ROUGHT00000241822<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>1<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>2011-01-12 10:33:07<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>2011-01-12 10:33:07<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>12<o:p></o:p></pre><pre> <o:p></o:p></pre><pre> <o:p></o:p></pre><pre> <o:p></o:p></pre><pre>Now I need to map the gene_id or transcript_id to some kind of standard id (eg ensg00000*****) so that I can tell what gene is the gene_id regards to, do you know what is the best way to do so? if you can tell me how to map the gene_id? In additional, do you know if there is a ‘# of read” for the rnaseq data?<o:p></o:p></pre><pre> <o:p></o:p></pre><pre> <o:p></o:p></pre><pre> <o:p></o:p></pre><pre>Thanks a lot for your help,<o:p></o:p></pre><pre> <o:p></o:p></pre><pre> <o:p></o:p></pre><pre> <o:p></o:p></pre><pre>Best regards,<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>Ying<o:p></o:p></pre><p class=MsoNormal><br><br><br><br><br><o:p></o:p></p><pre> <o:p></o:p></pre><pre>Hi there,<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>I am on your mailing list, so resubmitting this question -- see attached file.<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>Thanks a lot for your help.<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>Best,<o:p></o:p></pre><pre>Ying<o:p></o:p></pre><pre>-----Original Message-----<o:p></o:p></pre><pre>From: <a href="mailto:dev-bounces@ensembl.org">dev-bounces@ensembl.org</a> [<a href="mailto:dev-bounces@ensembl.org">mailto:dev-bounces@ensembl.org</a>] On Behalf Of <a href="mailto:dev-owner@ensembl.org">dev-owner@ensembl.org</a><o:p></o:p></pre><pre>Sent: Wednesday, January 25, 2012 4:52 PM<o:p></o:p></pre><pre>To: Li, Ying L {PXTP~Nutley}<o:p></o:p></pre><pre>Subject: Re: [ensembl-dev] Download human body map 2.0 transcript coordinates<o:p></o:p></pre><pre> <o:p></o:p></pre><pre>The Ensembl dev mailing list only accepts postings from people who are subscribed. You can subscribe or unsubscribe at <a href="http://lists.ensembl.org/mailman/listinfo/dev">http://lists.ensembl.org/mailman/listinfo/dev</a><o:p></o:p></pre><pre> <o:p></o:p></pre><p class=MsoNormal><br><br><br><br><br><br><o:p></o:p></p><pre>_______________________________________________<o:p></o:p></pre><pre>Dev mailing list    <a href="mailto:Dev@ensembl.org">Dev@ensembl.org</a><o:p></o:p></pre><pre>List admin (including subscribe/unsubscribe): <a href="http://lists.ensembl.org/mailman/listinfo/dev">http://lists.ensembl.org/mailman/listinfo/dev</a><o:p></o:p></pre><pre>Ensembl Blog: <a href="http://www.ensembl.info/">http://www.ensembl.info/</a><o:p></o:p></pre><p class=MsoNormal><br>-- The Wellcome Trust Sanger Institute is operated by Genome Research Limited, a charity registered in England with number 1021457 and a company registered in England with number 2742969, whose registered office is 215 Euston Road, London, NW1 2BE. <o:p></o:p></p><p class=MsoNormal><br>-- The Wellcome Trust Sanger Institute is operated by Genome Research Limited, a charity registered in England with number 1021457 and a company registered in England with number 2742969, whose registered office is 215 Euston Road, London, NW1 2BE. <o:p></o:p></p><p class=MsoNormal><br><br><br><o:p></o:p></p><pre>_______________________________________________<o:p></o:p></pre><pre>Dev mailing list    <a href="mailto:Dev@ensembl.org">Dev@ensembl.org</a><o:p></o:p></pre><pre>List admin (including subscribe/unsubscribe): <a href="http://lists.ensembl.org/mailman/listinfo/dev">http://lists.ensembl.org/mailman/listinfo/dev</a><o:p></o:p></pre><pre>Ensembl Blog: <a href="http://www.ensembl.info/">http://www.ensembl.info/</a><o:p></o:p></pre></div></body></html>