<html xmlns:v="urn:schemas-microsoft-com:vml" xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv=Content-Type content="text/html; charset=us-ascii">
<meta name=Generator content="Microsoft Word 12 (filtered medium)">
<style>
<!--
/* Font Definitions */
@font-face
{font-family:Calibri;
panose-1:2 15 5 2 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
{margin:0in;
margin-bottom:.0001pt;
font-size:11.0pt;
font-family:"Calibri","sans-serif";}
a:link, span.MsoHyperlink
{mso-style-priority:99;
color:blue;
text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
{mso-style-priority:99;
color:purple;
text-decoration:underline;}
span.EmailStyle17
{mso-style-type:personal-compose;
font-family:"Calibri","sans-serif";
color:windowtext;}
.MsoChpDefault
{mso-style-type:export-only;
font-size:10.0pt;}
@page Section1
{size:8.5in 11.0in;
margin:1.0in 1.0in 1.0in 1.0in;}
div.Section1
{page:Section1;}
-->
</style>
<!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->
</head>
<body lang=EN-US link=blue vlink=purple>
<div class=Section1>
<p class=MsoNormal>I wish to fetch all 3’ UTRs from the human genome
using the latest version of the core API (version 63), but I’m
noticing some differences in the API results and what I see on the website.
ENSTs that return nothing from the ‘three_prime_utr’ method should
be treated as non-protein coding RNAs. For ENSG00000187634, the API reports
that 3/9 transcripts have 3’UTR (as a result of being protein coding).
However, the website reports that 5/9 are protein coding. (See here: <a
href="http://uswest.ensembl.org/Homo_sapiens/Transcript/ProteinSummary?db=core;g=ENSG00000187634;r=1:860260-879955;t=ENST00000342066">http://uswest.ensembl.org/Homo_sapiens/Transcript/ProteinSummary?db=core;g=ENSG00000187634;r=1:860260-879955;t=ENST00000342066</a>
)<o:p></o:p></p>
<p class=MsoNormal><o:p> </o:p></p>
<p class=MsoNormal>My code and results are below. Many thanks for any
suggestions!<o:p></o:p></p>
<p class=MsoNormal>Simon.<o:p></o:p></p>
<p class=MsoNormal><o:p> </o:p></p>
<p class=MsoNormal><o:p> </o:p></p>
<p class=MsoNormal>#!/usr/bin/perl –w<o:p></o:p></p>
<p class=MsoNormal><o:p> </o:p></p>
<p class=MsoNormal>use strict;<o:p></o:p></p>
<p class=MsoNormal>use Bio::EnsEMBL::Registry;<o:p></o:p></p>
<p class=MsoNormal><o:p> </o:p></p>
<p class=MsoNormal>###<o:p></o:p></p>
<p class=MsoNormal>### Access the registry:<o:p></o:p></p>
<p class=MsoNormal>###<o:p></o:p></p>
<p class=MsoNormal>my $registry = 'Bio::EnsEMBL::Registry';<o:p></o:p></p>
<p class=MsoNormal>$registry->load_registry_from_db(<o:p></o:p></p>
<p class=MsoNormal> ### -host =>
'ensembldb.ensembl.org',<o:p></o:p></p>
<p class=MsoNormal> ### -user =>
'anonymous'<o:p></o:p></p>
<p class=MsoNormal> -host =>
'ensembl01.bcgsc.ca', <o:p></o:p></p>
<p class=MsoNormal> -user => 'ensembl',<o:p></o:p></p>
<p class=MsoNormal> -pass =>
'ensembl',<o:p></o:p></p>
<p class=MsoNormal> -port => 3306,<o:p></o:p></p>
<p class=MsoNormal> -species =>
'homo sapiens',<o:p></o:p></p>
<p class=MsoNormal> -verbose => 0,<o:p></o:p></p>
<p class=MsoNormal> -db_version =>
63<o:p></o:p></p>
<p class=MsoNormal>);<o:p></o:p></p>
<p class=MsoNormal>my $gene_adaptor = $registry->get_adaptor('Human',
'Core', 'Gene');<o:p></o:p></p>
<p class=MsoNormal>my $gene_object =
$gene_adaptor->fetch_by_stable_id('ENSG00000187634');<o:p></o:p></p>
<p class=MsoNormal>my $all_trans = $gene_object->get_all_Transcripts();<o:p></o:p></p>
<p class=MsoNormal>for my $trans_obj ( @{$all_trans}
){ <o:p></o:p></p>
<p class=MsoNormal> my $ENST =
$trans_obj->stable_id;<o:p></o:p></p>
<p class=MsoNormal> my $thr_utr =
$trans_obj->three_prime_utr;<o:p></o:p></p>
<p class=MsoNormal> if (defined
$thr_utr){<o:p></o:p></p>
<p class=MsoNormal>
print "ENST:$ENST\t$thr_utr\n";<o:p></o:p></p>
<p class=MsoNormal> } else {<o:p></o:p></p>
<p class=MsoNormal> print
"ENST:$ENST\tNoUTR\n";<o:p></o:p></p>
<p class=MsoNormal> }<o:p></o:p></p>
<p class=MsoNormal>}<o:p></o:p></p>
<p class=MsoNormal><o:p> </o:p></p>
<p class=MsoNormal><o:p> </o:p></p>
<p class=MsoNormal>### Results:<o:p></o:p></p>
<p class=MsoNormal>ENST:ENST00000420190 NoUTR<o:p></o:p></p>
<p class=MsoNormal>ENST:ENST00000437963 NoUTR<o:p></o:p></p>
<p class=MsoNormal>ENST:ENST00000342066
Bio::Seq=HASH(0x182a1850)<o:p></o:p></p>
<p class=MsoNormal>ENST:ENST00000341065
Bio::Seq=HASH(0x183fb870)<o:p></o:p></p>
<p class=MsoNormal>ENST:ENST00000455979
Bio::Seq=HASH(0x182a0c40)<o:p></o:p></p>
<p class=MsoNormal>ENST:ENST00000478729 NoUTR<o:p></o:p></p>
<p class=MsoNormal>ENST:ENST00000474461 NoUTR<o:p></o:p></p>
<p class=MsoNormal>ENST:ENST00000466827 NoUTR<o:p></o:p></p>
<p class=MsoNormal>ENST:ENST00000464948 NoUTR<o:p></o:p></p>
<p class=MsoNormal><o:p> </o:p></p>
</div>
</body>
</html>