<div dir="ltr">I understand the difference in the definition. I probably failed to explain my own understanding very well. <div><br></div><div>Yes... Your definition is what I agree with... so in layman's terms the start of the gene coordinate would be the most upstream start of any transcript (even if that transcript is not the biggest) and the end coordinate would be the most downstream coordinate of any of the transcripts found, again even if that transcript is not the largest in the set)</div>

<div><br></div><div>This is the kind of definition I would like to have...</div><div>so that any refseq transcript of that gene should always be contained within the ENSG coordinates for that gene correct?<br></div><div>
<br>
</div><div>In this case it is not valid. </div><div>So here is my question reformulated:</div><div>Can I not rely on the idea that the ENSEMBL gene coordinates will always encompass any refseq transcript for the gene of interest? </div>

<div>In this case and in many other in my dataset it appears I cannot. And I have many other examples if this in my dataset.</div><div><br></div><div>Best regards</div><div><br></div><div>Duarte</div><div> </div></div><div class="gmail_extra">

<br clear="all"><div><font style="background-color:rgb(255,255,255)" color="#999999">=========================<br>     Duarte Miguel Paulo Molha      <br></font><div><font style="background-color:rgb(255,255,255)" color="#999999">         <a href="http://about.me/duarte" target="_blank">http://about.me/duarte</a>         <br>

=========================</font></div></div>
<br><br><div class="gmail_quote">On Mon, Feb 24, 2014 at 9:55 AM, Andy Yates <span dir="ltr"><<a href="mailto:ayates@ebi.ac.uk" target="_blank">ayates@ebi.ac.uk</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">

Hi Duarte,<br>
<br>
Just to clarify one mis-conception here. Ensembl gene coordinates are the minimum start and maximum end of any transcript from the set linked to a gene (the coordinates which bound all transcripts). A gene's coordinates are not the same as its longest transcript model.<br>


<br>
That doesn't explain the discrepancy you've seen between NM_001101426.3 and ENST00000407010. I can see from <a href="http://www.ensembl.org/Homo_sapiens/Share/17e6832cf57be0231caa268e919b3da4126347817" target="_blank">http://www.ensembl.org/Homo_sapiens/Share/17e6832cf57be0231caa268e919b3da4126347817</a> that this is caused by a longer 3' UTR in the RefSeq model. I do not know why that's the case. Hopefully someone else on the list will have a better idea.<br>


<br>
Andy<br>
<div><div class="h5"><br>
On 24 Feb 2014, at 09:09, Duarte Molha <<a href="mailto:duartemolha@gmail.com">duartemolha@gmail.com</a>> wrote:<br>
<br>
> Dear Developers…<br>
><br>
><br>
> I was wondering if anyone of you could help me with an problem I am having comparing REFSEQ with ENSEMBL transcripts…<br>
><br>
> I had assumed that the gene start and end coordinates in ensembl were obtained from the longest transcript model for each gene. However this does not seem to be the case when comparing as list of around 300 genes I have queried<br>


><br>
><br>
> Take a look at the example for transcript NM_001101426. In refseq this transcript has the coordinates: chr7:16127152-16460947. However if you search for it in Ensembl you get the transcript ENST00000407010 with the coordinates : chr7:16130817-16460947<br>


><br>
> If we assume that ensembl would use the longest running transcript to determine the start and end coordinates then the ISPD gene should start at 16127152 and not at 16130817. There is a difference of almost 4KB. I understand the gene models are different and I would expect small differences between the two… but not a 4KB diference. Can you explain the discrepancy?<br>


> Best regards<br>
> Duarte<br>
><br>
> =========================<br>
>      Duarte Miguel Paulo Molha<br>
>          <a href="http://about.me/duarte" target="_blank">http://about.me/duarte</a><br>
> =========================<br>
</div></div>> _______________________________________________<br>
> Dev mailing list    <a href="mailto:Dev@ensembl.org">Dev@ensembl.org</a><br>
> Posting guidelines and subscribe/unsubscribe info: <a href="http://lists.ensembl.org/mailman/listinfo/dev" target="_blank">http://lists.ensembl.org/mailman/listinfo/dev</a><br>
> Ensembl Blog: <a href="http://www.ensembl.info/" target="_blank">http://www.ensembl.info/</a><br>
<br>
<br>
_______________________________________________<br>
Dev mailing list    <a href="mailto:Dev@ensembl.org">Dev@ensembl.org</a><br>
Posting guidelines and subscribe/unsubscribe info: <a href="http://lists.ensembl.org/mailman/listinfo/dev" target="_blank">http://lists.ensembl.org/mailman/listinfo/dev</a><br>
Ensembl Blog: <a href="http://www.ensembl.info/" target="_blank">http://www.ensembl.info/</a><br>
</blockquote></div><br></div>