Hi Rhoda,<div>Thank you very much for the explanation. I will try to access via MySQL and make the selections according to the example.</div><div>Regards,</div><div>Gustavo<br><br><div class="gmail_quote">On Fri, Aug 24, 2012 at 5:25 AM, Rhoda Kinsella <span dir="ltr"><<a href="mailto:rhoda@ebi.ac.uk" target="_blank">rhoda@ebi.ac.uk</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div style="word-wrap:break-word">Hi Gustavo<div>The reason you cannot get the RefSeq ID with the version attached in BioMart is because we use the dbprimary_acc from the xref table which does not have the version. If you take a look at the public MySQL server (see information on how to connect here: <a href="http://www.ensembl.org/info/data/mysql.html" target="_blank">http://www.ensembl.org/info/data/mysql.html</a>) you will see that the corresponding display_label contains the version. The display_label is used for the website.</div>
<div><br></div><div><div>mysql> select * from xref where dbprimary_acc like "NM_203373%";</div><div>+---------+----------------+---------------+---------------+---------+-----------------------------------------------------------------------+-----------+--------------------+</div>
<div>| xref_id | external_db_id | dbprimary_acc | display_label | version | description                                                           | info_type | info_text          |</div><div>+---------+----------------+---------------+---------------+---------+-----------------------------------------------------------------------+-----------+--------------------+</div>
<div>|    1359 |           1800 | NM_203373     | NM_203373.2   | 2       | NULL                                                                  | NONE      |                    | </div><div>| 4928719 |           1801 | NM_203373     | NM_203373.2   | 2       | Homo sapiens F-box and leucine-rich repeat protein 22 (FBXL22), mRNA. | DIRECT    | Generated via ccds | </div>
<div>+---------+----------------+---------------+---------------+---------+-----------------------------------------------------------------------+-----------+--------------------+</div><div>2 rows in set (1.86 sec)</div>
<div><br></div><div>To get the information pertaining to your specific query you could do something like this:</div><div><br></div><div><div><div>mysql> select distinct t.stable_id, x.dbprimary_acc, x.display_label, x.version from transcript t, object_xref ox, xref x where x.dbprimary_acc like "NM_203373%" and ox.xref_id=x.xref_id and t.transcript_id=ox.ensembl_id and ox.ensembl_object_type="transcript";</div>
<div>+-----------------+---------------+---------------+---------+</div><div>| stable_id       | dbprimary_acc | display_label | version |</div><div>+-----------------+---------------+---------------+---------+</div><div>
| ENST00000539570 | NM_203373     | NM_203373.2   | 2       | </div><div>+-----------------+---------------+---------------+---------+</div><div>1 row in set (0.14 sec)</div></div></div><div><br></div><div><br></div><div>
I hope that helps</div><div>Regards</div><div>Rhoda</div><div><br></div><div><br></div><div><div>On 24 Aug 2012, at 01:59, Gustavo Franca <<a href="mailto:gsfranca@gmail.com" target="_blank">gsfranca@gmail.com</a>> wrote:</div>
<br><blockquote type="cite">Hi ib,<div><br></div><div>Thank you for all the information. I got your point. Despite the NM_203373.2 and NM_203373 refer to the same transcript, the .2 denotes the annotated version of the RefSeq accession, which can change over time, so, it is important to me to keep the correct RefSeq version associated with each Ensembl Transcript. Anyway, I appreciate your kind help!</div>

<div><br></div><div>Best,</div><div>Gustavo<br><br><div class="gmail_quote">On Thu, Aug 23, 2012 at 7:42 PM, i b <span dir="ltr"><<a href="mailto:ibseq12@gmail.com" target="_blank">ibseq12@gmail.com</a>></span> wrote:<br>

<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Hi Gustavo,<br>
if you know which accession number you want in this "format" you can<br>
just find it on Pubmed. The number after the accession number, e.g. in<br>
NM_203373.2, the number 2, does not change the identity of the<br>
protein/transcript. I have seen this only on pubmed, thus I don't<br>
think you will find it since NM_203373.2 is the same as NM_203373 as<br>
RefSeq.<br>
You can easily see this if on Pubmed, under nucleotide, you digit<br>
NM_203373 or NM_203373.2....the link is the same<br>
(<a href="http://www.ncbi.nlm.nih.gov/nuccore/NM_203373" target="_blank">http://www.ncbi.nlm.nih.gov/nuccore/NM_203373</a> and<br>
<a href="http://www.ncbi.nlm.nih.gov/nuccore/NM_203373.2" target="_blank">http://www.ncbi.nlm.nih.gov/nuccore/NM_203373.2</a>)<br>
<br>
hope it helps,<br>
ib<br>
<br>
On Thu, Aug 23, 2012 at 10:34 PM, Gustavo Franca <<a href="mailto:gsfranca@gmail.com" target="_blank">gsfranca@gmail.com</a>> wrote:<br>
> Hi ib,<br>
><br>
> I have chosen RefSeq mRNA and RefSeq protein ID in Attributes -> External<br>
> References, but still, I didn't get RefSeq version. For example, via<br>
> BioMart, I've got:<br>
><br>
> ENSG00000259662    ENST00000539570     NP_976307     NM_203373<br>
><br>
> Note that there are no RefSeq versions. Instead, I would like to get:<br>
><br>
> ENSG00000259662    ENST00000539570    NP_976307.2   NM_203373.2<br>
><br>
> Do you know how to get data this way?<br>
> Regards,<br>
> Gustavo<br>
><br>
><br>
> On Thu, Aug 23, 2012 at 6:18 PM, i b <<a href="mailto:ibseq12@gmail.com" target="_blank">ibseq12@gmail.com</a>> wrote:<br>
>><br>
>> hi gustavo,<br>
>> I have done a similar thing on biomart and was ok...did you choose<br>
>> refseq on the list on biomart while doing the conversion.if im not<br>
>> wrong shoudl be under attributes/external...<br>
>><br>
>> let me know i might be able to do it and see if it works<br>
>><br>
>> regards,<br>
>> ib<br>
>><br>
>> On Thu, Aug 23, 2012 at 9:52 PM, Gustavo Franca <<a href="mailto:gsfranca@gmail.com" target="_blank">gsfranca@gmail.com</a>><br>
>> wrote:<br>
>> > Hello,<br>
>> ><br>
>> > I would like to retrieve a table with all human genes, containing<br>
>> > Ensembl<br>
>> > Gene IDs, Ensembl Transcript IDs, Ensembl Protein IDs and their<br>
>> > respective<br>
>> > RefSeq mRNA IDs and RefSeq peptide IDs. As an example, see the last<br>
>> > table<br>
>> > (External references) shown in KIR2DL5A page:<br>
>> ><br>
>> > <a href="http://www.ensembl.org/Homo_sapiens/Gene/Matches?g=ENSG00000215764;r=GL000209.1:7891-96246" target="_blank">http://www.ensembl.org/Homo_sapiens/Gene/Matches?g=ENSG00000215764;r=GL000209.1:7891-96246</a><br>


>> ><br>
>> > I realized that it is possible to get ID conversions via BioMart,<br>
>> > however,<br>
>> > the BioMart output does not provide me the version of the RefSeq entry<br>
>> > as<br>
>> > shown in the above example. (e.g: ENST00000344867    NP_055034.2<br>
>> > NM_014219.2). So, I would like to retrieve Ensembl transcripts and their<br>
>> > corresponding RefSeq versions.<br>
>> > Anyone could help me out on this?<br>
>> ><br>
>> > Thank you very much,<br>
>> > Gustavo<br>
>> ><br>
>> > _______________________________________________<br>
>> > Dev mailing list    <a href="mailto:Dev@ensembl.org" target="_blank">Dev@ensembl.org</a><br>
>> > List admin (including subscribe/unsubscribe):<br>
>> > <a href="http://lists.ensembl.org/mailman/listinfo/dev" target="_blank">http://lists.ensembl.org/mailman/listinfo/dev</a><br>
>> > Ensembl Blog: <a href="http://www.ensembl.info/" target="_blank">http://www.ensembl.info/</a><br>
>> ><br>
>><br>
>> _______________________________________________<br>
>> Dev mailing list    <a href="mailto:Dev@ensembl.org" target="_blank">Dev@ensembl.org</a><br>
>> List admin (including subscribe/unsubscribe):<br>
>> <a href="http://lists.ensembl.org/mailman/listinfo/dev" target="_blank">http://lists.ensembl.org/mailman/listinfo/dev</a><br>
>> Ensembl Blog: <a href="http://www.ensembl.info/" target="_blank">http://www.ensembl.info/</a><br>
><br>
><br>
><br>
> _______________________________________________<br>
> Dev mailing list    <a href="mailto:Dev@ensembl.org" target="_blank">Dev@ensembl.org</a><br>
> List admin (including subscribe/unsubscribe):<br>
> <a href="http://lists.ensembl.org/mailman/listinfo/dev" target="_blank">http://lists.ensembl.org/mailman/listinfo/dev</a><br>
> Ensembl Blog: <a href="http://www.ensembl.info/" target="_blank">http://www.ensembl.info/</a><br>
><br>
<br>
_______________________________________________<br>
Dev mailing list    <a href="mailto:Dev@ensembl.org" target="_blank">Dev@ensembl.org</a><br>
List admin (including subscribe/unsubscribe): <a href="http://lists.ensembl.org/mailman/listinfo/dev" target="_blank">http://lists.ensembl.org/mailman/listinfo/dev</a><br>
Ensembl Blog: <a href="http://www.ensembl.info/" target="_blank">http://www.ensembl.info/</a><br>
</blockquote></div><br></div>
_______________________________________________<br>Dev mailing list    <a href="mailto:Dev@ensembl.org" target="_blank">Dev@ensembl.org</a><br>List admin (including subscribe/unsubscribe): <a href="http://lists.ensembl.org/mailman/listinfo/dev" target="_blank">http://lists.ensembl.org/mailman/listinfo/dev</a><br>
Ensembl Blog: <a href="http://www.ensembl.info/" target="_blank">http://www.ensembl.info/</a><br></blockquote></div><br><div>
<div>Rhoda Kinsella Ph.D.</div><div>Ensembl Production Project Leader,</div><div>European Bioinformatics Institute (EMBL-EBI),</div><div>Wellcome Trust Genome Campus,</div><div>Hinxton,</div><div>Cambridge,</div><div>CB10 1SD</div>
<div><br></div><br>

</div>
<br></div></div><br>_______________________________________________<br>
Dev mailing list    <a href="mailto:Dev@ensembl.org">Dev@ensembl.org</a><br>
List admin (including subscribe/unsubscribe): <a href="http://lists.ensembl.org/mailman/listinfo/dev" target="_blank">http://lists.ensembl.org/mailman/listinfo/dev</a><br>
Ensembl Blog: <a href="http://www.ensembl.info/" target="_blank">http://www.ensembl.info/</a><br>
<br></blockquote></div><br></div>