<html xmlns:o="urn:schemas-microsoft-com:office:office" xmlns:w="urn:schemas-microsoft-com:office:word" xmlns:m="http://schemas.microsoft.com/office/2004/12/omml" xmlns="http://www.w3.org/TR/REC-html40">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<meta name="Title" content="">
<meta name="Keywords" content="">
<meta name="Generator" content="Microsoft Word 15 (filtered medium)">
<style><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:DengXian;
        panose-1:2 1 6 0 3 1 1 1 1 1;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
@font-face
        {font-family:Menlo;
        panose-1:2 11 6 9 3 8 4 2 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:12.0pt;
        font-family:"Calibri",sans-serif;}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:#0563C1;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:#954F72;
        text-decoration:underline;}
span.EmailStyle17
        {mso-style-type:personal-compose;
        font-family:"Calibri",sans-serif;
        color:windowtext;}
p.p1, li.p1, div.p1
        {mso-style-name:p1;
        margin:0in;
        margin-bottom:.0001pt;
        font-size:8.5pt;
        font-family:"Menlo",sans-serif;
        color:#008400;}
p.p2, li.p2, div.p2
        {mso-style-name:p2;
        margin:0in;
        margin-bottom:.0001pt;
        font-size:8.5pt;
        font-family:"Menlo",sans-serif;
        color:black;}
p.p3, li.p3, div.p3
        {mso-style-name:p3;
        margin:0in;
        margin-bottom:.0001pt;
        font-size:8.5pt;
        font-family:"Menlo",sans-serif;
        color:black;}
p.p4, li.p4, div.p4
        {mso-style-name:p4;
        margin:0in;
        margin-bottom:.0001pt;
        font-size:8.5pt;
        font-family:"Menlo",sans-serif;
        color:#D12F1B;}
span.s2
        {mso-style-name:s2;
        color:#BA2DA2;}
span.s3
        {mso-style-name:s3;
        color:black;}
span.s4
        {mso-style-name:s4;
        color:#D12F1B;}
span.s1
        {mso-style-name:s1;}
span.apple-converted-space
        {mso-style-name:apple-converted-space;}
span.msoIns
        {mso-style-type:export-only;
        mso-style-name:"";
        text-decoration:underline;
        color:teal;}
.MsoChpDefault
        {mso-style-type:export-only;
        font-family:"Calibri",sans-serif;}
@page WordSection1
        {size:595.0pt 842.0pt;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
        {page:WordSection1;}
--></style>
</head>
<body bgcolor="white" lang="EN-GB" link="#0563C1" vlink="#954F72">
<div class="WordSection1">
<p class="MsoNormal"><span style="font-size:11.0pt">Hi,<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p> </o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt">I’ve been trying to retrieve some GRCh37 protein sequences with code similar to that below and have found some proteins that have corrupted sequences, including asterisks. Please can you tell me how to get
 the correct protein sequences?<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt"><o:p> </o:p></span></p>
<p class="p1"><span class="s1">#!/usr/bin/env perl</span><o:p></o:p></p>
<p class="p2"><o:p> </o:p></p>
<p class="p3"><span class="s2">use</span><span class="s1"> strict;</span><o:p></o:p></p>
<p class="p3"><span class="s2">use</span><span class="s1"> warnings;</span><o:p></o:p></p>
<p class="p2"><o:p> </o:p></p>
<p class="p3"><span class="s2">use</span><span class="s1"> Bio::EnsEMBL::Registry;</span><o:p></o:p></p>
<p class="p3"><span class="s2">use</span><span class="s1"> Getopt::Long qw(GetOptionsFromArray);</span><o:p></o:p></p>
<p class="p2"><o:p> </o:p></p>
<p class="p4"><span class="s2">my</span><span class="s3"> $registry = </span><span class="s1">'Bio::EnsEMBL::Registry'</span><span class="s3">;</span><o:p></o:p></p>
<p class="p2"><o:p> </o:p></p>
<p class="p3"><span class="s1">$registry->load_registry_from_db(</span><o:p></o:p></p>
<p class="p4"><span class="apple-converted-space">    </span><span class="s3">-host =>
</span><span class="s1">'ensembldb.ensembl.org'</span><span class="s3">,</span><o:p></o:p></p>
<p class="p3"><span class="apple-converted-space">    </span><span class="s1">-user =>
</span><span class="s4">'anonymous'</span><span class="s1">,</span><o:p></o:p></p>
<p class="p3"><span class="apple-converted-space">    </span><span class="s1">-port =>
</span><span class="s4">'3337'</span><o:p></o:p></p>
<p class="p3"><span class="s1">);</span><o:p></o:p></p>
<p class="p2"><o:p> </o:p></p>
<p class="p3"><span class="s2">my</span><span class="s1"> $transcript_adaptor = $registry->get_adaptor(
</span><span class="s4">'Human'</span><span class="s1">, </span><span class="s4">'otherfeatures'</span><span class="s1">,
</span><span class="s4">'Transcript'</span><span class="s1"> );</span><o:p></o:p></p>
<p class="p3"><span class="s2"><o:p> </o:p></span></p>
<p class="p3"><span class="s2">foreach</span><span class="s1"> </span><span class="s2">my</span><span class="s1"> $transcript_id (</span><span class="s4">"NM_002426.4"</span><span class="s1">) {</span><o:p></o:p></p>
<p class="p3"><span class="apple-converted-space">    </span><span class="s2">foreach</span><span class="s1">
</span><span class="s2">my</span><span class="s1"> $transcript (@{ $transcript_adaptor->fetch_all_versions_by_stable_id($transcript_id) }) {</span><o:p></o:p></p>
<p class="p3"><span class="apple-converted-space">        </span><span class="s2">my</span><span class="s1"> $protein = $transcript->translation();</span><o:p></o:p></p>
<p class="p3"><span class="apple-converted-space">        </span><span class="s2">defined</span><span class="s1">($protein)
</span><span class="s2">or</span><span class="s1"> </span><span class="s2">next</span><span class="s1">;</span><o:p></o:p></p>
<p class="p3"><span class="apple-converted-space">        </span><span class="s2">print</span><span class="s1">
</span><span class="s4">">"</span><span class="s1"> . $protein->stable_id() . </span>
<span class="s4">"\n"</span><span class="s1">;</span><o:p></o:p></p>
<p class="p3"><span class="apple-converted-space">        </span><span class="s2">print</span><span class="s1"> $protein->seq() .
</span><span class="s4">"\n"</span><span class="s1">;</span><o:p></o:p></p>
<p class="p3"><span class="apple-converted-space">    </span><span class="s1">}</span><o:p></o:p></p>
<p class="p3"><span class="s1">}</span><o:p></o:p></p>
<p class="p2"><o:p> </o:p></p>
<p class="p2"><o:p> </o:p></p>
<p class="MsoNormal"><span style="font-size:11.0pt;color:black">Kind regards,<o:p></o:p></span></p>
<p class="MsoNormal"><span style="font-size:11.0pt;color:black">Luke</span><o:p></o:p></p>
</div>
This e-mail message contains confidential information intended only for the use of the individual or entity to which it is addressed. If you are not the intended recipient, please do not disseminate, distribute or copy this communication, by e-mail or otherwise.
 Instead, please notify us immediately by return e-mail and then delete and discard all copies of the e-mail. We have taken all reasonable precautions to check this e-mail and any attachments for viruses, but we cannot accept any liability for any damage sustained
 as a result of any virus, worm or other malicious software. Achilles Therapeutics Limited (10167668) is registered in England and Wales. The registered office is at 215 Euston Road, London, NW1 2BE, UK.
</body>
</html>