<div dir="ltr">Hi Andrew,<div><br></div><div>Thanks for the prompt response.</div><div>May I assume that this is just the problem of HGVS calculation and CDS position is already corrected by RefSeq alignment in such case?</div><div><br clear="all"><div><div dir="ltr" class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr">Regards,<div>Wallace Ko</div></div></div></div><br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Tue, Jan 21, 2020 at 6:30 PM Andrew Parton <<a href="mailto:aparton@ebi.ac.uk">aparton@ebi.ac.uk</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div style="overflow-wrap: break-word;"><div><span>Hi Wallace,</span></div><span><div><span><br></span></div>Thanks for this report, it is an issue we are aware of. As you identified, not all RefSeq transcripts completely match the reference genome. In cases where they don't, we are now using alignment files provided by NCBI to create a new reference, matching the transcript, and use this for consequence calling.</span><div><span><br></span><span>Our HGVS calculation does not currently use this reference modification, but it is something we are working on and aim to release later this year. VEP can report reference miss-matches for GRCh38, but these data are not available for GRCh37.</span></div><div><span><br></span><span>More details on the differences to the reference genome and correcting transcript models using BAM can be found here:  <a href="https://www.ensembl.org/info/docs/tools/vep/script/vep_other.html#refseq" target="_blank">https://www.ensembl.org/info/docs/tools/vep/script/vep_other.html#refseq</a></span></div><div><span><br></span><span>Let us know if there’s anything else we can do to help.</span></div><div><span><br></span></div><div><span>Kind Regards,</span></div><div>Andrew<br><div><span><br></span><div><blockquote type="cite"><div>On 21 Jan 2020, at 09:23, Wallace Ko <<a href="mailto:myko@l3-bioinfo.com" target="_blank">myko@l3-bioinfo.com</a>> wrote:</div><br><div><div dir="ltr">Hi Ensembl Developers,<div><br></div><div>The variant NC_000012.11:g.103249104C>A is annotated by online VEP and offline cached VEP (99, RefSeq, GRCh37) as:<br></div><div><ul><li>HGVSc: NM_000277.1:<b>c.517</b>G>T</li><li>HGVSp: NP_000268.1:p.Gln172His<br></li><li>CDS Position: 516</li></ul></div><div>On the other hand, <a href="https://www.ncbi.nlm.nih.gov/clinvar/variation/664621/" target="_blank">ClinVar</a> reports the variant as NM_000277.3:<b>c.516</b>G>T (NP_000268.1:p.Gln172His). Besides, blast result shows that there is a 1-bp gap between c.303 and c.304 when NM_000277.1 is aligned to NC_000012.11. And even VEP itself reports the CDS position as 516.</div><div><br></div><div>All these make me believe that the HGVSc reported should be at c.516 instead of c.517.</div><div><br clear="all"><div><div dir="ltr"><div dir="ltr">Regards,<div>Wallace Ko</div></div></div></div></div></div>
_______________________________________________<br>Dev mailing list    <a href="mailto:Dev@ensembl.org" target="_blank">Dev@ensembl.org</a><br>Posting guidelines and subscribe/unsubscribe info: <a href="https://lists.ensembl.org/mailman/listinfo/dev_ensembl.org" target="_blank">https://lists.ensembl.org/mailman/listinfo/dev_ensembl.org</a><br>Ensembl Blog: <a href="http://www.ensembl.info/" target="_blank">http://www.ensembl.info/</a><br></div></blockquote></div><br></div></div></div>_______________________________________________<br>
Dev mailing list    <a href="mailto:Dev@ensembl.org" target="_blank">Dev@ensembl.org</a><br>
Posting guidelines and subscribe/unsubscribe info: <a href="https://lists.ensembl.org/mailman/listinfo/dev_ensembl.org" rel="noreferrer" target="_blank">https://lists.ensembl.org/mailman/listinfo/dev_ensembl.org</a><br>
Ensembl Blog: <a href="http://www.ensembl.info/" rel="noreferrer" target="_blank">http://www.ensembl.info/</a><br>
</blockquote></div>