<div dir="ltr">Hi Andrew,<div><br></div><div>Since VEP 100 (GRCh37) the REFSEQ_MATCH column is filled with content. Is it reliable to use this column to determine if the HGVS code is probably incorrect because of RefSeq alignment mismatch?</div><div><br></div><div>Or shall I simply use the BAM_EDIT column for the purpose?</div><div><br></div><div>And is my understanding of the BAM_EDIT value below correct (according to this <a href="https://github.com/Ensembl/ensembl-vep/issues/265#issuecomment-415416679">Github issue</a>)?</div><div><ul><li><b>-</b>: no mismatch is found. Annotations and HGVS code are both fine.</li><li><b>OK</b>: mismatch is found and fix is applied. Annotations are fine. HGVS code is fixed too but could still be incorrect in some cases.</li><li><b>FAILED</b>: mismatch is found and fix could not be applied. Both annotations and HGVS code could be incorrect.</li></ul></div><div><br clear="all"><div><div dir="ltr" class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><span>Regards,<br>Wallace Ko</span></div></div></div></div></div></div></div><br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Tue, Jan 21, 2020 at 7:50 PM Andrew Parton <<a href="mailto:aparton@ebi.ac.uk">aparton@ebi.ac.uk</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div style="overflow-wrap: break-word;">Hi,<div><br></div><div>Yep, that’s correct.</div><div><br></div><div>One thing to be aware of however is that our HGVS code shifts variants reported in repeated regions in the 3’ direction by default, while our CDS position is not shifted in such a way. This is the most common cause of CDS position and HGVSc position mismatch, although it can also be caused by these RefSeq alignment mismatches.</div><div><br></div><div>Kind Regards,</div><div>Andrew<br><div><br><blockquote type="cite"><div>On 21 Jan 2020, at 11:08, Wallace Ko <<a href="mailto:myko@l3-bioinfo.com" target="_blank">myko@l3-bioinfo.com</a>> wrote:</div><br><div><div dir="ltr">Hi Andrew,<div><br></div><div>Thanks for the prompt response.</div><div>May I assume that this is just the problem of HGVS calculation and CDS position is already corrected by RefSeq alignment in such case?</div><div><br clear="all"><div><div dir="ltr"><div dir="ltr">Regards,<div>Wallace Ko</div></div></div></div><br></div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Tue, Jan 21, 2020 at 6:30 PM Andrew Parton <<a href="mailto:aparton@ebi.ac.uk" target="_blank">aparton@ebi.ac.uk</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex"><div><div><span>Hi Wallace,</span></div><span><div><span><br></span></div>Thanks for this report, it is an issue we are aware of. As you identified, not all RefSeq transcripts completely match the reference genome. In cases where they don't, we are now using alignment files provided by NCBI to create a new reference, matching the transcript, and use this for consequence calling.</span><div><span><br></span><span>Our HGVS calculation does not currently use this reference modification, but it is something we are working on and aim to release later this year. VEP can report reference miss-matches for GRCh38, but these data are not available for GRCh37.</span></div><div><span><br></span><span>More details on the differences to the reference genome and correcting transcript models using BAM can be found here:  <a href="https://www.ensembl.org/info/docs/tools/vep/script/vep_other.html#refseq" target="_blank">https://www.ensembl.org/info/docs/tools/vep/script/vep_other.html#refseq</a></span></div><div><span><br></span><span>Let us know if there’s anything else we can do to help.</span></div><div><span><br></span></div><div><span>Kind Regards,</span></div><div>Andrew<br><div><span><br></span><div><blockquote type="cite"><div>On 21 Jan 2020, at 09:23, Wallace Ko <<a href="mailto:myko@l3-bioinfo.com" target="_blank">myko@l3-bioinfo.com</a>> wrote:</div><br><div><div dir="ltr">Hi Ensembl Developers,<div><br></div><div>The variant NC_000012.11:g.103249104C>A is annotated by online VEP and offline cached VEP (99, RefSeq, GRCh37) as:<br></div><div><ul><li>HGVSc: NM_000277.1:<b>c.517</b>G>T</li><li>HGVSp: NP_000268.1:p.Gln172His<br></li><li>CDS Position: 516</li></ul></div><div>On the other hand, <a href="https://www.ncbi.nlm.nih.gov/clinvar/variation/664621/" target="_blank">ClinVar</a> reports the variant as NM_000277.3:<b>c.516</b>G>T (NP_000268.1:p.Gln172His). Besides, blast result shows that there is a 1-bp gap between c.303 and c.304 when NM_000277.1 is aligned to NC_000012.11. And even VEP itself reports the CDS position as 516.</div><div><br></div><div>All these make me believe that the HGVSc reported should be at c.516 instead of c.517.</div><div><br clear="all"><div><div dir="ltr"><div dir="ltr">Regards,<div>Wallace Ko</div></div></div></div></div></div>
_______________________________________________<br>Dev mailing list    <a href="mailto:Dev@ensembl.org" target="_blank">Dev@ensembl.org</a><br>Posting guidelines and subscribe/unsubscribe info: <a href="https://lists.ensembl.org/mailman/listinfo/dev_ensembl.org" target="_blank">https://lists.ensembl.org/mailman/listinfo/dev_ensembl.org</a><br>Ensembl Blog: <a href="http://www.ensembl.info/" target="_blank">http://www.ensembl.info/</a><br></div></blockquote></div><br></div></div></div>_______________________________________________<br>
Dev mailing list    <a href="mailto:Dev@ensembl.org" target="_blank">Dev@ensembl.org</a><br>
Posting guidelines and subscribe/unsubscribe info: <a href="https://lists.ensembl.org/mailman/listinfo/dev_ensembl.org" rel="noreferrer" target="_blank">https://lists.ensembl.org/mailman/listinfo/dev_ensembl.org</a><br>
Ensembl Blog: <a href="http://www.ensembl.info/" rel="noreferrer" target="_blank">http://www.ensembl.info/</a><br>
</blockquote></div>
_______________________________________________<br>Dev mailing list    <a href="mailto:Dev@ensembl.org" target="_blank">Dev@ensembl.org</a><br>Posting guidelines and subscribe/unsubscribe info: <a href="https://lists.ensembl.org/mailman/listinfo/dev_ensembl.org" target="_blank">https://lists.ensembl.org/mailman/listinfo/dev_ensembl.org</a><br>Ensembl Blog: <a href="http://www.ensembl.info/" target="_blank">http://www.ensembl.info/</a><br></div></blockquote></div><br></div></div>_______________________________________________<br>
Dev mailing list    <a href="mailto:Dev@ensembl.org" target="_blank">Dev@ensembl.org</a><br>
Posting guidelines and subscribe/unsubscribe info: <a href="https://lists.ensembl.org/mailman/listinfo/dev_ensembl.org" rel="noreferrer" target="_blank">https://lists.ensembl.org/mailman/listinfo/dev_ensembl.org</a><br>
Ensembl Blog: <a href="http://www.ensembl.info/" rel="noreferrer" target="_blank">http://www.ensembl.info/</a><br>
</blockquote></div>