<html><head><meta http-equiv="Content-Type" content="text/html; charset=utf-8"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">Dear Alexei,<div class="">Our current data model and the pipeline would always assign transcripts with overlapping CDS regions to the same gene and the name is assigned to the gene. With manual curation it would be possible to separate them and then hopefully assign the correct name to the correct transcript. Unfortunately, this is not something we can do at the moment.</div><div class=""><br class=""></div><div class="">The way we assign gene name has quite often trouble with gene families. This means that unfortunately the problem of the name changes is a known bug but we haven’t found yet the best way to fix it as one solution for one gene might break the naming of a different gene.</div><div class=""><br class=""></div><div class="">Because human and mouse have been manually curated, and thus multiple genes have been created, I don’t think that using human and mouse more actively would solve the problem of Ugt1a. However it might be helpful for other gene families.</div><div class=""><br class=""></div><div class="">Kind regards</div><div class="">Thibaut</div><div class=""><div class=""><div><br class=""><blockquote type="cite" class=""><div class="">On 21 Oct 2021, at 22:19, Podtelezhnikov, Alexei <<a href="mailto:alexei_podtelezhnikov@merck.com" class="">alexei_podtelezhnikov@merck.com</a>> wrote:</div><br class="Apple-interchange-newline"><div class=""><meta charset="UTF-8" class=""><div class="WordSection1" style="page: WordSection1; caret-color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none;"><div style="margin: 0in; font-size: 11pt; font-family: Calibri, sans-serif;" class="">Dear developers,<o:p class=""></o:p></div><div style="margin: 0in; font-size: 11pt; font-family: Calibri, sans-serif;" class=""><o:p class=""> </o:p></div><div style="margin: 0in; font-size: 11pt; font-family: Calibri, sans-serif;" class="">The tox community looks forward to the mRatBN7.2 assembly that should come in Ensembl 105. My benchmark is Ugt1a locus (ENSRNOG00000018740) which is historically very problematic for Ensembl. Mouse and Human get it right with multiple genes having distant first exons (and promoters) but sharing the trailing exons. Rat was never correct when using transcript variants of a single gene. What is even more confusing that the rat gene name is randomly changing: Ugt1a3 in Rapid, Ugt1a6 in 104, Ugt1a3 in 96, Ugt1a5 in 90, and so on.<o:p class=""></o:p></div><div style="margin: 0in; font-size: 11pt; font-family: Calibri, sans-serif;" class=""><o:p class=""> </o:p></div><div style="margin: 0in; font-size: 11pt; font-family: Calibri, sans-serif;" class="">In general the Rapid with mRatBN7.2 is much improved with fewer gene duplications and less gene entanglement in large families. It is just Ugt1a family which continues to be a problem. I suggest that this family be aligned with NCBI and with mouse and human. I think there should be reasonable alignment between three mammalian genomes selected for GRC.<o:p class=""></o:p></div><div style="margin: 0in; font-size: 11pt; font-family: Calibri, sans-serif;" class=""><o:p class=""> </o:p></div><div style="margin: 0in; font-size: 11pt; font-family: Calibri, sans-serif;" class="">Please consider this improvement for the future release. Thank you for your time and help.<o:p class=""></o:p></div><div style="margin: 0in; font-size: 11pt; font-family: Calibri, sans-serif;" class=""><o:p class=""> </o:p></div><div style="margin: 0in; font-size: 11pt; font-family: Calibri, sans-serif;" class="">Alexei<o:p class=""></o:p></div><div style="margin: 0in; font-size: 11pt; font-family: Calibri, sans-serif;" class=""><o:p class=""> </o:p></div><div style="margin: 0in; font-size: 11pt; font-family: Calibri, sans-serif;" class="">Alexei A Podtelezhnikov, PhD<o:p class=""></o:p></div><div style="margin: 0in; font-size: 11pt; font-family: Calibri, sans-serif;" class="">Principal Scientist<o:p class=""></o:p></div><div style="margin: 0in; font-size: 11pt; font-family: Calibri, sans-serif;" class="">Genome & Biomarker Sciences<o:p class=""></o:p></div><div style="margin: 0in; font-size: 11pt; font-family: Calibri, sans-serif;" class="">Merck & Co., Inc.<o:p class=""></o:p></div><div style="margin: 0in; font-size: 11pt; font-family: Calibri, sans-serif;" class=""><o:p class=""> </o:p></div></div><p style="caret-color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none;" class="">Notice:  This e-mail message, together with any attachments, contains<br class="">information of Merck & Co., Inc. (2000 Galloping Hill Road, Kenilworth,<span class="Apple-converted-space"> </span><br class="">New Jersey, USA 07033), and/or its affiliates Direct contact information<br class="">for affiliates is available at<span class="Apple-converted-space"> </span><br class=""><a href="http://www.merck.com/contact/contacts.html" class="">http://www.merck.com/contact/contacts.html</a>) that may be confidential,<br class="">proprietary copyrighted and/or legally privileged. It is intended solely<br class="">for the use of the individual or entity named on this message. If you are<br class="">not the intended recipient, and have received this message in error,<br class="">please notify us immediately by reply e-mail and then delete it from<span class="Apple-converted-space"> </span><br class="">your system.</p><span style="caret-color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; float: none; display: inline !important;" class="">_______________________________________________</span><br style="caret-color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none;" class=""><span style="caret-color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; float: none; display: inline !important;" class="">Dev mailing list    </span><a href="mailto:Dev@ensembl.org" style="font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" class="">Dev@ensembl.org</a><br style="caret-color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none;" class=""><span style="caret-color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; float: none; display: inline !important;" class="">Posting guidelines and subscribe/unsubscribe info:<span class="Apple-converted-space"> </span></span><a href="https://lists.ensembl.org/mailman/listinfo/dev_ensembl.org" style="font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" class="">https://lists.ensembl.org/mailman/listinfo/dev_ensembl.org</a><br style="caret-color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none;" class=""><span style="caret-color: rgb(0, 0, 0); font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; word-spacing: 0px; -webkit-text-stroke-width: 0px; text-decoration: none; float: none; display: inline !important;" class="">Ensembl Blog:<span class="Apple-converted-space"> </span></span><a href="http://www.ensembl.info/" style="font-family: Helvetica; font-size: 12px; font-style: normal; font-variant-caps: normal; font-weight: normal; letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-size-adjust: auto; -webkit-text-stroke-width: 0px;" class="">http://www.ensembl.info/</a></div></blockquote></div><br class=""></div></div></body></html>