You don't need to run an alignment for this task, as the relative position of each transcript is well-defined by its genomic coordinates. What you could do is extract each transcript in genomic space:<div><br></div><div>

1) Collect the DNA sequence covering the entire gene</div><div>2) Replace any bases which are NOT exons in the current transcript with gap characters</div><div><br></div><div>This will get you 4 strings of the same length but different patterns of gaps and characters. Finally, treating these strings as your alignment, just remove any columns which have a gap in all of the sequences. I think that would yield the result you're looking for.</div>

<div><br></div><div>greg</div><div><div><br><div class="gmail_quote">On Tue, Feb 22, 2011 at 4:52 PM, Tjaart de Beer <span dir="ltr"><<a href="mailto:tjaart@ebi.ac.uk">tjaart@ebi.ac.uk</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex;">

Hi all<br>
<br>
I would like to know if it is possible to get an aligned set of<br>
transcripts for a specific gene from one species from Ensembl?<br>
<br>
E.g. When looking at<br>
<a href="http://www.ensembl.org/Homo_sapiens/Gene/Splice?g=ENSG00000150540;r=2:138721590-138773930" target="_blank">http://www.ensembl.org/Homo_sapiens/Gene/Splice?g=ENSG00000150540;r=2:138721590-138773930</a><br>
<br>
we see there are 8 transcripts of which 4 potentially codes for a protein.<br>
Transcripts ENST0000280097, ENST00000410115, ENST00000280096 will all<br>
align without any problem. The problem comes in when adding<br>
ENST00000329366. This transcript contains an exon that none of the other<br>
transcripts do. When using the sequences of the 4 transcripts in a normal<br>
alignment, it will try to align that exon with other pieces and not<br>
introduce a gap in the other sequences to accommodate the exon.<br>
<br>
Ideally the results should look like this:<br>
<br>
>ENST1<br>
AAC---CGAGGTTTT<br>
>ENST2<br>
AAC---CGAGGT---<br>
>ENST3<br>
AACCGGCGAGGTTTT<br>
>ENST4<br>
AAC---CGAGGTT--<br>
<br>
Using the API, is it possible to get this type of aligned transcripts back?<br>
<br>
Any other suggestions on how to do this are also welcome!<br>
<br>
Thanks!<br>
Tjaart<br>
<br>
<br>
<br>
<br>
_______________________________________________<br>
Dev mailing list<br>
<a href="mailto:Dev@ensembl.org">Dev@ensembl.org</a><br>
<a href="http://lists.ensembl.org/mailman/listinfo/dev" target="_blank">http://lists.ensembl.org/mailman/listinfo/dev</a><br>
</blockquote></div><br></div></div>