<div dir="ltr">Hi Kieron!<div><br></div><div>Thanks for getting back to me so quickly. The info/species endpoint does in fact have what I'm looking for! I can use it to get all the assemblies for species/strain.</div><div><br></div><div>Ultimately what I'm trying to do is download a file like <a href="ftp://ftp.ensemblgenomes.org/pub/release-45/bacteria/fasta/bacteria_100_collection/pseudomonas_aeruginosa_gca_001180445/dna/Pseudomonas_aeruginosa_gca_001180445.E1_London_17_VIM_2_02_09.dna.toplevel.fa.gz">ftp://ftp.ensemblgenomes.org/pub/release-45/bacteria/fasta/bacteria_100_collection/pseudomonas_aeruginosa_gca_001180445/dna/Pseudomonas_aeruginosa_gca_001180445.E1_London_17_VIM_2_02_09.dna.toplevel.fa.gz</a> given a species/strain/assembly version. I think that assemblies endpoint has all the information I need to construct that URL, except for the `bacteria_100_collection` part. Do you know where I can figure out which collection a particular organism/strain/assembly version would fall in? Even better would be if I could get that direct link without having to construct it.</div><div><br></div><div>If you can help with that I appreciate it, but if not I'm still grateful for the help with the assemblies endpoint!</div><div><br></div><div>- Kurt</div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Thu, Dec 19, 2019 at 11:49 AM Kieron Taylor <<a href="mailto:ktaylor@ebi.ac.uk">ktaylor@ebi.ac.uk</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">Hi Kurt,<br>
<br>
I believe this is a leakage of our internal understanding, combined with poor wording that makes it confusing.<br>
<br>
In the human example you can see five "coord_system_versions". This means we have assembly mappings from the latest to the previous ones listed. These additional assemblies are generally only available in the context of the newest assembly, rather than in isolation. The exception to this is the long time favourite GRCh37/hg19, and we provide a data freeze of that assembly via the <a href="http://grch37.rest.ensembl.org" rel="noreferrer" target="_blank">grch37.rest.ensembl.org</a> service.<br>
<br>
Due to complicated historic reasons, organisms like Pseuodmoniae are bundled up differently, such as Pseudomonas_aeruginosa_gca_000705235 : <br>
<a href="http://rest.ensembl.org/info/assembly/Pseudomonas_aeruginosa_gca_000705235?content-type=application/json" rel="noreferrer" target="_blank">http://rest.ensembl.org/info/assembly/Pseudomonas_aeruginosa_gca_000705235?content-type=application/json</a><br>
<br>
Here you can see one assembly named "pseuodomonas" attached to the "species".<br>
<br>
If you want to see what others we have, you need the info/species endpoint, but that is very large for bacteria!<br>
<br>
<a href="https://rest.ensembl.org/info/species?content-type=application/json&division=EnsemblBacteria" rel="noreferrer" target="_blank">https://rest.ensembl.org/info/species?content-type=application/json&division=EnsemblBacteria</a><br>
<br>
We are aware that this requires rather more insight into Ensembl's historic workings than should be necessary, and we are working to improve matters! I have created a ticket to improve the documentation on the endpoint in question, but it is a much larger job to have the endpoints working the way you would perhaps like them to.<br>
<br>
<br>
Regards,<br>
<br>
Kieron<br>
<br>
<br>
Kieron Taylor PhD.<br>
Ensembl Developer<br>
<br>
EMBL, European Bioinformatics Institute<br>
<br>
<br>
<br>
<br>
<br>
<br>
> On 19 Dec 2019, at 15:22, Kurt Wheeler <<a href="mailto:kurt.wheeler91@gmail.com" target="_blank">kurt.wheeler91@gmail.com</a>> wrote:<br>
> <br>
> Hello,<br>
> <br>
> I'm confused by this endpoint: <a href="http://rest.ensembl.org/documentation/info/assembly_info" rel="noreferrer" target="_blank">http://rest.ensembl.org/documentation/info/assembly_info</a><br>
> <br>
> It says that it will "List the currently available assemblies for a species, along with toplevel sequences, chromosomes and cytogenetic bands."<br>
> <br>
> However the response only has a single assembly, it's not even with a JSON list: []<br>
> <br>
> Example: <a href="http://rest.ensembl.org/info/assembly/PSEUDOMONAS_AERUGINOSA?content-type=application/json" rel="noreferrer" target="_blank">http://rest.ensembl.org/info/assembly/PSEUDOMONAS_AERUGINOSA?content-type=application/json</a><br>
> <br>
> Is this a bug? It seems like I should be expecting the response to be a list based on the documentation.<br>
> <br>
> Thanks,<br>
> <br>
> - Kurt<br>
> _______________________________________________<br>
> Dev mailing list    <a href="mailto:Dev@ensembl.org" target="_blank">Dev@ensembl.org</a><br>
> Posting guidelines and subscribe/unsubscribe info: <a href="https://lists.ensembl.org/mailman/listinfo/dev_ensembl.org" rel="noreferrer" target="_blank">https://lists.ensembl.org/mailman/listinfo/dev_ensembl.org</a><br>
> Ensembl Blog: <a href="http://www.ensembl.info/" rel="noreferrer" target="_blank">http://www.ensembl.info/</a><br>
<br>
<br>
_______________________________________________<br>
Dev mailing list    <a href="mailto:Dev@ensembl.org" target="_blank">Dev@ensembl.org</a><br>
Posting guidelines and subscribe/unsubscribe info: <a href="https://lists.ensembl.org/mailman/listinfo/dev_ensembl.org" rel="noreferrer" target="_blank">https://lists.ensembl.org/mailman/listinfo/dev_ensembl.org</a><br>
Ensembl Blog: <a href="http://www.ensembl.info/" rel="noreferrer" target="_blank">http://www.ensembl.info/</a><br>
</blockquote></div>