<div dir="ltr">Hi Juliano,<div><br></div><div>Due to the large number of positions and alleles, we don't store allele frequencies for 1000 Genomes data in our MySQL schema.</div><div><br>Instead, the REST API and web interfaces use our Perl API [1], which includes a layer that queries VCF files containing genotype data and calculates these frequencies on the fly [2].</div><div><br></div><div>If you have variant positions in addition to the rsIDs, you might like to consider using the Variant Effect Predictor [3]. This tool is designed to rapidly analyse many variants, and is able to annotate such positions with frequency data from 1000 Genomes, ExAC and more [4]. While it can accept rsIDs as input, it works most efficiently if you use something like a VCF containing the variant's genomic coordinates.</div><div><br></div><div>Hope that helps</div><div><br></div><div>Will McLaren</div><div>Ensembl Variation</div><div><br></div><div>[1] : <a href="http://www.ensembl.org/info/docs/api/index.html">http://www.ensembl.org/info/docs/api/index.html</a></div><div>[2] : <a href="http://www.ensembl.info/blog/2015/06/18/1000-genomes-phase-3-frequencies-genotypes-and-ld-data/">http://www.ensembl.info/blog/2015/06/18/1000-genomes-phase-3-frequencies-genotypes-and-ld-data/</a></div><div>[3] : <a href="http://www.ensembl.org/vep">http://www.ensembl.org/vep</a></div><div>[4] : <a href="http://www.ensembl.org/info/docs/tools/vep/script/vep_options.html#opt_gmaf">http://www.ensembl.org/info/docs/tools/vep/script/vep_options.html#opt_gmaf</a></div></div><div class="gmail_extra"><br><div class="gmail_quote">On 3 August 2016 at 10:28, Kieron Taylor <span dir="ltr"><<a href="mailto:ktaylor@ebi.ac.uk" target="_blank">ktaylor@ebi.ac.uk</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">Dear Juliano,<br>
<br>
You are correct, that requesting millions of variants at 15 per second would take a very long time. This is why we support batch requests via POST.<br>
<br>
<a href="https://rest.ensembl.org/documentation/info/variation_post" rel="noreferrer" target="_blank">https://rest.ensembl.org/documentation/info/variation_post</a><br>
<br>
You can greatly increase your throughput by putting hundreds of IDs in each request, for example:<br>
<br>
curl '<a href="https://rest.ensembl.org/variation/homo_sapiens" rel="noreferrer" target="_blank">https://rest.ensembl.org/variation/homo_sapiens</a>' -H 'Content-type:application/json' -H 'Accept:application/json' -X POST -d '{ "ids" : ["rs56116432", "COSM476", .... ] }'<br>
<br>
If that is not suitable (run time measured in a few hours perhaps), we have the original Variation API which can undoubtedly help you get the data directly. Someone from our helpdesk or Variation team might be able to help if you still feel you must query the database directly.<br>
<br>
Regards,<br>
<br>
Kieron<br>
<br>
<br>
Kieron Taylor PhD.<br>
Ensembl Developer<br>
<br>
EMBL, European Bioinformatics Institute<br>
<div><div class="h5"><br>
<br>
<br>
<br>
<br>
<br>
> On 2 Aug 2016, at 20:51, Juliano Martins <<a href="mailto:julianovmartins@gmail.com">julianovmartins@gmail.com</a>> wrote:<br>
><br>
> Hello,<br>
><br>
> I am Brazilian student of computer science at the Catholic University of Paraná. I am starting research on genome variants and would like to extract some statistics such data and for that I need to download it to my local machine.<br>
><br>
> Using the REST API (<br>
> <a href="https://rest.ensembl.org/variation/human/rs56116432?content-type=application/json;population_genotypes=1" rel="noreferrer" target="_blank">https://rest.ensembl.org/variation/human/rs56116432?content-type=application/json;population_genotypes=1</a>) I get exactly the data I need, but it would be very time consuming for millions of variants IDs because the service time limits.<br>
><br>
> Where I could get the same information (range, population, genotype ) massively?<br>
><br>
> I tried to find this data into the public mysql ensembl database and performed several queries, but did not get the same data. Especially the 'population' table and frequency fields does not seems to have the same data I got the in the REST API.<br>
><br>
> I need data variation for the assembly GRCh37 3 GRCh38 and looked for these two bases:<br>
> - homo_sapiens_variation_73_37<br>
> - homo_sapiens_variation_85_38<br>
><br>
><br>
> This is a sample query that I used in the database (homo_sapiens_variation_73_37):<br>
><br>
> SELECT DISTINCT<br>
> <a href="http://variation.name" rel="noreferrer" target="_blank">variation.name</a>,<br>
> allele.frequency,<br>
> allele.count,<br>
> allele_code.allele,<br>
> variation.ancestral_allele,<br>
> variation.minor_allele,<br>
> variation.minor_allele_freq,<br>
> variation.minor_allele_count,<br>
> <a href="http://population.name" rel="noreferrer" target="_blank">population.name</a><br>
> FROM allele, allele_code, variation, population<br>
> WHERE <a href="http://variation.name" rel="noreferrer" target="_blank">variation.name</a> LIKE 'rs56116432' AND<br>
> allele.allele_code_id = allele_code.allele_code_id AND<br>
> allele.variation_id = variation.variation_id AND<br>
> allele.population_id = population.population_id<br>
><br>
> I thank you!.<br>
> Sorry my bad English.<br>
><br>
> Juliano V. Martins<br>
</div></div>> _______________________________________________<br>
> Dev mailing list    <a href="mailto:Dev@ensembl.org">Dev@ensembl.org</a><br>
> Posting guidelines and subscribe/unsubscribe info: <a href="http://lists.ensembl.org/mailman/listinfo/dev" rel="noreferrer" target="_blank">http://lists.ensembl.org/mailman/listinfo/dev</a><br>
> Ensembl Blog: <a href="http://www.ensembl.info/" rel="noreferrer" target="_blank">http://www.ensembl.info/</a><br>
<br>
<br>
_______________________________________________<br>
Dev mailing list    <a href="mailto:Dev@ensembl.org">Dev@ensembl.org</a><br>
Posting guidelines and subscribe/unsubscribe info: <a href="http://lists.ensembl.org/mailman/listinfo/dev" rel="noreferrer" target="_blank">http://lists.ensembl.org/mailman/listinfo/dev</a><br>
Ensembl Blog: <a href="http://www.ensembl.info/" rel="noreferrer" target="_blank">http://www.ensembl.info/</a><br>
</blockquote></div><br></div>