<div dir="ltr"><div dir="ltr">Hi Helen, wow, thanks for the quick reply, you re awesome guys !<div><br></div><div>there was no warnings file created, that s why I was assuming that the VEP run was ok and it just stopped at some point 'naturally'.<br></div><div><br></div><div>But after your reply, I took the lines 16500-17000 (to catch the supposed to be wrong one) and inputted to VEP; </div><div><br></div><div>-> In the ouptut tab file, there are 465 variants</div><div><br></div><div>-- > the stats file show that 465 (not 500) variants are read; and 464 processed; and 0 filtered out. </div><div><br></div><div><font size="1">Lines of input read       465<br>Variants processed 464<br>Variants filtered out      0</font><br></div></div><div><br></div><div>-> the ids of the variants that are in the input but not ias you pointed outn the output (note that the id is the variant number), are from 16965 to 17000. <span style="background-color:rgb(255,242,204)">This would be compatible with VEP finding a line that does not like and stop, </span><span style="background-color:rgb(255,255,255)">as you pointed out</span><br></div><div><br></div><div>-> the first 'not mapped' variant is ( GRCh37) </div><div>2  167099158  16965     A   A  </div><div>which o course it makes no sense to consider it as a variant, but I do not know i<span style="background-color:rgb(255,242,204)">f it s such a weird thing to make everything stop</span> (indeed in the web VEP this is not mapped neither)<br></div><div><br></div><div>--> And<span style="background-color:rgb(255,242,204)"> there is no warning file<b> </b></span><br></div><div><span style="background-color:rgb(255,255,255)"><br></span></div><div><span style="background-color:rgb(255,255,255)">--> I removed this 'conflictive' entry and VEP consequently run the 499 variants</span></div><div><span style="background-color:rgb(255,255,255)"><br></span></div><div><span style="background-color:rgb(255,255,255)">So I think this is a bug, since --as far as i know-- the normal behaviour when VEP encounters a line that does not like is to ignore it and generate the corresponding warning file, right ?</span></div><div><span style="background-color:rgb(255,242,204)"><b><br></b></span></div><div><br></div><div><span style="background-color:rgb(255,242,204)"><b><br></b></span></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">El vie., 7 jun. 2019 a las 12:39, Helen Schuilenburg (<<a href="mailto:helens@ebi.ac.uk">helens@ebi.ac.uk</a>>) escribió:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
  
    
  
  <div bgcolor="#FFFFFF">
    <p>Hi David</p>
    <p>VEP can run with 100K variants. The VEP publication (McLaren W et
      al. 2016, doi:10.1186/s13059-016-0974-4) gives examples of<br>
      number of variants and timings e.g for 4,474,140 variants.<br>
      <br>
      Were any warnings reported in your warnings_file ( --warning_file
      /home/david/Desktop/tmp/tmp/vep_warnings.txt)?</p>
    <p>From the stats file, there may be a problem with your input file
      causing to to stop processing at Line 16856 of your input file.<br>
      <br>
      Regards<br>
      Helen<br>
    </p>
    <div class="gmail-m_2995700720703143231moz-cite-prefix">On 07/06/2019 10:17, David Tamborero
      wrote:<br>
    </div>
    <blockquote type="cite">
      
      <div dir="ltr">Hi all,
        <div><br>
        </div>
        <div>I m working with VEP (command line) v95 to analyse (large)
          vcf files and generate VEP -tab files</div>
        <div><br>
        </div>
        <div>I ve realized that the output does not contain all the
          entries that I m feeding to the tool. I ve been doing several
          tests for vcf files with 1K, 5K, 10K, 20K, 50K, 100K entries
          and it looks to me that VEP reads 'a maximum' of 16K8 variants
          (see VEP stats output below)</div>
        <div><br>
        </div>
        <div>I was not aware that it existed such a limit, nor I am
          capable of finding any flag regarding this issue. I feel that
          I m missing a big point, but I do not know which one --sorry
          in advance if so.</div>
        <div><br>
        </div>
        <div>command:</div>
        <div>./vep -i blablabla.vcf -o blbabla.txt --tab --warning_file
          blabla.txt --format vcf --cache --offline --force_overwrite
          --hgvs --symbol --stats_file blablabla.txt --stats_text </div>
        <div><br>
        </div>
        <div>version:</div>
        <div>release 95<br>
          sub 4f834538054c1aee24098c72f31f92d4c5aa303b<br>
        </div>
        <div><br>
        </div>
        <div>and the stats file content for the run with a vcf file with
          100K entries :</div>
        <div> [<font size="1">VEP run statistics]<br>
            VEP version (API) 95 (95)<br>
            Annotation sources Cache:
            /home/david/.vep/homo_sapiens/95_GRCh37<br>
            Species homo_sapiens<br>
            Command line options --cache --dir /home/david/.vep
            --force_overwrite --format vcf --hgvs --input_file
            /home/david/Desktop/tmp/tmp/hq.vcf --offline --output_file
            /home/david/Desktop/tmp/tmp/vep.txt --stats_file
            /home/david/Desktop/tmp/tmp/stats_file.txt --stats_text
            --symbol --tab --warning_file
            /home/david/Desktop/tmp/tmp/vep_warnings.txt<br>
            Start time 2019-06-07 10:50:24<br>
            End time 2019-06-07 10:59:46<br>
            Run time 562 seconds<br>
            Input file /home/david/Desktop/tmp/tmp/hq.vcf<br>
            Output file /home/david/Desktop/tmp/tmp/vep.txt<br>
            <br>
            [General statistics]<br>
            <span style="background-color:rgb(255,217,102)">Lines of
              input read 16856</span><br>
            Variants processed 16855<br>
            Variants filtered out 0<br>
            Novel / existing variants -<br>
            Overlapped genes 2809<br>
            Overlapped transcripts 15672<br>
            Overlapped regulatory features -</font></div>
      </div>
      <br>
      <fieldset class="gmail-m_2995700720703143231mimeAttachmentHeader"></fieldset>
      <pre class="gmail-m_2995700720703143231moz-quote-pre">_______________________________________________
Dev mailing list    <a class="gmail-m_2995700720703143231moz-txt-link-abbreviated" href="mailto:Dev@ensembl.org" target="_blank">Dev@ensembl.org</a>
Posting guidelines and subscribe/unsubscribe info: <a class="gmail-m_2995700720703143231moz-txt-link-freetext" href="https://lists.ensembl.org/mailman/listinfo/dev_ensembl.org" target="_blank">https://lists.ensembl.org/mailman/listinfo/dev_ensembl.org</a>
Ensembl Blog: <a class="gmail-m_2995700720703143231moz-txt-link-freetext" href="http://www.ensembl.info/" target="_blank">http://www.ensembl.info/</a>
</pre>
    </blockquote>
    <pre class="gmail-m_2995700720703143231moz-signature" cols="72"></pre>
  </div>

_______________________________________________<br>
Dev mailing list    <a href="mailto:Dev@ensembl.org" target="_blank">Dev@ensembl.org</a><br>
Posting guidelines and subscribe/unsubscribe info: <a href="https://lists.ensembl.org/mailman/listinfo/dev_ensembl.org" rel="noreferrer" target="_blank">https://lists.ensembl.org/mailman/listinfo/dev_ensembl.org</a><br>
Ensembl Blog: <a href="http://www.ensembl.info/" rel="noreferrer" target="_blank">http://www.ensembl.info/</a>-<br>
</blockquote></div></div>