<div>I need to obtain the conservation scores (GERP scores) and was able to follow the instruction on the FAQ page and download the emf files for homo sapiens chr16 from Ensembl ftp site.  However, I am having trouble understanding the data.  Here is the first 25 lines of the emf file.  And my questons are:</div>

<div> </div>
<div>1. What does the numbers on the first line mean?  I image that they have something to do with the position, but couldn't figue out how. </div>
<div>2. What are the difference between SCORE aligned Watson reads and Venter reads?  It seems that missing gets assigned a scoe 0, is this correct?  There are instances where the Watson seq is the same as Venter seq, yet they have different scores, what is the reason?  </div>

<div>3. The scores: the references that I've read, it seems that GERP scores have decimal points, yet the scores listed here are all integers.  How are these calculated? </div>
<div> </div>
<div>Much thanks </div>
<div><br clear="all">SEQ human reference 16 60002 80290 1<br>SEQ human Watson WGS<br>SEQ human Venter WGS<br>SCORE aligned Watson reads<br>SCORE aligned Venter reads<br>DATA<br>A ~ A 0 1<br>A ~ A 0 1<br>C ~ C 0 1<br>C ~ C 0 1<br>
C ~ C 0 1<br>T ~ T 0 1<br>A ~ A 0 1<br>A ~ A 0 1<br>C ~ C 0 1<br>C ~ C 0 1<br>C ~ C 0 1<br>T ~ T 0 1<br>A ~ A 0 1<br>A ~ A 0 1<br>C ~ C 0 1<br><br>-- <br></div>
<div>Aijing Zoe Z. Starr</div>
<div>PhD Student</div>
<div>Department of Statistics</div>
<div>North Carolina State Univeristy</div>
<div> </div><br>