<br><font size=2 face="sans-serif">Hi All,</font>
<br>
<br><font size=2 face="sans-serif">One of my users has encountered some odd behaviour when trying to blast a 100MB query sequence against a human genomic sequence database.</font>
<br>
<br><font size=2 face="sans-serif">His message is below, but basically, he's finding he gets different results depending on how many alignments andone-line descriptors he asks to see. &nbsp;The input sequence, database, e-values etc remain constant, it's only the -v and -b options that change.<br>
</font>
<br><font size=2 face="sans-serif">We're using Blastall v2.2.11 (newer one is in testing) on Intel machines running RHEL3.</font>
<br>
<br><font size=2 face="sans-serif">Can anyone point me in an appropriate direction for things to look at please ?</font>
<br>
<br><font size=2 face="sans-serif">Thanks,</font>
<br><font size=2 face="sans-serif">Andrew<br>
<br>
Bioinformatics Advanced Scientific Computing, <br>
Animal Genetics and Genomics, PIRVic Attwood<br>
475 Mickleham Road, Attwood, 3049<br>
ph +61 3 92174342<br>
mob &nbsp;0413 009 761<br>
<br>
<br>
----------------<br>
There are 10 kinds of people...those who understand binary and those who don't.<br>
</font>
<br><font size=1 color=#800080 face="sans-serif">----- Forwarded by Andrew Mather/NRE on 05/01/06 06:08 PM -----</font>
<br>
<br><font size=2 face="sans-serif"><br>
The following problem was discovered with BLAST jobs where you ask for</font><font size=3 face="Times New Roman"> </font><font size=2 face="sans-serif"><br>
different numbers of hits to be presented. </font><font size=3 face="Times New Roman"><br>
</font><font size=2 face="sans-serif"><br>
A 100 MB segement of bovine Chromosome fasta was</font><font size=3 face="Times New Roman"> </font><font size=2 face="sans-serif"><br>
BLASTED onto Human with different -v and -b options to print the &quot;Top&quot;</font><font size=3 face="Times New Roman"> </font><font size=2 face="sans-serif"><br>
hits.</font><font size=3 face="Times New Roman"> <br>
</font><font size=2 face="sans-serif"><br>
The following were all run on -intel ques</font><font size=3 face="Times New Roman"> <br>
</font><font size=2 face="sans-serif"><br>
Consider this where we ask for the top hit only</font><font size=3 face="Times New Roman"> <br>
</font><font size=2 face="sans-serif"><br>
/usr/local/bin/blastall -p blastn -i test.out -d &quot;/blastdb/human_genomic&quot; -e 1e-25 -v 1 -b 1 -a4 -o one.b</font><font size=3 face="Times New Roman"> </font><font size=2 face="sans-serif"><br>
lastn</font><font size=3 face="Times New Roman"> <br>
</font><font size=2 face="sans-serif"><br>
This is what I get</font><font size=3 face="Times New Roman"> <br>
                                                                                                                      </font><font size=2 face="Times New Roman">Score    E</font><font size=3 face="Times New Roman"> </font><font size=2 face="sans-serif"><br>
                            Sequences producing significant alignments:                      (bits) Value</font><font size=3 face="Times New Roman"> <br>
</font><font size=2 face="sans-serif"><br>
ref|NC_000001.8|NC_000001 Homo sapiens chromosome 1, complete se...   224   8e-54</font><font size=3 face="Times New Roman"> <br>
</font><font size=2 face="sans-serif"><br>
Now if I ask for 5 top hits .....</font><font size=3 face="Times New Roman"> <br>
<br>
</font><font size=2 face="sans-serif"><br>
/usr/local/bin/blastall -p blastn -i test.out -d &quot;/blastdb/human_genomic&quot; -e 1e-25 -v 5 -b 5 -a4 -o five.blastn</font><font size=3 face="Times New Roman"> <br>
</font><font size=2 face="sans-serif"><br>
This is what I get</font><font size=3 face="Times New Roman"> <br>
</font><font size=2 face="sans-serif"><br>
                                                                                                                        Score    E</font><font size=3 face="Times New Roman"> </font><font size=2 face="sans-serif"><br>
                             Sequences producing significant alignments:                      (bits) Value</font><font size=3 face="Times New Roman"> <br>
</font><font size=2 face="sans-serif"><br>
ref|NC_000004.9|NC_000004 Homo sapiens chromosome 4, complete se...   281   4e-71</font><font size=3 face="Times New Roman"> </font><font size=2 face="sans-serif"><br>
ref|NC_000001.8|NC_000001 Homo sapiens chromosome 1, complete se...   224   8e-54</font><font size=3 face="Times New Roman"> </font><font size=2 face="sans-serif"><br>
ref|NC_000013.9|NC_000013 Homo sapiens chromosome 13, complete s...   222   3e-53</font><font size=3 face="Times New Roman"> </font><font size=2 face="sans-serif"><br>
ref|NC_000005.8|NC_000005 Homo sapiens chromosome 5, complete se...   214   8e-51</font><font size=3 face="Times New Roman"> </font><font size=2 face="sans-serif"><br>
ref|NC_000009.9|NC_000009 Homo sapiens chromosome 9, complete se...   206   2e-48</font><font size=3 face="Times New Roman"> <br>
</font><font size=2 face="sans-serif"><br>
Note, there is now a hit on Chromosome 4 that is above the top hit on</font><font size=3 face="Times New Roman"> </font><font size=2 face="sans-serif"><br>
Chromosome 1 that was seen previously.  The hit on chromosome 1 is the</font><font size=3 face="Times New Roman"> </font><font size=2 face="sans-serif"><br>
same as was seen previously though.</font><font size=3 face="Times New Roman"> <br>
</font><font size=2 face="sans-serif"><br>
It gets worse ...  what if we ask for the top 7 hits?</font><font size=3 face="Times New Roman"> <br>
</font><font size=2 face="sans-serif"><br>
/usr/local/bin/blastall -p blastn -i test.out -d</font><font size=3 face="Times New Roman"> </font>
<br><font size=2 face="sans-serif">&quot;/blastdb/human_genomic&quot; -e 1e-25 -v 7 -b 7 -a4 -o seven.blastn</font><font size=3 face="Times New Roman"> <br>
</font><font size=2 face="sans-serif"><br>
This is what we get</font><font size=3 face="Times New Roman"> <br>
</font><font size=2 face="sans-serif"><br>
                                                                 Score    E</font><font size=3 face="Times New Roman"> </font><font size=2 face="sans-serif"><br>
Sequences producing significant alignments:                      (bits) Value</font><font size=3 face="Times New Roman"> <br>
</font><font size=2 face="sans-serif"><br>
ref|NC_000004.9|NC_000004 Homo sapiens chromosome 4, complete se...   281   4e-71</font><font size=3 face="Times New Roman"> </font><font size=2 face="sans-serif"><br>
ref|NC_000011.8|NC_000011 Homo sapiens chromosome 11, complete s...   230   1e-55</font><font size=3 face="Times New Roman"> </font><font size=2 face="sans-serif"><br>
ref|NC_000001.8|NC_000001 Homo sapiens chromosome 1, complete se...   224   8e-54</font><font size=3 face="Times New Roman"> </font><font size=2 face="sans-serif"><br>
ref|NC_000013.9|NC_000013 Homo sapiens chromosome 13, complete s...   222   3e-53</font><font size=3 face="Times New Roman"> </font><font size=2 face="sans-serif"><br>
ref|NC_000005.8|NC_000005 Homo sapiens chromosome 5, complete se...   214   8e-51</font><font size=3 face="Times New Roman"> </font><font size=2 face="sans-serif"><br>
ref|NC_000009.9|NC_000009 Homo sapiens chromosome 9, complete se...   206   2e-48</font><font size=3 face="Times New Roman"> </font><font size=2 face="sans-serif"><br>
ref|NC_000023.8|NC_000023 Homo sapiens chromosome X, complete se...   198   5e-46</font><font size=3 face="Times New Roman"> <br>
<br>
</font><font size=2 face="sans-serif"><br>
Now we have a hit on Chromosome 11 that pops up between the top hit on</font><font size=3 face="Times New Roman"> </font><font size=2 face="sans-serif"><br>
Chromosome 4 and our original hit on Chromosome 1.</font><font size=3 face="Times New Roman"> <br>
</font><font size=2 face="sans-serif"><br>
Does it get any worse? I tried the top 10 hits ...</font><font size=3 face="Times New Roman"> <br>
</font><font size=2 face="sans-serif"><br>
/usr/local/bin/blastall -p blastn -i test.out -d &quot;/blastdb/human_genomic&quot; -e 1e-25 -v 10 -b 10 -a4 -o ten</font><font size=3 face="Times New Roman"> </font><font size=2 face="sans-serif"><br>
.blastn</font><font size=3 face="Times New Roman"> <br>
</font><font size=2 face="sans-serif"><br>
Here are the results</font><font size=3 face="Times New Roman"> <br>
</font><font size=2 face="sans-serif"><br>
                                                                 Score    E</font><font size=3 face="Times New Roman"> </font><font size=2 face="sans-serif"><br>
Sequences producing significant alignments:                      (bits) Value</font><font size=3 face="Times New Roman"> <br>
</font><font size=2 face="sans-serif"><br>
ref|NC_000004.9|NC_000004 Homo sapiens chromosome 4, complete se...   281   4e-71</font><font size=3 face="Times New Roman"> </font><font size=2 face="sans-serif"><br>
ref|NC_000011.8|NC_000011 Homo sapiens chromosome 11, complete s...   230   1e-55</font><font size=3 face="Times New Roman"> </font><font size=2 face="sans-serif"><br>
ref|NC_000001.8|NC_000001 Homo sapiens chromosome 1, complete se...   224   8e-54</font><font size=3 face="Times New Roman"> </font><font size=2 face="sans-serif"><br>
ref|NC_000013.9|NC_000013 Homo sapiens chromosome 13, complete s...   222   3e-53</font><font size=3 face="Times New Roman"> </font><font size=2 face="sans-serif"><br>
ref|NC_000005.8|NC_000005 Homo sapiens chromosome 5, complete se...   214   8e-51</font><font size=3 face="Times New Roman"> </font><font size=2 face="sans-serif"><br>
ref|NC_000009.9|NC_000009 Homo sapiens chromosome 9, complete se...   206   2e-48</font><font size=3 face="Times New Roman"> </font><font size=2 face="sans-serif"><br>
ref|NC_000008.9|NC_000008 Homo sapiens chromosome 8, complete se...   202   3e-47</font><font size=3 face="Times New Roman"> </font><font size=2 face="sans-serif"><br>
ref|NC_000023.8|NC_000023 Homo sapiens chromosome X, complete se...   198   5e-46</font><font size=3 face="Times New Roman"> </font><font size=2 face="sans-serif"><br>
ref|NC_000002.9|NC_000002 Homo sapiens chromosome 2, complete se...   198   5e-46</font><font size=3 face="Times New Roman"> </font><font size=2 face="sans-serif"><br>
ref|NC_000014.7|NC_000014 Homo sapiens chromosome 14, complete s...   194   7e-45</font><font size=3 face="Times New Roman"> <br>
<br>
</font><font size=2 face="sans-serif"><br>
No more hits jumping in near the top... but we do have a hit that pops</font><font size=3 face="Times New Roman"> </font><font size=2 face="sans-serif"><br>
in between 9 and X (8).</font><font size=3 face="Times New Roman"> <br>
</font><font size=2 face="sans-serif"><br>
So what is going on?  The same BLAST job on the same machine ... just</font><font size=3 face="Times New Roman"> </font><font size=2 face="sans-serif"><br>
changing the -v and -b option to pick the number of hits to display.</font><font size=3 face="Times New Roman"> </font>
<br>
<br>