Table 14.3. Positional weight matrices (profiles) for a variety of features associated with human genes. Positions are labeled by various biological conventions. Entries are probabilities. Intron profiles are for low %G+C loci. All data are taken from Zhang (1998). Branch profile -5 -4 -3 -2 -1 0 +1 A 0.25 0.25 0.00 0.00 0.39 1.00 0.18 C 0.19 0.22 0.60 0.02 0.24 0.00 0.33 G 0.15 0.17 0.00 0.00 0.32 0.00 0.03 T 0.41 0.36 0.40 0.98 0.05 0.00 0.46 5' Splice site profile (low G+C): -3 -2 -1 0 +1 +2 +3 +4 +5 A 0.38 0.62 0.12 0.00 0.00 0.71 0.73 0.11 0.21 C 0.31 0.10 0.04 0.00 0.00 0.02 0.06 0.06 0.10 G 0.18 0.12 0.77 1.00 0.00 0.24 0.08 0.75 0.14 T 0.13 0.16 0.07 0.00 1.00 0.03 0.13 0.08 0.55 3' Splice site profile (low G+C): -15 -14 -13 -12 -11 -10 -9 -8 -7 -6 -5 -4 -3 -2 -1 0 +1 A 0.15 0.14 0.13 0.11 0.10 0.10 0.11 0.12 0.13 0.11 0.10 0.26 0.07 1.00 0.00 0.26 0.24 C 0.24 0.21 0.20 0.22 0.21 0.22 0.25 0.28 0.28 0.25 0.22 0.25 0.55 0.00 0.00 0.11 0.15 G 0.10 0.12 0.10 0.09 0.10 0.09 0.10 0.10 0.08 0.05 0.05 0.15 0.01 0.00 1.00 0.50 0.20 T 0.51 0.53 0.57 0.58 0.59 0.59 0.54 0.50 0.51 0.59 0.63 0.33 0.37 0.00 0.00 0.13 0.41 TATA box profile -3 -2 -1 0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +10 +11 A 0.12 0.06 0.69 0.02 0.70 0.57 0.69 0.42 0.24 0.13 0.20 0.18 0.19 0.18 0.15 C 0.39 0.22 0.04 0.15 0.06 0.06 0.09 0.05 0.18 0.35 0.36 0.31 0.32 0.30 0.30 G 0.35 0.15 0.07 0.11 0.12 0.05 0.16 0.26 0.46 0.41 0.34 0.34 0.31 0.35 0.36 T 0.14 0.57 0.20 0.72 0.12 0.32 0.07 0.27 0.12 0.12 0.11 0.17 0.17 0.18 0.19 Start site profile -9 -8 -7 -6 -5 -4 -3 -2 -1 0 +1 +2 +3 A 0.21 0.15 0.21 0.21 0.18 0.24 0.57 0.31 0.15 1.00 0.00 0.00 0.26 C 0.28 0.38 0.38 0.24 0.35 0.49 0.05 0.43 0.53 0.00 0.00 0.00 0.20 G 0.31 0.27 0.22 0.42 0.27 0.22 0.36 0.17 0.27 0.00 0.00 1.00 0.41 T 0.19 0.20 0.19 0.13 0.20 0.05 0.02 0.10 0.04 0.00 1.00 0.00 0.10