#NEXUS [saved by seaview on Fri Jan 19 12:53:01 2018] BEGIN DATA; DIMENSIONS NTAX=67 NCHAR=1810; FORMAT DATATYPE=DNA GAP=- ; MATRIX [1] A4 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACCGAGT-TCACGCCCTCAC-GGGTA GA---CCTCCAACCC-TTGTGTA-TCTCTACCATGTTGCTTTGGCAGGCTGCTCGACCCT TC--CGGG--GACAGCCTCAGCGCCCTCCGGGG--CCGGAGAGTCGCCTGCCGGAGGAAA ATCACAACTCTGAATTGTCAGTGTCGTCTGAGTGACTATCT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAGCTCTCTGCTTGGTATTGG GCC--T-CCGCCGGTCACACGGCGGGCCTTAAAGTCAGTGGCGGCGCCGCTGGGTCCTGA ACGTAGTAACACATACCTCTCGTTACAGGGTCCCCGCGCGCTCCCG-CCGTAAAA-CCCC CCTCATTTTCTCTGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTTGTAAGTTCT-------CCTTTAC-TATCCTACTAT TTCAGCCCTTTGCGAAGTTGGCATAGCTATTTTCAAAAACTT---------AG-AA-GCT AATGG-TTGGGACTTAACAGGACAAGAATGGTGACGGTCAGTAC-TCCTTCTTCAAGCTA TATCCGAATTGTTTCTG-T----CGCATATTGGGTT-GG------TCATATCCGCCTTTA TTCGATTTACCCCTTTT---GCATACAATGATCGGAC-GGACGAC-GAGGCTTGGACCAC TATCGCGACCT------------TGAATATCATGCTGATGGGTAGCGTCA-AGGACAAAT TACTAGCAAGGAGCTGGGCACCGTTATGCGATCCCTTGGCCAAAATCCCTCAGAGTCTGA GCTTCAGGATATGATCAACGAGGTTGACGCTGATAACAACGGCACCATTGACTTCCCGGG TATGACATAACAT-TATATA--TGATGGTTCGGG--CTGTAGACTGACGTTTGCAAAACT GTAGAATTTCTCACCATGATGGCCAGAAAGATGAAGCCGACCGTTGAAGTTAATGCGTAC ACTTGCGATCGATGCGGTTGCGAAATCTTCCAACCTGTTGGAT-CCAAAACGTTCGGACC TTTGGTAGAATGCCCGTCGCCAGACTGCAAGGTCAACCAAACCAAGGGACAATTACATCA TTCCACTAGGGCATCGAAATTCCAGCCATTCCAGGAAGTCAAGATTCAAGAGATGGCCGA ACAAGTACCAGTTGGTCATATTCCGAGAATGTTAACTGTCCTCTGCCATGGAGCGCTTGT TCGTCGTATCAACCCGGGGGATGTCGTTGATGTCGCCGGCATATTCTTGCCTACCCCCTA CACTGGTTTCAAGGCGATAAGAGCTGGCCTTCTTACCGACACATATCTGGAAGCACAACA TGTCACCCAGCACAAGAAGGCATATGAAGATCTTACCATTGATAGCCGCGTGTTTAGACG GATTGAACAGTACAGAACTTCCGGTCACGTGTATGAGTACCTCGCCAAATCTATCGCTCC TGAGATCTACGGTCATCTCGATGTGAAGAAGGCATTACTCTTGTTATTGGTTGGTGGTGT G--ACAAAGGAAATGGGAGATGGTATGCG-C-ATCAGAGGTGACATCAACATTTGTCTAA TGGGAGACCC [2] BC14 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACCGAGT-TCACGCCCTCAC-GGGTA GA---CCTCCAACCC-TTGTGTA-TCTCTACCATGTTGCTTTGGCCGGCTGCTCGACCCT TC--GGGG--GACAGCCTCAGCGCCCTCCGGGG--CCCGAGAGTCGCCGGCCGGAGGAAA ACCACAACTCTGAATTGTCAGTGTCGTCTGAGTGACTATCT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCTGCTTGGTCTTGG GCC--T-GCGCCGGTCACACGGCGGGCCTCAAAGTCAGTGGCGGTGCCGCTGGGTCCTGA ACGTAGTAACACATACCTCTCGTTACAGGGTCCCCGCGCGCGCCCG-CCGTAAAACCCCC CCTCATTTTCGCTGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCC-CTTTGTAAGTTCT-------CCTTTAC-CATCCTACCAT TTCTGCCCTTTGCGAAGTTGGCATAGCCATTTTAAAAAACTT---------AG-AA-GCT AATGG-TTGGGACTTAACAGGACAAGAATGGCGACGGTCAGTAC-CCCTTCTTCAAGCCA CATCCGAATTGTTTCTG-T----CGCATATTGGGTTGGG------TCATATCTGCCTTTA TTCGATTTACCCCTTTT---GCATACAATGATCGGAC-GGACGAC-GAGGCTTGGACCAC TATCGTGACCT------------TGAATATCATGCTGATGGGTAGCTTCA-GGGACAAAT TACTAGCAAGGAGCTGGGCACCGTTATGCGATCCCTTGGCCAAAATCCCTCAGAGTCTGA GCTTCAGGATATGATCAACGAGGTTGACGCTGATAACAACGGCACCATTGACTTCCCGGG TATGATATAACAT-TATATA--TGATGGTCCGGG--CTGTGGACTGACGTTTGCAAAACC GTAGAATTTCTCACCATGATGGCCAGAAAGATG??????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ?????????? [3] Bcinerea_B0510 ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ?????????????????????TGTCGTCTGAGT-ACTATAT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTTAGCTTGGTATTGA GTC--T-ATGTCAGT--AATGGCAGGCTCTAAAATCAGTGGCGGCGCCGCTGGGTCCTGA ACGTAGTAATA----TCTCTCGTTACAGGTTCTCGGTGTGCTTCTG-CCAAAAC----CC AAA-TTTTTCTATGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTTGTACGTTGA-------TATTCCC-TACTTGATACT CTCAGCCCTATGGACACTTGGCAGGG-CATATTTGAAGATTT---------GA-AA-GCT AATAG-CTGTGACTCTACAGGACAAGAATGGTGATGGTTCGTAC------TTCCATATTA TTCCTTTGAAATTGCAGATC--TCGAATATCCTCCTGTGTTTACACACTTGCCCTCTCGA CCGCCCCAGCCCCTATCTC------GAACAATTGTAC-CAATAAT-GGGGACAGCGACGC AAATCGGCAGA-ACAATGTAG---AGAGACAGCACTGATATATGGATCTATAGGACAAAT CACTAGCAAGGAGTTGGGAACCGTCATGCGATCCCTTGGTCAAAACCCTTCCGAGTCCGA GTTGCAAGACATGATCAACGAGGTCGATGCTGACAACAACGGTACCATTGATTTCCCAGG TATGGCGCAACAC-AATAAAGCTCATGACTTAAA------ATGCTGA--------CGCGA CCAGAATTTCTTACTATGATGGCCAGAAAGATGAAGCCCACCGTCGAGGTCAACGCCTAC ACCTGCGACCGCTGCGGCTGCGAGATCTTCCAGCCCGTCGGCT-CCAAGACCTTCGGCCC CCTCGTCGAGTGCCCCTCCCCCGACTGCACCACCAACCAGACCAAGGGCCAGCTCCACCA CTCCACCCGCGCCTCCAAGTTCCAGCCCTTCCAGGAGATCAAGATCCAGGAGATGGCCGA GCAGGTCCCCGTCGGCCACATCCCCCGCATGCTCACCGTCCTCTGCCACGGCGCCCTCGT CCGCCGCATCAACCCCGGCGACGTCGTCGACATCGCCGGCATCTTCCTCCCCACCCCCTA CACCGGCTTCAAGGCCATCCGCGCCGGCCTCCTCACCGACACCTACCTCGAGGCCCAGCA CGTCACCCAGCACAAGAAGGCCTACGAGGACCTCACCATCGACTCCCGCGTCTTCAAGCG CATCGAGCAGTACCGCGCCTCCGGCCACGTCTACGAGTACCTCGCCAAGTCCATCGCCCC CGAGATCTACGGCCACCTCGACGTCAAGAAGGCCCTCCTCCTCCTCCTCGTCGGCGGCGT C--ACCAAGTCCATGGGCGACGGCATGCG-C-ATCCGCGGCGACATCAACATCTGCCTCA TGGGCGACCC [4] CBS110160 ACCGTTCCGTAGGTGAACCTGCGGAAGGATCATTACAGAGT-TCATGCCCGAAA-GGGTA GA---CCTCCCACCC-TTGTGTA-TTATTACTTTGTTGCTTTGGCGAGCCGCCTTC---- ------------------------------GGG--CCTTGTA--TGCTCGTCAGAGGCCT ATAA-AACTCT-TTTTATTAATGTCGTCTGAGT-ACTATAT---AATAGTTAAAACTTTC AACAACGGATCTCCTGGTTCTGGCATCGATGAAGAATGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CACTGCTTGGTATTGA GCC--CTATGTCAGA--AATGGCAGGCTCTAAAATCAGTGGCGGCGCCGCTGGGTCCTGA ACGTAGTAATA----TCTCTCGTTACAGGCTCTCAGTGTGCTTCTG-CCAAAAC----CC CAAATTTTTTTATGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTTGTAAGTCCA-------TCTTTAC-AGCACTACTTT CTCAGCCCTATGGATCATGGGGAGGA-GATATTTGAAGACCTAGAGAATAGAG-AG-GCT AATAATTTGTGACTTTATAGGACAAGAACGGTGATGGTTCGTAT------TTTCAAATTA TACATTCGGTGTCGCAGAT----CAACTATCCTCCTTTACCTGCATTCTCCCTATTT--- -CGCTCCAGCCCCTATCTC------AAATTATTGGACTCGACAAC-GAGGACAACATTAC TATCACACATGAAGAACAAAC---GAGGATATAGCTGATATGAGAATCCATAGGACAAAT TACTAGCAAAGAATTGGGTACCGTTATGCGATCCCTTGGACAAAACCCTTCCGAGTCAGA ATTGCAAGACATGATCAACGAGGTTGATGCCGATAACAACGGTACCATCGATTACCCAGG TATGATACATCTC-GAGATGGTTCATGACTCACA------AAGCTGA--------TATGA TTAGAATTTCTTACCATGATGGCCAGAAAGATG??????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ?????????? [5] CBS11117 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACAGAGT-TCATGCCCGAAA-GGGTA GA---CCTCCCACCC-TTGTGTA-CTATTACTTTGTTGCTTTGGCGAGCTGCTCTTCG-- ------------------------------GGG--CCTTGTA--TGCTCGCCAGAGAATA TCAA-AACTCT-TTTTATTAATGTCGTCTGAGT-ACTATAT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCAGCTTGGTATTGA GTC--C-ATGTCAGT--AATGGCAGGCTCTAAAATCAGTGGCGGCGCCGCTGGGTCCTGA ACGTAGTAATA----TCTCTCGTTACAGGTTCTCGGTGTGCTTCTG-CAAAAAA----CC CAA--TTTTCTATGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTTGTAAGTTCA-------TCTCCCTGACTTTTATAAT CTCAGCCCTATGGACACTTGGCAGGG-TATATTTGGAGATTT---------GG-TA-GCT AATAATGTATGACTCTACAGGACAAGAATGGCGATGGTTAGTAA------TTTCAGGTTA TACTTTCCATGTCCCAGAT----CGACTCTCCTCTTTTATGTAGATGCTAGACATCTTGA CCGACACCGCCCCTATCTC------GAGCAATTGTAC-CGACAAA-GGGGGGAGCAACAC GATTGAGCATG-ATGACAC------AGGACAGGGCTGATGTATAAATCCATAGGACAAAT TACTAGCAAGGAGTTGGGTACCGTTATGCGATCCCTTGGACAAAACCCCTCCGAGTCTGA GTTGCAAGACATGATCAATGAGGTTGATGCCGATAACAACGGTACCATTGATTTCCCAGG TACGGCTAAGCAT-GACATAGTTTATGACTCATA------AAGCTAA--------TGGGA GTAGAATTCCTCACCATGATGGCCAGAAAGATGAAGCCAGCCGTGGAAGTCAACGCATAC ACTTGTGATAGATGCGGTTGTGAGATATTTCAGCCCGTCGGGT-CCAAGACCTTTGGACC ATTAGTCGAATGCCCTTCTCCTGACTGTACTACCAACCAAACCAAAGGGCAACTCCATCA CTCCACTCGAGCCTCAAAATTCCAGCCATTTCAAGAGGTTAAAATTCAGGAAATGGCCGA ACAAGTTCCAGTTGGTCACATTCCTCGAATGCTAACTGTTCTTTGCCATGGAGCTTTAGT ACGACGTATAAATCCTGGAGATGTTGTTGATATTGCAGGAATTTTCTTACCTACTCCATA TACTGGTTTCAAAGCCATCAGAGCTGGTCTTCTTACCGATACGTATCTTGAGGCACAACA CGTCACTCAACATAAAAAGGCTTACGAAGATTTAACGATTGATAGCCGAGTATTCAAGCG AATTGAGCAATACAGAGCCTCTGGTCACGTTTACGAATACCTTGCAAAATCTATCGCGCC TGAAATTTACGGACACTTGGATGTGAAGAAGGCATTACTTTTGTTATTGGTCGGTGGTGT T--ACTAAAACTATGGGTGATGGAATGCG-A-ATTAGGGGTGATATCAATATCTGTTTGA TGGGGAGACC [6] CBS111547 ACCGTTCCGTAGGTGAACCTGCGGAAGGATCATTACAGAGT-TCATGCCCTAAC-GGGTA GA---CCTCCCACCC-TTGTGTA-TTTATACTTTGTTGCTTTGGCGAGCTGCTCTGGGCC TT--ACAG-CTTAGAGCCCCAGGCTTTC--GAG--CCTGAGAGTCGTTCGCCGAAGGAAA AATA-AACCCT-GATAATTATTGTCGTCTGAGT-ACTATAT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTTAGCTTGGTATTGG GCT----TCGTCGGTAACACGACGGGCCTTAAAATCAGTGGCGGCGCCGTTGGGTCCTGA ACGTAGTAATA----TATTTCGTTACAGGTGCCTCGCGTGCTTCTG-CCATTAAA---CC CCCAATTTTTTATGG-TGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTTGTAAGTTCT-------CCTTTAC-TATCCTGCTAT TTCAGCCCTTTGCGAAGTTGGCATAGCTATTTTCAAAAACTT---------AG-AA-GCT AGTGG-TTGGGACTTAACAGGACAAGAATGGTGACGGTCAGTAC-TCCTTCTTCAAGCTA TATCCGAATTGCTTCTG-T----CGCATATCGGGTTGGG------TCATATCTGCCTTTA TTCGATTTACCCCTTTT---GCATACAATGATCGGAC-GGACGAC-GAGGCTTGGACCAC TATCGCGACCT------------TGAATATCATGCTGATGGGTAGCTTCA-AGGACAAAT TACTAGCAAGGAGCTGGGCACCGTTATGCGATCCCTTGGCCAAAATCCCTCAGAGTCTGA GCTTCAGGATATGATCAACGAGGTTGACGCTGATAACAACGGCACCATTGACTTCCCGGG TATGACACAACAT-TATATA--TGATGGTTCGGG--CTGTAGACTGACGTTTGCAAAACT GTAGAATTTCTCACCATGATGGCCAGAAAGATG??????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ?????????? [7] CBS111549 ACCGTTCCGTAGGTGAACCTGCGGAAGGATCATTACAGAGT-TCATGCCCTAAC-GGGTA GA---CCTCCCACCC-TTGTGTA-TTTATACTTTGTTGCTTTGGCGAGCTGCTCTGGGCC TT--ACAG-CTTAGAGCCCCAGGCTTTC--GAG--CCTGAGAGTCGTTCGCCGAAGGAAA AATA-AACCCT-GATAATTATTGTCGTCTGAGT-ACTATAT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTTAGCTTGGTATTGG GCT----TCGTCGGTAACACGACGGGCCTTAAAATCAGTGGCGGCGCCGTTGGGTCCTGA ACGTAGTAATA----TATTTCGTTACAGGTGCCTCGCGTGCTTCTG-CCATTAAA---CC CCCAATTTTTTATGG-TGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTATTCGTAAGTCCT-------CCGCTAC-CATCCTGCTAT TTCAGCCCTATGTGAACTTGGCATAGGCATCGTCAAACACTT---------GGAAA-GCT GATGT-GCGGGACTTAACAGGACAAGAATGGCGACGGTCAGTACTCTCTTCCGCAAGGCA CACCGGATTTCTGTCTG-T----CGCATGCTGCATTGGG-------ACATGTCCACTCTA CTCGATTTACCCCTTTTTC-GCATGCACTGAGCAGAC-AGACGAC-AAGGCGTGGACCAC GATCGCGATCT------------TGAATATCATGCTGATGGATAGCTTCA-AGGACAAAT TACTAGCAAGGAGTTGGGGACTGTTATGCGATCCCTTGGCCAAAATCCTTCAGAGTCTGA GCTTCAGGATATGATCAACGAGGTTGACGCTGATAACAACGGCACCATCGACTTCCCGGG TATGACATAACAT-TATATA--TGATGGTTCGGG--CTGTGGACTGACGTTTGCAAAACT GTAGAATTTCTCACCATGATGGCCAGAAAGATGAAGCCAACTGTAGAAGTCAATGCTTAT ACTTGCGACCGATGTGGATGCGAAATCTCCCAACCAGTTGGGT-CTAAGAGTTTTGGGCC TTTGGAAGAGTGCCCATCCAAAGACTGCACGACGAATCAGACAAAAGGACAACTGCATCA TTCTACCAGAGCTTCAAAATTCCAGCCATTCCAAGAAGTGAAGATACAGGAAATGGCTGA ACAAGTTCCAGTCGGTCACATTCCTCGAATGCTCACGATTATTTGCCATGGAGCACTTGT TCGTCGTATCAATCCGGGAGATGTCGTCGATGTTGCAGGCATCTTCTTGCCCACTCCCTA CACTGGTTTTAAAGCGATTAAAGCCGGTCTCCTTACTGATACATACTTGGAAGCACAACA TGTTACTCAGCACAAGAAAGCGTATGAAAATCTTACTATAGATCGGCGAGTTTTCAAACG AATCGAACAATACCGAAGTTCAGGTCATGTTTATGAATATCTTGCAAAGTCTATTGCCCC TGAGATTTATGGTCATTTAGATGTAAAGAAAGCACTTCTCCTATTGTTAGTAGGCGGTGT C--ACCAAAGAGATGGGTGATGGTATGCG-T-ATCAGAGGTGACATTAACATCTGTTTGA TGGGTGACCC [8] CBS11217 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACAGAGT-TCATGCCCGAAA-GGGTA GA---CCTCCCACCC-TTGTGTA-CTATTACTTTGTTGCTTTGGCGAGCTGCTCTTCG-- ------------------------------GGG--CCTTGTA--TGCTCGCCAGAGAATA TCAA-AACTCT-TTTTATTAATGTCGTCTGAGT-ACTATAT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCAGCTTGGTATTGA GTC--C-ATGTCAGT--AATGGCAGGCTCTAAAATCAGTGGCGGCGCCGCTGGGTCCTGA ACGTAGTAATA----TCTCTCGTTACAGGTTCTCGGTGTGCTTCTG-CAAAAAA----CC CAA--TTTTCTATGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTTGTAAGTTCA-------TCTCCCTGACTTTTATAAT CTCAGCCCTATGGACACTTGGCAGGG-TATATTTGGAGATTT---------GG-TAGGCT AATAATGTATGACTCTACAGGACAAGAATGGCGATGGTTAGTAA------TTTCAGGTTA TACTTTCCATGTCCCAGAT----CGACTCTCCTCTTTTATGTAGATGCTAGACATCTTGA CCGACACCGCCCCTATCTC------GAGCAATTGTAC-CGACAAA-GGGGGGAGCAACAC GATTGAGCATG-ATGACAC------AGGACAGGGCTGATGTATAAATCCATAGGACAAAT TACTAGCAAGGAGTTGGGTACCGTTATGCGATCCCTTGGACAAAACCCCTCCGAGTCTGA GTTGCAAGACATGATCAATGAGGTTGATGCCGATAACAACGGTACCATTGATTTCCCAGG TACGGCTAAGCAT-GACATAGTTTATGACTCATA------AAGCTAA--------TGGGA GTAGAATTCCTCACCATGATGGCAAGAAAGATG??????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ?????????? [9] CBS11586 ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ?????????????????????????????????AAGCCAACTGTAGAAGTCAATGCTTAT ACTTGTGACCGATGTGGATGCGAAATCTTCCAACCTGTCGGGT-CTAAGACTTTTGGGCC TTTGGAAGAGTGCCCATCCAAGGATTGTACGACTAATCAGACTAAAGGACAACTGCATCA TTCTACCAGAGCATCAAAATTTCAGCCATTCCAAGAAGTGAAGATACAGGAAATGGCTGA ACAAGTCCCAGTGGGTCATATTCCTCGAATGCTCACAATCATTTGCCATGGAGCACTTGT TCGTCGTATCAATCCGGGAGACGTCGTTGATGTTGCAGGAATATTCTTGCCCACCCCATA CACTGGCTTCAAAGCGATTAGAGCCGGTCTTCTTACTGATACATACTTGGAAGCACAACA CGTTACTCAGCACAAGAAAGCGTATGAAGATCTTACTATCGATCCACGAGTTTTCAAACG AATTGAACAATACAGAAGTTCAGGTCATGTTTACGAATATCTTGCAAAGTCTATTGCCCC TGAAATTTATGGCCATTTAGATGTAAAGAAAGCACTTCTCTTATTGTTAGTAGGCGGCGT C--ACCAAAGAGATGGGTGATGGTATGCA-T-ATCAGAGGTGACATTAACATTTGTTTGA TGGGTGACCC [10] CBS115928 ACCGTTCCGTAGGTGAACCTGCGGAAGGATCATTACAGAGT-TCATGCCCTAAC-GGGTA GA---CCT-CCACCC-TTGTGTA-TTTATACTTTGTTGCTTTGGCGAGCTGCCCTGGGCT TA--ATTG-CCCAGAGCCCCAGGCTTTC--GAG--CCTGAGAGTCGTTCGCCGAAGGAAA ACTA-AACCCT-GATAATTATTGTCGTCTGAGT-ACTATAT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTTAGCTTGGTATTGG GCT----TCGTCAGTAAAATGGCGGGCTTTAAAATCAGTGGCGGCGCCACTAGGCCCTGA ACGTAGTAATA----TATTTCGTTATAGGTGTCTGGTGTGCTTCTG-CCATTAAA---CC CCCAATTTTTTATGG-TGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATA?? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ?????????????????????????????????AAGCCAACTGTAGAAGTTAATGCTTAT ACTTGTGATCGATGTGGTTGCG-AATATTCCAGCCTGTTGGCT-CTAAGACCTTTGGACC TTTGGAAGAGTGCCCATCCAAAGATTGCACAACGAATCAAACTAAAGGACAACTACATCA TTCTACCAGAGCTTCGAAATTTCAGCCATTTCAAGAAGTGAAGATCCAGGAAATGGCCGA ACAAGTTCCAGTTGGGCACATTCCTCGAATGCTCACTATCATCTGCCATGGAGCTCTCGT CCGCCGTATCAACCCGGGAGACGTCGTCGACGTTACTGGAATCTTCTTGCCCACCCCCTA CACCGGGTTCAAAGCGATCAGGGCTGGTCTTCTTACTGATACGTACTTGGAAGCACAACA TGTTACTCAGCATAAGAAAGCATATGAAGATCTCACTATAGATCCACGAGTTTTCAAACG AATCGAACAATACCGAAGTTCGGGTCATGTTTACGAGTATCTTGCAAAATCTATTGCTCC CGAGATTTATGGTCATTTAGATGTAAAGAAAGCACTCCTCTTATTGTTAGTAGGTGGTGT C--ACTAAAGAGATGGGTGATGGTATGCG-A-ATCAGAGGTGACATTAACATCTGTTTAA TGGGAGACCC [11] CBS115975 ACCGTTCCGTAGGTGAACCTGCGGAAGGATCATTACAGAGT-TCATGCCCTAAC-GGGTA GA---CCT-CCACCC-TTGTGTA-TTTATACTTTGTTGCTTTGGCGAGCTGCCCTGGGCT TA--ATTG-TCCAGAGCCCCAGGCTTTC--GAG--CCTGAGAGTCGTTCGCCGAAGGAAA ACTA-AACCCT-GATAATTATTGTCGTCTGAGT-ACTATAT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTGAGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCCTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--GTTAGCTTGGTATTGG GCT----TGGTCAGTAAAATGACGGGCTTTAAAATCAGTGGCGGCGCCACTAGGCCCTGA ACGTAGTAATA----TATTTCTTTATAGGTGTCTAGTGTGTT?????????????????? ??????????????????????????????????????????????????????????GA GTTCAAGGAGGCCTTCTCCCTCTTTGTAAGTTGA-------TTTCAAC-AATTTTGAAAT CTCAGCCTTATGGAAACTTGGCAGGA---GAACCTACGTCTT---------GG-TA-GCT AACAACGTGTAATCGCGCAGGATAAAAATGGCGACGGTTAGTAC------TACGAATTCC TAACTTCCTA-------------TCGAGATCCTATCGAATCTTGGAGTTTACTGCTTCTT ACGAATAAATCCCCCTTTTTTCTTCAGCTATGCGTGG-AGACGAC-GAG----------C AGTTAGGCATC-AGCAGAAATATCGAACATAATACTGATACGTGGTATAAAAGGACAAAT CACCAGCAAGGAATTGGGAACCGTTATGCGATCCCTTGGTCAAAATCCATCCGAGTCTGA ACTTCAAGACATGATCAACGAGGTTGATGCTGATAACAATGGCACCATCGACTTTCCAGG TACGATACGGTCT-TTGAGT--CTTTCGCTCAGGGATGGCGAGCTGA--------TTTGA TTAGAATTCCTTACCATGATGGCCAGAAAGATGAAGCCAACTGTAGAAGTTAATGCTTAT ACTTGTGATCGATGTGGTTGCGAAATATTCCAGCCTGTTGGCT-CTAAGACCTTTGGACC TTTGGAAGAGTGCCCATCCAAAGATTGCACAACGAATCAAACTAAAGGACAACTACATCA TTCTACCAGAGCTTCGAAATTACAGCCATTTCAAGAAGTGAAGATCCAGGAAATGGCCGA ACAAGTTCCAGTCGGGCACATTCCTCGAATGCTCACTATCATCTGCCATGGAGCTCTCGT CCGCCGTATCAACCCGGGAGACGTCGTCGACGTTGCTGGAATCTTCTTGCCCACCCCCTA CACCGGATTCAAAGCGATCAGGGCTGGTCTTCTTACTGATACGTACTTGGAAGCACAACA TGTTACTCAGCATAAGAAAGCATATGAAGATCTCACTTTAGATCCACGAGTTTTCAAACG AATCGAACAATACCGAAGTTCGGGTCATGTTTACGAGTATCTTGCAAAATCTATTGCTCC CGAAATTTATGGTCATTTAGATGTAAAGAAAGCACTCCTCTTATTGTTAGTAGGTGGTGT C--ACTAAAGAGATGGGTGATGGTATGCG-A-ATCAGAGGTGACATTAACATCTGTTTAA TGGGTGATCC [12] CBS11724 ??????????????????????????GGATCATTACAGAGT-TCATGCCCGAAA-GGGTA GA---CCTCCCACCC-TTGTGTA-TTATTACTATGTTGCTTTGGCGAGCTGCCTTC---- ------------------------------GGG--CCTAAGC--GTCTCGCCAGAGGATA TCAA-AACTCT-TTTTATTAATGTCGTCTGAGT-ACTATAT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCTGCTTGGTATTGA GCC--T-ATGTCAGT--AATGGCAGGCTTTAAAATTAGTGGCGGTGCCGCTGGGTCCTGA ACGTAGTAATA----TCTCTCGTTACAGGTTCTCAGTGTGCCTCTG-CCAAAAC----CC AAA-TTTTTCTATGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATA?? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ?????????? [13] CBS11947 ????????????????????????????????TTACAGAGT-TCATGCCCGAAA-GGGTA GA---CCTCCCACCC-TTGTGTA-TTATTACTTTGTTGCTTTGGCGAGCTGCCTTC---- ------------------------------GGG--CCTTGTA--TGCTCGCCAGAGAAAA CCAA-AACTCT-TTTTATTAATGTCGTCTGAGT-ACTATAT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTTAGCTTGGTATTGA GTC--T-ATGTCAGT--AATGGCAGGCTCTAAAATCAGTGGCGGCGCCGCTGGGTCCTGA ACGTAGTAATA----TCTCTCGTTACAGGTTCTCGGTGTGCTTCTG-CCAAAAC----CC AAA-TTTTTCTATGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTTGTACGTTAA-------TATTCTC-ACCTTAGTACT CTCAGCCCTATGGACACTAGGCAGGG-CATATTTGAAGATTTGAAGATTT-GA-AA-GCT AATAAGCCGTGACTTTACAGGACAAGAATGGTGATGGTTCGTAC------TCCCATATTA TTCCTTTGACATTGCAGATC--TCGGAAATCCCCCTGTGTTCACATACTTGCCCTCTCGA CCAACTCAACCCCTATCTC------GAACAATTGTAA-CAACAATGGGGGACAACCACAC AAATTGGCGGA-ACAATATTG---AAGGACAGCACTGATATATGGATCTACAGGACAAAT CACTAGCAAGGAGTTGGGCACTGTTATGCGATCCCTTGGTCAAAACCCTTCCGAGTCCGA GTTGCAAGACATGATCAACGAGGTCGATGCTGACAACAACGGTACCATTGATTTCCCAGG TATGGCGCAACAC-AATGAAATTAACGACTCAGG------ATGCTGA--------CGCGA TTAGAATTTCTTACCATGATGGCCAGAAAGATGAAGCCGACTGTGGAAGTAAACGCATAT ACTTGTGATAGATGTGGTTGCGAGATTTTCCAGCCCGTTGGAT-CCAAGACATTCGGGCC ATTAGTTGAATGTCCTTCTCCCGATTGTACTACGAATCAGACCAAAGGACAACTCCATCA TTCCACTCGAGCCTCAAAATTCCAGCCATTCCAAGAAATCAAGATCCAGGAAATGGCCGA ACAAGTCCCAGTTGGTCACATTCCTCGAATGTTGACTGTCCTATGCCACGGAGCTCTAGT TCGACGTATCAATCCTGGAGATGTTGTCGATATTGCAGGAATTTTTCTCCCTACACCATA TACTGGTTTCAAAGCCATTAGAGCTGGTCTTCTCACTGATACATATCTCGAGGCACAGCA CGTCACTCAACACAAGAAGGCTTACGAAGATTTAACTATTGATAGCCGAGTTTTCAAGCG AATTGAGCAATACAGAGCATCTGGCCATGTTTACGAATACCTTGCAAAATCCATCGCGCC TGAAATTTACGGTCATTTAGATGTGAAGAAAGCATTACTTTTATTGTTGGTCGGTGGTGT T--ACTAAAAGTATGGGTGATGGAATGAG-A-ATCAGAGGTGATATCAATATCTGTCTGA TGGGAGACCC [14] CBS13031 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACAGAGT-TCATGCCCGAAA-GGGTA GA---CCTCCCACCC-TTGTGTA-TTATTACTTTGTTGCTTTGGCGAGCTGCCTTC---- ------------------------------GGG--CCTTGTA--TGCTCGTCAGAGGCCT ATAA-AACTCT-TTTTATTAATGTCGTCTGAGT-ACTATAT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CACTGCTTGGTATTGA GCC--CTATGTCAGA-GAATGGCAGGCTCTAAAATCAGTGGCGGCGCCGCTGGGTCCTGA ACGTAGTAATA----TCTCTCGTTACAGGTTCTCAGTGTGCTTCTG-CCAAAAC----CC CAAATTTTTTTATGG????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ?????????? [15] CBS13991 AGGTTTCCGTAGTGACCTGGGAGGAA-----TTTACAGAGT-TCATGCCCGAAA-GGGTA GA---CCTCCCACCC-TTGTGTA-TTATTACTATGTTGCTTTGGCGAGCTACCCTTTG-- ------------------------------GGG--TCTTGTA--TGCTCGCCAGAGAATA TCAA-AACTCT-TTTTATTAATGTCGTCTGAGT-ACTATAT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCAGCTTGGTATTGA GTC--C-ATGTCAGT--AATGGCAGGCTCTAAAATTAGTGCCGGCGCCGCTGGGTCCTGA ACGTAGTAATA----TCTCTCGTTACAGGTTCTCAGTGTG-TTCTG-TCAAAAC----CC AA----TTTGTATGGTGAACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTCGTAAGTTCA-------TCTTTCTAACTTTTACAAT CTCAGCCCTATGGACACTTGGCAGGG-TATATTTGAAGATTT---------GG-TA-GCT AATAATTTATGACTTTACAGGACAAGAATGGTGATGGTTAGTGA------TTTCAGATTA TACTTTCCATATCCTAGAT----CAACTCTCCTCCTTTATCTACATGCTAGACATCCTGA CCGACACGGCCCCTATCTC------GAACAATTGTAC-CAAC-AA-GGGGGCAATAACAC GATTAAGCATG-ATAATACA----GAGGACAGCGCTGATATGTAAATTCATAGGACAAAT CACTAGCAAGGAGTTGGGTACCGTTATGCGATCCCTTGGGCAAAATCCTTCCGAGTCTGA GTTGCAAGACATGATCAATGAGGTCGACGCCGATAACAATGGTACCATTGATTTCCCAGG TACGGCAAAGCAT-AATATAGTTTATGACTCACA------AGGCTGA--------CCGAA TTAGAATTCCTCACCATGATGGCCAGAAAGATGAAGCCAACTGTGGAAGTCAACGCATAT ACTTGTGATAGATGCGGTTGTGAGATATTTCAGCCCGTTGGAT-CCAAGACCTTTGGACC ATTAGTCGAATGCCCTTCTCCCGACTGTACTACCAACCAAACTAAAGGACAACTCCATCA CTCCACTCGAGCCTCAAAGTTTCAGCCATTTCAAGAGATTAAAATTCAGGAAATGGCCGA ACAAGTTCCAGTTGGTCATATTCCTCGAATGCTAACTGTTCTTTGCCATGGAGCTCTAGT ACGACGCATAAATCCTGGAGACGTTGTTGATATTGCAGGAATTTTCTTACCTACCCCATA TACTGGCTTCAAAGCCATTAGAGCTGGTCTTCTCACCGATACGTACCTTGAGGCACAACA CGTCACTCAACACAAAAAGGCTTACGAAGATTTAACTATTGATAGCCGAGTATTCAAGCG AATTGAGCAATACAGAGCCTCTGGTCACGTTTACGAATACCTTGCAAAATCCATCGCGCC TGAAATTTACGGACACTTGGATGTGAAGAAGGCATTACTCTTGTTATTGGTCGGTGGTGT T--ACTAAAACTATGGGTGATGGAATGCG-A-ATTAGAGGTGATATCAATATCTGTTTGA TGGGAGACCC [16] CBS17124 AAGGTTCCGTAGGTGACCTTGCGGGAGGATCATTACAGAGT-TCATGCCCGAAA-GGGTA GA---CCTCCCACCC-TTGTGTA-TTATTACTTTGTTGCTTTGGCGAGCTGCTCTTCG-- ------------------------------GGG--CCTTGTA--TGCTCGCCAGAGAATA TCAA-AACTCT-TTTTATTAATGTCGTCTGAGT-ACTATAT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCAGCTTGGTATTGA GTC--C-ATGTCAGC--AATGGCAGGCTCTAAAATCAGTGGCGGCGCCGCTGGGTCCTGA ACGTAGTAATA----TCTCTCGTTACAGGTTCTCGGTGTGCTTCTG-CCAAAAC----CC AAA--TTTTCTATGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTTGTGAGTTCA-------TCTCCCTAACTTTTACAAT CTCAGCCCTATGGACACTTGGCAGGG-TATATTTGAAGATAT---------GG-TA-GCT GATAATTTATGACTTTATAGGACAAGAATGGTGATGGTTAGTAA------TTTCAGATTA TACTTTCCATGTCCTAGAT----CGACTCTCCTCCTTTATCTACATGCTAGACATCTTGA CCGACACCGCCCCTATCTC------GAGCAATTGTTC-CAAC-AA-GGAGGCAATAACAC GATTGAGCATG-ATAACAC------AGGACAGGGCTGATATATAAATTCATAGGACAAAT TACCAGCAAGGAGTTGGGTACCGTTATGCGATCCCTTGGACAAAACCCTTCCGAGTCTGA GTTGCAAGACATGATCAATGAGGTCGATGCCGATAACAACGGAACCATTGATTTCCCAGG TACGGCGAAGCAT-AATATAGTTTATGACTCACA------AAGCTGA--------CGGGA TCAGAATTCCTCACCATGATGGCAAGAAAGATGAAGCCAACTGTGGAAGTCAACGCATAT ACTTGTGATAGATGCGGTTGTGAGATATTTCAGCCCGTAGGGT-CCAAGACCTTTGGACC ATTAGTCGAATGCCCTTCTCCTGACTGTACGACCAACCAAACTAAAGGACAACTCCATCA CTCCACTCGAGCCTCAAAATTCCAGCCATTTCAAGAGATTAAAATTCAAGAAATGGCCGA ACAAGTTCCAGTTGGTCATATTCCTCGAATGCTAACTGTTCTTTGCCATGGAGCTTTAGT ACGACGTATAAATCCTGGAGATGTTGTTGATATTGCAGGAATTTTCTTACCTACTCCATA TACTGGTTTCAAAGCCATCAGAGCTGGCCTTCTCACCGATACGTATCTTGAGGCACAACA CGTCACTCAACACAAAAAGGCTTACGAGGATTTAACGATTGATAGCCGAGTATTCAAGCG AATTGAGCAATACAGAGCCTCTGGTCACGTTTACGAATACCTTGCAAAGTCTATCGCGCC TGAAATTTATGGACACTTGGATGTGAAGAAGGCATTACTTCTGTTATTGGTCGGCGGTGT T--ACTAAAACTATGGGTGATGGAATGCG-GTATTAGAGGTGATATAAATATCTGTTTGA TGGGT????? [17] CBS18493 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACAGAGT-TCATGCCCTAAC-GGGTA GA---CCTCCCACCC-TTGTGTA-TTTATACAATGTTGCTTTGGCGAGCCGCGCAGCTTC ---------GGCTGTGCCTTGGGCCTTC--GGG--CCTAGGTG-TGCTCGCCAGAGAAAA ACCA-AACTCT-GATTATTTTTGTCGTCTGAGT-ACTATAT--CAATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCTGCTTGGTATTGG ACT--T-TTGCCAGT--AATGGCAGGTTCTAAAATCAGTGGCGGTGCCGTTGGGTCCTGA GCGTAGTAATA----CTTCTCGCTACTGGATTCCCGCGTGCGTCTTGCCATAA-----CC CAATTTTTTTCAGGT-TGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTCGTAAGTTCT-------CCTTTAC-TATCCTACTAT TTCAGCCCTTTGCGAAGTTGGCATAGCCATTTTCAGGAACTT---------AG-AA-GCT AATGG-TTGGGACTTAACAGGACAAGAATGGCGACGGTCAGTAC-CCCTTCTTCAAGCCA CATCCGAATTGTTTCTG-T----CGCATATTGGGTTGGG------TCATATCTGCCTTTA TTCGATTTACCCCTTTT---GCATACAATGATCGGAC-GGACGAC-GAGGCTTGGACCAC TATCGCGACCT------------TGAATATCATGCTGATAGGTAGCTTCA-AGGACAAAT TACCAGCAAGGAGCTGGGCGCCGTTATGCGATCCCTTGGCCAAAATCCCTCAGAGTCTGA GCTTCAGGATATGATCAACGAGGTTGACGCTGATAACAACGGCACCATCGACTTCCCAGG TACGACATGACAC-TCTGTC--TGATGGTTAGGA--TTGGGGGCTAATACTTGC-AATCT ACAGAATTCCTTACCATGATGGCCAGAAAGATG??????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ?????????? [18] CBS19947 ?????????????????????????????????????GAGT-TCATGCCCTAAC-GGGTA GA---CCTCCCACCC-TTGTGTA-TTTATACAATGTTGCTTTGGCGAGCCGCGCAGCTTC ---------GGCTGTGCCTTGGGCCTTT--GGG--TCTAGGTG-TGCTCGCCAGAGAAAA ACCA-AACTCT-GATTATTTTTGTCGTCTGAGT-ACTATAT--CAATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCTGCTTGGTATTGG ACT--T-TTGCCAGT--AATGGCAGGTTCTAAAATCAGTGGCGGTGCCGTTGGGTCCTGA GCGTAGTAATA----CTTCTCGCTACTGGATTCCCGCGTGCGTCTTGCCATAA-----CC CAATTTTTTTCAGGT-TGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTTTTCGTAAGTTTGTTTGTCCTCTTTGC-GCTCTTACAGC TTCAGCCCTGTAGAGATTTAGCAGAG-TCACAACCAAGATTT---------AC-AT-ATT AACAT-TCTTGACTCGATAGGACAAAAATGGCGATGGTTAGCAC------CCCGAATATA TCTCCTTGCATCGGTCGCA----GAGCGATTCCCTTCAGCTTC--GTGCTGTTCTTGCAC AATGCCTAGCCCCTATCTC------GAAGGGGCTCTT-CAGCTGA-------AGAACCGA GCTTATCCACC-ACCAATAAC-TCGAACACGAATCTGATA--TCAATGTACAGGACAAAT CACCAGCAAGGAATTGGGCACCGTTATGCGCTCCCTCGGACAAAACCCATCAGAATCCGA ACTCCAAGATATGATCAACGAGGTTGACGCTGACAGCAACGGAACCATCGATTTCCCAGG TACGCTAAGCCGC-ACTATA---GATGGAATACA--GGATAGAAGGGCTCACAC-TACCA CTAGAATTCCTTACCATGATGGCCAGAAAGATGAAGCCCACAGTAGAAGTCAATGCGTAC ACTTGCGATCGTTGTGGCTGTGAAATTTTCCAACCCGTTGGAA-GCAAAACCTTCGGACC TCTAGTAGAGTGCCCTTCACCTGATTGTACTCGAGAACAAACCAAAGGGCAACTTCATCA CTCCACCCGAGCTTCTAAATTTCAGCCATTCCAAGAAGTTAAGATCCAGGAAATGGCTGA ACAGGTACCTGTGGGTCACATTCCTAGAATGCTGACTGTTTTGTGTCATGGAGCCCTTGT TCGACGGATCAATCCAGGAGATATTGTTGATATCGCAGGAATTTTCTTACCTACCCCTTA TACTGGGTTCAAAGCTATTAGAGCCGGCCTGCTCACTGATACATATCTGGAAGCTCAGCA TGTAACTCAGCACAAAAAAGCCTACGAAGATCTTACTATCGATAACCGAATTTTCAAGAG AATCGAACAATATAGAGCCTCAGGTCACGTTTACGAATATCTCGCCAAATCTATTGCCCC TGAAATCTACGGACATTTGGATGTAAAGAAGGCACTGCTTTTGTTGCTCGTTGGTGGAGT T--ACAAAGGAGATGGGTGATGGTATGCG-A-ATTAGGGGTGACATTAACATCTGTTTGA TGGGTGACCC [19] CBS21924 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACAGAGT-TCATGCCCGAAA-GGGTA GA---CCTCCCACCC-TTGTGTA-TTACTACTTTGTTGCTTTGGCGAGCTGCCTTC---- ------------------------------GGG--CCTTGTA--TGCTTGCCAGAGAAAA CTAA-AACTCT-TTTTATTAATGTCGTCTGAGT-ACTATAT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCATTTTCAACCCTCAAG--CTTAGCTTGGTATTGA GTC--C-ATGTCAGC--AATAGCAGGCTCTAAAATCAGTGGCGGCGCCGCTTGGTCCTGA ACGTAGTAATA----TCTCTCGTTACAGGTTCTCGGTGTGCTTCTG-CCAAAAC----CC ??????????????????????????????????????????????????????????GA GTTCAAGGAGGCCTTCTCCCTCTTCGTAAGTTAA-------TATTCCC-ATCTTTATAGT CTCAGCTCTATGGACACTTTGCACGG-CAATGTCGAAGACTT---------GG-AA-GCT AATAATCTGAGAATTTATAGGACAAGAATGGTGATGGTTCGTAC------TTTCATCTTA TTCTTTTGGCATTGCAGATC--TCGACTATACTCTTGTGTTTACATACTTGCCCTCTCGA CCATCCCAGCCCCTATCTC------GAACAATTGTAC-CAACAAC-GGGAA--------- ------ACAAC-ACAATATGA---AAGAACACCACTGATATTTGAGTACATAGGACAAAT CACTAGCAAGGAGTTGGGCACCGTTATGCGATCCCTTGGCCAAAACCCTTCCGAGTCCGA GTTGCAAGACATGATCAACGAGGTTGATGCCGATAACAACGGTACCATCGATTTCCCAGG TATGGAAAGACAT-GATAGAAATTACGAATCAGA------ATGC???????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ?????????? [20] CBS23077 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACAGAGTATCATGCCCTCAC-GGGTA GA---TCTCCCACCC-TTGTGTA-TTTATACCATGTTGCTTTGGCGAGCCGCACACTT-- -----------GTGTGCCTGGGGCCTTT--GGG--CTTCGGCG-TGCTCGCCAGAAACAA ---A-ACTCTA-GATTATTTTTGTCGTCTGAGT-ACTATAT--TAATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCTGCTTGGTATTGA GCT--C-TTGCCAGT--GATGGCAGGCTCTAAAATCAGTGGCGGTGCCGTTGGGTCCTGA GCGTAGTAATA----CTTCTCGCTACTGGATTCCTGCGTGCGTCTTGCCATAAC----CC CAAATTTTTCTTAGG-TGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATA?? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ?????????? [21] CBS29454 ????????????????????GCGGAAGGATCATTACAGAGT-TCATGCCCTAAC-GGGTA GA---CCTCCCACCCTTTGTGTA-TTTATACCATGTTGCTTTGGTGAGCCGCATAGCTTC ---------GGCCATGCCTTGGGCCTTT--GGG--CCTGAGTG-TGCTCGCCAGAGGAAA ACTA-AACTCT-GATTATTTTTGTCGTCTGAGT-ACTATAT--CAATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCTGCTTGGTATTGG ACT--T-TTGCCAGT--GATGGCAGGTTCTAAAATCAGTGGCGGTGCCGCTGGGTCCTGA GCGTAGTAATA----CTTCTCGCTACTGGATTCCCGCGTGCGTCTTGCCATAA-----CC CAATTTTTTTCAGGT-TGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATA?? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ?????????????????????????????????AAGCCTACAGTAGAAGTCAACGCCTAT ACTTGCGACCGTTGTGGCTGCGAAATCTTCCAACCTATTGGAA-CTAAAACTTTTGGACC TTTGGTAGAATGCCCTTCACCCGATTGTACTCGAGAACAAACTAAAGGACAACTTCACCA CTCCACCCGAGCTTCCAAATTCCAGCCGTTCCAGGAAGTCAAGATCCAGGAAATGGCCGA ACAGGTTCCGGTTGGTCACATTCCTAGAATGCTGTCTGTTCTGTGTCATGGAGCCCTTGT TCGACGCATCCATCCAGGAGACATTGTTGATATTGCAGGAATTTTCTTACCTACTCCTTA TACTGGATTTAAGGCTATTAGAGCTGGTCTGCTCACTGATACATATCTGGAAGCTCAGCA TGTTGCTCAGCACAAAAAGGCTTACGAAGAGCTTACCATCGACAACCGTATTTTCAAGAG AATCGAGCAATATAGAGCTTCGGGCCATGTCTACGAATATCTCGCCAAATCCATTGCCCC TGAAATTTATGGACATCTAGATGTAAAGAAAGCACTGCTTTTACTGCTCGTTGGTGGTGT T--ACAAAAGAGATGGGAGATGGTATGCG-A-ATTAGGGGTGACATCAATATCTGTTTGA TGGGAGATCC [22] CBS30331 ACCGTTCCGTAGGTGAACCTGCGGAAGGATCATTACAGAGT-TCATGCCCGAAA-GGGTA GA---CCTCCCACCC-TTGTGTA-TTATTACTTTGTTGCTTTGGCGAGCTGCCTTT---- ------------------------------GGG--CCTTGTA--TGCTCGCCAGAGACTA ATCA-AACTCT-TTTTATTAATGTCGTCTGAGT-ACTATAT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCAGCTTGGTATTGA GTC--C-ATGTCAGT--AATGGCTGTCTCTAAAATCAGTGGCGGCGCCGCTGGGTCCTGA ACGTAGTAATA----TCTCTCGTTACAGGTTCTCGGTGTGCTTCTG-CCAAAAC----C- --AATTTTTTTATGG-TGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTTGTAAGTTCA-------CATTTCCCAACTTTATTGC TTCAGCCCTATGGACACTTGGCAGGG-CATATTCAAAGGCAT---------GA-AA-GCT AATAATTTATGACTTTACAGGACAAGAATGGTGATGGTTCGTAC------TTCCAATTTA TATGTTCAGTGTCGCAGATCGACCGACTATCCCCCTTCATCTGCATGTTTGCTGTCTCGG CCCAGCCCAGCCCC-TATC------GAATAATTTTAT-CAATCAG-GAGGACAACAGTCC TATTGGGCATA-ACAATACAT---AAGGGCAACGCTGATATATGAATCCATAGGACAAAT TACTAGCAAGGAGTTGGGCACCGTTATGCGATCCCTTGGTCAAAACCCTTCCGAGTCTGA GTTGCAGGATATGATCAATGAGGTTGATGCCGACAACAACGGTACCATCGATTTCCCTGG TACGGCACAGCAT-CCAATGCTTCCTGACTCATA------AGACTTA--------CATGA TTAGAATTCCTCACCATGATGGCCAGAAAGATGAAGCCGACGGTGGAAGTCAACGCATAT ACTTGTGATAGATGTGGTTGTGAAATTTTCCAACCCGTTGGAT-CTAAGACTTTCGGACC ATTAGTCGAATGTCCTTCTCCTGATTGTACTACCAACCAAACCAAAGGACAACTTCATCA CTCCACTCGTGCCTCAAAATTTCAGCCATTCCAAGAAGTTAAAATTCAAGAGATGGCCGA ACAAGTTCCTGTTGGTCACATTCCTCGAATGTTGACAGTTCTTTGTCACGGAGCCTTGGT TCGACGTATCAATCCAGGAGATGTTGTGGATATTGCAGGAATTTTCTTACCTACCCCATA TACTGGTTTTAAAGCTATTAGAGCTGGTCTTCTCACCGATACATACCTTGAAGCACAGCA CGTTACTCAACACAAGAAAGCTTACGAAGATTTAACTATTGATAGCCGAGTATTCAAGCG AATCGAGCAATATAGAGCTTCTGGTCACGTTTACGAATACCTTGCCAAATCTATCGCGCC TGAAATTTACGGGCACTTGGATGTGAAGAAGGCATTGCTCTTGTTGTTGGTTGGTGGTGT T--ACTAAAGAAATGGGTGATGGAATGCGAA-ATTAGAGGTGA????????????????? ?????????? [23] CBS30937 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACAGAGT-TCATGCCCTCAC-GGGTA GA---CCTCCCACCC-TTGTGTA-TTTATACCATGTTGCTTTGGCAGGCTGCTGCCCCCC TC--GGGG--GACAGCCCCAGCGCCTTC--GGG--CCTGGGAGTCGCCTGCCGGAGGAAA AACA-AACTCTGAATTGTTAGTGTCGTCTGAGT-ACTATATTTTAATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCTGCTTGGTATTGG GCC--T-TCGCCGGGCGACCGGCGGGCCTTAAAGTCAGTGGCGGCGCCGTTGGGTCCTGA ACGTAGTAACA--TACCTCTCGTTACAGGGTCCCCGCGTGCTTCTG-CCATTAAA---CC CCAAACTTTTTATGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTCGTAAGTTCT-------CCTTTAC-CATTCTACTAT TTCAGCCCTGTGGAAACTTGGCATAGGCAT-CTCAAAAACTT---------GG-AA-GCT AATGA-GTGGGACTTAACAGGACAAGAATGGCGACGGTCAGTAATCCCTTCTCCAAATCA CACGCGAATCCTTTCTG-T----CGCATATTGGGCTGGG------AAGATGTCCACTCTA CTCGATTTACCCCTTTTTC-GCATGCACTGAGCAGAC-GGACGAC-GAGGCGTGGATTAC GATCGCGATCT------------TGAATATCATGCTGATGGATAGGTTCA-AGGACAAAT TACTAGCAAGGAGTTGGGCACCGTTATGCGATCCCTCGGCCAAAATCCTTCAGAGTCTGA GCTTCAGGATATGATCAACGAGGTTGACGCTGATAACAACGGCACCATTGACTTCCCAGG TATGAAATGAGAC-TATATC--AGATGGTTAGGA--CTG-GGGCTAATACTGGC-AACTT GCAGAGTTCCTTACCATGATGGCCAGAAAGATGAAGCCGACTGTAGAAGTTAACGCGTAC ACTTGCGATCGATGCGGTTGCGAAATTTTCCAACCTGTTGGAT-CCAAAACGTTCGGGCC TTTAGTAGAATGCCCGTCGCCAGACTGCAAGGTCAACCAAACCAAGGGCCAACTGCATCA TTCTACTAGAGCATCGAAATTCCAGCCATTCCAGGAAGCCAAGATTCAAGAGATGGCCGA ACAAGTACCAGTTGGTCATATTCCAAGAATGTTGACCATTCTATGCCATGGAGCGCTTGT TCGTCGCATCAACCCAGGAGATGTTGTTGACGTCGCCGGAATATTCTTGCCTACCCCCTA CACTGGTTTCAAGGCGATAAGAGCTGGTCTCCTTACCGACACATATTTAGAAGCGCAACA TGTCACCCAGCACAAGAAGGCATATGAAGACCTTACGATCGACAGCCGCGTGTTTAGACG AATTGAACAATACAGAGCTTCTGGTCATGTGTATGAGTACCTCGCTAAATCTATCGCTCC TGAAATCTACGGTCATCTCGATGTGAAGAAGGCACTACTATTGCTGTTGGTTGGTGGTGT G--ACAAAAGAAATGGGAGATGGTATGCG-C-ATCAGAGGTGACATCAACATCTGTCTTA TGGGTGATCC [24] CBS31037 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACAGAGT-TCACGCCCTCAC-GGGTA GA---CCTCCCACCC-TTGTGTA-TCTATACTATGTTGCTTTGGCAGGCTGCTGGACCCC TC--GGGG--GACAGCCTCGGCGCCCTC--GGG--CCTGAGAGTCGCCTGCCGGAGGAAA AACA-AACTCTGAATTGTTAGTGTCGTCTGAGT-ACTATATTTTAATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCCTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCAGCTTGGTATTGG GCC--T-CCGCCGGGCGACCGGCGGGCCTTAAAGTCAGTGGCGGCGCCGTTGGGTCCTGA ACGTAGTAACA--TACACCTCGTTACAGGGCCCCCGCGTGCTTCTG-CCATTAAA---CC CCCAACTTTCTATGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTATTCGTAAGTCCT-------CCGCTAC-CATCCTGCTAT TTCAGCCCTATGTGAACTTGGCATAGGCATCGTCAAACACTT---------GGAAA-GCT AATGT-GCGGGACTTAACAGGACAAGAATGGCGACGGTCAGTACTCTCTTCCGCAAGGCA CACCGGATTTCTGTCTG-T----CGCATGCTGCATTGGG-------ACATGTCCACTCTA CTCGATTTACCCCTTTTTC-GCATGCACTGAGCAGAC-AGACGAC-AAGGCGTGGACCAC GATCGCGATCT------------TGAATATCATGCTGATGGATAGCTTCA-AGGACAAAT TACTAGCAAGGAGTTGGGGACTGTTATGCGATCCCTTGGCCAAAATCCTTCAGAGTCTGA GCTTCAGGATATGATCAACGAGGTTGATGCTGATAACAACGGCACCATCGACTTCCCAGG TACGACATGACAC-TCTGTC--TGATGGTTAGGA--TTGGGGGCTAATACTTGC-AATCT ACAGAATTCCTTACCATGATGGCCAGAAAGATGAAGCCGACTGTTGAAGTTAACGCATAC ACTTGCGATCGATGCGGTTGCG-AATTTTCCAGCCTGTTGGGT-CCAAAACTTTCGGGCC CTTGGTTGAATGTCCGTCGCCCGACTGCAAGGTCAACCAAACCAAGGGACAACTGCATCA TTCTACTAGAGCATCAAAATTCCAGCCATTCCAGGAAGTTAAGATTCAAGAGATGGCCGA ACAAGTACCAGTCGGTCATATTCCAAGAATGTTGACGATTCTATGCCATGGAGCACTTGT TCGTCGTATCAACCCGGGAGATGTCGTTGATGTCGCTGGAATATTCTTGCCTACCCCCTA CACTGGCTTCAAGGCGATAAGAGCTGGTCTTCTTACTGACACATATCTGGAAGCACAACA TGTCACCCAACACAAGAAGGCATACGAAGATCTTACCATTGACAGCCGCGTATTCAGACG GATTGAACAATACAGAGCTTCCGGTCATGTGTATGAGTACCTCGCTAAATCTATCGCCCC TGAAATCTACGGTCATCTCGATGTGAAGAAGGCACTACTATTGCTGTTGGTTGGTGGTGT G--ACAAAGGAAATGGGAGATGGTATGCG-C-ATCAGAGGTGATATCAACATTTGTCTTA TGGGAGACCC [25] CBS31137 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACAGAGT-TCATGCCCTCAC-GGGTA GA---CCTCCCACCC-TTGTGTA-TTTATACCATGTTGCTTTGGCAGGCTGCTGCCCCCC TC--GGGG--GACAGCCCCAGCGCCTTC--GGG--CCTGGGAGTCGCCTGCCGGAGGAAA AACA-AACTCTGAATTGTTAGTGTCGTCTGAGT-ACTATATTTTAATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCTGCTTGGTATTGG GCC--T-TCGCCGGGCGACCGGCGGGCCTTAAAGTCAGTGGCGGCGCCGTTGGGTCCTGA ACGTAGTAACA--TACCTCTCGTTACAGGGTCCCCGCGTGCTTCTG-CCATTAAA---CC CCAAACTTTTTATGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTCGTAAGTTCT-------CCTTTAC-CATTCTACTAT TTCAGCCCTGTGGAAACTTGGCATAGGCAT-CTCAAAAACTT---------GG-AA-GCT AATGA-GTGGGACTTAACAGGACAAGAATGGCGACGGTCAGTAATCCCTTCTCCAAATCA CACGCGAATCCTTTCTG-T----CGCATATTGGGCTGGG------AAGATGTCCACTCTA CTCGATTTACCCCTTTTTC-GCATGCACTGAGCAGAC-GGACGAC-GAGGCGTGGATTAC GATCGCGATCT------------TGAATATCATGCTGATGGATAGGTTCA-AGGACAAAT TACTAGCAAGGAGTTGGGCACCGTTATGCGATCCCTCGGCCAAAATCCTTCAGAGTCTGA GCTTCAGGATATGATCAACGAGGTTGACGCTGATAACAACGGCACCATTGACTTCCCAGG TATGAAATGAGAC-TATATC--AGATGGTTAGGA--CTG-GGGCTAATACTGGC-AACTT GCAGAGTTCCTTACCATGATGGCCAGAAAGATGAAGCCGACTGTTGAAGTTAACGCATAC ACTTGCGATCGATGCGGTTGCG-AATTTTCCAACCTGTTGGAT-CCAAAACTTTCGGGCC CTTGGTTGAATGTCCGTCGCCCGACTGCAAGGTCAACCAAACCAAGGGACAACTGCATCA TTCTACTAGAGCATCAAAATTCCAGCCATTCCAGGAAGTTAAGATTCAAGAGATGGCCGA ACAAGTACCGGTCGGTCACATTCCCAGAATGTTGACGATTCTATGTCATGGAGCACTTGT TCGTCGTATCAATCCGGGGGATGTCGTTGATGTCGCTGGAATATTCTTGCCTACCCCCTA CACTGGCTTCAAGGCGATAAGAGCTGGTCTTCTTACCGACACATATCTGGAAGCACAACA TGTCACCCAACACAAGAAGGCATACGAAGATCTTACCATTGACAGCCGCGTGTTCAGACG GATTGAACAATACAGAGCTTCCGGTCATGTGTATGAGTACCTCGCTAAATCTATCGCCCC TGAAATCTACGGTCATCTCGATGTGAAAAAGGCACTACTATTGCTGTTGGTTGGTGGTGT A--ACAAAGGAAATGGGAGATGGTATGCG-C-ATCAGAGGTGATATCAACATTTGTCTTA TGGGAGACCC [26] CBS34162 ACCGTTCCGTAGGTGAACCTGCGGAAGGATCATTACAGAGT-TCATGCCCTCAC-GGGTA GA---CCTCCCACCC-TTGTGTA-TCTATACATTGTTGCTTTGGCGAGCTGCCTTGGCCT TA--ACTGCCCCAAGGCCTCAAGCTTTC--GAG--CCTGAGAGTCGCCCGCCGGAGGAAA AATA-AACCCT-GATAATTAATGTCGTCTGAGT-ACTATAT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGCATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCAGCTTGGTATTGG GCC----TCGTCGGTTACACGACGGGCCTTAAAGTCAGTGGCGGCGCCGTTGGGTCCTGA ACGTAGTAATA----TATTTCGTTACAGGTGCCCCGCGTGCTTCTG-CCATTAAA---CC CCCAATCTTTTATG????????????????????????????????????????????GA GTTCAAGGAGGCCTTCTCCCTCTTCGTAAGTTCT-------CCTTTAC-CATTCTACTAT TTCAGCCCTGTGGAAACTTGGCATAGGCAT-CTCAAAAACTT---------GG-AA-GCT AATGA-GTGGGACTTAACAGGACAAGAATGGCGACGGTCAGTAATCCCTTCTCCAAATCA CACGCGAATCCTTTCTG-T----CGCATATTGGGCTGGG------AAAATGTCCACTCTA CTCGATTTACCCCTTTTTC-GCATGCACTGAGCAGAC-GGACGAC-GAGGCGTGGATTAC AATCGCGATCT------------TGAATATCATGCTGATGGATAGGTTCA-AGGACAAAT TACTAGCAAGGAGTTGGGCACCGTTATGCGATCCCTCGGCCAAAATCCTTCGGAGTCTGA GCTTCAGGATATGATCAACGAGGTTGACGCTGATAATAACGGCACCATTGACTTCCCAGG TATGAAATGAGAC-TATTTC--AGATGGCTAGGA--CTG-GGGCTAATACTGGC-AACTT GCAGAGTTCCTTACCATGATGGCCAGAAAGATGAAGCCAACTGTAGAAGTCAATGCTTAT ACTTGTGACCGATGTGGATGCGAAATCTTCCAACCTGTCGGGT-CTAAGACTTTTGGGCC TTTGGAAGAGTGCCCATCCAAGGATTGTACGACTAATCAGACTAAAGGACAACTGCATCA TTCTACCAGAGCATCAAAATTTCAGCCATTCCAAGAAGTGAAGATACAGGAAATGGCTGA ACAAGTCCCAGTGGGTCATATTCCTCGAATGCTCACAATCATTTGCCATGGAGCACTTGT TCGTCGTATCAATCCGGGAGACGTCGTTGATGTTGCAGGAATATTCTTGCCCACCCCATA CACTGGCTTCAAAGCGATTAGAGCCGGTCTTCTTACTGATACATACTTGGAAGCACAACA CGTTACTCAGCACAAGAAAGCGTATGAAGATCTTACTATCGATCCACGAGTTTTCAAACG AATTGAACAATACAGAAGTTCAGGTCATGTTTACGAATATCTTGCAAAGTCTATTGCCCC TGAGATTTATGGCCATTTAGATGTAAAGAAAGCACTTCTCTTATTGTTAGTAGGCGGCGT C--ACCAAAGAGATGGGTGATGGTATGCG-T-ATCAGAGGTGACATTAACATTTGTTTGA TGGGAGACCC [27] CBS46473 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACAGAGT-TCATGCCCTCAC-GGGTA GA---CCTCCCACCC-TTGTGTA-TTTATACCGTGTTGCTTTGGCAGGCTGCTGCACCCC TC--GGGG--GACAGCCCCAGCGCCTTC--GGG--CCTGGGAGTCGCCTGCCGGAGGAAA AACA-AACTCTGAATTGTTAGTGTCGTCTGAGT-ACTATATTTTAATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAGCCCTCAAG--CTCTGCTTGGTATTGG GCC--T-TCGCCGGGTGACCGGCGGGCCTTAAAGTCAGTGGCGGCGCCGTTGGGTCCTGA ACGTAGTAACA--TACCTCTCGTTACAGGGTCCCCGCGTGCTTCTG-CCATTAAA---CC CCAAACTTTTTATGG-TGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTCGTAAGTTCT-------CCTTTAC-CATTCTACTAT TTCAGCCCTGTGGAAACTTGGCATAGGCAT-CTCAAAAACTT---------GG-AA-GCT AATGA-GTGGGACTTAACAGGACAAGAATGGCGACGGTCAGTAATCCCTTCTCCAAATCA CACGCGAATCCTTTCTG-T----CGCATATTGGGCTGGG------AAGATGTCCACTCTA CTCGATTTACCCCTTTTTC-GCATGCACTGAGCAGAC-GGACGAC-GAGGCGTGGATTAC GATCGCGATCT------------TGAATATCATGCTGATGGATAGGTTCA-AGGACAAAT TACTAGCAAGGAGTTGGGCACCGTTATGCGATCCCTCGGCCAAAATCCTTCAGAGTCTGA GCTTCAGGATATGATCAACGAGGTTGACGCTGATAACAACGGCACCATTGACTTCCCAGG TATGAAATGAGAC-TATATC--AGATGGTTAGGA--CTG-GGGCTAATACTGGC-AACTT GCAGAGTTCCTTACCATGATGGCCAGAAAGATGAAGCCGACTGTAGAAGTTAACGCGTAC ACTTGCGATCGATGTGGTTGCGAAATTTTCCAACCTGTTGGAT-CCAAAACGTTCGGGCC TTTGGTAGAATGCCCGTCGCCAGACTGCAAGGTCAACCAAACCAAGGGACAACTGCATCA TTCTACTAGAGCATCGAAATTCCAGCCATTCCAGGAAGTCAAGATTCAAGAGATGGCCGA ACAAGTACCAGTTGGTCATATTCCAAGAATGTTGACCATTCTATGCCATGGAGCGCTTGT TCGTCGCATCAACCCAGGAGATGTTGTTGACGTCGCCGGAATATTCTTGCCTACCCCTTA CACTGGTTTCAAGGCGATAAGAGCTGGTCTCCTTACCGACACATATTTAGAAGCGCAACA TGTCACCCAGCACAAGAAGGCATATGAAGACCTTACGATCGACAGCCGCGTGTTTAGACG AATTGAACAATACAGAGCTTCTGGTCATGTGTATGAGTACCTCGCTAAATCTATCGCTCC TGAAATCTACGGTCATCTCGATGTGAAGAAGGCACTACTATTGCTGTTGGTTGGTGGTGT G--ACGAAAGAAATGGGAGATGGTATGCG-C-ATCAGAGGCGACATCAACATCTGTCTTA TGGGAGACCC [28] CBS46573 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACAGAGT-TCATGCCCTCAC-GGGTA GA---CCTCCCACCC-TTGTGTA-TTTATACCATGTTGCTTTGGCAGGCTGCTGCCCCCC TC--GGGG--GACAGCCCCAGCGCCTTC--GGG--CCTGGGAGTCGCCTGCCGGAGGAAA AACA-AACTCTGAATTGTTAGTGTCGTCTGAGT-ACTATATTTTAATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCTGCTTGGTATTGG GCC--T-TCGCCGGGCGACCGGCGGGCCTTAAAGTCAGTGGCGGCGCCGTTGGGTCCTGA ACGTAGTAACA--TACCTCTCGTTACA-GGTCCCCGCGTGCTTCTG-CCATTAAA---CC CCAAACTTTTTATGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTCGTAAGTTCT-------CCTTTAC-TATCCTACTAT TTCAGCCCTTTGCGAAGTTGGCATAGCCATTTTCAGGAACTT---------AG-AA-GCT AATGG-TTGGGACTTAACAGGACAAGAATGGCGACGGTCAGTAC-CCCTTCTTCAAGCCA CATCCGAATTGTTTCTG-T----CGCATATTGGGTTGGG------TCATATCTGCCTTTA TTCGATTTACCCCTTTT---GCATACAATGATCGGAC-GGACGAC-GAGGCTTGGACCAC TATCGCGACCT------------TGAATATCATGCTGATAGGTAGCTTCA-AGGACAAAT TACTAGCAAGGAGCTGGGCACCGTTATGCGATCCCTTGGCCAAAATCCCTCAGAGTCTGA GCTTCAGGATATGATCAACGAGGTTGACGCTGATAACAACGGCACCATTGACTTCCCGGG TATGACATAACAT-TATATA--TGATGGTTCGGG--CTGTGGACTGACGTTTGCAAAACT GTAGAATTTCTCACCATGATGGCCAGAAAGATGAAGCCGACTGTAGAAGTTAACGCGTAC ACTTGCGATCGATGCGGTTGCGAAATTTTCCAACCTGTTGGAT-CCAAAACGTTCGGGCC TTTAGTAGAATGCCCACCGCCAGACTGCAAGGTCAACCAAACCAAGGGCCAACTGCATCA TTCTACTAGAGCATCGAAATTCCAGCCATTCCAGGAAGCCAAGATTCAAGAGATGGCCGA ACAAGTACCAGTTGGTCATATTCCAAGAATGTTGACTATTCTATGCCATGGAGCGCTTGT TCGTCGCATCAACCCAGGAGATGTTGTTGACGTCGCCGGAATATTCTTGCCTACCCCCTA CACTGGTTTCAAGGCGATAAGAGCTGGTCTCCTTACCGACGCATATTTAGAAGCGCAACA TGTCACCCAGCACAAGAAGGCATATGAAGACCTTACGATCGACAGCCGCGTGTTTAGACG AATTGAACAATACAGAGCTTCTGGTCATGTGTATGAGTACCTCGCTAAATCTATCGCTCC TGAAATCTACGGTCATCTCGATGTGAAGAAGGCACTACTATTGCTGTTGGTTGGTGGTGT G--ACAAAAGAAATGGGAGATGGTATGCG-C-ATCAGAGGTGACATCAACATCTGTCTTA TGGGAGATCC [29] CBS51089 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACCGAGT-TCACGCCCTCAC-GGGTA GA---CCTCCAACCC-TTGTGTA-TCTCTACCATGTTGCTTTGGCAGGCTGCTCGACCCT TC--CGGG--GACAGCCTCAGCGCCCTCCGGGG--CCGGAGAGTCGCCTGCCGGAGGAAA ATCACAACTCTGAATTGTCAGTGTCGTCTGAGTGACTATCT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAGCTCTCTGCTTGGTATTGG GCC--T-CCGCCGGTCACACGGCGGGCCTTAAAGTCAGTGGCGGCGCCGCTGGGTCCTGA ACGTAGTAACACATACCTCTCGTTACAGGGTCCCCGCGCGCTCCCG-CCGTAAAA-CCCC CCTCATTTTCTCTGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATA?? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ?????????????????????????????????AAGCCGACCGTTGAAGTTAATGCGTAC ACTTGCGATCGATGCGGTTGCG-AATCTTCCAACCTGTTGGAT-CCAAAACGTTCGGACC TTTGGTAGAATGCCCGTCGCCAGACTGCAAGGTCAACCAAACCAAGGGACAATTACATCA TTCCACTAGGGCATCGAAATTCCAGCCATTCCAGGAAGTCAAGATTCAAGAGATGGCCGA ACAAGTACCAGTTGGTCATATTCCGAGAATGTTAACTGTCCTCTGCCATGGAGCGCTTGT TCGTCGTATCAACCCGGGGGATGTCGTTGATGTCGCCGGCATATTCTTGCCTACCCCCTA CACTGGTTTCAAGGCGATAAGAGCTGGCCTTCTTACCGACACATATCTGGAAGCACAACA TGTCACCCAGCACAAGAAGGCATATGAAGATCTTACCATTGATAGCCGCGTGTTTAGACG GATTGAACAGTACAGAACTTCCGGTCACGTGTATGAGTACCTCGCCAAATCTATCGCTCC TGAGATCTACGGTCATCTCGATGTGAAGAAGGCATTACTCTTGTTATTGGTTGGTGGTGT G--ACAAAGGAAATGGGAGATGGTATGCG-C-ATCAGAGGTGACATCAACATTTGTCTAA TGGGAGACCC [30] CBS51875 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACAGAGT-TCATGCCCGAAA-GGGTA GA---CCTCCCACCC-TTGTGTA-TTATTACTTTGTTGCTTTGGTGAAGAGCCCCA---- ------------------------------GATCTTCTGGGG--CGCCCACCAAAGACTA TCAA-AACTCT-TTTTATTAATGTCGTCTGAGT-ACTATAT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCAGCTTGGTATTGA GTC--C-ATGTCAGT--AATGGCAGGCTCCAAAATCAGTGGCGGCGCCGCTGGGTCCTGA ACGTAGTAATA----TCTCTCGTTACAGGCTCTCAGCGTGCTTCTG-CCAAAAC----CC AAA--CTTTCTATGG-TGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATA?? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ?????????????????????????????????AAGCCAACTGTAGAAGTTAGCGCATAT ACTTGTGATCGATGCGGTTGTGAGCTTTTCCAAACCGTTGGAT-CCAAGACCTTTGCGCC ATTAGTTGAATGCCAATCTTCAGACTGCCTTACCGAACAGACTAAAGGGCAACTTCATCC TTCTACTCGAGCCTCAAAATTCCAGCCATTCCAAGAGGTTAAAATTCAAGAAATGGCCGA ACAAGTTCCAGTCGGTCATATCCCTCGAATGTTAACTGTTCTTTGTCACGGAGCTCTCGT TCGACGTATTAATCCTGGAGATGTTGTCGATATCGCAGGAATCTTCTTACCCACCCCGTA TACTGGTTTCAAAGCCATTAGAGCCGGTCTTCTTACCGATACATACTTGGAAGCGCAACA CGTCACTCAACATAAGAAGGCCTATGAAGACTTAACTATTGATAGTCGAGTCTTTAAGCG AATTGAGCAATACCGAGCATCTGGTCACGTTTACGAATATCTTGCAAAATCCATTGCGCC TGAAATCTACGGACATTTGGATGTGAAGAAGGCATTACTTTTGTTGTTAGTTGGCGGTGT T--ACCAAGAGTATGGGAGATGGAATGCG-C-ATTAGAGGTGATATCAACATCTGTTTAA TGGGAGATCC [31] CBS52690 ????????????????????????????ATCATTACAGAGT-TCATGCCCGAAA-GGGTA GA---CCTCCCACCC-TTGTGTA-TTATTACTTTGTTGCTTTAGCGAGCTGCCCCT---- ------------------------------GGG--CCTTGTA--TGCTCGCTAGAGACTA CCAA-AACTCT-TTTTATTAATGTCGTCTGAGT-ACTATAT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CACAGCTTGGTATTGA GCC--C-ATGTCAGC--AATGGCAGGTTCTAAAATCAGTGGCGGCGCCGCTGGGTCCTGA ACGTAGTAATA----TCTCTCGTTACAGGTTCTCAGTGAGCTTCTG-CCAAAAC----CC AAA-TTTTTCTATGG-TGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATA?? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ?????????? [32] CBS65492 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACAGAGT-TCATGCCCGAAA-GGGTA GA---CCTCCCACCC-TTGTGTA-TTAATACTTTGTTGCTTTGGCGAGCTGCCTTC---- ------------------------------GGG--CCTAACT--GTCTCGCCAGAGGATA TCAA-AACTCT-TTTTATTAATGTCGTCTGAGT-ACTATAT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCTGCTTGGTATTGA GTC--A-ATGTCAGT--AATGGCAGGCTTTAAAGTTAGTGGCGGCGCCGCTGGGTCCTGA ACGTAGTAATA----TCTTTCGTTACAGGTTCTCGGTGTGCTTCTG-CCAAAAC----CC AAAAATTTTATATTG-TGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATA?? ???????????????????????????????????????????????????????????? ??????????????TACTTGGCAGAG-AATGTTTAAGGATTC---------AG-AA-GCT AACAGTTTGTAACTTTATAGGACAAAAATGGTGATGGTTAGTAC------TTTCAAGTTA TGCTTGTGCTGTCACAGAT----CGACAATCCTCCTATCGCTGCATACTTTCCTTTT--- -CAACCCAACCCCTATCTC---GAAGAATAATTGTAC-CGACTAC-AAAGACAACTACAA CATTAGGCATC-ATGCAACAC---AAGGACAAAGCTGATGTGTAAACTCATAGGACGAAT TACTAGCAAGGAGTTGGGCACCGTTATGCGATCCCTCGGACAAAACCCCTCGGAATCTGA GCTCCAAGATATGATTAACGAGGTCGATGCCGACAACAATGGCACCATTGATTTCCCAGG TACGGCACAGCTTCAATACGATTCATGACACACG------AGGCTGA--------CTCAA CTAGAATTTCTCACCATGATGGCCAGAAAGATG??????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ?????????? [33] CBS77395 ACCGTTCCGTAGGTGAACCTGCGGAAGGATCATTACAGAGT-TCACGCCCGAAA-GGGTA GA---CCTCCCACCC-TTGTGTACCTAATACCGTGTTGCTTTGGCGAGCCGGCCCTCT-- -------------GGCCCTCAGGCCCTC-GAGC--CTGAGCG--CGCTCGCCAAGGGATA CCAA-AACTCT-TTTTGTTCATGTCGTCTGAGC-ACTATAT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCAGCTTGGTATTGA GCC--C-GTGCCAGC--GATGGCAGGCTCTAAAATCAGTGGCGGCGCCGCTGGGTCCTGA ACGTAGTAATC----TCTCTCGTTACAGGTGCTCGGCGTGCTTCTG-CCAAAAC----CT CAAATTTTTCTATGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTTGTAAGTCCA-------TCTTTAC-AGCACTACTTT CTCAGCCCTATGGATCATGGGGAGGA-GATATTTGAAGACCTAGAGAATAGAG-AG-GCT AATAATTTGTGACTTTATAGGACAAGAACGGTGATGGTTCGTAT------TTTCAAATTA TACATTCGGTGTCGCAGAT----CAACTATCCTCCTTTACCTGCATTCTCCCTATTT--- -CGCTCCAGCCCCTATCTC------AAATTATTGGACTCGACAAC-GAGGACAACATTAC TATCACACATGAAGAACAAAC---GAGGATATAGCTGATATGAGAATCCATAGGACAAAT TACTAGCAAAGAATTGGGTACCGTTATGCGATCCCTTGGACAAAACCCTTCCGAGTCAGA ATTGCAAGACATGATCAACGAGGTTGATGCCGATAACAACGGTACCATCGATTACCCAGG TATGATACATCTC-GAGATGGTTCATGACTCACA------AAGCTGA--------TATGA TTAGAATTTCTTACCATGATGGCCAGAAAGATG??????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ?????????? [34] CBS77495 ????????????????????????????ATCATTACAGAGT-TCATGCCCTAAC-GGGTA GA---CCTCCCACCC-TTGTGTA-TTTATACAATGTTGCTTTGGCGAGCCGCGCAGCTTC ---------GGCTGTGCCTTGGGCCTTC--GGG--CCTAGGTG-TGCTCGCCAGAGAAAA ACCA-AACTCT-GATTATTTTTGTCGTCTGAGT-ACTATAT--CAATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCTGCTTGGTATTGG ACT--T-TTGCCAGT--AATGGCAGGTTCTAAAATCAGTGGCGGTGCCGTTGGGTCCTGA GCGTAGTAATA----CTTCTCGCTACTGGATTCCCGCGTGCGTCTTGCCATAA-----CC CAATTTTTTTCAGGT-TGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATA?? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ?????????? [35] CBS81185 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTATAGAGT-TCACGCCCTCAC-GGGTA GA---TCCCCCACCC-TTGTGTA-TTTATACTTTGTTGCTTTGGCGGGTTGTTCAGCCCT AA--ACCG---TTGAGCCTTTAGCTTTCACAAG--CCGAAGAGTCGCCCGCCAGAGGATA CCAA-AATTCT-TATTATCAATGTCGTCTGAGT-ACTATAT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACACTCAAG--CTCTGCTTGGTATTGG GCT--TCATACCAGTAAAATGGTAGGCCTCAAAGTCAGTGGCGGTGCCGTTGGGTTCTGA ACGTAGTAATA----TATTTCGTTACAGATATCCAGCGCGCTTCTG-CCATTAAA---CC CCCAATTTTCTAGTC-TGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATA?? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ?????????????????????????????????AAGCCAACTGTGGAGGTCAATGCCTAC ACTTGTGACCGATGTGGCTGTGAGATTTTCCAACCTGTAGGCT-CCAAGACCTTCGGGCC CCTGGTTGAATGCCCATCGGAAGACTGTACAAAGAACCAGACGAAAGGGCAATTGCACCA CTCTACTCGAGCCTCGAAATTTCAGCCATTCCAGGAAGTCAAGGTTCAGGAGATGGCCGA ACAAGTACCAGTTGGTCACATTCCTAGAATGCTCACTATAATGTGTCACGGAGCTCTTGT TCGGCGAATAAACCCTGGGGACGTCATTGATGTTGCTGGAATATTCTTGCCCACACCATA TACTGGATTCAAGGCGATCAGAGCTGGTCTCCTCACCGATACCTATTTGGAAGCACAGCA TGTCACGCAGCACAAGAAGGCTTATGAGGATCTGGAAGTCGACCACCAAATCTCTAAGCG TATTGAGCAATATCAAGCATCCGGTCACGTGTATGAGTATCTAGCCAAGTCTATTGCACC TGAAATCTATGGTCATCTTGATGTGAAGAAAGCACTACCTTTGTTGCTCGTCGGTGGAGT C--ACCAAACAGATGGGGGATGGTATGCG-T-ATCAGGGGTGATATCAACATCTGCTTGA TGGGAGACCC [36] CBS85497 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACAGAGT-TCATGCCCTCAC-GGGTA GA---CCTCCCACCC-TTGTGTA-TTTATACCATGTTGCTTTGGCAGGCTGCTGCCCCCC TC--GGGG--GACAGCCCCAGCGCCTTC--GGG--CCTGGGAGTCGCCTGCCGGAGGAAA AACA-AACTCTGAATTGTTAGTGTCGTCTGAGT-ACTATATTTTAATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCTGCTTGGTATTGG GCC--T-TCGCCGGGCGACCGGCGGGCCTTAAAGTCAGTGGCGGCGCCGTTGGGTCCTGA ACGTAGTAACA--TACCTCTCGTTACAGGGTCCCCGCGTGCTTCTG-CCATTAAA---CC CCAAACTTTTTATGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTCGTAAGTTCT-------CCTTTAC-CATTCTACTAT TTCAGCCCTGTGGAAACTTGGCATAGGCAT-CTCAAAAACTT---------GG-AA-GCT AATGA-GTGGGACTTAACAGGACAAGAATGGCGACGGTCAGTAATCCCTTCTCCAAATCA CACGCGAATCCTTTCTG-T----CGCATATTGGGCTGGG------AAGATGTCCACTCTA CTCGATTTACCCCTTTTTC-GCATGCACTGAGCAGAC-GGACGAC-GAGGCGTGGATTAC GATCGCGATCT------------TGAATATCATGCTGATGGATAGGTTCA-AGGACAAAT TACTAGCAAGGAGTTGGGCACCGTTATGCGATCCCTCGGCCAAAATCCTTCAGAGTCTGA GCTTCAGGATATGATCAACGAGGTTGACGCTGATAACAACGGCACCATTGACTTCCCAGG TATGAAATGAGAC-TATATC--AGATGGTTAGGA--CTG-GGGCTAATACTGGC-AACTT GCAGAGTTTCTTACCATGATGGCCAGAAAGATGAAGCCGACTGTAGAAGTTAACGCATAC ACTTGCGATCGATGTGGTTGCGAAATTTTCCAACCTGTTGGAT-CCAAAACTTTCGGGCC TTTGGTAGAATGTCCGTCGCCAGACTGCAAGGTCAACCAAACCAAGGGACAACTGCATCA TTCTACTAGAGCATCAAAATTCCAGCCATTCCAGGAAGTTAAGATTCAAGAGATGGCCGA ACAAGTACCGGTTGGTCATATTCCAAGAATGTTGACCATTCTATGCCATGGAGCGCTTGT TCGTCGTATCAATCCAGGAGATGTTGTTGATGTCGCCGGAATATTCTTGCCTACCCCTTA CACTGGTTTCAAGGCCATAAGAGCTGGTCTTCTTACCGACACATATCTGGAAGCGCAACA TGTCACCCAACACAAGAAGGCATACGAAGATCTTACGATTGACAGCCGCGTGTTCAGACG AATTGAACAATACAGAGCTTCTGGTCATGTGTATGAGTACCTCGCTAAATCTATCGCTCC TGAAATCTACGGTCATCTCGATGTGAAAAAGGCACTACTATTGCTGTTGGTTGGTGGTGT G--ACGAAAGAAATGGGAGATGGTATGCG-C-ATCAGAGGTGATATCAACATCTGTCTTA TGGGAGACCC [37] CPB17 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACAGAGT-TCACGCCCTCAC-GGGTA GA---CCTCCCACCC-TTGTGTA-TCTATACTATGTTGCTTTGGCAGGCTGCTGGACCCC TC--GGGG--GACAGCCTCGGCGCCCTC--GGG--CCTGAGAGTCGCCTGCCGGAGGAAA AACA-AACTCTGAATTGTTAGTGTCGTCTGAGT-ACTATATTTTAATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCCTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCAGCTTGGTATTGG GCC--T-CCGCCGGGCGACCGGCGGGCCTTAAAGTCAGTGGCGGCGCCGTTGGGTCCTGA ACGTAGTAACA--TACACCTCGTTACAGGGCCCCCGCGTGCTTCTG-CCATTAAA---CC CCCAACTTTCTATGG-TGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTTGTAAGTTCT-------CCTTTAC-TATCCTACTAT TTCAGCCCTTTGCGAAGTTGGCATAGCTATTTTCAAAAACTT---------AG-AA-GCT AGTGG-TTGGGACTTAACAGGACAAGAATGGTGACGGTCAGTAC-TCCTTCTTCAAGCTA TATCCGAATTGCTTCTG-T----CGCATATCGGGTTGGG------TCATATCTGCCTTTA TTCGATTTACCCCTTTT---GCATACAATGATCGGAC-GGACGAC-GAGGCTTGGACCAC TATCGCGACCT------------TGAATATCATGCTGATGGGTAGCTTCA-AGGACAAAT TACTAGCAAGGAGCTGGGCACCGTTATGCGATCCCTTGGCCAAAATCCCTCAGAGTCTGA GCTTCAGGATATGATCAACGAGGTTGACGCTGATAACAACGGCACCATTGACTTCCCGGG TATGACATAACAT-TATATA--TGATGGTTCGGG--CTGTAGACTGACGTTTGCAAAACT GTAGAATTTCTCACCATGATGGCCAGAAAGATGAAGCCGACTGTAGAAGTTAACGCGTAC ACTTGCGATCGATGCGGTTGCG-AATTTTCCAGCCTGTTGGGT-CCAAAACTTTCGGGCC CTTGGTTGAATGTCCGTCGCCCGACTGCAAGGTCAACCAAACCAAGGGACAACTGCATCA TTCTACTAGAGCATCAAAATTCCAGCCATTCCAGGAAGTTAAGATTCAAGAGATGGCCGA ACAAGTACCAGTCGGTCATATTCCAAGAATGTTGACGATTCTATGCCATGGAGCACTTGT TCGTCGTATCAACCCGGGAGATGTCGTTGATGTCGCTGGAATATTCTTGCCTACCCCCTA CACTGGCTTCAAGGCGATAAGAGCTGGTCTTCTTACTGACACATATCTGGAAGCACAACA TGTCACCCAACACAAGAAGGCATACGAAGATCTTACCATTGACAGCCGCGTATTCAGACG GATTGAACAATACAGAGCTTCCGGTCATGTGTATGAGTACCTCGCTAAATCTATCGCCCC TGAAATCTACGGTCATCTCGATGTGAAGAAGGCACTACTATTGCTGTTGGTTGGTGGTGT G--ACAAAGGAAATGGGAGATGGTATGCG-C-ATCAGAGGTGATATCAACATTTGTCTTA TGGGTGATCC [38] CPB5 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACAGAGT-TCACGCCCTCAC-GGGTA GA---CCTCCCACCC-TTGTGTA-TCTATACTATGTTGCTTTGGCAGGCTGCTGGACCCC TC--GGGG--GACAGCCTCGGCGCCCTC--GGG--CCTGAGAGTCGCCTGCCGGAGGAAA AACA-AACTCTGAATTGTTAGTGTCGTCTGAGT-ACTATATTTTAATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCCTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCAGCTTGGTATTGG GCC--T-CCGCCGGGCGACCGGCGGGCCTTAAAGTCAGTGGCGGCGCCGTTGGGTCCTGA ACGTAGTAACA--TACACCTCGTTACAGGGCCCCCGCGTGCTTCTG-CCATTAAA---CC CCCAACTTTCTATGG-TGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTATTCGTAAGTCCT-------CCGCTAC-CATCCTGCTAT TTCAGCCCTATGTGAACTTGGCATAGGCATCGTCAAACACTT---------GGAAA-GCT AATGT-GCGGGACTTAACAGGACAAGAATGGCGACGGTCAGTACTCTCTTCCGCAAGGCA CACCGGATTTCTGTCTG-T----CGCATGCTGCATTGGG-------ACATGTCCACTCTA CTCGATTTACCCCTTTTTC-GCATGCACTGAGCAGAC-AGACGAC-AAGGCGTGGACCAC GATCGCGATCT------------TGAATATCATGCTGATGGATAGCTTCA-AGGACAAAT TACTAGCAAGGAGTTGGGGACTGTTATGCGATCCCTTGGCCAAAATCCTTCAGAGTCTGA GCTTCAGGATATGATCAACGAGGTTGACGCTGATAACAACGGCACCATTGACTTCCCGGG TATGACATAACAT-TATATA--TGATGGTTCGGG--CTGTGGACTGACGTTTGCAAAACT GTAGAATTTCTCACCATGATGGCCAGAAAGATG?????????GTTGAAGTTAACGCATAC ACTTGCGATCGATGCGGTTGCG-AATTTTCCAGCCTGTTGGGT-CCAAAACTTTCGGGCC CTTGGTTGAATGTCCGTCGCCCGACTGCAAGGTCAACCAAACCAAGGGACAACTGCATCA TTCTACTAGAGCATCAAAATTCCAGCCATTCCAGGAAGTTAAGATTCAAGAGATGGCCGA ACAAGTACCAGTCGGTCATATTCCAAGAATGTTGACGATTCTATGCCATGGAGCACTTGT TCGTCGTATCAACCCGGGAGATGTCGTTGATGTCGCTGGAATATTCTTGCCTACCCCCTA CACTGGCTTCAAGGCGATAAGAGCTGGTCTTCTTACTGACACATATCTGGAAGCACAACA TGTCACCCAACACAAGAAGGCATACGAAGATCTTACCATTGACAGCCGCGTATTCAGACG GATTGAACAATACAGAGCTTCCGGTCATGTGTATGAGTACCTCGCTAAATCTATCGCCCC TGAAATCTACGGTCATCTCGATGTGAAGAAGGCACTACTATTGCTGTTGGTTGGTGGTGT G--ACAAAGGAAATGGGAGATGGTATGCG-C-ATCAGAGGTGATATCAACATTTGTCTTA TGGGTGATCC [39] D19 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACCGAGT-TCACGCCCTCAC-GGGTA GA---CCTCCAACCC-TTGTGTA-TCTCTACCATGTTGCTTTGGCAGGCTGCTCGACCCT TC--CGGG--GACAGCCTCAGCGCCCTCCGGGG--CCGGAGAGTCGCCTGCCGGAGGAAA ATCACAACTCTGAATTGTCAGTGTCGTCTGAGTGACTATCT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAGCTCTCTGCTTGGTATTGG GCC--T-CCGCCGGTCACACGGCGGGCCTTAAAGTCAGTGGCGGCGCCGCTGGGTCCTGA ACGTAGTAACACATACCTCTCGTTACAGGGTCCCCGCGCGCTCCCG-CCGTAAAA-CCCC CCTCATTTTCTCTGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCCTTGTAAGTTCT-------CCTTTAC-TATCCTACTAT TTCAGCCCTTTGCGAAGTTGGTATAGCTATTTTCAAAAACTT---------AG-AA-GCT AATGG-TTGGGACTTAACAGGACAAGAATGGTGACGGTCAGTAC-TCCTTCTTCAAGCTA TATCCGAATTGTTTCTG-T----CGCATATTGGGTTGGG------TCATATCTGCCTTTA TTCGATTTACCCCTTTT---GCATACAATGATCGGAC-GGACGAC-GAGGCTTGGACCAC TATCGCGACCT------------TGAATATCATGCTGATGGGTAGCTTCA-AGGACAAAT TACTAGCAAGGAGCTGGGCACCGTTATGCGATCCCTTGGCCAAAATCCCTCAGAGTCTGA GCTTCAGGATATGATCAACGAGGTTGACGCTGATAACAACGGCACCATTGACTTCCCGGG TATGACATAACAT-TATATA--TGATGGTTCGGG--CTGTAGACTGACGTTTGCAAAACT GTAGAATTTCTCACCATGATGGCCAGAAAGATG??????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ?????????? [40] DRR09 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACCGAGT-TCACGCCCTCAC-GGGTA GA---CCTCCAACCC-TTGTGTA-TCTCTACCATGTTGCTTTGGCCGGCTGCTCGACCCT ACGGGGGG--GACAGCCTCAGCGCCCTCCGGGG--CCCGAGAGTCGCCGGCCGGAGGAAA ATCACAACTCTGAATTGTCAGTGTCGTCTGAGTGACTATCT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCTGCTTGGTCTTGG GCC--T-GCGCCGGTCACACGGCGGGCCTCAAAGTTAGTGGCGGTGCCGCTGGGTCCTGA ACGTAGTAACACATACCTCTCGTTACAGGGTCCCCGCGCGCGCCCG-CCGTAAAA--CCC CCTCATTTTCTCTGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTTGTAAGTTCT-------CCTTTAC-CATCCTACTAT TTCAGCCCTTTGCGAAGTTGGCATAGCCATTTTCAAAAACTT---------AG-AA-GCT AATGG-TTGGGACTTAACAGGACAAGAATGGCGACGGTCAGTAC-CCCTTCTTCAAGCCA CATCCGAATTGTTTCTG-T----CGCATATTGGGTTGGG------TCATATCTGCCTTTA TTCGATTTACCCCTTTT---GTATACAATGATCGGAC-GGACGAC-GAGGCTTGGACCAC TATCGCGACCT------------TGAATATCATGCTGATGGGTAGCTTCA-AGGACAAAT TACTAGCAAGGAGCTGGGCACCGTTATGCGATCCCTTGGCCAAAATCCCTCAGAGTCTGA GCTTCAGGATATGATCAACGAGGTTGACGCTGATAACAACGGCACCATTGACTTCCCGGG TATGACATAACAT-TATATA--TGATGGTTCGGG--CTGTGGACTGACGTTTGCAAAACT GTAGAATTTCTCACCATGATGGCCAGAAAGATGAAGCCGACCGTTGAAGTTAATGCGTAC ACTTGCGATCGATGCGGTTGCGAAATCTTCCAACCTGTTGGAT-CCAAAACGTTCGGACC TTTGGTAGAATGCCCGTCGCCAGACTGCAAGGTCAACCAAACCAAGGGACAATTACATCA TTCCACTAGGGCATCAAAATTCCTGCCATTCCAGGAAGTCAAGATTCAAGAGATGGCCGA ACAAGTACCAGTTGGTCATATTCCGAGAATGTTAACTGTTCTCTGCCATGGAGCGCTTGT TCGTCGTATCAACCCGGGGGATGTCGTAGATGTCGCCGGCATATTCTTGCCTACCCCCTA CACTGGTTTCAAGGCGATAAGAGCTGGCCTTCTTACCGACACATATCTGGAAGCACAACA CGTCACCCAGCATAAGAAGGCATATGAAGATCTTACCATTGATAGCCGCGTGTTTAGACG GATTGAACAGTACAGAACTTCAGGTCACGTGTATGAGTACCTCGCCAAATCTATCGCTCC TGAGATCTACGGCCATCTCGATGTGAAGAAGGCATTACTCTTGTTATTGGTTGGTGGTGT G--ACAAAGGAAATGGG??????????????????????????????????????????? ?????????? [41] DS7440203 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACAGAGT-TCATGCCCGAAA-GGGTA GA---CCTCCCACCC-TTGTGTA-TTATTACTTTGTTGCTTTGGCGAGCTGCTCTTCG-- ------------------------------GGG--CCTTGTA--TGCTCGCCAGAGAATA TCAA-AACTCT-TTTTATTAATGTCGTCTGAGT-ACTATAT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCAGCTTGGTATTGA GTC--C-ATGTCAGT--AATGGCAGGCTCTAAAATCAGTGGCGGCGCCGCTGGGTCCTGA ACGTAGTAATA----TCTCTCGTTACAGGTTCTCGGTGTGCTTCTG-CAAAAAA----CC CAA--TTTTCTATGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATA?? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ?????????????????????????????????AAGCCAACCGTGGAAGTCAACGCATAC ACTTGTGATAGATGCGGTTGTGAGATATTTCAGCCCGTCGGGT-CCAAGACCTTTGGACC ATTAGTCGAATGCCCTTCTCCTGACTGTACTACCAACCAAACCAAAGGGCAACTCCATCA CTCCACTCGAGCCTCAAAATTCCAGCCATTTCAAGAGGTTAAAATTCAGGAAATGGCCGA ACAAGTTCCAGTTGGTCACATTCCTCGAATGCTAACTGTTCTTTGCCATGGAGCTTTAGT ACGACGTATAAATCCTGGAGATGTTGTTGATATTGCAGGAATTTTCTTACCTACTCCATA TACTGGTTTCAAAGCCATCAGAGCTGGTCTTCTTACCGATACGTATCTTGAGGCACAACA CGTCACTCAACATAAAAAGGCTTACGAAGATTTAACGATTGATAGCCGAGTATTCAAGCG AATTGAGCAATACAGAGCCTCTGGTCACGTTTACGAATACCTTGCAAAATCTATCGCGCC TGAAATTTACGGACACTTGGATGTGAAGAAGGCATTACTTTTGTTATTGGTCGGTGGTGT T--ACTAAAACTATGGGTGATGGAATGCG-A-ATTAGGGGTGATATCAATATCTGTTTGA TGGGAGACCC [42] HP50 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACCGAGT-TCACGCCCTCAC-GGGTA GA---CCTCCAACCC-TTGTGTA-TCTCTACCATGTTGCTTTGGCAGGCTGCTCGACCCT TC--CGGG--GACAGCCTCAGCGCCCTCCGGGG--CCGGAGAGTCGCCTGCCGGAGGAAA ATCACAACTCTGAATTGTCAGTGTCGTCTGAGTGACTATCT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAGCTCTCTGCTTGGTATTGG GCC--T-CCGCCGGTCACACGGCGGGCCTTAAAGTCAGTGGCGGCGCCGCTGGGTCCTGA ACGTAGTAACACATACCTCTCGTTACAGGGTCCCCGCGCGCTCCCG-CCGTAAAA-CCCC CCTCATTTTCTCTGG-TGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTTGTAAGTTCT-------CCTTTAC-TATCCTACTAT TTCAGCCCTTTGCGAAGTTGGCATAGCTATTTTCAAAAACTT---------AG-AA-GCT AATGG-TTGGGACTTAACAGGACAAGAATGGTGACGGTCAGTAC-TCCTTCTTCAAGCTA TATCCGAATTGTTTCTG-T----CGCATATTGGGTTGGG------TCATATCTGCCTTTA TTCGATTTACCCCTTTT---GCATACAATGATCGGAC-GGACGAC-GAGGCTTGGACCAC TATCGCGACCT------------TGAATATCATGCTGATGGGTAGCTTCA-AGGACAAAT TACTAGCAAGGAGCTGGGCACCGTTATGCGATCCCTTGGCCAAAATCCCTCAGAGTCTGA GCTTCAGGATATGATCAACGAGGTTGACGCTGATAACAACGGCACCATTGACTTCCCGGG TATGACATAACAT-TATATA--TGATGGTTCGGG--CTGTAGACTGACGTTTGCAAAACT GTAGAATTTCTCACCATGATGGCCAGAAAGATG??????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ?????????? [43] IMI167641 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACAGAGT-TCACGCCCTCAC-GGGTA GA---CCTCCCACCC-TTGTGTA-TCTATACTATGTTGCTTTGGCAGGCTGCTGGACCCC TC--GGGG--GACAGCCTCGGCGCCCTC--GGG--CCTGAGAGTCGCCTGCCGGAGGAAA AACA-AACTCTGAATTGTTAGTGTCGTCTGAGT-ACTATATTTTAATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCCTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCAGCTTGGTATTGG GCC--T-CCGCCGGGCGACCGGCGGGCCTTAAAGTCAGTGGCGGCGCCGTTGGGTCCTGA ACGTAGTAACA--TACACCTCGTTACAGGGCCCCCGCGTGCTTCTG-CCATTAAA---CC CCCAACTTTCTATGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTATTCGTAAGTCCT-------CCGCTAC-CATCCTGCTAT TTCAGCCCTATGTGAACTTGGCATAGGCATCGTCAAACACTT---------GGAAA-GCT AATGT-GCGGGACTTAACAGGACAAGAATGGCGACGGTCAGTACTCTCTTCCGCAAGGCA CACCGGATTTCTGTCTG-T----CGCATGCTGCATTGGG-------ACATGTCCACTCTA CTCGATTTACCCCTTTTTC-GCATGCACTGAGCAGAC-AGACGAC-AAGGCGTGGACCAC GATCGCGATCT------------TGAATATCATGCTGATGGATAGCTTCA-AGGACAAAT TACTAGCAAGGAGTTGGGGACTGTTATGCGATCCCTTGGCCAAAATCCTTCAGAGTCTGA GCTTCAGGATATGATCAACGAGGTTGATGCTGATAACAACGGCACCATCGACTTCCCAGG TACGACATGACAC-TCTGTC--TGATGGTTAGGA--TTGGGGGCTAATACTTGC-AATCT ACAGAATTCCTTACCATGATGGCCAGAAAGATGAAGCCGACTGTTGAAGTTAACGCATAC ACTTGCGATCGATGCGGTTGCGAAATTTTCCAGCCTGTTGGGT-CCAAAACTTTCGGGCC CTTGGTTGAATGTCCGTCGCCCGACTGCAAGGTCAACCAAACCAAGGGACAACTGCATCA TTCTACTAGAGCATCAAAATTCCAGCCATTCCAGGAAGTTAAGATTCAAGAGATGGCCGA ACAAGTACCAGTCGGTCATATTCCAAGAATGTTGACGATTCTATGCCATGGAGCACTTGT TCGTCGTATCAACCCGGGAGATGTCGTTGATGTCGCTGGAATATTCTTGCCTACCCCCTA CACTGGCTTCAAGGCGATAAGAGCTGGTCTTCTTACTGACACATATCTGGAAGCACAACA TGTCACCCAACACAAGAAGGCATACGAAGATCTTACCATTGACAGCCGCGTATTCAGACG GATTGAACAATACAGAGCTTCCGGTCATGTGTATGAGTACCTCGCTAAATCTATCGCCCC TGAAATCTACGGTCATCTCGATGTGAAGAAGGCACTACTATTGCTGTTGGTTGGTGGTGT G--ACAAAGGAAATGGGAGATGGTATGCG-C-ATCAGAGGTGATATCAACATTTGTCTTA TGGGTGATCC [44] LEF17T21 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACCGAGT-TCACGCCCTCAC-GGGTA GA---CCTCCAACCC-TTGTGTA-TCTCTACCATGTTGCTTTGGCAGGCTGCTCGACCCT TC--CGGG--GACAGCCTCAGCGCCCTCCGGGG--CCGGAGAGTCGCCTGCCGGAGGAAA ATCACAACTCTGAATTGTCAGTGTCGTCTGAGTGACTATCT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAGCTCTCTGCTTGGTATTGG GCC--T-CCGCCGGTCACACGGCGGGCCTTAAAGTCAGTGGCGGCGCCGCTGGGTCCTGA ACGTAGTAACACATACCTCTCGTTACAGGGTCCCCGCGCGCTCCCG-CCGTAAAA-CCCC CCTCATTTTCTCTGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTTGTAAGTTCT-------CCTTTAC-TATCCTACTAT TTCAGCCCTTTGCGAAGTTGGCATAGCTATTTTCAAAAACTT---------AG-AA-GCT AATGG-TTGGGACTTAACAGGACAAGAATGGTGACGGTCAGTAC-TCCTTCTTCAAGCTA TATCCGAATTGTTTCTG-T----CGCATATTGGGTTGGG------TCATATCTGCCTTTA TTCGATTTACCCCTTTT---GCATACAATGATCGGAC-GGACGAC-GAGGCTTGGACCAC TATCGCGACCT------------TGAATATCATGCTGATGGGTAGCTTCA-AGGACAAAT TACTAGCAAGGAGCTGGGCACCGTTATGCGATCCCTTGGCCAAAATCCCTCAGAGTCTGA GCTTCAGGATATGATCAACGAGGTTGACGCTGATAACAACGGCACCATTGACTTCCCGGG TATGACATAACAT-TATATA--TGATGGTTCGGG--CTGTAGACTGACGTTTGCAAAACT GTAGAATTTCTCACCATGATGGCCAGAAAGATG??????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ?????????? [45] LFDF14 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACCGAGT-TCACGCCCTCAC-GGGTA GA---CCTCCAACCC-TTGTGTA-TCTCTACCATGTTGCTTTGGCCGGCTGCTCGACCCT TC--GGGG--GACAGCCTCAGCGCCCTCCGGGG--CCCGAGAGTCGCCGGCCGGAGGAAA ACCACAACTCTGAATTGTCAGTGTCGTCTGAGTGACTATCT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCTGCTTGGTCTTGG GCC--T-GCGCCGGTCACACGGCGGGCCTCAAAGTCAGTGGCGGTGCCGCTGGGTCCTGA ACGTAGTAACACATACCTCTCGTTACAGGGTCCCCGCGCGCGCCCG-CCGTAAAACCCCC CCTCATTTTCGCTGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTTGTAAGTTCT-------CCTTTAC-CATCCTACCAT TTCAGCCCTTTGCGAAGTTGGCATAGCCATTTTCAAAAACTT---------AG-AA-GCT AATGG-TTGGGACTTAACAGGACAAGAATGGCGACGGTCAGTAC-CCCTTCTTCAAGCCA CATCCGAATTGTTTCTG-T----CGCATATTGGGTTGGG------TCATATCTGCCTTTA TTCGATTTACCCCTTTT---GCATACAATGATCGGAC-GGACGAC-GAGGCTTGGACCAC TATCGCGACCT------------TGAATATCATGCTGATGGGTAGCTTCA-AGGACAAAT TACTAGCAAGGAGCTGGGCACCGTTATGCGATCCCTTGGCCAAAATCCCTCAGAGTCTGA GCTTCAGGATATGATCAACGAGGTTGACGCTGATAACAACGGCACCATTGACTTCCCGGG TATGATATAACAT-TATATA--TGATGGTCCGGG--CTGTGGACTGACGTTTGCAAAACC GTAGAATTTCTCACCATGATGGCCAGAAAGATG??????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ?????????? [46] LWC102 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACCGAGT-TCACGCCCTCAC-GGGTA GA---CCTCCAACCC-TTGTGTA-TCTCTACCATGTTGCTTTGGCAGGCTGCTCGACCCT TC--CGGG--GACAGCCTCAGCGCCCTCCGGGG--CCGGAGAGTCGCCTGCCGGAGGAAA ATCACAACTCTGAATTGTCAGTGTCGTCTGAGTGACTATCT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAGCTCTCTGCTTGGTATTGG GCC--T-CCGCCGGTCACACGGCGGGCCTTAAAGTCAGTGGCGGCGCCGCTGGGTCCTGA ACGTAGTAACACATACCTCTCGTTACAGGGTCCCCGCGCGCTCCCG-CCGTAAAA-CCCC CCTCATTTTCTCTGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTTGTAAGTTCT-------CCTTTAC-TATCCTACTAT TTCAGCCCTTTGCGAAGTTGGCATAGCTATTTTCAAAAACTT---------AG-AA-GCT AATGG-TTGGGACTTAACAGGACAAGAATGGTGACGGTCAGTAC-TCCTTCTTCAAGCTA TATCCGAATTGTTTCTG-T----CGCATATTGGGTTGGG------TCATATCTGCCTTTA TTCGATTTACCCCTTTT---GCATACAATGATCGGAC-GGACGAC-GAGGCTTGGACCAC TATCGCGACCT------------TGAATATCATGCTGATGGGTAGCTTCA-AGGACAAAT TACTAGCAAGGAGCTGGGCACCGTTATGCGATCCCTTGGCCAAAATCCCTCAGAGTCTGA GCTTCAGGATATGATCAACGAGGTTGACGCTGATAACAACGGCACCATTGACTTCCCGGG TATGACATAACAT-TATATA--TGATGGTTCGGG--CTGTAGACTGACGTTTGCAAAACT GTAGAATTTCTCACCATGATGGCCAGAAAGATGAAGCCGACCGTTGAAGTTAATGCGTAC ACTTGCGATCGATGCGGTTGCGAAATCTTCCAACCTGTTGGAT-CCAAAACGTTCGGACC TTTGGTAGAATGCCCGTCGCCAGACTGCAAGGTCAACCAAACCAAGGGACAATTACATCA TTCCACTAGGGCATCGAAATTCCAGCCATTCCAGGAAGTCAAGATTCAAGAGATGGCCGA ACAAGTACCAGTTGGTCATATTCCGAGAATGTTAACTGTCCTCTGCCATGGAGCGCTTGT TCGTCGTATCAACCCGGGGGATGTCGTTGATGTCGCCGGCATATTCTTGCCTACCCCCTA CACTGGTTTCAAGGCGATAAGAGCTGGCCTTCTTACCGACACATATCTGGAAGCACAACA TGTCACCCAGCACAAGAAGGCATATGAAGATCTTACCATTGATAGCCGCGTGTTTAGACG GATTGAACAGTACAGAACTTCCGGTCACGTGTATGAGTACCTCGCCAAATCTATCGCTCC TGAGATCTACGGTCATCTCGATGTGAAGAAGGCATTACTCTTGTTATTGGTTGGTGGTGT G--ACAAAGGAAATGGGAGATGGTATGCG-C-ATCGAAGGTGACATCAACATTTGTCTAA TGGGTGA??? [47] MAFF235854 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACCGAGT-TCACGCCCTCAC-GGGTA GA---CCTCCAACCC-TTGTGTA-TCTCTACCATGTTGCTTTGGCAGGCTGCTCGACCCT TC--GGGG--GACAGCCTCAGCGCCCTCCGGGG--CCGGAGAGTCGCCTGCCGGAGGAAA ATCACAACTCTGAATTGTCAGTGTCGTCTGAGTGACTATCT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCTGCTTGGTATTGG GCCCTT-CCGCCGGTCACACGGCGGGCCTTAAAGTCAGTGGCGGCGCCGCTGGGTCCTGA ACGTAGTAACACATACCTCTCGTTACAGGGTCCCCGCGCGCTCCCG-CCGTAAAA-CCCC CCTCATTTTCTCTGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTTGTAAGTTCT-------CCTTTAC-TATCCTACTAT TTCAGCCCTTTGCGAAGTTGGCATAGCTATTTTCAAAAACTT---------AG-AA-GCT AGTGG-TTGGGACTTAACAGGACAAGAATGGTGACGGTCAGTAC-TCCTTCTTCAAGCTA TATCCGAATTGTTTCTG-T----CGCATATCGGGTTGGG------TCATATCTGCCTTTA TTCGATTTACCCCTTTT---GCATACAATGATCGGAC-GGACGAC-GAGGCTTGGACCAC TATCGCGACCT------------TGAATATCATGCTGATGGGTAGCTTCA-AGGACAAAT TACTAGCAAGGAGCTGGGCACCGTTATGCGATCCCTTGGCCAAAATCCCTCAGAGTCTGA GCTTCAGGATATGATCAACGAGGTTGACGCTGATAACAACGGCACCATTGACTTCCCGGG TATGACATAACAT-TATATA--TGATGGTTCGGG--CTGTAGACTGACGTTTGCAAAACT GTAGAATTTCTCACCATGATGGCCAGAAAGATGAAGCCGACCGTTGAAGTTAATGCGTAC ACTTGCGATCGATGCGGTTGCGAAATCTTCCAACCTGTTGGAT-CCAAAACGTTCGGACC TTTGGTAGAATGCCCGTCGCCAGACTGCAAGGTCAACCAAACCAAGGGACAATTACATCA TTCCACTAGGGCATCGAAATTCCAGCCATTCCAGGAAGTCAAGATTCAAGAGATGGCCGA ACAAGTACCAGTTGGTCATATTCCGAGAATGTTAACTGTCCTCTGCCATGGAGCGCTTGT TCGTCGTATCAACCCGGGGGATGTCGTTGATGTCGCCGGCATATTCTTGCCTACCCCCTA CACTGGTTTCAAGGCGATAAGAGCTGGCCTTCTTACCGACACATATCTGGAAGCACAACA TGTCACCCAGCACAAGAAGGCATATGAAGATCTTACCATTGATAGCCGCGTGTTTAGACG GATTGAACAGTACAGAACTTCCGGTCACGTGTATGAGTACCTCGCCAAATCTATCGCTCC TGAGATCTACGGTCATCTCGATGTGAAGAAGGCATTACTCTTGTTATTGGTTGGTGGTGT G--ACAAAGGAAATGGGAGATGGTATGCG-C-ATCAGAGGTGACATCAACATTTGTCTAA TGGGAGACCC [48] MAFF235856 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACCGAGT-TCACGCCCTCAC-GGGTA GA---CCTCCAACCC-TTGTGTA-TCTCTACCATGTTGCTTTGGCAGGCTGCTCGACCCT TC--GGGG--GACAGCCTCAGCGCCCTCCGGGG--CCGGAGAGTCGCCTGCCGGAGGAAA ATCACAACTCTGAATTGTCAGTGTCGTCTGAGTGACTATCT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCTGCTTGGTATTGG GCCCTT-CCGCCGGTCACACGGCGGGCCTTAAAGTCAGTGGCGGCGCCGCTGGGTCCTGA ACGTAGTAACACATACCTCTCGTTACAGGGTCCCCGCGCGCTCCCG-CCGTAAAA-CCCC CCTCA-TTTCTCTGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTTGTAAGTTCT-------CCTTTAC-TATCCTACTAT TTCAGCCCTTTGCGAAGTTGGCATAGCTATTTTCAAAAACTT---------AG-AA-GCT AATGG-TTGGGACTTAACAGGACAAGAATGGTGACGGTCAGTAC-TCCTTCTTCAAGCTA TATCCGAATTGTTTCTG-T----CGCATATTGGGTTGGG------TCATATCTGCCTTTA TTCGATTTACCCCTTTT---GCATACAATGATCGGAC-GGACGAC-GAGGCTTGGACCAC TATCGCGACCT------------TGAATATCATGCTGATGGGTAGCTTCA-AGGACAAAT TACTAGCAAGGAGCTGGGCACCGTTATGCGATCCCTTGGCCAAAATCCCTCAGAGTCTGA GCTTCAGGATATGATCAACGAGGTTGACGCTGATAACAACGGCACCATTGACTTCCCGGG TATGACATAACAT-TATATA--TGATGGTTCGGG--CTGTAGACTGACGTTTGCAAAACT GTAGAATTTCTCACCATGATGGCCAGAAAGATG?????????GTTGAAGTTAATGCGTAC ACTTGCGATCGATGCGGTTGCG-AATCTTCCAACCTGTTGGAT-CCAAAACGTTCGGACC TTTGGTAGAATGCCCGTCGCCAGACTGCAAGGTCAACCAAACCAAGGGACAATTACATCA TTCCACTAGGGCATCGAAATTCCAGCCATTCCAGGAAGTCAAGATTCAAGAGATGGCCGA ACAAGTACCAGTTGGTCATATTCCGAGAATGTTAACTGTCCTCTGCCATGGAGCGCTTGT TCGTCGTATCAACCCGGGGGATGTCGTTGATGTCGCCGGCATATTCTTGCCTACCCCCTA CACTGGTTTCAAGGCGATAAGAGCTGGCCTTCTTACCGACACATATCTGGAAGCACAACA TGTCACCCAGCACAAGAAGGCATATGAAGATCTTACCATTGATAGCCGCGTGTTTAGACG GATTGAACAGTACAGAACTTCCGGTCACGTGTATGAGTACCTCGCCAAATCTATCGCTCC TGAGATCTACGGTCATCTCGATGTGAAGAAGGCATTACTCTTGTTATTGGTTGGTGGTGT G--ACAAAGGAAATGGGAGATGGTATGCG-C-ATCAGAGGTGACATCAACATTTGTCTAA TGGG?????? [49] MAFF235858 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACCGAGT-TCACGCCCTCAC-GGGTA GA---CCTCCAACCC-TTGTGTA-TCTCTACCATGTTGCTTTGGCAGGCTGCTCGACCCT TC--GGGG--GACAGCCTCAGCGCCCTCCGGGG--CCGGAGAGTCGCCTGCCGGAGGAAA ATCACAACTCTGAATTGTCAGTGTCGTCTGAGTGACTATCT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCTGCTTGGTATTGG GCCCTT-CCGCCGGTCACACGGCGGGCCTTAAAGTCAGTGGCGGCGCCGCTGGGTCCTGA ACGTAGTAACACATACCTCTCGTTACAGGGTCCCCGCGCGCTCCCG-CCGTAAAA-CCCC CCTCA-TTTCTCTGG-TGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTTGTAAGTTCT-------CCTTTAC-TATCCTACTAT TTCAGCCCTTTGCGAAGTTGGCATAGCTATTTTCAAAAACTT---------AG-AA-GCT AATGG-TTGGGACTTAACAGGACAAGAATGGTGACGGTCAGTAC-TCCTTCTTCAAGCTA TATCCGAATTGTTTCTG-T----CGCATATTGGGTTGGG------TCGTATCTGCCTTTA TTCGATTTACCCCTTTT---GCATACAATGATCGGAC-GGACGAC-GAGGCTTGGACCAC TATCGCGACCT------------TGAATATCATGCTGATGGGTAGCTTCA-AGGACAAAT TACTAGCAAGGAGCTGGGCACCGTTATGCGATCCCTTGGCCAAAATCCCTCAGAGTCTGA GCTTCAGGATATGATCAACGAGGTTGACGCTGATAACAACGGCACCATTGACTTCCCGGG TATGACATAACAT-TATATA--TGATGGTTCGGG--CTGTAGACTGACGTTTGCAAAACT GTAGAATTTCTCACCATGATGGCCAGAAAGATG??????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ?????????? [50] MAFF236938 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACCGAGT-TCACGCCCTCAC-GGGTA GA---CCTCCAACCC-TTGTGTA-TCTCTACCATGTTGCTTTGGCCGGCTGCTCGACCCT AC--GGGG--GACAGCCTCAGCGCCCTCCGGGG--CCCGAGAGTCGCCGGCCGGAGGAAA ATCACAACTCTGAATTGTCAGTGTCGTCTGAGTGACTATCT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCTGCTTGGTCTTGG GCC--T-GCGCCGGTCACACGGCGGGCCTCAAAGTTAGTGGCGGTGCCGCTGGGTCCTGA ACGTAGTAACACATACCTCTCGTTACAGGGTCCCCGCGCGCGCCCG-CCGTAAAA--CCC CCTCA-TTTCTCTGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTTGTAAGTTCT-------CCTTTAC-CATCCTACTAT TTCAGCCCTTTGCGAAGTTGGCATAGCCATTTTCAAAAACTT---------AG-AA-GCT AATGG-TTGGGACTTAACAGGACAAGAATGGCGACGGTCAGTAC-CCCTTCTTCAAGCCA CATCCGAATTGTTTCTG-T----CGCATATTGGGTTGGG------TCATATCTGCCTTTA TTCGATTTACCCCTTTT---GCATACAATGATCGGAC-GGACGAC-GAGGCTTGGACCAC TATCGCGACCT------------TGAATATCATGCTGATGGGTAGCTTCA-AGGACAAAT TACTAGCAAGGAGCTGGGCACCGTTATGCGATCCCTTGGCCAAAATCCCTCAGAGTCTGA GCTTCAGGATATGATCAACGAGGTTGACGCTGATAACAACGGCACCATTGACTTCCCGGG TATGACATAACAT-TATATA--TGATGGTTCGGG--CTGTGGACTGACGTTTGCAAAACT GTAGAATTTCTCACCATGATGGCCAGAAAGATGAAGCCGACCGTTGAAGTTAATGCGTAC ACTTGCGATCGATGCGGTTGCG-AATCTTCCAACCTGTTGGAT-CCAAAACGTTCGGACC TTTGGTAGAATGCCCGTCGCCAGACTGCAAGGTCAACCAAACCAAGGGACAATTACATCA TTCCACTAGGGCATCAAAATTCCTGCCATTCCAGGAAGTCAAGATTCAAGAGATGGCCGA ACAAGTACCAGTTGGTCATATTCCGAGAATGTTAACTGTTCTCTGCCATGGAGCGCTTGT TCGTCGTATCAACCCGGGGGATGTCGTAGATGTCGCCGGCATATTCTTGCCTACCCCCTA CACTGGTTTCAAGGCGATAAGAGCTGGCCTTCTTACCGACACATATCTGGAAGCACAACA CGTCACCCAGCATAAGAAGGCATATGAAGATCTTACCATTGATAGCCGCGTGTTTAGACG GATTGAACAGTACAGAACTTCAGGTCACGTGTATGAGTACCTCGCCAAATCTATCGCTCC TGAGATCTACGGCCATCTCGATGTGAAGAAGGCATTACTCTTGTTATTGGTTGGTGGTGT G--ACAAAGGAAATGGGAGATGGTATGCG-C-ATCAGAGGTGACATCAACATTTGTCTTA TGGGAGA??? [51] MAFF236941 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACCGAGT-TCACGCCCTCAC-GGGTA GA---CCTCCAACCC-TTGTGTA-TCTCTACCATGTTGCTTTGGCAGGCTGCTCGACCCT TC--CGGG--GACAGCCTCAGCGCCCTCCGGGG--CCGGAGAGTCGCCTGCCGGAGGAAA ATCACAACTCTGAATTGTCAGTGTCGTCTGAGTGACTATCT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAGCTCTCTGCTTGGTATTGG GCC--T-CCGCCGGTCACACGGCGGGCCTTAAAGTCAGTGGCGGCGCCGCTGGGTCCTGA ACGTAGTAACACATACCTCTCGTTACAGGGTCCCCGCGCGCTCCCG-CCGTAAAA-CCCC CCTCATTTTCTCTGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTTGTAAGTTCT-------CCTTTAC-TATCCTACTAT TTCAGCCCTTTGCGAAGTTGGCATAGCTATTTTCAAAAACTT---------AG-AA-GCT AATGG-TTGGGACTTAACAGGACAAGAATGGTGACGGTCAGTAC-TCCTTCTTCAAGCTA TATCCGAATTGTTTCTG-T----CGCATATTGGGTTGGG------TCATATCTGCCTTTA TTCGATTTACCCCTTTT---GCATACAATGATCGGAC-GGACGAC-GAGGCTTGGACCAC TATCGCGACCT------------TGAATATCATGCTGATGGGTAGCTTCA-AGGACAAAT TACTAGCAAGGAGCTGGGCACCGTTATGCGATCCCTTGGCCAAAATCCCTCAGAGTCTGA GCTTCAGGATATGATCAACGAGGTTGACGCTGATAACAACGGCACCATTGACTTCCCGGG TATGACATAACAT-TATATA--TGATGGTTCGGG--CTGTAGACTGACGTTTGCAAAACT GTAGAATTTCTCACCATGATGGCCAGAAAGATGAAGCCGACCGTTGAAGTTAATGCGTAC ACTTGCGATCGATGCGGTTGCG-AATCTTCCAACCTGTTGGAT-CCAAAACGTTCGGACC TTTGGTAGAATGCCCGTCGCCAGACTGCAAGGTCAACCAAACCAAGGGACAATTACATCA TTCCACTAGGGCATCGAAATTCCAGCCATTCCAGGAAGTCAAGATTCAAGAGATGGCCGA ACAAGTACCAGTTGGTCATATTCCGAGAATGTTAACTGTCCTCTGCCATGGAGCGCTTGT TCGTCGTATCAACCCGGGGGATGTCGTTGATGTCGCCGGCATATTCTTGCCTACCCCCTA CACTGGTTTCAAGGCGATAAGAGCTGGCCTTCTTACCGACACATATCTGGAAGCACAACA TGTCACCCAGCACAAGAAGGCATATGAAGATCTTACCATTGATAGCCGCGTGTTTAGACG GATTGAACAGTACAGAACTTCCGGTCACGTGTATGAGTACCTCGCCAAATCTATCGCTCC TGAGATCTACGGTCATCTCGATGTGAAGAAGGCATTACTCTTGTTATTGGTTGGTGGTGT G--ACAAAGGAAATGGGAGATGGTATGCG-C-ATCAGAGGTGACATCAACATTTGTCTAA TGGGAGACCC [52] MB01 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACCGAGT-TCACGCCCTCAC-GGGTA GA---CCTCCAACCC-TTGTGTA-TCTCTACCATGTTGCTTTGGCAGGCTGCTCGACCCT TC--CGGG--GACAGCCTCAGCGCCCTCCGGGG--CCGGAGAGTCGCCTGCCGGAGGAAA ATCACAACTCTGAATTGTCAGTGTCGTCTGAGTGACTATCT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAGCTCTCTGCTTGGTATTGG GCC--T-CCGCCGGTCACACGGCGGGCCTTAAAGTCAGTGGCGGCGCCGCTGGGTCCTGA ACGTAGTAACACATACCTCTCGTTACAGGGTCCCCGCGCGCTCCCG-CCGTAAAA-CCCC CCTCATTTTCTCTGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTTGTAAGTTCT-------CCTTTAC-TATCCTACTAT TTCAGCCCTTTGCGAAGTTGGCATAGCTATTTTCAAAAACTT---------AG-AA-GCT AATGG-TTGGGACTTAACAGGACAAGAATGGTGACGGTCAGTAC-TCCTTCTTCAAGCTA TATCCGAATTGTTTCTG-T----CGCATATTGGGTTGGG------TCATATCTGCCTTTA TTCGATTTACCCCTTTT---GCATACAATGATCGGAC-GGACGAC-GAGGCTTGGACCAC TATCGCGACCT------------TGAATATCATGCTGATGGGTAGCTTCA-AGGACAAAT TACTAGCAAGGAGCTGGGCACCGTTATGCGATCCCTTGGCCAAAATCCCTCAGAGTCTGA GCTTCAGGATATGATCAACGAGGTTGACGCTGATAACAACGGCACCATTGACTTCCCGGG TATGACATAACAT-TATATA--TGATGGTTCGGG--CTGTAGACTGACGTTTGCAAAACT GTAGAATTTCTCACCATGATGGCCAGAAAGATGAAGCCGACCGTTGAAGTTAATGCGTAC ACTTGCGATCGATGCGGTTGCGAAATCTTCCAACCTGTTGGAT-CCAAAACGTTCGGACC TTTGGTAGAATGCCCGTCGCCAGACTGCAAGGTCAACCAAACCAAGGGACAATTACATCA TTCCACTAGGGCATCGAAATTCCAGCCATTCCAGGAAGTCAAGATTCAAGAGATGGCCGA ACAAGTACCAGTTGGTCATATTCCGAGAATGTTAACTGTCCTCTGCCATGGAGCGCTTGT TCGTCGTATCAACCCGGGGGATGTCGTTGATGTCGCCGGCATATTCTTGCCTACCCCCTA CACTGGTTTCAAGGCGATAAGAGCTGGCCTTCTTACCGACACATATCTGGAAGCACAACA TGTCACCCAGCACAAGAAGGCATATGAAGATCTTACCATTGATAGCCGCGTGTTTAGACG GATTGAACAGTATAGAACTTCCGGTCACGTGTATGAGTACCTCGCCAAATCTATCGCTCC TGAGATCTACGGTCATCTCGATGTGAAGAAGGCATTACTCTTGTTATTGGTTGGTGGTGT G--ACAAAGGAAATGGG??????????????????????????????????????????? ?????????? [53] PSFFB1 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACAGAGT-TCACGCCCTCAC-GGGTA GA---CCTCCCACCC-TTGTGTA-TCTATACTATGTTGCTTTGGCAGGCTGCTGGACCCC TC--GGGG--GACAGCCTCGGCGCCCTC--GGG--CCTGAGAGTCGCCTGCCGGAGGAAA AACA-AACTCTGAATTGTTAGTGTCGTCTGAGT-ACTATATTTTAATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCCTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCAGCTTGGTATTGG GCC--T-CCGCCGGGCGACCGGCGGGCCTTAAAGTCAGTGGCGGCGCCGTTGGGTCCTGA ACGTAGTAACA--TACACCTCGTTACAGGGCCCCCGCGTGCTTCTGTCCATTAAA---CC CCCAACTTTCTATGG-TGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTCGTAAGTTCT-------CCTTTAC-TATCCTACTAT TTCAGCCCTTTGCGAAGTTGGCATAGCCATTTTCAGGAACTT---------AG-AA-GCT AATGG-TTGGGACTTAACAGGACAAGAATGGCGACGGTCAGTAC-CCCTTCTTCAAGCCA CATCCGAATTGTTTCTG-T----CGCATATTGGGTTGGG------TCATATCTGCCTTTA TTCGATTTACCCCTTTT---GCATACAATGATCGGAC-GGACGAC-GAGGCTTGGACCAC TATCGCGACCT------------TGAATATCATGCTGATAGGTAGCTTCA-AGGACAAAT TACCAGCAAGGAGCTGGGCGCCGTTATGCGATCCCTTGGCCAAAATCCCTCAGAGTCTGA GCTTCAGGATATGATCAACGAGGTTGACGCTGATAACAACGGCACCATCGACTTCCCAGG TACGACATGACAC-TCTGTC--TGATGGTTAGGA--TTGGGGGCTAATACTTGC-AATCT ACAGAATTCCTTACCATGATGGCCAGAAAGATGAAGCCGACTGTTGAAGTTAACGCATAC ACTTGCGATCGATGCGGTTGCGAAATTTTCCAGCCTGTTGGGT-CCAAAACTTTCGGGCC CTTGGTTGAATGTCCGTCGCCCGACTGCAAGGTCAACCAAACCAAGGGACAACTGCATCA TTCTACTAGAGCATCAAAATTCCAGCCATTCCAGGAAGTTAAGATTCAAGAGATGGCCGA ACAAGTACCAGTCGGTCATATTCCAAGAATGTTGACGATTCTATGCCATGGAGCACTTGT TCGTCGTATCAACCCGGGAGATGTCGTTGATGTCGCTGGAATATTCTTGCCTACCCCCTA CACTGGCTTCAAGGCGATAAGAGCTGGTCTTCTTACTGACACATATCTGGAAGCACAACA TGTCACCCAACACAAGAAGGCATACGAAGATCTTACCATTGACAGCCGCGTATTCAGACG GATTGAACAATACAGAGCTTCCGGTCATGTGTATGAGTACCTCGCTAAATCTATCGCCCC TGAAATCTACGGTCATCTCGATGTGAAGAAGGCACTACTATTGCTGTTGGTTGGTGGTGT G--ACAAAGGAAATGGGAGATGGTATGCG-C-ATCAGAGGTGATATCAACATTTGTCTTA TGGGTGATCC [54] PSFFB3 ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ??????????????????????????????????????????????????????????GA GTTCAAGGAGGCCTTCTCCCTATTCGTAAGTCCT-------CCGCTAC-CATCCTGCTAT TTCAGCCCTATGTGAACTTGGCATAGGCATCGTCAAACACTT---------GGAAA-GCT AATGT-GCGGGACTTAACAGGACAAGAATGGCGACGGTCAGTACTCTCTTCCGCAAGGCA CACCGGATTTCTGTCTG-T----CGCATGCTGCATTGGG-------ACATGTCCACTCTA CTCGATTTACCCCTCTTTC-GCATGCACTGAGCAGAC-AGACGAC-AAGGCGTGGACCAC GATCGCGATCT------------TGAATATCATGCTGATGGATAGCTTCA-AGGACAAAT TACTAGCAAGGAGTTGGGGACTGTTATGCGATCCCTTGGCCAAAATCCTTCAGAGTCTGA GCTTCAGGATATGATCAACGAGGTTGATGCTGATAACAACGGCACCATCGACTTCCCAGG TACGACATGACAC-TCTGTC--TGATGGTTAGGA--TTGGGGGCTAATACTTGC-AATCT ACAGAATTCCTTACCATGATGGCCAGAAAGATG??????????????????????????? ???????????????????????TTTTTCCCAGCCTGTTGGGTCCCAAAACTTTCGGGCC CTTGGTTGAATGTCCGTCGCCCGACTGCAAGGTCAACCAAACCAAGGGACAACTGCATCA TTCTACTAGAGCATCAAAATTCCAGCCATTCCAGGAAGTTAAGATTCAAGAGATGGCCGA ACAAGTACCAGTCGGTCATATTCCAAGAATGTTGACGATTCTATGCCATGGAGCACTTGT TCGTCGTATCAACCCGGGAGATGTCGTTGATGTCGCTGGAATATTCTTGCCTACCCCCTA CACTGGCTTCAAGGCGATAAGAGCTGGTCTTCTTACTGACACATATCTGGAAGCACAACA TGTCACCCAACACAAGAAGGCATACGAAGATCTTACCATTGACAGCCGCGTATTCAGACG GATTGAACAATACAGAGCTTCCGGTCATGTGTATGAGTACCTCGCTAAATCTATCGCCCC TGAAATCTACGGTCATCTCGATGTGAAGAAGGCACTACTATTGCTGTTGGTTGGTGGTGT G--ACAAAGGAAATGGGAGATGGTATGCG-C-ATCAGAGGTGATATCAACATTTGTCTTA TGGGTGATCC [55] RB19 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACCGAGT-TCACGCCCTCAC-GGGTA GA---CCTCCAACCC-TTGTGTA-TCTCTACCATGTTGCTTTGGCCGGCTGCTCGACCCT TC--GGGG--GACAGCCTCAGCGCCCTCCGGGGC-CCCGAGAGTCGCCGGCCGGAGGAAA ACCACAACTCTGAATTGTCAGTGTCGTCTGAGTGACTATCT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCTGCTTGGTCTTGG GCC--T-GCGCCGGTCACACGGCGGGCCTCAAAGTCAGTGGCGGTGCCGCTGGGTCCTGA ACGTAGTAACACATACCTCTCGTTACAGGGTCCCCGCGCGCGCCCG-CCGTAAAA-CCCC CCTCATTTTCGCTGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTTGTAAGTTCT-------CCTTTAC-CATCCTACCAT TTCAGCCCTTTGCGAAGTTGGCATAGCCATTTTCAAAAACTT---------AG-AA-GCT AATGG-TTGGGACTTAACAGGACAAGAATGGCGACGGTCAGTAC-CCCTTCTTCAAGCCA CATCCGAATTGTTTCTG-T----CGCATATTGGGTTGGG------TCATATCTGCCTTTA TTCGATTTACCCCTTTT---GCATACAATGATCGGAC-GGACGAC-GAGGCTTGGACCAC TATCGCGACCT------------TGAATATCATGCTGATGGGTAGCTTCA-AGGACAAAT TACTAGCAAGGAGCTGGGCACCGTTATGCGATCCCTTGGCCAAAATCCCTCAGAGTCTGA GCTTCAGGATATAATCAACGAGGTTGACGCTGATAACAACGGCACCATTGACTTCCCGGG TATGATATAACAT-TATATA--TGATGGTCCGGG--CTGTGGACTGACGTTTGCAAAACC GTAGAATTTCTCACCATGATGGCCAGAAAGATGAAGCCGACCGTTGAAGTTAATGCGTAC ACTTGCGATCGATGCGGTTGTGAAATCTTCCAACCTGTTGGAT-CCAAAACGTTCGGACC TTTGGTAGAATGCCCGTCGCCAGACTGCAAGGTCAACCAAACCAAGGGACAATTACATCA TTCCACTAGGGCATCAAAATTCCTGCCATTCCAGGAAGTCAAGATTCAAGAGATGGCCGA ACAAGTACCAGTTGGTCATATTCCGAGAATGTTAACTGTTCTCTGCCATGGAGCGCTTGT TCGTCGTATCAACCCGGGGGATGTCGTAGATGTCGCCGGCATATTCTTGCCTACCCCCTA CACTGGTTTCAAGGCGATAAGAGCTGGCCTTCTTACCGACACATATCTGGAAGCACAACA CGTCACCCAGCATAAGAAGGCATATGAAGATCTTACCATTGATAGCCGCGTGTTTAGACG GATTGAACAGTACAGAACTTCCGGTCACGTGTATGAGTACCTCGCCAAATCTATCGCTCC TGAGATCTACGGTCATCTCGATGTGAAGAAGGCATTACTCTTGTTATTGGTTGGTGGTGT G--ACAAAGGAAATGGG??????????????????????????????????????????? ?????????? [56] RCCPG1 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACCGAGT-TCACGCCCTCAC-GGGTA GA---CCTCCAACCC-TTGTGTA-TCTCTACCATGTTGCTTTGGCAGGCTGCTCGACCCT TC--CGGG--GACAGCCTCAGCGCCCTCCGGGG--CCGGAGAGTCGCCTGCCGGAGGAAA ATCACAACTCTGAATTGTCAGTGTCGTCTGAGTGACTATCT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAGCTCTCTGCTTGGTATTGG GCC--T-CCGCCGGTCACACGGCGGGCCTTAAAGTCAGTGGCGGCGCCGCTGGGTCCTGA ACGTAGTAACACATACCTCTCGTTACAGGGTCCCCGCGCGCTCCCG-CCGTAAAA-CCCC CCTCATTTTCTCTGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTTGTAAGTTCT-------CCTTTAC-TATCCTACTAT TTCAGCCCTTTGCGAAGTTGGCATAGCTATTTTCAAAAACTT---------AG-AA-GCT AATGG-TTGGGACTTAACAGGACAAGAATGGTGACGGTCAGTAC-TCCTTCTTCAAGCTA TATCCGAATTGTTTCTG-T----CGCATATTGGGTTGGG------TCATATCTGCCTTTA TTCGATTTACCCCTTTT---GCATACAATGATCGGAC-GGACGAC-GAGGCCTGGACCAC TATCGCGACCT------------TGAATATCATGCTGATGGGTAGCTTCA-AGGACAAAT TACTAGCAAGGAGCTGGGCACCGTTATGCGATCCCTTGGCCAAAATCCCTCAGAGTCTGA GCTTCAGGATATGATCAACGAGATTGACGCTGATAACAACGGCACCATTGACTTCCCGGG TATGACATAACAT-TATATA--TGATGGTTCGGG--CTGTAGACTGACGTTTGCAAAACT GTAGAATTTCTCACCATGATGGCCAGAAAGATG??????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ?????????? [57] RE18G38 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACCGAGT-TCACGCCCTCAC-GGGTA GA---CCTCCAACCC-TTGTGTA-TCTCTACCATGTTGCTTTGGCAGGCTGCTCGACCCT TC--CGGG--GACAGCCTCAGCGCCCTCCGGGG--CCGGAGAGTCGCCTGCCGGAGGAAA ATCACAACTCTGAATTGTCAGTGTCGTCTGAGTGACTATCT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAGCTCTCTGCTTGGTATTGG GCC--T-CCGCCGGTCACACGGCGGGCCTTAAAGTCAGTGGCGGCGCCGCTGGGTCCTGA ACGTAGTAACACATACCTCTCGTTACAGGGTCCCCGCGCGCTCCCG-CCGTAAAA-CCCC CCTCATTTTCTCTGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTTGTAAGTTCT-------CCTTTAC-TATCCTACTAT TTCAGCCCTTTGCGAAGTTGGCATAGCTATTTTCAAAAACTT---------AG-AA-GCT AATGG-TTGGGACTTAACAGGACAAGAATGGTGACGGTCAGTAC-TCCTTCTTCAAGCTA TATCCGAATTGTTTCTG-T----CGCATATTGGGTTGGG------TCATATCTGCCTTTA TTCGATTTACCCCTTTT---GCATACAATGATCGGAC-GGACGAC-GAGGCTTGGACCAC TATCGCGACCT------------TGAATATCATGCTGATGGGTAGCTTCA-AGGACAAAT TACTAGCAAGGAGCTGGGCACCGTTATGCGATCCCTTGGCCAAAATCCCTCAGAGTCTGA GCTTCAGGATATGATCAACGAGGTTGACGCTGATAACAACGGCACCATTGACTTCCCGGG TATGACATAACAT-TATATA--TGATGGTTCGGG--CTGCAGACTGACGTTTGCAAAACT GTAGAATTTCTCACCATGATGGCCAGAAAGATG??????????????????????????? ???????????????GGTTGCGAAATCTTCCAACCTGTTGGAT-CCAAAACGTTCGGACC TTTGGTAGAATGCCCGTCGCCAGACTGCAAGGTCAACCAAACCAAGGGACAATTACATCA TTCCACTAGGGCATCGAAATTCCAGCCATTCCAGGAAGTCAAGATTCAAGAGATGGCCGA ACAAGTACCAGTTGGTCATATTCCGAGAATGTTAACTGTCCTCTGCCATGGAGCGCTTGT TCGTCGTATCAACCCGGGGGATGTCGTTGATGTCGCCGGCATATTCTTGCCTACCCCCTA CACTGGTTTCAAGGCGATAAGAGCTGGCCTTCTTACCGACACATATCTGGAAGCACAACA TGTCACCCAGCACAAGAAGGCATATGAAGATCTTACCATTGATAGCCGCGTGTTTAGACG GATTGAACAGTACAGAACTTCCGGTCACGTGTATGAGTACCTCGCCAAATCTATCGCTCC TGAGATCTACGGTCATCTCGATGTGAAGAAGGCATTACTCTTGTTATTGGTTGGTGGTGT G--ACAAAGGAAATGGGAGATGGTATGCG-C-ATCAGAGGTGACATCAACATTTGTCTAA TGGGTGATCC [58] SE16F42 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACCGAGT-TCACGCCCTCAC-GGGTA GA---CCTCCAACCC-TTGTGTA-TCTCTACCATGTTGCTTTGGCAGGCTGCTCGACCCT TC--CGGG--GACAGCCTCAGCGCCCTCCGGGG--CCGGAGAGTCGCCTGCCGGAGGAAA ATCACAACTCTGAATTGTCAGTGTCGTCTGAGTGACTATCT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAGCTCTCTGCTTGGTATTGG GCC--T-CCGCCGGTCACACGGCGGGCCTTAAAGTCAGTGGCGGCGCCGCTGGGTCCTGA ACGTAGTAACACATACCTCTCGTTACAGGGTCCCCGCGCGCTCCCG-CCGTAAAA-CCCC CCTCATTTTCTCTGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTTGTAAGTTCT-------CCTTTAC-TATCCTACTAT TTCAGCCCTTTGCGAAGTTGGCATAGCTATTTTCAAAAACTT---------AG-AA-GCT AATGG-TTGGGACTTAACAGGACAAGAATGGTGACGGTCAGTAC-TCCTTCTTCAAGCTA TATCCGAATTGTTTCTG-T----CGCATATTGGGTTGGG------TCATATCTGCCTTTA TTCGATTTACCCCTTTT---GCATACAATGATCGGAC-GGACGAC-GAGGCTTGGACCAC TATCGCGACCT------------TGAATATCATGCTGATGGGTAGCTTCA-AGGACAAAT TACTAGCAAGGAGCTGGGCACCGTTATGCGATCCCTTGGCCAAAATCCCTCAGAGTCTGA GCTTCAGGATATGATCAACGAGGTTGACGCTGATAACAACGGCACCATTGACTTCCCGGG TATGACATAACAT-TATATA--TGATGGTTCGGG--CTGTAGACTGACGTTTGCAAAACT GTAGAATTTCTCACCATGATGGCCAGAAAGATGAAGCCGACCGTTGAAGTTAATGCGTAC ACTTGCGATCGATGCGGTTGCGAAATCTTCCAACCTGTTGGAT-CCAAAACGTTCGGACC TTTGGTAGAATGCCCGTCGCCAGACTGCAAGGTCAACCAAACCAAGGGACAATTACATCA TTCCACTAGGGCATCGAAATTCCAGCCATTCCAGGAAGTCAAGATTCAAGAGATGGCCGA ACAAGTACCAGTTGGTCATATTCCGAGAATGTTAACTGTCCTCTGCCATGGAGCGCTTGT TCGTCGTATCAACCCGGGGGATGTCGTTGATGTCGCCGGCATATTCTTGCCTACCCCCTA CACTGGTTTCAAGGCGATAAGAGCTGGCCTTCTTACCGACACATATCTGGAAGCACAACA TGTCACCCAGCACAAGAAGGCATATGAAGATCTTACCATTGATAGCCGCGTGTTTAGACG GATTGAACAGTACAGAACTTCCGGTCACGTGTATGAGTACCTCGCCAAATCTATCGCTCC TGAGATCTACGGTCATCTCGATGTGAAGAAGGCATTACTCTTGTTATTGGTTGGTGGTGT G--ACAAAGGAAATGGG??????????????????????????????????????????? ?????????? [59] SH44 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACCGAGT-TCACGCCCTCAC-GGGTA GA---CCTCCAACCC-TTGTGTA-TCTCTACCATGTTGCTTTGGCAGGCTGCTCGACCCT TC--CGGG--GACAGCCTCAGCGCCCTCCGGGG--CCGGAGAGTCGCCTGCCGGAGGAAA ATCACAACTCTGAATTGTCAGTGTCGTCTGAGTGACTATCT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAGCTCTCTGCTTGGTATTGG GCC--T-CCGCCGGTCACACGGCGGGCCTTAAAGTCAGTGGCGGCGCCGCTGGGTCCTGA ACGTAGTAACACATACCTCTCGTTACAGGGTCCCCGCGCGCTCCCG-CCGTAAAA-CCCC CCTCATTTTCTCTGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTTGTAAGTTCT-------CCTTTAC-TATCCTACTAT TTCAGCCCTTTGCGAAGTTGGCATAGCTATTTTCAAAAACTT---------AG-AA-GCT AATGG-TTGGGACTTAACAGGACAAGAATGGTGACGGTCAGTAC-TCCTTCTTCAAGCTA TATCCGAATTGTTTCTG-T----CGCATATTGGGTTGGG------TCATATCTGCCTTTA TTCGATTTACCCCTTTT---GCATACAATGATCGGAC-GGACGAC-GAGGCTTGGACCAC TATCGCGACCT------------TGAATATCATGCTGATGGGTAGCTTCA-AGGACAAAT TACTAGCAAGGAGCTGGGCACCGTTATGCGATCCCTTGGCCAAAATCCCTCAGAGTCTGA GCTTCAGGATATGATCAACGAGGTTGACGCTGATAACAACGGCACCATTGACTTCCCGGG TATGACATAACAT-TATATA--TGATGGTTCGGG--CTGTAGACTGACGTTTGCAAAACT GTAGAATTTCTCACCATGATGGCCAGAAAGATGAAGCCGACCGTTGAAGTTAATGCGTAC ACTTGCGATCGATGCGGTTGCG-AATCTTCCAACCTGTTGGAT-CCAAAACGTTCGGACC TTTGGTAGAATGCCCGTCGCCAGACTGCAAGGTCAACCAAACCAAGGGACAATTACATCA TTCCACTAGGGCATCGAAATTCCAGCCATTCCAGGAAGTCAAGATTCAAGAGATGGCCGA ACAAGTACCAGTTGGTCATATTCCGAGAATGTTAACTGTCCTCTGCCATGGAGCGCTTGT TCGTCGTATCAACCCGGGGGATGTCGTTGATGTCGCCGGCATATTCTTGCCTACCCCCTA CACTGGTTTCAAGGCGATAAGAGCTGGCCTTCTTACCGACACATATCTGGAAGCACAACA TGTCACCCAGCACAAGAAGGCATATGAAGATCTTACCATTGATAGCCGCGTGTTTAGACG GATTGAACAGTACAGAACTTCCGGTCACGTGTATGAGTACCTCGCCAAATCTATCGCTCC TGAGATCTACGGTCATCTCGATGTGAAGAAGGCATTACTCTTGTTATTGGTTGGTGGTGT G--ACAAAGGAAATGGGAGATGGTATGCG-C-ATCAGAGGTGACATCAACATTTGTCTAA TGGGAGACCC [60] SH80 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACCGAGT-TCACGCCCTCAC-GGGTA GA---CCTCCAACCC-TTGTGTA-TCTCTACCATGTTGCTTTGGCAGGCTGCTCGACCCT TC--CGGG--GACAGCCTCAGCGCCCTCCGGGG--CCGGAGAGTCGCCTGCCGGAGGAAA ATCACAACTCTGAATTGTCAGTGTCGTCTGAGTGACTATCT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAGCTCTCTGCTTGGTATTGG GCC--T-CCGCCGGTCACACGGCGGGCCTTAAAGTCAGTGGCGGCGCCGCTGGGTCCTGA ACGTAGTAACACATACCTCTCGTTACAGGGTCCCCGCGCGCTCCCG-CCGTAAAA-CCCC CCTCATTTTCTCTGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTTGTAAGTTCT-------CCTTTAC-TATCCTACTAT TTCAGCCCTTTGCGAAGTTGGCATAGCTATTTTCAAAAACTT---------AG-AA-GCT AATGG-TTGGGACTTAACAGGACAAGAATGGTGACGGTCAGTAC-TCCTTCTTCAAGCTA TATCCGAATTGTTTCTG-T----CGCATATTGGGTTGGG------TCATATCTGCCTTTA TTCGATTTACCCCTTTT---GCATACAATGATCGGAC-GGACGAC-GAGGCTTGGACCAC TATCGCGACCT------------TGAATATCATGCTGATGGGTAGCTTCA-AGGACAAAT TACTAGCAAGGAGCTGGGCACCGTTATGCGATCCCTTGGCCAAAATCCCTCAGAGTCTGA GCTTCAGGATATGATCAACGAGGTTGACGCTGATAACAACGGCACCATTGACTTCCCGGG TATGACATAACAT-TATATA--TGATGGTTCGGG--CTGTAGACTGACGTTTGCAAAACT GTAGAATTTCTCACCATGATGGCCAGAAAGATG??????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ?????????? [61] SS1 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACAGAGT-TCATGCCCGAAAGGGGTA GA---CCTCCCACCC-TTGTGTA-TTATTACTTTGTTGCTTTGGCGAGCTGCTCTTCG-- ------------------------------GGG--CCTTGTA--TGCTCGCCAGAGAATA TCAA-AACTCT-TTTTATTAATGTCGTCTGAGT-ACTATAT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCAGCTTGGTATTGA GTC--C-ATGTCAGT--AATGGCAGGCTCTAAAATCAGTGGCGGCGCCGCTGGGTCCTGA ACGTAGTAATA----TCTCTCGTTACAGGTTCTCGGTGTGCTTCTG-CCAAAAC----CC AAA--TTTTCTATGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTTGTAAGTTCA-------TCTCTCTAACTTTTACAAT CTCAGCCCTATGGACACTTGGCAGGG-TATATTTGAAGATTT---------GG-TA-GCT AATAATTTATAACTTTACAGGACAAGAATGGTGATGGTTAGTAA------TTTCAGATTA TACTTTCCATGTCCCAGTT----CGACTCTCCTCTTTTATCTACGTGCTAGACATCTTGA CCGACACCGCCCCTATCTC------GAACAATTGTAC-CAACAAA-GGGGGCAATAACAC GATTGAGCATG-ATAATAC------AGGACAGGGTTGATATATAAATTCATAGGACAAAT TACTAGCAAGGAGCTGGGTACCGTCATGCGATCCCTTGGACGAAACCCTTCCGAGTCTGA GTTGCAAGACATGATCAATGAGGTCGATGCCGATAACAACGGTACCATTGATTTCCCAGG TACGGCAAAGCAT-AATATAGTTTATGACTCACG------AAGCTGA--------CTGGA TCAGAATTCCTCACCATGATGGCCAGAAAGATGAAGCCAACTGTGGAAGTCAACGCATAT ACTTGTGATAGATGCGGTTGTGAGATATTTCAGCCCGTTGGAT-CCAAGACCTTTGGACC ATTAGTTGAATGCCCTTCCCCTGATTGTACTACCAACCAAACTAAAGGACAACTCCATCA TTCCACCCGAGCCTCAAAATTCCAGCCATTTCAAGAGATTAAAATTCAGGAAATGGCTGA ACAAGTCCCAGTTGGTCATATTCCTCGAATGCTAACTGTTCTTTGCCATGGAGCTCTAGT GCGACGTATAAATCCTGGAGACGTTGTTGATATCGCAGGAATTTTCCTACCTACTCCATA TACTGGTTTCAAAGCTATCAGAGCTGGTCTTCTCACCGATACGTATCTTGAGGCACAACA CGTCACTCAACACAAAAAGGCTTACGAAGATTTAACGATCGATAGCCGAGTATTCAAGCG AATTGAGCAATACAGAGCCTCTGGTCACGTTTACGAATACCTTGCAAAATCTATCGCGCC TGAAATTTACGGACACTTGGATGTAAAGAAGGCATTACTTTTGTTATTGGTCGGTGGAGT T--ACTAAAACTATGGGTGATGGAATGCG-A-ATTAGAGGTGATATCAATATCTGTTTGA TGGGAGACCC [62] SS4 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACAGAGT-TCATGCCCGAAA-GGGTA GA---CCTCCCACCC-TTGTGTA-TTATTACTTTGTTGCTTTGGCGAGCTGCTCTTCG-- ------------------------------GGG--CCTTGTA--TGCTCGCCAGAGAATA TCAA-AACTCT-TTTTATTAATGTCGTCTGAGT-ACTATAT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCAGCTTGGTATTGA GTC--C-ATGTCAGT--AATGGCAGGCTCTAAAATCAGTGGCGGCGCCGCTGGGTCCTGA ACGTAGTAATA----TCTCTCGTTACAGGTTCTCGGTGTGCTTCTG-CCAAAAC----CC AAA--TTTTCTATGG-TGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATA?? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ?????????????????????????????????AAGCCAACTGTGGAAGTCAACGCATAT ACTTGTGATAGATGCGGTTGTGAGATATTTCAGCCCGTTGGAT-CCAAGACCTTTGGACC ATTAGTTGAATGCCCTTCCCCTGATTGTACTACCAACCAAACTAAAGGACAACTCCATCA TTCCACCCGAGCCTCAAAATTCCAGCCATTTCAAGAGATTAAAATTCAGGAAATGGCTGA ACAAGTCCCAGTTGGTCATATTCCTCGAATGCTAACTGTTCTTTGCCATGGAGCTCTAGT GCGACGTATAAATCCTGGAGACGTTGTTGATATCGCAGGAATTTTCCTACCTACTCCATA TACTGGTTTCAAAGCTATCAGAGCTGGTCTTCTCACCGATACGTATCTTGAGGCACAACA CGTCACTCAACACAAAAAGGCTTACGAAGATTTAACGATCGATAGCCGAGTATTCAAGCG AATTGAGCAATACAGAGCCTCTGGTCACGTTTACGAATACCTTGCAAAATCTATCGCGCC TGAAATTTACGGACACTTGGATGTAAAGAAGGCATTACTTTTGTTATTGGTCGGTGGAGT cTAcCTAAAACTATGGGTGATGGAATGCG-A-ATtAGAGGTGATATCAATATCTGTTTGA TGGGAGACCC [63] SS5 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACAGAGT-TCATGCCCGAAA-GGGTA GA---CCTCCCACCC-TTGTGTA-TTATTACTTTGTTGCTTTGGCGAGCTGCTCTTCG-- ------------------------------GGG--CCTTGTA--TGCTCGCCAGAGAATA TCAA-AACTCT-TTTTATTAATGTCGTCTGAGT-ACTATAT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCAGCTTGGTATTGA GTC--C-ATGTCAGT--AATGGCAGGCTCTAAAATCAGTGGCGGCGCCGCTGGGTCCTGA ACGTAGTAATA----TCTCTCGTTACAGGTTCTCGGTGTGCTTCTG-CCAAAAC----CC AAA--TTTTCTATGG-TGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTTGTAAGTTCA-------TCTCTCTAACTTTTACAAT CTCAGCCCTATGGACACTTGGCAGGG-TATATTTGAAGATTT---------GG-TA-GCT AATAATTTATAACTTTACAGGACAAGAATGGTGATGGTTAGTAA------TTTCAGATTA TACTTTCCATGTCCCAGTT----CGACTCTCCTCTTTTATCTACGTGCTAGACATCTTGA CCGACACCGCCCCTATCTC------GAACAATTGTAC-CAACAAA-GGGGGCAATAACAC GATTGAGCATG-ATAATAC------AGGACAGGGTTGATATATAAATTCATAGGACAAAT TACTAGCAAGGAGCTGGGTACCGTCATGCGATCCCTTGGACAAAACCCTTCCGAGTCTGA GTTGCAAGACATGATCAATGAGGTCGATGCCGATAACAACGGTACCATTGATTTCCCAGG TACGGCAAAGCAT-AATATAGTTTATGACTCACG------AAGCCGA--------CTGGA TCAGAATTCCTCACCATGATGGCCAGAAAGATGAAGCCAACTGTGGAAGTCAACGCATAT ACTTGTGATAGATGCGGTTGTGAGATATTTCAGCCCGTTGGAT-CCAAGACCTTTGGACC ATTAGTTGAATGCCCTTCCCCTGATTGTACTACCAACCAAACTAAAGGACAACTCCATCA TTCCACCCGAGCCTCAAAATTCCAGCCATTTCAAGAGATTAAAATTCAGGAAATGGCTGA ACAAGTCCCAGTTGGTCATATTCCTCGAATGCTAACTGTTCTTTGCCATGGAGCTCTAGT GCGACGTATAAATCCTGGAGACGTTGTTGATATCGCAGGAATTTTCCTACCTACTCCATA TACTGGTTTCAAAGCTATCAGAGCTGGTCTTCTCACCGATACGTATCTTGAGGCACAACA CGTCACTCAACACAAAAAGGCTTACGAAGATTTAACGATCGATAGCCGAGTATTCAAGCG AATTGAGCAATACAGAGCCTCTGGTCACGTTTACGAATACCTTGCAAAATCTATCGCGCC TGAAATTTACGGACACTTGGATGTAAAGAAGGCATTACTTTTGTTATTGGTCGGTGGAGT T--ACTAAAACTATGGGTGATGGAATGCG-A-ATTAGAGGTGATATCAATATCTGTTTGA TGGGAGACCC [64] Ssclerotiorum_1980 ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ?????????????????????????????????????????????????GCCAGAGAATA TCAA-AACTCT-TTTTATTAATGTCGTCTGAGT-ACTATAT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCAGCTTGGTATTGA GTC--C-ATGTCAGT--AATGGCAGGCTCTAAAATCAGTGGCGGCGCCGCTGGGTCCTGA ACGTAGTAATA----TCTCTCGTTACAGGTTCTCGGTGTGCTTCTG-CCAAAAC----CC AAA--TTTTCTATGGTTGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTTGTAAGTTCA-------TCTCTCTAACTTTTACAAT CTCAGCCCTATGGACACTTGGCAGGG-TATATTTGAAGATTT---------GG-TA-GCT AATAATTTATAACTTTACAGGACAAGAATGGTGATGGTTAGTAA------TTTCAGATTA TACTTTCCATGTCCCAGTT----CGACTCTCCTCTTTTATCTACGTGCTAGACATCTTGA CCGACACCGCCCCTATCTC------GAACAATTGTAC-CAACAAA-GGGGGCAATAACAC GATTGAGCATG-ATAATAC------AGGTCAGGGTTGATATATAAATTCATAGGACAAAT TACTAGCAAGGAGCTGGGTACCGTCATGCGATCCCTTGGACAAAACCCTTCCGAGTCTGA GTTGCAAGACATGATCAATGAGGTCGATGCCGATAACAACGGTACCATTGATTTCCCAGG TACGGCAAAGCAT-AATATAGTTTATGACTCACG------AAGCTGA--------CTGGA TCAGAATTCCTCACTATGATGGCCAGAAAGATGAAACCAACTGTGGAAGTCAACGCATAT ACTTGTGATAGATGCGGTTGTGAGATATTTCAGCCCGTTGGAT-CCAAGACCTTTGGACC ATTAGTTGAATGCCCTTCCCCTGATTGTACTACCAACCAAACTAAAGGACAACTCCATCA TTCCACCCGAGCCTCAAAATTCCAGCCATTTCAAGAGATTAAAATTCAGGAAATGGCTGA ACAAGTCCCAGTTGGTCATATTCCTCGAATGCTAACTGTTCTTTGCCATGGAGCTCTAGT GCGACGTATAAATCCTGGAGACGTTGTTGATATCGCAGGAATTTTCCTACCTACTCCATA TACTGGTTTCAAAGCTATCAGAGCTGGTCTTCTCACCGATACGTATCTTGAGGCACAACA CGTCACTCAACACAAAAAGGCTTACGAAGATTTAACGATCGATAGCCGAGTATTCAAGCG AATTGAGCAATACAGAGCCTCTGGTCACGTTTACGAATACCTTGCAAAATCTATCGCGCC TGAAATTTACGGACACTTGGATGTAAAGAAGGCATTACTTTTGTTATTGGTCGGTGGAGT T--ACTAAAACTATGGGTGATGGAATGCG-A-ATTAGAGGTGATATCAATATCTGTTTGA TGGGTGACCC [65] SSI1 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTATAGAGC-TCACGCCCTCAA-GGGCA GAACCTCTCCACCCT-TTGTGTA-TCATTACTTTGTTGCTTTGGCGGGCCGCCTCC---- ------------------------------GGG--CCT------CGCGTGCCCGCCAATG ACCT-AACCCT-TCTTATTCATGTCGTCTGAGC-ACTATGC---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CCCTGCTTGGTGTTGA GCC--C-TCGCCAGC--GATGGCCGGCTCTAAAATCAGTGGCGGCGCCGCTGGGTCCTGA ACGCAGTAAT-----CTCCTCGTTCCAGGTGCCCGGCGTGCTCCCG-TCGAA------CC TCA-ACTTTCTATGGTtGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTTGTAAGTT--------------CCATCTTTGACAAG CTCAGCTCT------------CAGGG-CGTATCTGAAGACTT---------GG-AA-GCT AATCCTTTATGACTTTACAGGACAAGAATGGTGACGGTTCGTAC------TTCCAACTTA CGCTTTCGATGTCGCAGAT----CACCTATCTTCTTCTATCTATCTACGTGCTTCCTATT TCGGCCCAGCCCCTATCTC------GAACAACTGTGC-AAACATC-TAGGACAACATTAC TATCAAACATG-GCAACACATGAGGAGAACTAAGCTGATGTGCGGGTCCATAGGGCAAAT TACTAGCAAGGAGTTGGGCACCGTCATGCGATCCCTTGGACAAAACCCTTCCGAGTCCGA GTTACAAGATATGATCAACGAGGTCGACGCCGACAACAACGGTACCATTGATTTCCCAGG TACGGCACAGAAC-TGGGTGGAACATTAATCACA------AGGCTTA--------CGCGA TTAGAATTCCTTACCATGATGGCCAGAAAGATGAAGCCGACTGTGGAAGTCAACGCATAT ACTTGTGATAGATGTGGTTGTGAGATTTTCCAGCCTGTTGGAT-CCAAGACTTTCGGACC ATTGGTAGAATGTCCTTCTTCAGATTGTACAACCAATCAAACCAAAGGACAACTTCATCA CTCAACGCGAGCCTCAAAATTCCAGCCATTCCAAGAAGTTAAAATTCAGGAAATGGCCGA ACAAGTTCCGGTTGGTCATATTCCTCGAATGTTGACGGTTCTTTGCCACGGTGCTTTAGT TCGACGTATCAATCCCGGAGACGTTGTCGATATTGCAGGAATTTTCTTACCTACCCCATA TACTGGTTTCAAAGCCATTAGAGCTGGTCTTCTCACCGATACATACCTGGAAGCACAGCA CGTTACTCAACACAAGAAGGCTTACGAAGATTTAACTATTGATAGCCGTGTTTTCAGGAG AATCGAGCAATACAGAGCCTCTGGTCACGTTTACGAATACCTTTCCAAGTCTATCGCGCC TGAAATTTACGGACACTTGGATGTGAAAAAGGCATTACTGTTGTTGTTGGTCGGTGGCGT T--ACTAAAGAAATGGGTGACGGAATGCG-A-ATTAGAGGTGATATCAATATCTGTTTGA TGGGAGACCC [66] SSI2 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTATAGAGC-TCACGCCCTCAAGGGGCA GAACCTCTCCACCCT-TTGTGTA-TCATTACTTTGTTGCTTTGGCGGGCCGCCTCC---- ------------------------------GGG--CCT------CGCGTGCCCGCCAATG ACCT-AACCCT-TCTTATTCATGTCGTCTGAGC-ACTATGC---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGTAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CCCTGCTTGGTGTTGA GCC--C-TCGCCAGC--GATGGCCGGCTCTAAAATCAGTGGCGGCGCCGCTGGGTCCTGA ACGCAGTAAT-----CTCCTCGTTCCAGGTGCCCGGCGTGCTCCCG-TCGAA------CC TCA-ACTTTCTATGGTtGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTTGTAAGTT--------------CCATCTTTGACAAG CTCAGCTCT------------CAGGG-CGTATCTGAAGACTT---------GG-AA-GCT AATCCTTTATGACTTTACAGGACAAGAATGGTGACGGTTCGTAC------TTCCAACTTA CGCTTTCGATGTCGCAGAT----CACCTATCTTCTTCTATCTATCTACGTGCTTCCTATT TCGGCCCAGCCCCTATCTC------GAACAACTGTGC-AAACATC-TAGGACAACATTAC TATCAAACATG-GCAACACATGAGGAGAACTAAGCTGATGTGCGGGTCCATAGGGCAAAT TACTAGCAAGGAGTTGGGCACCGTCATGCGATCCCTTGGACAAAACCCTTCCGAGTCCGA GTTACAAGATATGATCAACGAGGTCGACGCCGACAACAACGGTACCATTGATTTCCCAGG TACGGCACAGAAC-TGGGTGGAACATTAATCACA------AGGCTTA--------CGCGA TTAGAATTCCTTACCATGATGGCCAGAAAGATGAAGCCGACTGTGGAAGTCAACGCATAT ACTTGTGATAGATGTGGTTGTGAGATTTTCCAGCCTGTTGGAT-CCAAGACTTTCGGACC ATTGGTAGAATGTCCTTCTTCAGATTGTACAACCAATCAAACCAAAGGACAACTTCATCA CTCAACGCGAGCCTCAAAATTCCAGCCATTCCAAGAAGTTAAAATTCAGGAAATGGCCGA ACAAGTTCCGGTTGGTCATATTCCTCGAATGTTGACGGTTCTTTGCCACGGTGCTTTAGT TCGACGTATCAATCCCGGAGACGTTGTCGATATTGCAGGAATTTTCTTACCTACCCCATA TACTGGTTTCAAAGCCATTAGAGCTGGTCTTCTCACCGATACATACCTGGAAGCACAGCA CGTTACTCAACACAAGAAGGCTTACGAAGATTTAACTATTGATAGCCGTGTTTTCAGGAG AATCGAGCAATACAGAGCCTCTGGTCACGTTTACGAATACCTTTCCAAGTCTATCGCGCC TGAAATTTACGGACACTTGGATGTGAAAAAGGCATTACTGTTGTTGTTGGTCGGTGGCGT T--ACTAAAGAAATGGGTGACGGAATGCG-A-ATtAGAGGTGATATCAATATCTGTTTGA TGGGAGACCC [67] TEKP2 AGGTTTCCGTAGGTGAACCTGCGGAAGGATCATTACCGAGT-TCACGCCCTCAC-GGGTA GA---CCTCCAACCC-TTGTGTA-TCTCTACCATGTTGCTTTGGCCGGCTGCTCGACCCT ACGGGGGG--GACAGCCTCAGCGCCCTCCGGGG--CCCGAGAGTCGCCGGCCGGAGGAAA ATCACAACTCTGAATTGTCAGTGTCGTCTGAGTGACTATCT---AATAGTTAAAACTTTC AACAACGGATCTCTTGGTTCTGGCATCGATGAAGAACGCAGCGAAATGCGATAAGWAATG TGAATTGCAGAATTCAGTGAATCATCGAATCTTTGAACGCACATTGCGCCCCTTGGTATT CCGGGGGGCATGCCTGTTCGAGCGTCA-TTTCAACCCTCAAG--CTCTGCTTGGTCTTGG GCC--T-GCGCCGGTCACACGGCGGGCCTCAAAGTTAGTGGCGGTGCCGCTGGGTCCTGA ACGTAGTAACACATACCTCTCGTTACAGGGTCCCCGCGCGCGCCCG-CCGTAAAA--CCC CCTCATTTTCTCTGG-TGACCTCGGATCAGGTAGGGATACCCGCTGAACTTAAGCATAGA GTTCAAGGAGGCCTTCTCCCTCTTTGTAAGTTCT-------CCTTTAC-CATCCTACTTT TTCAGCCCTTTGCGAAGTTGGCATAGCCATTTTCAAAAACTT---------AG-AA-GCT AATGG-TTGGGACTTAACAGGACAAGAATGGCGACGGTCAGTAC-CCCTTCTTCAAGCCA CATCCGAATTGTTTCTG-T----CGCATATTGGGTTGGG------TCATATCTGCCTTTA TTCGATTTACCCCTTTT---GCATACAATGATCGGAC-GGACGAC-GAGGCTTGGACCAC TATCGCGACCT------------TGAATATCATGCTGATGGGTAGCTTCA-AGGACAAAT TACTAGCAAGGAGCTGGGCACCGTTATGCGATCCCTTGGCCAAAATCCCTCAGAGTCTGA GCTTCAGGATATGATCAACGAGGTTGACGCTGATAACAACGGCACCATTGACTTCCCGGG TATGACATAACAT-TATATA--TGATGGTTCGGG--CTGTGGACTGACGTTTGCAAAACT GTAGAATTTCTCACCATGATGGCCAGAAAGATG??????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ???????????????????????????????????????????????????????????? ?????????? ; END; BEGIN SETS; CHARSET 'ITS' = 1-598; CHARSET 'CAL' = 599-1173; CHARSET 'MCM7' = 1174-1810; END;