T2H3 encodes a putative pectinesterase gene from 3594 to 7262. The gene model suggests intron 2 is 1464 nt in length from 5107 to 6570. This is not an unreasonably large intron, but did prompt a search for repeat elements residing within this intron. One such element was found within a portion of the intron. This region of genomic sequence is repeated with a copy number of at least 5. The table lists the sequences and the position of the element and an alignment depicts the sequence conservation. T2H3 contains a long imperfect direct repeat (overscored with ----; cognate A from 5741 to 5904, cognate B from 5905 to 6076); a short inverted repeat, highlighted in red, is nearby. Interestingly, this 1.1 kb element is also found within an intron in FCA3: intron 6 of a cycloartenol synthase-like gene.
| Sequence | Range | Strand |
|---|---|---|
| T2H3 | 5326 - 6375 | + |
| F9D12 | 67412 - 68540 | - |
| FCA3 | 141426 - 142556 | + |
| T26D22 | 94478 - 95546 | + |
| F6N15 | 10352 - 11494 | - |
1 60
T2H3 ~~~~GAAAGAAATACTATGTTTTAGTTTCATTTAGTTTTAT.AAAGATAGTAGATTTT..
F9D12 GATACAAGAACAAAGCTCGTGTTCAATTTGAAGGCTTTTGA.ATATATACTAGATTTT..
FCA3 ~~~~~TACCTAAAATCACCAGATGTATATGAGCTTTTTTTATCTATTCACTAGATTTT..
T26D22 ~~~~~~ATATGACCAGGCTTTGTTTATTGGGCCTTTTTCTCTTACTTCTCTTATTCTTTC
F6N15 ~~~~~~~~AGAATCAATTCTGTATACGACTCGCATGTATATTTGTTGTCATAGTTTAG..
61 120
T2H3 ...AACCCG.CTATACATTTT...GGGATTATATTTATTAAAAAAATAAAAATTTAATTT
F9D12 ...AACCCG.CGGTGTACCGC...ATAATTATATTTTTTAAAAA...TAAAAATTAATTT
FCA3 ...AACCCGCCGATACACCGCGAGCTATATCTTTTTTTTTTAAA...TAAAATTTAACTT
T26D22 ATCTATTTTCTATTCACACTAAATTTCTATTTTGTTCTTTTAAG...AAAAATTAAATTT
F6N15 ...TAGGATTCGCTAACATATAATACTAGTTTTTATCCCGCGGT...ATAAATTTAATTT
121 180
T2H3 GTTTAATAGATTAAAAATATATATGGTTTAATGTTTTGTATTTTTTAAATGTACAACACT
F9D12 GTTTTGTAGATTAAAAATAAATATGATTTAATGTTTTGTATTTTCTAAACGTACAACTCT
FCA3 GTTTAGTAGATTTAAAATATATATGATTTAATTTTCTGTATTTTCTAAATGTATAACTCT
T26D22 ATTTATTCGATTAAAAATATATATGATTTAATGTTTTGTATTTTCTGAATGTACAACTCT
F6N15 GTTTAGTAGA.TTAAAATATATATGATTTAATGTTTTATATTTTCTAAATGTACAACTCT
181 240
T2H3 TATATCTATTTCTATATTATTTAGTGTACAATTAATATGTTTGATTTTTACTAGTTAAAA
F9D12 TATATCTA....TATATTTTTTAGTGTATAATTACTATGTTTAATTTTTACTGTTTAAAA
FCA3 TATATCTA....CATATTATTTAGTGTACAATTACTATGTTTGGTTTTTACTCTTTAAAA
T26D22 TATATCTG....TATATTATTTAGTATACAATTACTATGTTTGATTTTTACTGTTTAAAA
F6N15 TATTTTTA....TATATTATTTACTGTATAATTACT.TGTTTGATTTTTACTATTTAAAG
241 300
T2H3 CTATAGCAACAATAACATATAGTTCATTAAGTTAAAATGTAAATTATAACTAAATTAACT
F9D12 ATATAGGAACAATAA...............GTTAAAATCTAAATTATAACTAAAT..ATT
FCA3 ATATAGGAAGAATAACATAGAGTTCATTAAATTAAAATATATATTATAACTAAATA.ATT
T26D22 ATATAGGAACAATAACGTATCGTTCAAT................................
F6N15 ATATAGGAACAATAACATACCGTCCATTAAGTTAAAATTTAGATTATAACTAAATA.ATT
301 360
T2H3 TAAAATTTAATTATATTTGTTTTGTTAATATTTTCTGTTTTGTTTGGTGTTTTAGATAAT
F9D12 TAAGTTCTAATTATATTTGTTTTGTTAATATTGTTT.GTTTGTTTTAGTATTTAGATAAT
FCA3 CAAATTTTAATTATATTTGTT...TTATTATATATT.TTTTGTTTAGTGTTTAAGATAAT
T26D22 .....................................................CTAAATT
F6N15 TAAATTTAAATTATATTTATTTTGTTAATATTGTTTGTTTTGTATAGTGTTTAAGATAAT
361 420
T2H3 AGAATTATTATTTTATTGTTATATTTATGATTTCACCTATAGTATAACATCTAATATTAC
F9D12 ATAATTTTATTTTTAATGATATATCTAGGATTTCATCCGTCGTATACCGTCTCGTATTAC
FCA3 TTAATTATATTTTAATTTTTATATCTAGGATTTCACCTATGGTATACCGTCTCGTATTAC
T26D22 ATAATTGTATTTTGATTGTTATATATAGGATTTCATTTGTGGTATACCGTCTCGTATTAC
F6N15 ATAATTGTATTTTGATTGTTATATATATGATTTCGCCCGTGGTATACCGTCTCGTATTAC
421 480
T2H3 TATCGACTC...................................................
F9D12 TATTGATCCAAATCTGTCCTACCATCTAATCCTGTTTAGTGAA.ATTAAACATATCTAAT
FCA3 TATCGACCCAAATCCGTCATATCATCTAATCTCGTTCAATGAA.ATTAAACATATTTAAT
T26D22 TATCAATCCAAACCCGTTCTACCATCTAATCCCGTTCAGTGAA.ACTAAACATATCTAAT
F6N15 TATCGACTCAAACCCGTCCTACAATCTAATCTCGTTCAGTGAATATCAAACATATCTTAT
481 ---------------540
T2H3 ..........................................AAACCCGTCAT.ACCATC
F9D12 GTATTTCACTTGTGGTATACCATCTCATAATACTATCGACCCAAACCCCTTAT.ATCATC
FCA3 GGATTTCACCCGTGGTATAGCGTCTCGT.ATTTTATCGACTCAAACCCTTTTT.ACCATC
T26D22 GGATTTCACCCGTGGTATACCGTCTCGTATTACTGTCGACCCAAACTCGTCTT.ACCATC
F6N15 GGATTTCACCCATGATATATCGTCTTGTATTTCTATCGACTCAAACCCGTCCTAACCATC
541------------ long imperfect direct repeat ------------600
T2H3 TAACCCCGTTCAGTGAAATTAAACATTATTTT..GTTATTTAT.TCTTAATAATACTTTA
F9D12 TAACTCCGTTTAGTGAAATTAAACATTATTTTT.GTTATTTTTGTTTAAATAATATTTTA
FCA3 TAACCCCGTTCAATGAACTTAAACATTATTTT..GTTATTTTTGTTTTAATAATACTTTA
T26D22 TAACCCCGTTCAGTGAAATTAAACATTTTTTTTTGTTATTT.TGTTTTAATAATACTTTA
F6N15 TAAACCCGATCAATAAAATTAAATATTATTTT..GTCATTTTTGT.TTAATAATACTTTA
601------------ long imperfect direct repeat ------------660
T2H3 ATTTAAAAGATATATAATTCAAATCAATTTAA.AAGTTTTCTATCAAATGGTTATTTAAT
F9D12 ATTTAAAAGATATATAATTCAACACAATTTAA.AAGTTTTCTTTCAAATGGTTATTTAAT
FCA3 A.TTGAAAGATATATAATTTAAATCAATTTAA.ATTTTTTACTTTAAATGGTTATTTAAT
T26D22 ATTTAAAAGATATATAATTCAAATTAATTTAATTTTTTTTCTTTCTAATGGTTATTTAAT
F6N15 ATCGAAAAGATATATAATTCAAATCAATATAA.AAGTTTTCTTTCAAATGGTTATTTAAT
661-----------------------------------------------------720
T2H3 TGTTATAAAGTTCACATGTTATTAATATTCTAAATCCGTCTAACCATCTAACCCCATTCG
F9D12 TGTTATAAAGTTCATATATTAT.GATATTCTAAATCCGTCCTACCATCTAATCCCATTTC
FCA3 TGTTTAAAAGTTCATATATTATAAATATTATTAACCCGTCATACCATCTAATCCCGTTCG
T26D22 TGTTATTAAATTCATACATTAT.AATATTCTAAACCCGTCTCACCATCTAATCGAGTTCG
F6N15 TGTTCTAAAGTTCATATATTAT.AATATTCTAAACCCGTCCTACCATCT.ATACCATTCG
721------------ long imperfect direct repeat ------------780
T2H3 GTGAAACTAAACATTATTTTGTTATACTTTT.TTTTAACAATACTTTTCTTAAAAGATTA
F9D12 ATAAAATTAAATATTATTTTT...AATTTTTGTTTTAATAATACTTTTATTAAAAGATTT
FCA3 ATGAAATTAAACATTATTTTTTTGTTTTGTTGTTTAAATAATATTTTTATTAAAAAAGAT
T26D22 GTAAAATTAAACATTATTTTTT..CTTTTTTGTTCTTATAATATTTTTATTAAAAGATTT
F6N15 GTGAAATTAAACATTATTTTTT..ATTTTTTGTTTTAATAATACTTTTATTAAAAGATTT
781------------ long imperfect direct repeat ------------840
T2H3 TTAATTCAAATCAATTTTTTTAAAATGGTTATTTAATTTGTATATTATTTAATTTGTATA
F9D12 ATAATTTA....AATTAATTTAAAAGTTTTCTTTC.AATG...GTTATTTAATTTTTATA
FCA3 ATAATTCA....AATCAATTTATAAGTTTT.TTT.AAATG...ATTATTTAATTTTTATA
T26D22 ATAATACA....AATAAATTTAAAAGTTTTCTTTGAAAT....GGTTATTTAATTTTATA
F6N15 ATAATTCAAA..AATCAATTAAAAAGTTTTCTTTCAAATG...GTTATTTAATTGTTCTA
841-------------------- 900
T2H3 GATTTCACATATTATAAATATTCTAAA..CGTTTTTCCGTCAAATTTTCTAA..AAGTTT
F9D12 GATTT.ACATATTATAAATATACTATAACGTTTTTTCTGTGAAATATTCTAATTTTTTTT
FCA3 GATTTCACATATTATAAATATTCTA.AACGTTTATTCCGTTAAATATTCTAA..ATGTTT
T26D22 GATTTCATATAATATATAT....TCAAAACGTTTTTTCGTTAAATAATATAAACTTCTT.
F6N15 AAGTTCATATATTACA.ATATTCTAAACCCATTATACCATCTAATCCAGTTCGGTGAAAT
901 960
T2H3 AATAAACTTTAAATAATTATAATATTTAA........CCTTTAAAAAAGTATAATATTAA
F9D12 AATAAACTTTAAATAACTACATTATTTA........TCTTTTAATAAAGTATAATATTAA
FCA3 AATTAACTATA.........ATATTTTA........TTTTTTAATGAAGTAT.ATATTAA
T26D22 .ATAAACTTTAAATTATTATAATATTTA........TC.TTTAATAAAGTATAATATTAA
F6N15 TAAATATTATTTTTTATTTTTTGTTTTAATAATACTTTTATTAAAAGATTTATAATTCAA
961 1020
T2H3 TAATGTCCTAATTTTT....TTTTTTAAGTAATTAGAATCGATG...GAGATATATTAGA
F9D12 TAGTGTCCTAAGATTT....TTTTTGACGTATTAAGAATTGATG.GAGATATATATCAGA
FCA3 TAGTGTCCTAAAATTTCTCATTTTTTAAGTAATTAGAATTGAT...ACAGATATATTATA
T26D22 TAAAGTTTTAAGATTTCTCTTTTTTAAAAAAATAATTAGAATTGATGGAGATATATTAGA
F6N15 AAATCAATTAAAAAGTTTTCTTTCAAATGGTTATTTAATTGTTCTAAAGTTCATATATTA
1021 1080
T2H3 TAAAGAAATATTAGTAGTGAGGAATATTAATTAATTGATAAGAATTA.............
F9D12 TAAGAAAATGCTAGTAGTTAGGAATATTAATTTATTAATAATAATTA...ATGCCAAATG
FCA3 TAAGAAAATGCTATTAATTAGGAATATTAATTAATTGAAAATAATTA...ATGTC.AATG
T26D22 TAAGGAAATGCTAATAATTAGGAATATTAATTAATTGATAATAATTA...ATGCC.AATA
F6N15 TAATATTCTAAACCCATTATACCATCTAATCCAGTTCGGTGTAATTAAACATTATTTTTT
1081 1140
T2H3 ..ATTCATTGTAAAGAAATTCCAACTTGAATATATATTTGATAAA...AGTGCATATGTA
F9D12 GTATTTCTTGTAAATAAGTTTCAACTTGAGGATTTATTTGTAAAA...ATGTATATATAT
FCA3 GCATTGCTTGTAAATAAGTTTCAACTTGAGGATTTATTTCATAAA...ATGGTTGCAAAA
T26D22 GCATCCCTTGTAAATAAGTTTCAACTAAAGGATTTATTTGTTAAATGGCTGCAAAAATGT
F6N15 ATTTTTTGTTTTAATAATACTTTATTAAAAGATTTATAATTTAAATCAATTAAAAAGTTT
1141 1200
T2H3 AATAGACCATGTTGTTCAATCCAAATATAATACACATTTTTAGAAATTGCTTGTTAGAAC
F9D12 AGATGAGAAAGGTTTAAAACATGGGTAAAGGAAAGTTTTCAAAGATATTTTTGATATATT
FCA3 ATGTATATGTAGATATAAACTTAACTTACCTTTGCACATCGGTTTCGTGCTTGCCTCCAA
T26D22 ACATATAGATATTTTTCATGTTAGTTATTGCTATTTTTTATGGAGTAAATGAGGCTTGTA
F6N15 TCTTTCAAATGTTTATTTAATTTTATAGATTTTCCATATT~~~~~~~~~~~~~~~~~~~~
written 17 Aug 98
Larry
Parnell