T2H3 encodes a putative pectinesterase gene from 3594 to 7262. The gene model suggests intron 2 is 1464 nt in length from 5107 to 6570. This is not an unreasonably large intron, but did prompt a search for repeat elements residing within this intron. One such element was found within a portion of the intron. This region of genomic sequence is repeated with a copy number of at least 5. The table lists the sequences and the position of the element and an alignment depicts the sequence conservation. T2H3 contains a long imperfect direct repeat (overscored with ----; cognate A from 5741 to 5904, cognate B from 5905 to 6076); a short inverted repeat, highlighted in red, is nearby. Interestingly, this 1.1 kb element is also found within an intron in FCA3: intron 6 of a cycloartenol synthase-like gene.

Sequence Range Strand
T2H3 5326 - 6375 +
F9D12 67412 - 68540 -
FCA3 141426 - 142556 +
T26D22 94478 - 95546 +
F6N15 10352 - 11494 -

 

        1                                                         60
  T2H3  ~~~~GAAAGAAATACTATGTTTTAGTTTCATTTAGTTTTAT.AAAGATAGTAGATTTT..
 F9D12  GATACAAGAACAAAGCTCGTGTTCAATTTGAAGGCTTTTGA.ATATATACTAGATTTT..
  FCA3  ~~~~~TACCTAAAATCACCAGATGTATATGAGCTTTTTTTATCTATTCACTAGATTTT..
T26D22  ~~~~~~ATATGACCAGGCTTTGTTTATTGGGCCTTTTTCTCTTACTTCTCTTATTCTTTC
 F6N15  ~~~~~~~~AGAATCAATTCTGTATACGACTCGCATGTATATTTGTTGTCATAGTTTAG..

        61                                                       120
  T2H3  ...AACCCG.CTATACATTTT...GGGATTATATTTATTAAAAAAATAAAAATTTAATTT
 F9D12  ...AACCCG.CGGTGTACCGC...ATAATTATATTTTTTAAAAA...TAAAAATTAATTT
  FCA3  ...AACCCGCCGATACACCGCGAGCTATATCTTTTTTTTTTAAA...TAAAATTTAACTT
T26D22  ATCTATTTTCTATTCACACTAAATTTCTATTTTGTTCTTTTAAG...AAAAATTAAATTT
 F6N15  ...TAGGATTCGCTAACATATAATACTAGTTTTTATCCCGCGGT...ATAAATTTAATTT

        121                                                      180
  T2H3  GTTTAATAGATTAAAAATATATATGGTTTAATGTTTTGTATTTTTTAAATGTACAACACT
 F9D12  GTTTTGTAGATTAAAAATAAATATGATTTAATGTTTTGTATTTTCTAAACGTACAACTCT
  FCA3  GTTTAGTAGATTTAAAATATATATGATTTAATTTTCTGTATTTTCTAAATGTATAACTCT
T26D22  ATTTATTCGATTAAAAATATATATGATTTAATGTTTTGTATTTTCTGAATGTACAACTCT
 F6N15  GTTTAGTAGA.TTAAAATATATATGATTTAATGTTTTATATTTTCTAAATGTACAACTCT

        181                                                      240
  T2H3  TATATCTATTTCTATATTATTTAGTGTACAATTAATATGTTTGATTTTTACTAGTTAAAA
 F9D12  TATATCTA....TATATTTTTTAGTGTATAATTACTATGTTTAATTTTTACTGTTTAAAA
  FCA3  TATATCTA....CATATTATTTAGTGTACAATTACTATGTTTGGTTTTTACTCTTTAAAA
T26D22  TATATCTG....TATATTATTTAGTATACAATTACTATGTTTGATTTTTACTGTTTAAAA
 F6N15  TATTTTTA....TATATTATTTACTGTATAATTACT.TGTTTGATTTTTACTATTTAAAG

        241                                                      300
  T2H3  CTATAGCAACAATAACATATAGTTCATTAAGTTAAAATGTAAATTATAACTAAATTAACT
 F9D12  ATATAGGAACAATAA...............GTTAAAATCTAAATTATAACTAAAT..ATT
  FCA3  ATATAGGAAGAATAACATAGAGTTCATTAAATTAAAATATATATTATAACTAAATA.ATT
T26D22  ATATAGGAACAATAACGTATCGTTCAAT................................
 F6N15  ATATAGGAACAATAACATACCGTCCATTAAGTTAAAATTTAGATTATAACTAAATA.ATT

        301                                                      360
  T2H3  TAAAATTTAATTATATTTGTTTTGTTAATATTTTCTGTTTTGTTTGGTGTTTTAGATAAT
 F9D12  TAAGTTCTAATTATATTTGTTTTGTTAATATTGTTT.GTTTGTTTTAGTATTTAGATAAT
  FCA3  CAAATTTTAATTATATTTGTT...TTATTATATATT.TTTTGTTTAGTGTTTAAGATAAT
T26D22  .....................................................CTAAATT
 F6N15  TAAATTTAAATTATATTTATTTTGTTAATATTGTTTGTTTTGTATAGTGTTTAAGATAAT

        361                                                      420
  T2H3  AGAATTATTATTTTATTGTTATATTTATGATTTCACCTATAGTATAACATCTAATATTAC
 F9D12  ATAATTTTATTTTTAATGATATATCTAGGATTTCATCCGTCGTATACCGTCTCGTATTAC
  FCA3  TTAATTATATTTTAATTTTTATATCTAGGATTTCACCTATGGTATACCGTCTCGTATTAC
T26D22  ATAATTGTATTTTGATTGTTATATATAGGATTTCATTTGTGGTATACCGTCTCGTATTAC
 F6N15  ATAATTGTATTTTGATTGTTATATATATGATTTCGCCCGTGGTATACCGTCTCGTATTAC

        421                                                      480
  T2H3  TATCGACTC...................................................
 F9D12  TATTGATCCAAATCTGTCCTACCATCTAATCCTGTTTAGTGAA.ATTAAACATATCTAAT
  FCA3  TATCGACCCAAATCCGTCATATCATCTAATCTCGTTCAATGAA.ATTAAACATATTTAAT
T26D22  TATCAATCCAAACCCGTTCTACCATCTAATCCCGTTCAGTGAA.ACTAAACATATCTAAT
 F6N15  TATCGACTCAAACCCGTCCTACAATCTAATCTCGTTCAGTGAATATCAAACATATCTTAT

        481                                       ---------------540
  T2H3  ..........................................AAACCCGTCAT.ACCATC
 F9D12  GTATTTCACTTGTGGTATACCATCTCATAATACTATCGACCCAAACCCCTTAT.ATCATC
  FCA3  GGATTTCACCCGTGGTATAGCGTCTCGT.ATTTTATCGACTCAAACCCTTTTT.ACCATC
T26D22  GGATTTCACCCGTGGTATACCGTCTCGTATTACTGTCGACCCAAACTCGTCTT.ACCATC
 F6N15  GGATTTCACCCATGATATATCGTCTTGTATTTCTATCGACTCAAACCCGTCCTAACCATC

        541------------ long imperfect direct repeat ------------600
  T2H3  TAACCCCGTTCAGTGAAATTAAACATTATTTT..GTTATTTAT.TCTTAATAATACTTTA
 F9D12  TAACTCCGTTTAGTGAAATTAAACATTATTTTT.GTTATTTTTGTTTAAATAATATTTTA
  FCA3  TAACCCCGTTCAATGAACTTAAACATTATTTT..GTTATTTTTGTTTTAATAATACTTTA
T26D22  TAACCCCGTTCAGTGAAATTAAACATTTTTTTTTGTTATTT.TGTTTTAATAATACTTTA
 F6N15  TAAACCCGATCAATAAAATTAAATATTATTTT..GTCATTTTTGT.TTAATAATACTTTA

        601------------ long imperfect direct repeat ------------660
  T2H3  ATTTAAAAGATATATAATTCAAATCAATTTAA.AAGTTTTCTATCAAATGGTTATTTAAT
 F9D12  ATTTAAAAGATATATAATTCAACACAATTTAA.AAGTTTTCTTTCAAATGGTTATTTAAT
  FCA3  A.TTGAAAGATATATAATTTAAATCAATTTAA.ATTTTTTACTTTAAATGGTTATTTAAT
T26D22  ATTTAAAAGATATATAATTCAAATTAATTTAATTTTTTTTCTTTCTAATGGTTATTTAAT
 F6N15  ATCGAAAAGATATATAATTCAAATCAATATAA.AAGTTTTCTTTCAAATGGTTATTTAAT

        661-----------------------------------------------------720
  T2H3  TGTTATAAAGTTCACATGTTATTAATATTCTAAATCCGTCTAACCATCTAACCCCATTCG
 F9D12  TGTTATAAAGTTCATATATTAT.GATATTCTAAATCCGTCCTACCATCTAATCCCATTTC
  FCA3  TGTTTAAAAGTTCATATATTATAAATATTATTAACCCGTCATACCATCTAATCCCGTTCG
T26D22  TGTTATTAAATTCATACATTAT.AATATTCTAAACCCGTCTCACCATCTAATCGAGTTCG
 F6N15  TGTTCTAAAGTTCATATATTAT.AATATTCTAAACCCGTCCTACCATCT.ATACCATTCG

        721------------ long imperfect direct repeat ------------780
  T2H3  GTGAAACTAAACATTATTTTGTTATACTTTT.TTTTAACAATACTTTTCTTAAAAGATTA
 F9D12  ATAAAATTAAATATTATTTTT...AATTTTTGTTTTAATAATACTTTTATTAAAAGATTT
  FCA3  ATGAAATTAAACATTATTTTTTTGTTTTGTTGTTTAAATAATATTTTTATTAAAAAAGAT
T26D22  GTAAAATTAAACATTATTTTTT..CTTTTTTGTTCTTATAATATTTTTATTAAAAGATTT
 F6N15  GTGAAATTAAACATTATTTTTT..ATTTTTTGTTTTAATAATACTTTTATTAAAAGATTT

        781------------ long imperfect direct repeat ------------840
  T2H3  TTAATTCAAATCAATTTTTTTAAAATGGTTATTTAATTTGTATATTATTTAATTTGTATA
 F9D12  ATAATTTA....AATTAATTTAAAAGTTTTCTTTC.AATG...GTTATTTAATTTTTATA
  FCA3  ATAATTCA....AATCAATTTATAAGTTTT.TTT.AAATG...ATTATTTAATTTTTATA
T26D22  ATAATACA....AATAAATTTAAAAGTTTTCTTTGAAAT....GGTTATTTAATTTTATA
 F6N15  ATAATTCAAA..AATCAATTAAAAAGTTTTCTTTCAAATG...GTTATTTAATTGTTCTA

        841--------------------                                 900
  T2H3  GATTTCACATATTATAAATATTCTAAA..CGTTTTTCCGTCAAATTTTCTAA..AAGTTT
 F9D12  GATTT.ACATATTATAAATATACTATAACGTTTTTTCTGTGAAATATTCTAATTTTTTTT
  FCA3  GATTTCACATATTATAAATATTCTA.AACGTTTATTCCGTTAAATATTCTAA..ATGTTT
T26D22  GATTTCATATAATATATAT....TCAAAACGTTTTTTCGTTAAATAATATAAACTTCTT.
 F6N15  AAGTTCATATATTACA.ATATTCTAAACCCATTATACCATCTAATCCAGTTCGGTGAAAT

        901                                                      960
  T2H3  AATAAACTTTAAATAATTATAATATTTAA........CCTTTAAAAAAGTATAATATTAA
 F9D12  AATAAACTTTAAATAACTACATTATTTA........TCTTTTAATAAAGTATAATATTAA
  FCA3  AATTAACTATA.........ATATTTTA........TTTTTTAATGAAGTAT.ATATTAA
T26D22  .ATAAACTTTAAATTATTATAATATTTA........TC.TTTAATAAAGTATAATATTAA
 F6N15  TAAATATTATTTTTTATTTTTTGTTTTAATAATACTTTTATTAAAAGATTTATAATTCAA

        961                                                     1020
  T2H3  TAATGTCCTAATTTTT....TTTTTTAAGTAATTAGAATCGATG...GAGATATATTAGA
 F9D12  TAGTGTCCTAAGATTT....TTTTTGACGTATTAAGAATTGATG.GAGATATATATCAGA
  FCA3  TAGTGTCCTAAAATTTCTCATTTTTTAAGTAATTAGAATTGAT...ACAGATATATTATA
T26D22  TAAAGTTTTAAGATTTCTCTTTTTTAAAAAAATAATTAGAATTGATGGAGATATATTAGA
 F6N15  AAATCAATTAAAAAGTTTTCTTTCAAATGGTTATTTAATTGTTCTAAAGTTCATATATTA

        1021                                                    1080
  T2H3  TAAAGAAATATTAGTAGTGAGGAATATTAATTAATTGATAAGAATTA.............
 F9D12  TAAGAAAATGCTAGTAGTTAGGAATATTAATTTATTAATAATAATTA...ATGCCAAATG
  FCA3  TAAGAAAATGCTATTAATTAGGAATATTAATTAATTGAAAATAATTA...ATGTC.AATG
T26D22  TAAGGAAATGCTAATAATTAGGAATATTAATTAATTGATAATAATTA...ATGCC.AATA
 F6N15  TAATATTCTAAACCCATTATACCATCTAATCCAGTTCGGTGTAATTAAACATTATTTTTT

        1081                                                    1140
  T2H3  ..ATTCATTGTAAAGAAATTCCAACTTGAATATATATTTGATAAA...AGTGCATATGTA
 F9D12  GTATTTCTTGTAAATAAGTTTCAACTTGAGGATTTATTTGTAAAA...ATGTATATATAT
  FCA3  GCATTGCTTGTAAATAAGTTTCAACTTGAGGATTTATTTCATAAA...ATGGTTGCAAAA
T26D22  GCATCCCTTGTAAATAAGTTTCAACTAAAGGATTTATTTGTTAAATGGCTGCAAAAATGT
 F6N15  ATTTTTTGTTTTAATAATACTTTATTAAAAGATTTATAATTTAAATCAATTAAAAAGTTT

        1141                                                    1200
  T2H3  AATAGACCATGTTGTTCAATCCAAATATAATACACATTTTTAGAAATTGCTTGTTAGAAC
 F9D12  AGATGAGAAAGGTTTAAAACATGGGTAAAGGAAAGTTTTCAAAGATATTTTTGATATATT
  FCA3  ATGTATATGTAGATATAAACTTAACTTACCTTTGCACATCGGTTTCGTGCTTGCCTCCAA
T26D22  ACATATAGATATTTTTCATGTTAGTTATTGCTATTTTTTATGGAGTAAATGAGGCTTGTA
 F6N15  TCTTTCAAATGTTTATTTAATTTTATAGATTTTCCATATT~~~~~~~~~~~~~~~~~~~~

written 17 Aug 98
Larry Parnell