Gene T4I9.B
Putative identification hypothetical protein
Position 7428 to 8962, from the initial methionine to the termination codon
Strand -
EST match none
Database match A. thaliana hypothetical protein MWD9.12

 

CDS:  The table below lists the coordinates of the T4I9.B exons and which exon prediction algorithms selected the 3' and 5' termini (GS = GenScan, Gr = GRAIL, M = MZEF, NPG = NetPlantGene - selects splice sites only, not exons)

Exon Range 3' 5'
1 8625 - 8962 GS, Gr, M, NPG GS, Gr
2 8408 - 8528 GS, Gr, M, NPG GS, Gr, M, NPG
3 7977 - 8327 GS, M, NPG GS, Gr, M, NPG
4 7428 - 7892 GS GS, Gr, NPG

Alternate exons not used in building the gene model: GRAIL selects internal exons from 8001 to 8327 and from 7854 to 7892 and a terminal exon from 7173 to 7295. MZEF predicts an exon from 8625 to 8805. NetPlantGene predicts several other splice donor and splice acceptor sites.

Complete CDS of T4I9.B

ATGACTAAAGGCGGAGGTTGCGGCGGCGGAGGAAAAGGAGGAAGGAGAAAATCAACGGCG
GAGGAGGAAGAAGAAGAAGAGCAGAATCAGCAACAACTGTCTCTTGTTGAGTTTCTCTTA
ACGGCGCTGCGTAAATCTGTGGTTTCTTGCCGTGTAGACAACAGACAAGACGACGGCGGA
GTAGGCGGAGGGATTTCGTCCGCCGTTCATCACATGGAGATCGGTTGGCCAACAAATGTT
CGACACATCACTCATGTAACATTCGATCGATTCCATGGCTTTCTTGGTCTCCCTCACGAG
CTTCAAGTTGAGATCCCATGTCGAGTCCCTAGTGCAAGTGTGAGTGTGTTTGGTGTATCG
GCGGAATCGATGCAATGTTCTTATGATGAGAAAGGAAACAGTGTCCCAACGATTCTATTA
CTTATGCAGGAGAGACTCTATTCTCAACAAGGTCTTAAGGCTGAAGGAATTTTCAGGATA
AACCCTGAGAATAGTCAAGAGGAACATGTAAGAGACCAACTAAACAGAGGTATTGTACCT
GAGAATATTGATGTGCATTGTTTGGCTGGTCTTATTAAAGCTTGGTTTAGAGAGTTACCA
AGTGGAGTGCTTGATGGTCTTTCTCCTGAGGAAGTTCTCAATTGCAACACTGAGGATGAA
TCCGTTGAACTCATTAAGCAGTTGAAGCCAACTGAGTCTGCTTTGCTTAATTGGGCTGTT
GATCTTATGGCTGATGTTGTTGAAGAAGAAGAGTCTAACAAAATGAATGCAAGGAATATA
GCCATGGTTTTTGCTCCTAATATGACTCAGATGACAGATCCATTAACGGCTCTTATGCAT
GCTGTTCAAGTGATGAACTTGCTTAAGACTCTTATCACAAAGACACTAGCTGAACGGGAA
GAAAATGCTACCGGATCAGAAGGATATTCTCCATCCCACTCATCCAATTCTCAAACTGAT
TCTGATTCTGACAATGCACAAGACATGGAAGTCAGCTGTGAATCACAAGCCACAGATTCG
GAATGCGGAGAAGAAGAAGAAGTAGAGGAAGTAGAACAGCATCAAGAACATCTCAGCCGC
CACTCTACCCACGAAGATGAAACCGATATTGGATCATTATGTTCAATAGAGAAATGCTTC
TTGAATCAACTCAACAACAATGCTGCTAGAGTTTCAAACACCAGTATCTCTGAAGACTGG
AGTCCTAAAGCATTTCCGCTTGTATCATTCACAGAAAACAAAAGCAACACTTTGAGCTCA
AGCACTAGCGACTAA

 

Protein translation

MTKGGGCGGGGKGGRRKSTAEEEEEEEQNQQQLSLVEFLLTALRKSVVSCRVDNRQDDGG
VGGGISSAVHHMEIGWPTNVRHITHVTFDRFHGFLGLPHELQVEIPCRVPSASVSVFGVS
AESMQCSYDEKGNSVPTILLLMQERLYSQQGLKAEGIFRINPENSQEEHVRDQLNRGIVP
ENIDVHCLAGLIKAWFRELPSGVLDGLSPEEVLNCNTEDESVELIKQLKPTESALLNWAV
DLMADVVEEEESNKMNARNIAMVFAPNMTQMTDPLTALMHAVQVMNLLKTLITKTLAERE
ENATGSEGYSPSHSSNSQTDSDSDNAQDMEVSCESQATDSECGEEEEVEEVEQHQEHLSR
HSTHEDETDIGSLCSIEKCFLNQLNNNAARVSNTSISEDWSPKAFPLVSFTENKSNTLSS
STSD*

 

Multiple sequence analysis

Aligned are proteins from S. pombe (SpC26A3.09c), rat cytocentrin, and two proteins from A. thaliana (MWD9.12 and T4I9.B). The GenBank entry for rat cytocentrin describes it as a "ral-binding protein; mitotic pole protein;" functions for the other three proteins are not described.

                1                                               50
        T4I9.B  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
       MWD9.12  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
   SpC26A3.09c  MVKMDVVRTTGFFLRSEPTTCRITTFAYSAEIIYFHAETTFLFEKIMKEG 
RatCytocentrin  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 

                51                                             100
        T4I9.B  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
       MWD9.12  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
   SpC26A3.09c  NELEKYSKIELNSEIWEDEEEEDNSGIVSQNERLMKLVNKQREIIYELHK 
RatCytocentrin  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 

                101                                            150
        T4I9.B  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
       MWD9.12  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
   SpC26A3.09c  DLEKVKKDNTSLRMRLSKYESTDSFPSSQPSRANSPQSDSYSSPYEKGKL 
RatCytocentrin  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 

                151                                            200
        T4I9.B  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
       MWD9.12  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
   SpC26A3.09c  FPKISLKSSKDVPTASAHISSSDHEKSSSVSLSALNNYNKTTDIKARSLD 
RatCytocentrin  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 

                201                                            250
        T4I9.B  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
       MWD9.12  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
   SpC26A3.09c  RLSDMTRPKLLLNTKRSHRSSEEPGASSPVTSPILKDSQKERIQALRNKA 
RatCytocentrin  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 

                251                                            300
        T4I9.B  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
       MWD9.12  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
   SpC26A3.09c  IKTYSVSTESAERIDSIRSDNLSPLSLNTSSFRRPITKPTPFNSDSNISI 
RatCytocentrin  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 

                301                                            350
        T4I9.B  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
       MWD9.12  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
   SpC26A3.09c  DPKDNNSNKQDHFAEIEDELRQQFLDIKVGRANASSPRRKSISIVKPHGI 
RatCytocentrin  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 

                351                                            400
        T4I9.B  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
       MWD9.12  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
   SpC26A3.09c  SSPKHSTNNLSSKSGKFHSDFRVVSENVLLQARSETNSPIIENKEANNFL 
RatCytocentrin  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 

                401                                            450
        T4I9.B  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
       MWD9.12  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
   SpC26A3.09c  APTSNVPAYSTPARPTESPPPPPISSSSTTPRPDDKPSLPPRGLSEDNDS 
RatCytocentrin  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 

                451                                            500
        T4I9.B  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
       MWD9.12  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
   SpC26A3.09c  LSLQKTGSSDTRRSSFSTLKIPDSDICFTRRRSDSNRTWTVIDPHHSQSF 
RatCytocentrin  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 

                501                                            550
        T4I9.B  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
       MWD9.12  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
   SpC26A3.09c  DNDILAEIPTSKLDNSSQKSPGKLSSKGLLNSFSPISPFSKSKSHNHHPS 
RatCytocentrin  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 

                551                                            600
        T4I9.B  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
       MWD9.12  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
   SpC26A3.09c  SQVEKSTSNSKGSMLPLDTLYNNKLSFRLDESLVRYLRFELMKTSLASLS 
RatCytocentrin  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 

                601                                            650
        T4I9.B  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
       MWD9.12  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
   SpC26A3.09c  PDFDCIGLQFVVGVSASSHLASQWKDEVWSFTRSIGECRSFATSFVLDIG 
RatCytocentrin  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 

                651                                            700
        T4I9.B  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
       MWD9.12  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
   SpC26A3.09c  APPFPTLDWFTNDSSVIQNELLRRSVDTYFRYIFQTDLKLEQRIKLLEFL 
RatCytocentrin  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 

                701                                            750
        T4I9.B  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
       MWD9.12  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
   SpC26A3.09c  SSDTLREYLHDVFFLPPEHAQKEGVLLKYIENSGLVSRYFYLKDNILYFA 
RatCytocentrin  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 

                751                                            800
        T4I9.B  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
       MWD9.12  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
   SpC26A3.09c  ENRNSPVLGTIHLKDAQVNRYNANLPIFSIIDPPHEFLTGENYQSAFVIQ 
RatCytocentrin  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 

                801                                            850
        T4I9.B  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
       MWD9.12  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
   SpC26A3.09c  EKQTETRTGTATVHVLLARDVEDQKSWLRAILRQVPGSTSPLNASPFSVL 
RatCytocentrin  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 

                851                                            900
        T4I9.B  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
       MWD9.12  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~MTEVLHFPSS 
   SpC26A3.09c  SSDFPGSSRYRDQSSPIRFYGKADSRPVSQEAILSQDISSSPSPVLPPSE 
RatCytocentrin  ~~~~~~~~~~~~~~~~~~~MTECFLPPTSSPSEHRRAEHGSGLTRTPSSE 

                901                                            950
        T4I9.B  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~MTKGG 
       MWD9.12  PSASHSSSSSSSSPSPSSLSYASRSNATLLISSDHNRRNPVARFDQDVDF 
   SpC26A3.09c  NVASYADDSLVSNLTMSPKLRDSMEQVPLENHREFEISDRVSELSFDSST 
RatCytocentrin  EISPTKFPGLYRTGEPSPP.HDILHEPP.DIVSDDEKDHGKKKGKFKKKE 

                951                                           1000
        T4I9.B  GCGGGGKGGRRKSTAEEEEEE..EQNQQQLSLVEFLLTALRKSVVSCRVD 
       MWD9.12  HASIEEQDLRRRSSTDGGEED..DGGEDQISLLALLVAIFRRSLISCKSN 
   SpC26A3.09c  GSVLEIADTRRNQDAPEKHVPVIEIQSSRPSLEKTDQSTPVELLIDSHSQ 
RatCytocentrin  KRTEGYAAFQEDSSGDEAESP.SKMKRSKGIHVFKKPSFSKKKEKDFKIK 

                1001                                          1050
        T4I9.B  NRQDDGGVGGGISSAVHHMEIGWPTNVRHITHVTFDRFHGFLGLPHELQV 
       MWD9.12  RRE............LCSMEIGWPTNVRHVAHVTFDRFNGFLGLPVEFEP 
   SpC26A3.09c  NSQNEEKRSRMKFWAFPHHKAENYEQISD.TNIPVIETNVMLSPSSTTSA 
RatCytocentrin  EKPKEEKHKEEKH.KEEKHKEKKCKDLTA.ADVVKQWKEKKKKKKPTQEP 

                1051                                          1100
        T4I9.B  EIPCRVPSASVSVFGVS.AESMQCSYDEKGNSVPTILLLMQERLYSQQGL 
       MWD9.12  EVPRRAPSASATVFGVS.TESMQLSYDSRGNCVPTILLLMQNCLYSQGGL 
   SpC26A3.09c  EPLQKHIVRKSGIFGLPLNEAVNISTQFNDSGLPIVVYRCIEYLESCRAE 
RatCytocentrin  EVPQTDAPSLRPIFGAPLADAVERTMMYDGIRLPAVFRECVDYMEK.HGM 

                1101                                          1150
        T4I9.B  KAEGIFRINPENSQEEHVRDQLNRGIVP......ENIDVHCLAGLIKAWF 
       MWD9.12  QAEGIFRLTAENSEEEAVREQLNRGFIP......ERIDVHCLAGLIKAWF 
   SpC26A3.09c  KEEGIYRLSGSASTIKHLKEQFNEGVDYDLLSSDEEFDVHVIAGLLKLYL 
RatCytocentrin  KCEGIYRVSGIKSKVDELKAAYDREESPNL....EEYEPNTVASLLKQYL 

                1151                                          1200
        T4I9.B  RELPSGVLD.GLSP..EEVLNCNTEDESV....ELIKQLKPTESALLNWA 
       MWD9.12  RELPTSVLD.SLSP..EQVMQCQTEEENV....ELVRLLPPTEAALLDWA 
   SpC26A3.09c  RNLPTNLLDTSMHKLFELLPNVPNDSAALGELCDVISKLPPENFALLDSL 
RatCytocentrin  RDLPENLLTKELMPRFEEACGRTTEVEKVQEFQRLLRELPEYNHLLLSWL 

                1201                                          1250
        T4I9.B  VDLMADVVEEEESNKMNARNIAMVFAPNMTQMTDPLTALMHAVQVMNLLK 
       MWD9.12  INLMADVVQYEHLNKMNSRNIAMVFAPNMTQMDDPLTALMYAVQVMNFLK 
   SpC26A3.09c  LHHLRRIIAFEKVNKMNIRNVCIVFSPTLNIPSDIFMMLI..LNYDHIF. 
RatCytocentrin  IVHMDHVIAKELETKMNIQNISIVLSPTVQISNRVLYVLF..THVQELFG 

                1251                                          1300
        T4I9.B  TLITKTLAEREENATGSE...GYSPSHSSNSQTDSDSDNAQDMEVSCESQ 
       MWD9.12  TLIEKTLRERQDSVVEQAHAFPLEPSDESGHQSPSQSLAFNTSEQSEETQ 
   SpC26A3.09c  TDISRQTNGAQNE..SDSDVSDDNGEDNEFF~~~~~~~~~~~~~~~~~~~ 
RatCytocentrin  TVVLKQVTRPLRW..SNMATMPTLPETQAGIKEEIRRQEFLLNCLHRDLQ 

                1301                                          1350
        T4I9.B  ATDSECGEEEEVEEVEQHQEHLSRHSTHEDETDIGSLCSIEKCFLNQLNN 
       MWD9.12  SDNIENAENQSSSSEISDELTLENNACEQRETDFG......KYRTGRLSD 
   SpC26A3.09c  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
RatCytocentrin  GGIKDLSKEERLWEVQRILTALKRKLREAKRQECETKIAQEIASLSKEDV 

                1351                                          1400
        T4I9.B  NAARVSNTSISEDWSPKAFPLVSFTENKSNTLSSSTSD*~~~~~~~~~~~ 
       MWD9.12  SSQQV...VLNLD.PPAQWP.VGRTKGLTN.LSRVGSRVERTEAWR*~~~ 
   SpC26A3.09c  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
RatCytocentrin  SKEETNENEEVINILLAQENEILTEQEELLAMEQFLRRQIASEKEEIDPL 

                1401                                          1450
        T4I9.B  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
       MWD9.12  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
   SpC26A3.09c  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
RatCytocentrin  RAEIAEIQSRQHGRSETEEYSSDSESESEDEEELQIILEDLQRQNEELEI 

                1451                                          1500
        T4I9.B  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
       MWD9.12  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
   SpC26A3.09c  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
RatCytocentrin  KNNHLNQAVHEEREAIVELRVQLRLLQMLRAKSEQQLQEEEEPERRGGTG 

                1501                                          1550
        T4I9.B  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
       MWD9.12  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
   SpC26A3.09c  ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 
RatCytocentrin  PLPCEGVLEVRAAKEQAKPRPAKTGRRRPSELPRPCASYCKRESAACPAR 

                1551                   1577
        T4I9.B  ~~~~~~~~~~~~~~~~~~~~~~~~~~~
       MWD9.12  ~~~~~~~~~~~~~~~~~~~~~~~~~~~
   SpC26A3.09c  ~~~~~~~~~~~~~~~~~~~~~~~~~~~
RatCytocentrin  QRSVKALRDARSCTRLTPCQAQVLGE*

 


written 17 Jul 98
Larry Parnell