| Gene | T4I9.B |
| Putative identification | hypothetical protein |
| Position | 7428 to 8962, from the initial methionine to the termination codon |
| Strand | - |
| EST match | none |
| Database match | A. thaliana hypothetical protein MWD9.12 |
CDS: The table below lists the coordinates of the T4I9.B exons and which exon prediction algorithms selected the 3' and 5' termini (GS = GenScan, Gr = GRAIL, M = MZEF, NPG = NetPlantGene - selects splice sites only, not exons)
| Exon | Range | 3' | 5' |
|---|---|---|---|
| 1 | 8625 - 8962 | GS, Gr, M, NPG | GS, Gr |
| 2 | 8408 - 8528 | GS, Gr, M, NPG | GS, Gr, M, NPG |
| 3 | 7977 - 8327 | GS, M, NPG | GS, Gr, M, NPG |
| 4 | 7428 - 7892 | GS | GS, Gr, NPG |
Alternate exons not used in building the gene model: GRAIL selects internal exons from 8001 to 8327 and from 7854 to 7892 and a terminal exon from 7173 to 7295. MZEF predicts an exon from 8625 to 8805. NetPlantGene predicts several other splice donor and splice acceptor sites.
Complete CDS of T4I9.B
ATGACTAAAGGCGGAGGTTGCGGCGGCGGAGGAAAAGGAGGAAGGAGAAAATCAACGGCG GAGGAGGAAGAAGAAGAAGAGCAGAATCAGCAACAACTGTCTCTTGTTGAGTTTCTCTTA ACGGCGCTGCGTAAATCTGTGGTTTCTTGCCGTGTAGACAACAGACAAGACGACGGCGGA GTAGGCGGAGGGATTTCGTCCGCCGTTCATCACATGGAGATCGGTTGGCCAACAAATGTT CGACACATCACTCATGTAACATTCGATCGATTCCATGGCTTTCTTGGTCTCCCTCACGAG CTTCAAGTTGAGATCCCATGTCGAGTCCCTAGTGCAAGTGTGAGTGTGTTTGGTGTATCG GCGGAATCGATGCAATGTTCTTATGATGAGAAAGGAAACAGTGTCCCAACGATTCTATTA CTTATGCAGGAGAGACTCTATTCTCAACAAGGTCTTAAGGCTGAAGGAATTTTCAGGATA AACCCTGAGAATAGTCAAGAGGAACATGTAAGAGACCAACTAAACAGAGGTATTGTACCT GAGAATATTGATGTGCATTGTTTGGCTGGTCTTATTAAAGCTTGGTTTAGAGAGTTACCA AGTGGAGTGCTTGATGGTCTTTCTCCTGAGGAAGTTCTCAATTGCAACACTGAGGATGAA TCCGTTGAACTCATTAAGCAGTTGAAGCCAACTGAGTCTGCTTTGCTTAATTGGGCTGTT GATCTTATGGCTGATGTTGTTGAAGAAGAAGAGTCTAACAAAATGAATGCAAGGAATATA GCCATGGTTTTTGCTCCTAATATGACTCAGATGACAGATCCATTAACGGCTCTTATGCAT GCTGTTCAAGTGATGAACTTGCTTAAGACTCTTATCACAAAGACACTAGCTGAACGGGAA GAAAATGCTACCGGATCAGAAGGATATTCTCCATCCCACTCATCCAATTCTCAAACTGAT TCTGATTCTGACAATGCACAAGACATGGAAGTCAGCTGTGAATCACAAGCCACAGATTCG GAATGCGGAGAAGAAGAAGAAGTAGAGGAAGTAGAACAGCATCAAGAACATCTCAGCCGC CACTCTACCCACGAAGATGAAACCGATATTGGATCATTATGTTCAATAGAGAAATGCTTC TTGAATCAACTCAACAACAATGCTGCTAGAGTTTCAAACACCAGTATCTCTGAAGACTGG AGTCCTAAAGCATTTCCGCTTGTATCATTCACAGAAAACAAAAGCAACACTTTGAGCTCA AGCACTAGCGACTAA
Protein translation
MTKGGGCGGGGKGGRRKSTAEEEEEEEQNQQQLSLVEFLLTALRKSVVSCRVDNRQDDGG VGGGISSAVHHMEIGWPTNVRHITHVTFDRFHGFLGLPHELQVEIPCRVPSASVSVFGVS AESMQCSYDEKGNSVPTILLLMQERLYSQQGLKAEGIFRINPENSQEEHVRDQLNRGIVP ENIDVHCLAGLIKAWFRELPSGVLDGLSPEEVLNCNTEDESVELIKQLKPTESALLNWAV DLMADVVEEEESNKMNARNIAMVFAPNMTQMTDPLTALMHAVQVMNLLKTLITKTLAERE ENATGSEGYSPSHSSNSQTDSDSDNAQDMEVSCESQATDSECGEEEEVEEVEQHQEHLSR HSTHEDETDIGSLCSIEKCFLNQLNNNAARVSNTSISEDWSPKAFPLVSFTENKSNTLSS STSD*
Multiple sequence analysis
Aligned are proteins from S. pombe (SpC26A3.09c), rat cytocentrin, and two proteins from A. thaliana (MWD9.12 and T4I9.B). The GenBank entry for rat cytocentrin describes it as a "ral-binding protein; mitotic pole protein;" functions for the other three proteins are not described.
1 50
T4I9.B ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
MWD9.12 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
SpC26A3.09c MVKMDVVRTTGFFLRSEPTTCRITTFAYSAEIIYFHAETTFLFEKIMKEG
RatCytocentrin ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
51 100
T4I9.B ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
MWD9.12 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
SpC26A3.09c NELEKYSKIELNSEIWEDEEEEDNSGIVSQNERLMKLVNKQREIIYELHK
RatCytocentrin ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
101 150
T4I9.B ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
MWD9.12 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
SpC26A3.09c DLEKVKKDNTSLRMRLSKYESTDSFPSSQPSRANSPQSDSYSSPYEKGKL
RatCytocentrin ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
151 200
T4I9.B ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
MWD9.12 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
SpC26A3.09c FPKISLKSSKDVPTASAHISSSDHEKSSSVSLSALNNYNKTTDIKARSLD
RatCytocentrin ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
201 250
T4I9.B ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
MWD9.12 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
SpC26A3.09c RLSDMTRPKLLLNTKRSHRSSEEPGASSPVTSPILKDSQKERIQALRNKA
RatCytocentrin ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
251 300
T4I9.B ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
MWD9.12 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
SpC26A3.09c IKTYSVSTESAERIDSIRSDNLSPLSLNTSSFRRPITKPTPFNSDSNISI
RatCytocentrin ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
301 350
T4I9.B ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
MWD9.12 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
SpC26A3.09c DPKDNNSNKQDHFAEIEDELRQQFLDIKVGRANASSPRRKSISIVKPHGI
RatCytocentrin ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
351 400
T4I9.B ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
MWD9.12 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
SpC26A3.09c SSPKHSTNNLSSKSGKFHSDFRVVSENVLLQARSETNSPIIENKEANNFL
RatCytocentrin ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
401 450
T4I9.B ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
MWD9.12 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
SpC26A3.09c APTSNVPAYSTPARPTESPPPPPISSSSTTPRPDDKPSLPPRGLSEDNDS
RatCytocentrin ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
451 500
T4I9.B ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
MWD9.12 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
SpC26A3.09c LSLQKTGSSDTRRSSFSTLKIPDSDICFTRRRSDSNRTWTVIDPHHSQSF
RatCytocentrin ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
501 550
T4I9.B ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
MWD9.12 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
SpC26A3.09c DNDILAEIPTSKLDNSSQKSPGKLSSKGLLNSFSPISPFSKSKSHNHHPS
RatCytocentrin ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
551 600
T4I9.B ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
MWD9.12 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
SpC26A3.09c SQVEKSTSNSKGSMLPLDTLYNNKLSFRLDESLVRYLRFELMKTSLASLS
RatCytocentrin ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
601 650
T4I9.B ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
MWD9.12 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
SpC26A3.09c PDFDCIGLQFVVGVSASSHLASQWKDEVWSFTRSIGECRSFATSFVLDIG
RatCytocentrin ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
651 700
T4I9.B ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
MWD9.12 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
SpC26A3.09c APPFPTLDWFTNDSSVIQNELLRRSVDTYFRYIFQTDLKLEQRIKLLEFL
RatCytocentrin ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
701 750
T4I9.B ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
MWD9.12 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
SpC26A3.09c SSDTLREYLHDVFFLPPEHAQKEGVLLKYIENSGLVSRYFYLKDNILYFA
RatCytocentrin ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
751 800
T4I9.B ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
MWD9.12 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
SpC26A3.09c ENRNSPVLGTIHLKDAQVNRYNANLPIFSIIDPPHEFLTGENYQSAFVIQ
RatCytocentrin ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
801 850
T4I9.B ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
MWD9.12 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
SpC26A3.09c EKQTETRTGTATVHVLLARDVEDQKSWLRAILRQVPGSTSPLNASPFSVL
RatCytocentrin ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
851 900
T4I9.B ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
MWD9.12 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~MTEVLHFPSS
SpC26A3.09c SSDFPGSSRYRDQSSPIRFYGKADSRPVSQEAILSQDISSSPSPVLPPSE
RatCytocentrin ~~~~~~~~~~~~~~~~~~~MTECFLPPTSSPSEHRRAEHGSGLTRTPSSE
901 950
T4I9.B ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~MTKGG
MWD9.12 PSASHSSSSSSSSPSPSSLSYASRSNATLLISSDHNRRNPVARFDQDVDF
SpC26A3.09c NVASYADDSLVSNLTMSPKLRDSMEQVPLENHREFEISDRVSELSFDSST
RatCytocentrin EISPTKFPGLYRTGEPSPP.HDILHEPP.DIVSDDEKDHGKKKGKFKKKE
951 1000
T4I9.B GCGGGGKGGRRKSTAEEEEEE..EQNQQQLSLVEFLLTALRKSVVSCRVD
MWD9.12 HASIEEQDLRRRSSTDGGEED..DGGEDQISLLALLVAIFRRSLISCKSN
SpC26A3.09c GSVLEIADTRRNQDAPEKHVPVIEIQSSRPSLEKTDQSTPVELLIDSHSQ
RatCytocentrin KRTEGYAAFQEDSSGDEAESP.SKMKRSKGIHVFKKPSFSKKKEKDFKIK
1001 1050
T4I9.B NRQDDGGVGGGISSAVHHMEIGWPTNVRHITHVTFDRFHGFLGLPHELQV
MWD9.12 RRE............LCSMEIGWPTNVRHVAHVTFDRFNGFLGLPVEFEP
SpC26A3.09c NSQNEEKRSRMKFWAFPHHKAENYEQISD.TNIPVIETNVMLSPSSTTSA
RatCytocentrin EKPKEEKHKEEKH.KEEKHKEKKCKDLTA.ADVVKQWKEKKKKKKPTQEP
1051 1100
T4I9.B EIPCRVPSASVSVFGVS.AESMQCSYDEKGNSVPTILLLMQERLYSQQGL
MWD9.12 EVPRRAPSASATVFGVS.TESMQLSYDSRGNCVPTILLLMQNCLYSQGGL
SpC26A3.09c EPLQKHIVRKSGIFGLPLNEAVNISTQFNDSGLPIVVYRCIEYLESCRAE
RatCytocentrin EVPQTDAPSLRPIFGAPLADAVERTMMYDGIRLPAVFRECVDYMEK.HGM
1101 1150
T4I9.B KAEGIFRINPENSQEEHVRDQLNRGIVP......ENIDVHCLAGLIKAWF
MWD9.12 QAEGIFRLTAENSEEEAVREQLNRGFIP......ERIDVHCLAGLIKAWF
SpC26A3.09c KEEGIYRLSGSASTIKHLKEQFNEGVDYDLLSSDEEFDVHVIAGLLKLYL
RatCytocentrin KCEGIYRVSGIKSKVDELKAAYDREESPNL....EEYEPNTVASLLKQYL
1151 1200
T4I9.B RELPSGVLD.GLSP..EEVLNCNTEDESV....ELIKQLKPTESALLNWA
MWD9.12 RELPTSVLD.SLSP..EQVMQCQTEEENV....ELVRLLPPTEAALLDWA
SpC26A3.09c RNLPTNLLDTSMHKLFELLPNVPNDSAALGELCDVISKLPPENFALLDSL
RatCytocentrin RDLPENLLTKELMPRFEEACGRTTEVEKVQEFQRLLRELPEYNHLLLSWL
1201 1250
T4I9.B VDLMADVVEEEESNKMNARNIAMVFAPNMTQMTDPLTALMHAVQVMNLLK
MWD9.12 INLMADVVQYEHLNKMNSRNIAMVFAPNMTQMDDPLTALMYAVQVMNFLK
SpC26A3.09c LHHLRRIIAFEKVNKMNIRNVCIVFSPTLNIPSDIFMMLI..LNYDHIF.
RatCytocentrin IVHMDHVIAKELETKMNIQNISIVLSPTVQISNRVLYVLF..THVQELFG
1251 1300
T4I9.B TLITKTLAEREENATGSE...GYSPSHSSNSQTDSDSDNAQDMEVSCESQ
MWD9.12 TLIEKTLRERQDSVVEQAHAFPLEPSDESGHQSPSQSLAFNTSEQSEETQ
SpC26A3.09c TDISRQTNGAQNE..SDSDVSDDNGEDNEFF~~~~~~~~~~~~~~~~~~~
RatCytocentrin TVVLKQVTRPLRW..SNMATMPTLPETQAGIKEEIRRQEFLLNCLHRDLQ
1301 1350
T4I9.B ATDSECGEEEEVEEVEQHQEHLSRHSTHEDETDIGSLCSIEKCFLNQLNN
MWD9.12 SDNIENAENQSSSSEISDELTLENNACEQRETDFG......KYRTGRLSD
SpC26A3.09c ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
RatCytocentrin GGIKDLSKEERLWEVQRILTALKRKLREAKRQECETKIAQEIASLSKEDV
1351 1400
T4I9.B NAARVSNTSISEDWSPKAFPLVSFTENKSNTLSSSTSD*~~~~~~~~~~~
MWD9.12 SSQQV...VLNLD.PPAQWP.VGRTKGLTN.LSRVGSRVERTEAWR*~~~
SpC26A3.09c ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
RatCytocentrin SKEETNENEEVINILLAQENEILTEQEELLAMEQFLRRQIASEKEEIDPL
1401 1450
T4I9.B ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
MWD9.12 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
SpC26A3.09c ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
RatCytocentrin RAEIAEIQSRQHGRSETEEYSSDSESESEDEEELQIILEDLQRQNEELEI
1451 1500
T4I9.B ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
MWD9.12 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
SpC26A3.09c ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
RatCytocentrin KNNHLNQAVHEEREAIVELRVQLRLLQMLRAKSEQQLQEEEEPERRGGTG
1501 1550
T4I9.B ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
MWD9.12 ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
SpC26A3.09c ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
RatCytocentrin PLPCEGVLEVRAAKEQAKPRPAKTGRRRPSELPRPCASYCKRESAACPAR
1551 1577
T4I9.B ~~~~~~~~~~~~~~~~~~~~~~~~~~~
MWD9.12 ~~~~~~~~~~~~~~~~~~~~~~~~~~~
SpC26A3.09c ~~~~~~~~~~~~~~~~~~~~~~~~~~~
RatCytocentrin QRSVKALRDARSCTRLTPCQAQVLGE*
written 17 Jul 98
Larry Parnell