ggKbase | features

Value	Algorithm	Source
Uncharacterized protein (Fragment) n=1 Tax=Bacteroides cellulosilyticus DSM 14838 RepID=E2N889_9BACE	similarity	UNIREF DB: UNIREF100
Identity: 42.6 Coverage: 462.0 Bit_score: 355 Evalue 1.00e-94
Uncharacterized protein {ECO:0000313\|EMBL:AEV68858.1}; TaxID=720554 species="Bacteria; Firmicutes; Clostridia; Clostridiales; Ruminococcaceae; Ruminiclostridium.;" source="Clostridium clariflavum (strain DSM 19732 / NBRC 101661 / EBR45).;"	similarity	UNIPROT DB: UniProtKB
Identity: 41.8 Coverage: 469.0 Bit_score: 351 Evalue 3.40e-93
dockerin type I cellulosome protein	similarity	KEGG DB: KEGG
Identity: 37.7 Coverage: 546.0 Bit_score: 341 Evalue 5.50e-91

Value

Algorithm

Source

Uncharacterized protein (Fragment) n=1 Tax=Bacteroides cellulosilyticus DSM 14838 RepID=E2N889_9BACE

similarity

UNIREF
DB: UNIREF100

Identity: 42.6
Coverage: 462.0
Bit_score: 355
Evalue 1.00e-94

Uncharacterized protein {ECO:0000313|EMBL:AEV68858.1}; TaxID=720554 species="Bacteria; Firmicutes; Clostridia; Clostridiales; Ruminococcaceae; Ruminiclostridium.;" source="Clostridium clariflavum (strain DSM 19732 / NBRC 101661 / EBR45).;"

similarity

UNIPROT
DB: UniProtKB

Identity: 41.8
Coverage: 469.0
Bit_score: 351
Evalue 3.40e-93

dockerin type I cellulosome protein

similarity

KEGG
DB: KEGG

Identity: 37.7
Coverage: 546.0
Bit_score: 341
Evalue 5.50e-91

DNA sequence

Length: 3291

ATGAAAACAAGAAGCATGTATCGGGGCATCGTTCTGATAGCCGCGGCACTGGCAACGGTAGCCTGCCAGAATGAACTGAAGGAAGAGTACAACGAACCCAAACCGGGTGAGAAGATAACCATGACCATCCGGGCAACACAAGGCGCGGCCTCACAGACGCGCACCGACTATGAAGACAATCTGGGAATAACCGGTATAGACAACATAGCAGTGAAGTGGGAAGGCGGAAGTACAGACGGTGCACCGGTGGAGAAGATTAAAGTATTCGGAGTCGATGCAAATGAGCTGGATTACTCGGTAGATTTCAATAGCCTGCCAAGCAGCCTCAGCCAGGACGGGACGAGTATCAGCTTCGAAGGAACCATTAATGCAAAGAGCCTCTACTTTGCCATGTATCCTGCCGATAACTGCAACTACAACACTACGGTTCAAGCCATCTACACCTCCTTCTCAGACCAGACACAAGACTGCGCCAAGCCCATGGCGCACCTCAAAGGCTTCGACCTTATGGTGGGACGAGCAGCGACAACGGGCTCGTATGATAAACTCACATTCAGCCACGAGGCCGCGATGATACGCTTCACCCTCAATGGCGTTCCTTCTTCAGAGAAAATCACCCGTGTAAGCCTCGCTGCCGCCAATAACAAACTGAGCTCCCGGATGTGCGCATCACTCGCCGGCTCGGAAATAGGAGGGTTAACCGTCGAAGCGGATACGGAATACGCCCCGGTGTCAAGTCTCGGCCTCGACATCACTAACCATACCCCCTCCACAGAGCCGCTGAAAGCCTACATGATGATACCTCCATGCGATCTGAGCAACGACCAGCTCACCGTCACCGTAAACACGGAAAGCGGCAATACCTACACCGGCGATCTGACAACCGGAGCCAGCACCTTGCTGAAGGCCGGTCTGTGCTATACCTTAGAACCCACACTAGCGCTCGGCAAAACCATCAGCCTGCCACCCGCTACGGCGGGGAGTTTGGGAAACGCCTTGAACAATATAACCCCGGCCCAAGGACAAACCGAACTGGCCGTGACGGGCGCGGTAAACACCGACGACATCACCGCCCTGGCCGCTTTCTTGAAAGAAACCAAGGCTGAGAATATCACCGCCATCGACCTGTCCGGCATCAGCGGCATAACCGACGTGACAGGCTTTGCAGGCTGCGCAAAGATAGAGAAAGTCATACTGCCCGACGCCGCGGAAGCCATTGGCGACAATGCCTTTGAAGGCTGCACGGCACTGACCACAGTCATCCAGAACGACCCGATACCCGCCGATGTAGCACCCGCCACCCGCAGTATCTCCAAAAGAATAAAAAGAATAGGCCACAGCGCCTTTAAAAATTGCACCTCGATGACCGAAATGTTCCTGCACGCCGATATACAAAGCGTAGGAAACAGCGCCTTTGAAGGGTGCACGGCAATGACAGCCCTCATATTCGAAGGCACAAAAGCGGTCAACGAAACCGACGGTATAAGCTTAGGAACCGGCATCATAACCGGAACGCACGCGGACATCAAAATATTCCTGCCCGCCATCACCGATCTCGCAGTGGGCACCGCATATAAGACAATCCTGGAAGAAAAGCCCACCTACTACAACTTCGCGGGCTACGGCAGCGCCACTACCACTGAAGAGAAAACGAATCCCGCATCGTACACACTCATCCCCACGGTTCCAGTTGATACAATGCGGTTCACCGTGAAGGTGGAAAGTGGCAATCTGGGATTCTGCATTCCCTTCCCCGACTCCGGCAATACTCCCGCGACTATCACGGTAAGTTGGGGTGACGGTACACCCGCTGTCGTAGTGCCCAAAGGCACGACGCTTGCAACGGGTGACAAATTCGAGTACACGTATGCCGAAGCGGGCACATACACCATCACCATCGGCTCGGGTGCGACGGCGGATAAACAGCAAATACCGGTACTGAATTTTAACCAAAGAGGCAGCTCTTACAACCCGAATAAACTGGTGAGCCTTGAAACGCCATTGCTCAATATGAATTGCTCATCTTTGAGCAAAGCGTTTAGAATTTGCGAAAACTTAACCACAATCCCGGGAAATCTTTTCGAAAAGAACACAGCGGTTACAAACTTCAGCAATTGCTTCGATTATTGTAAAGCATTAACCGCAATCCCGGGAAATCTTTTCGAAAAGAACACAGCGGCTACAAACTTCAGCTTTTGCTTCTTTAATTGCGAACTATTAAAAGAGATTCCTAACGAGCTTTTCGCAAGCAACACAGCGGCTACAAACTTCAGCGGTTGCTTCGCTAATTGTAAAGGATTAACCACAATCCCGGGAAATCTTTTCGAAAAGAACACAGCGGCTACAGACTTCAGCAATTGCTTCTATTATTGTAAAGAATTACAGTCAATTCCAGGAGGGCTTTTCGCAAGCAACACAGCGGCCATAAACTTTAGCACTTGCTTCAATCACTGTGACGCATTAACCACAATACCGGAATCACTTTTCGCGAACAACACAGAGGCTACAAAATTTAGTCAATGCTTCGCCGATTGTACCGCTTTAACCACAATCGAGGCAAGACTTTTCGCGAACAACGCAAATATAAACATTAGTTATTGCTTCTCTGGCTGTACCGCATTAACCACAATTTCGGCAGATCTTTTTGCGAATAACACAGCTATTAAAAGCTTCAACTATTGCTTCTATGAGTGTACCGCATTAAAGGCAATCCCGGAAGGGCTTTTCGCGAAGAACGCAGAGGCTACAAGCTTCAGCTATTGCTTCGCTAATTGTAAAGGATTAACCGCAATCCCGGAAAATCTTTTCGAAAAGAACACAGCGGCTACAGACTTCAAAAATTGCTTCCAATCGTGTAGCGCATTAAAGGCAATCCCGGGAAATCTTTTCGAAAAGAACACAGCGGCTACAGACTTCAGCTATTGCTTCTATGACTGTAGTAGTACCCAATTAACCACAATCCCGGAAGGGCTTTTCGCGAAGAACGCAGAAGCTACAAACTTCAACAGTTGCTTCTATGGGTGTACCTATATGATGTTCAATCCAAATATATTCGTCGATCCCACCGCGGCCGAACAGGATAAATTAAACCGCTTCATAGATAAAGACATGGACTTTAGGAATTGCTTCTACCAAGTCAATCTGCATAACAATTCAGGTACCGCCCCCGCGCTGTGGAAGTATGAGAAAGGTTCGGGCCAGTGGAAAACGACAAATTGCTTCAAAGGCTGCATAATGTCAAATTCCGAAGATATCACGGATTATTCAGCTTGGGGCACTCCTAAATTCTAA

PROTEIN sequence

Length: 1097

MKTRSMYRGIVLIAAALATVACQNELKEEYNEPKPGEKITMTIRATQGAASQTRTDYEDNLGITGIDNIAVKWEGGSTDGAPVEKIKVFGVDANELDYSVDFNSLPSSLSQDGTSISFEGTINAKSLYFAMYPADNCNYNTTVQAIYTSFSDQTQDCAKPMAHLKGFDLMVGRAATTGSYDKLTFSHEAAMIRFTLNGVPSSEKITRVSLAAANNKLSSRMCASLAGSEIGGLTVEADTEYAPVSSLGLDITNHTPSTEPLKAYMMIPPCDLSNDQLTVTVNTESGNTYTGDLTTGASTLLKAGLCYTLEPTLALGKTISLPPATAGSLGNALNNITPAQGQTELAVTGAVNTDDITALAAFLKETKAENITAIDLSGISGITDVTGFAGCAKIEKVILPDAAEAIGDNAFEGCTALTTVIQNDPIPADVAPATRSISKRIKRIGHSAFKNCTSMTEMFLHADIQSVGNSAFEGCTAMTALIFEGTKAVNETDGISLGTGIITGTHADIKIFLPAITDLAVGTAYKTILEEKPTYYNFAGYGSATTTEEKTNPASYTLIPTVPVDTMRFTVKVESGNLGFCIPFPDSGNTPATITVSWGDGTPAVVVPKGTTLATGDKFEYTYAEAGTYTITIGSGATADKQQIPVLNFNQRGSSYNPNKLVSLETPLLNMNCSSLSKAFRICENLTTIPGNLFEKNTAVTNFSNCFDYCKALTAIPGNLFEKNTAATNFSFCFFNCELLKEIPNELFASNTAATNFSGCFANCKGLTTIPGNLFEKNTAATDFSNCFYYCKELQSIPGGLFASNTAAINFSTCFNHCDALTTIPESLFANNTEATKFSQCFADCTALTTIEARLFANNANINISYCFSGCTALTTISADLFANNTAIKSFNYCFYECTALKAIPEGLFAKNAEATSFSYCFANCKGLTAIPENLFEKNTAATDFKNCFQSCSALKAIPGNLFEKNTAATDFSYCFYDCSSTQLTTIPEGLFAKNAEATNFNSCFYGCTYMMFNPNIFVDPTAAEQDKLNRFIDKDMDFRNCFYQVNLHNNSGTAPALWKYEKGSGQWKTTNCFKGCIMSNSEDITDYSAWGTPKF*

L2_026_000M1_scaffold_343_20

Organism: L2_026_000M1_public_UNK

Top 3 Functional Annotations

Lists

Notes

Taxonomy

Sequences

DNA sequence

PROTEIN sequence

L2_026_000M1_scaffold_343_20

Organism: L2_026_000M1_public_UNK

Top 3 Functional Annotations

Lists

Notes

Taxonomy

Sequences

DNA sequence

PROTEIN sequence

Processing

Terms of Service

Search Help