ggKbase home page

rifcsplowo2_01_scaffold_71609_4

Organism: RIFCSPLOWO2_01_FULL_Archaea_Woesearchaeota_28_8

near complete RP 37 / 55 MC: 5 BSCG 7 / 51 ASCG 34 / 38 MC: 5
Location: 897..4010

Top 3 Functional Annotations

Value Algorithm Source
Modification methylase BstVI protein {ECO:0000313|EMBL:KFM21489.1}; EC=5.1.3.6 {ECO:0000313|EMBL:KFM21489.1};; TaxID=1502289 species="Archaea; Thaumarchaeota; unclassified Thaumarchaeota; Marine Group similarity UNIPROT
DB: UniProtKB
  • Identity: 41.3
  • Coverage: 999.99
  • Bit_score: 751
  • Evalue 1.90e-213
Uncharacterized protein n=1 Tax=Candidatus Nitrosopumilus salaria BD31 RepID=I3D1L1_9ARCH similarity UNIREF
DB: UNIREF100
  • Identity: 41.1
  • Coverage: 999.99
  • Bit_score: 718
  • Evalue 7.30e-204
hypothetical protein similarity KEGG
DB: KEGG
  • Identity: 35.0
  • Coverage: 999.99
  • Bit_score: 541
  • Evalue 5.90e-151

Lists

This feature is not on any list.

Notes

This feature has no notes.

Taxonomy

Marine Group I thaumarchaeote SCGC AAA799-B03 → Thaumarchaeota → Archaea

Sequences

DNA sequence
Length: 3114
ATGCGGAAAGACTTATTTAATAAAAAAACAATATCAAGATTTATTTCAAAAATAGAGCCCACATTAAAACAAAAGAATGCATCTAAAAGATGGATAAGTTTAATAGAAACTAACCAGCTTGAAAATGAGAAATCAGCCTATATAGAATTTGCTAACACAATTCTTAGAGATTTATTAGACTACAACATCAGCATAGAAGAACTTAAGCACGAAGAAAATTTTATGGAGTTTGTATTCAGGGATAAATCTAATAATTATCTTGTTTGTTTTGAGGCAAAGGGAACTAAAACTAAAGACTTGTGGGCATCACAGGGAAGGAGTATAAAAATAAAAGAAACTCCAGTAAATCAGATTAATTATTATTTAATGCATAAAAAGATACCTTATGGAGTTTTAACTAATTACAAAGAATTTGTTTTATTCAAAAGAGAGGAGGGGGATTCAAAATACCATAAATTTGATTTCTTAGAAATTAAAAATAATCCTGAAAAGTTAAAAGAATTTATAGCTATCTTCTCAATGGAAAGTTTTAGTGAAAAAGAAACCGAAAAATTGTATAAAGAATCTATTACGGAAGAAAGAAATTTTACAAAAGAGTTCTATAAACTATACCATGAAACAAGATTAATGATTCTTAAAGAATTTAAGGAAAGTGGAATTGAGAATGAAGTTTGTTTACATTATTCCCAGTTGTTCCTAAATCGGCTAATGTTTATCTTTTTTGCGGGAGATACTGAGTTGCTTGATAAAAGGTATTTTGAGAGTAAGATATTAGAAGTGCTTGATAAAGGTGGCGGGATAGATGGACATACAGATTATATTTTCGGAAAGATCAAAAGCATCTTTAGAGAATTGGATGAAGAAGTCCCTAAACAAATAAAGGGCTTTAATGGAGAATTATTTAAAGAAGAGATAGATGGGAGATTATCTTTTAAAGATTATAGAAATACAAGTTTTTTCAAAGATGTATTTCAGCGTCACAGGCTAAATAAAGATATAGAGCTAAATGAACGTGACAAAAGCATATTTAATAAGCATAAAAACAAACTGAATAAGATAATTGAAAACATATTCTTAATGGCTTCTTTTGATTTTAGCACAGAGATTAACGTTAATATACTTGGGCATATTTTTGAGCAATCAATCTCAGACATAGAAAATTTAAAAGAAGAAAAATCGTCAAAAAGAAAAAAAGAGGGAGTTTTTTATACCCCAGAGTATGTAACTGAATATATTTGTAGAAACGCAATAATTCCTTATCTTTCTAAAAGTGGAACAAGTGATATTAATGAAATGATAGATGAGCATTCGCAAAACATATCCGAATTAGAAAATAAATTTAAACAAATAAAAATTTTAGATCCTGCTTGTGGCTCTGGAGCTTTCCTAATTAAATCAACTGAAATATTATTTGAAATATTTGAGAAGATACAATGGATTAAAGAAAATTACGGAGAGTATCGGGCAAATAGGGGATTGAAAAGAAAGAGTAATTTCAAAGGGCAGTCCACATTAAAGAAATGGGATGAAAAAGAGGAGATAAAAAATATTATAAAAAACAATATCTTTGGGGTTGATATTAATGAAGAATCTGTTGAAATAACCAAATTATCTTTATTCTTAAAAATAGCCAGACAAAATAAAAAATTAATTGATTTATCAAACAATATAAAACAGGGGAATAGTCTGATAGATGATGAAAAGATAACGGGAAAATTAGCTTTTAATTGGAATGCTGAGTTCTCAGAAATTATGAAAAGTGGAGGTTTCAATGTAATAATTGGAAACCCCCCATATGTAAGAGTCCAAAACTTGAGACATAAAGATATTGATTTTTTAACTAATAACTATAAAACTCCTACTGGTAAGATAGATATATCCATTTTATTCTTTGAAAAAGCATTAGACTTGATTAATAATAATGGGACTATTAGCTTTATCTCCTCATCACAATGGATTAACACAGACTATGGCAAGAATTTAAGAGAAATATTGGTAAGAGAAGGGTATTTAGCAAAGATGTTGGACTTCGGTTCTTTACCTGTTTTTGAGGAGGCGGATACTTATCCTTCAATATTTGTGTTAAATAAACATAAAAATACTTCTTTAAAATATGCTAAACTGACAAAAGATAATTATGATAAAATAAAAACAGAAAACATTAAATTTAAAAAATTTGATTTTGAGATTTTATCTTCAGACCCTTGGCAATTCTCGGATTTTAACTTAGTAAATAACTTGAATAAAAAGGGATTAATTTGGAAGGAATTGAATAGCTATGGCAAAGCATACATTGGTAATATTACTGGCTACGACAAAGCGTTTGTAGTCAACAAGAAAATAATTGATGAATTTAATTTAGAAAAAGAGATAATAATCCCCTACGCATTTAAAGGTGAGGAAGTTATTAGATACACCAACACAATCCCTCAGAATTTTGTTATTTATCCTTATAAAATAAATAATGATAAACAAGAACTAATGACTGAAAAAGAGTTAAAATCAAAATACCCCAACATCTTAACTTATTTGCTTAAATTTAAAAATGAATTAAAAAAAAGAAAAGACAGCAGGAAATTATATGCTAACAATGATCAGTGGTATAAACATGTTAGACCAGGCTCATTTAATTATATAAAACCTAAAAAGATTCATATTAAAGGAATTTCAACAAGACTAGAGGCTGGGATATTAAATGAAAATACTAACTTTAGTGGAGCCAATTGCCCCGCAATAATTCTTTTTAAAAATGAGGATATGTGGGAAATACTAGGAATTCTCAACTCTAGATTAATTAGCTTTTATCTAAATAATATTTGTCCAAAAAAACTTGGAGGATATATTAGATATAATGCTACAAATATTAGCAAAGTTCCAATAGTAATAGATAAATCAGAAAAATTAAAATCAAGTGTAGAGAGTGCGCTAAGTCTAAATGAAAGTTTTTACGAGAGAAAAAATATGTTTTTTAACAGAATAAATAAATCATTCAATTTGGATAAATTGAACAAAAAATTAGATTATTTTTTTGAATTAGAGTTTAATGACTTTATCAACGAAATTGAAAAACAAATTAANNNNNNNNNTCTAACGAATGTAAAAAAGAATTGTTAA
PROTEIN sequence
Length: 1038
MRKDLFNKKTISRFISKIEPTLKQKNASKRWISLIETNQLENEKSAYIEFANTILRDLLDYNISIEELKHEENFMEFVFRDKSNNYLVCFEAKGTKTKDLWASQGRSIKIKETPVNQINYYLMHKKIPYGVLTNYKEFVLFKREEGDSKYHKFDFLEIKNNPEKLKEFIAIFSMESFSEKETEKLYKESITEERNFTKEFYKLYHETRLMILKEFKESGIENEVCLHYSQLFLNRLMFIFFAGDTELLDKRYFESKILEVLDKGGGIDGHTDYIFGKIKSIFRELDEEVPKQIKGFNGELFKEEIDGRLSFKDYRNTSFFKDVFQRHRLNKDIELNERDKSIFNKHKNKLNKIIENIFLMASFDFSTEINVNILGHIFEQSISDIENLKEEKSSKRKKEGVFYTPEYVTEYICRNAIIPYLSKSGTSDINEMIDEHSQNISELENKFKQIKILDPACGSGAFLIKSTEILFEIFEKIQWIKENYGEYRANRGLKRKSNFKGQSTLKKWDEKEEIKNIIKNNIFGVDINEESVEITKLSLFLKIARQNKKLIDLSNNIKQGNSLIDDEKITGKLAFNWNAEFSEIMKSGGFNVIIGNPPYVRVQNLRHKDIDFLTNNYKTPTGKIDISILFFEKALDLINNNGTISFISSSQWINTDYGKNLREILVREGYLAKMLDFGSLPVFEEADTYPSIFVLNKHKNTSLKYAKLTKDNYDKIKTENIKFKKFDFEILSSDPWQFSDFNLVNNLNKKGLIWKELNSYGKAYIGNITGYDKAFVVNKKIIDEFNLEKEIIIPYAFKGEEVIRYTNTIPQNFVIYPYKINNDKQELMTEKELKSKYPNILTYLLKFKNELKKRKDSRKLYANNDQWYKHVRPGSFNYIKPKKIHIKGISTRLEAGILNENTNFSGANCPAIILFKNEDMWEILGILNSRLISFYLNNICPKKLGGYIRYNATNISKVPIVIDKSEKLKSSVESALSLNESFYERKNMFFNRINKSFNLDKLNKKLDYFFELEFNDFINEIEKQIXXXXLTNVKKNC*