Te biologiczne bazy danych są biblioteki, które wymienia informacje na temat nauk biologicznych pobranych przez eksperymentów naukowych do opublikowanej literatury, eksperymentalnych technologii szerokopasmowych oraz analizy komputerowej. Zawierają informacje z różnych dziedzin badań, takich jak genomika , proteomika , metabolomika , filogenetyka i mikromacierze DNA . Wśród zawartości baz danych znajdujemy informacje o funkcji, budowie, lokalizacji ( komórkowej i chromosomalnej ) genóworaz kliniczne skutki ich mutacji , jak również ich podobieństwa w sekwencji i strukturze.
Bazy te są ważnym narzędziem dla naukowców, ponieważ pozwalają im zrozumieć i wyjaśnić wiele zjawisk biologicznych, począwszy od struktury biomolekuł i ich oddziaływania na cały metabolizm organizmów, a nawet ewolucji od gatunku . Wiedza ta ułatwia zarządzanie patologiami, pozwala na tworzenie nowych leków i umożliwia odkrywanie relacji międzygatunkowych na przestrzeni dziejów życia.
Znajomość biologii jest przedmiotem wszelkiego rodzaju specjalistycznych lub ogólnych baz danych. W rezultacie czasami trudno jest zapewnić spójność informacji. Integracyjne Bioinformatyka ma na celu rozwiązanie tego problemu poprzez zapewnienie ujednoliconego dostępu. Pojęcie numeru dostępu w bioinformatyce umożliwia powiązanie ze sobą zawartości różnych baz danych.
Pojęcia relacyjnej bazy danych (wywodzącej się z informatyki ) i wyszukiwania informacji (w bibliotekach elektronicznych ) są ważne dla zrozumienia biologicznych baz danych. Ich projektowanie, rozwój i długoterminowe utrzymanie jest kluczowym obszarem bioinformatyki . To jest często opisywany jako pół- ustrukturyzowanych danych i może przyjąć formę tabel , XML struktur itp
Czasopismo Nucleic Acids Research (NAR) co roku publikuje specjalne wydanie zatytułowane The Database Issue of NAR , które jest dostępne bezpłatnie. Kategoryzuje dużą część ogólnodostępnych baz danych online związanych z biologią i bioinformatyką . Tej edycji towarzyszy The Online Molecular Biology Database Collection , lista 1380 baz danych. Istnieją inne zbiory baz danych, takie jak MetaBase lub Bioinformatics Links Collection .
Większość biologicznych baz danych jest dostępna na stronach internetowych, na których użytkownicy mogą przeglądać informacje. Ogólnie możliwe jest również pobieranie danych w różnych formatach: tekst, dane sekwencjonowania, struktury białek lub linki. Na przykład :
W przypadku niektórych gatunków, zwłaszcza tych często wykorzystywanych do badań, istnieją specjalistyczne bazy danych. Colibase jest na przykład poświęcona E. coli . Znajdujemy również FlyBase dla Drosophila , WormBase dla nicieni C. elegans i C. briggsae , EuPathDB dla patogenów eukariotycznych .