Sekwencjonowanie DNA jest ustalenie kolejności sekwencji nukleotydów z fragmentem DNA podane.
Sekwencja DNA zawiera informację, że żywe organizmy potrzebują, aby przetrwać i rozmnażać. Określenie tej sekwencji jest zatem przydatne zarówno w badaniach mających na celu poznanie sposobu życia organizmów, jak i w przypadku przedmiotów stosowanych. W medycynie może być stosowany do identyfikacji, diagnozowania i potencjalnego poszukiwania metod leczenia chorób genetycznych i wirusologii . W biologii badanie sekwencji DNA stało się ważnym narzędziem klasyfikacji gatunków .
Sekwencjonowanie DNA zostało wynalezione w drugiej połowie lat 70. Dwie metody zostały opracowane niezależnie, jedna przez zespół Waltera Gilberta w Stanach Zjednoczonych , a druga przez Fredericka Sangera (w 1977) w Wielkiej Brytanii . Te dwie metody opierają się na diametralnie przeciwstawnych zasadach: podejście Sangera jest metodą selektywnej syntezy enzymatycznej , natomiast podejście Maxama i Gilberta jest metodą selektywnej degradacji chemicznej . Za to odkrycie Gilbert i Sanger otrzymali w 1980 roku Nagrodę Nobla w dziedzinie chemii .
Początkowo metoda Sangera wymagała dostępności jednoniciowego DNA, które służyło jako matryca do enzymatycznej syntezy nici komplementarnej. Z tego powodu pierwszym organizmem biologicznym, którego genom zsekwencjonowano w 1977 r., jest wirus bakteriofagowy φX174 . Wirus ten ma właściwość posiadania genomu złożonego z jednoniciowego DNA, który jest zamknięty w cząsteczce wirusa.
W ciągu ostatnich 25 lat metoda Sangera została szeroko rozwinięta dzięki kilku ważnym postępom technologicznym:
Metoda Maxama i Gilberta wymaga toksycznych odczynników chemicznych i pozostaje ograniczona pod względem wielkości analizowanych fragmentów DNA (<250 nukleotydów). Mniej łatwy w robotyzacji, jego użycie stało się teraz poufne.
Ta metoda jest zwykle używana do wykonywania sekwencjonowania małych punktów. Do sekwencjonowania całego genomu zamiast tego stosuje się sekwencjonowanie nowej generacji. Zasada tej metody polega na zainicjowaniu polimeryzacji DNA za pomocą małego oligonukleotydu (startera) komplementarnego do części fragmentu DNA, który ma być sekwencjonowany. Wydłużenie startera jest realizowane przez fragment Klenowa ( polimeraza DNA I pozbawiona aktywności egzonukleazy 5 '→3') i utrzymywane przez termostabilne polimerazy DNA , które są używane do PCR . Dodaje się cztery dezoksyrybonukleotydy (dATP, dCTP, dGTP, dTTP), a także niskie stężenie jednego z czterech dideoksyrybonukleotydów (ddATP, ddCTP, ddGTP lub ddTTP).
Te dideoksyrybonukleotydy działają jako „trucizny” terminatorów łańcucha: po włączeniu do nowej syntetyzowanej nici zapobiegają dalszemu wydłużaniu, ponieważ nie mają końca 3'-OH (tylko wodór zamiast grupy hydroksylowej). To zakończenie następuje konkretnie na poziomie nukleotydów odpowiadających dideoksyrybonukleotydowi włączonemu do reakcji. W celu pełnego zsekwencjonowania tego samego fragmentu DNA, reakcję tę powtarza się równolegle czterokrotnie, z czterema różnymi dideoksyrybonukleotydami.
Na przykład w reakcji, w której dodano ddGTP, synteza zatrzymuje się na poziomie G. W mieszaninie reakcyjnej zawierającej zarówno dGTP, jak i trochę ddGTP, terminacja następuje statystycznie w zależności od tego, czy polimeraza DNA wykorzystuje którykolwiek z tych nukleotydów. Powoduje to mieszaninę fragmentów DNA o rosnących rozmiarach, z których wszystkie kończą się jednym z G w sekwencji. Fragmenty te są następnie rozdzielane przez elektroforezę na żelu poliakrylamidowym , co umożliwia identyfikację pozycji Gs w sekwencji.
Zsyntetyzowane w ten sposób fragmenty są wykrywane przez włączenie znacznika do zsyntetyzowanego DNA. Początkowo ten znacznik był radioaktywny; obecnie stosuje się znaczniki fluorescencyjne, przyłączone do oligonukleotydu lub dideoksyrybonukleotydu.
Ta metoda opiera się na chemicznej degradacji DNA i wykorzystuje różne reaktywności czterech zasad A, T, G i C, aby uzyskać selektywne rozszczepienia. Rekonstruując kolejność cięć, możemy cofnąć się do sekwencji nukleotydowej odpowiedniego DNA. To sekwencjonowanie chemiczne można podzielić na sześć kolejnych etapów:
Znajomość struktury genomu w całości może przejść przez jego sekwencjonowanie. Jednak ze względu na rozmiar genomów wynoszący kilka milionów zasad (lub megabaz), konieczne jest połączenie metod biologii molekularnej z metodami informatyki, aby móc przetwarzać tak dużą liczbę danych.
Stosowane są dwie główne zasady sekwencjonowania całego genomu. W obu przypadkach genomowy DNA jest najpierw fragmentowany metodami enzymatycznymi ( enzymy restrykcyjne ) lub fizycznymi ( ultradźwięki ):
Główna różnica między tymi dwiema zasadami polega na tym, że hierarchiczne sekwencjonowanie próbuje dopasować zestaw dużych klonów (~100 kb), podczas gdy w ogólnej metodzie cały genom jest redukowany do małych fragmentów, które są sekwencjonowane, a następnie dopasowywane.
Po ekstrakcji genomowy DNA jest cięty przez sonikację na fragmenty o wielkości od 50 do 200 kb, a następnie klonowany w odpowiednim wektorze, takim jak sztuczne chromosomy bakteryjne lub BAC. Liczba klonów powinna umożliwić pokrycie od 5 do 10 razy całkowitej długości badanego genomu. Nakładanie się i kolejność klonów przeprowadza się albo przez hybrydyzację specyficznych sond, albo przez analizę profili restrykcyjnych , albo częściej przez porządkowanie po sekwencjonowaniu i hybrydyzacji końców BAC. Po uporządkowaniu klonów są one indywidualnie fragmentowane i sekwencjonowane, a następnie składane przez dopasowanie bioinformatyczne.
Zaletami tej metody jest większa łatwość montażu fragmentów dzięki nakładaniu się BAC, możliwość porównywania fragmentów z dostępnymi bazami danych oraz możliwość współdzielenia pracy sekwencjonowania pomiędzy kilka laboratoriów, z których każde region chromosomalny.
Główną wadą jest trudność klonowania fragmentów zawierających powtarzające się sekwencje, które są bardzo częste w niektórych genomach, takich jak genomy ssaków, co utrudnia ostateczną analizę bioinformatyczną.
Jest to metoda sekwencjonowania genomowego DNA, pierwotnie opracowana w laboratorium Fredericka Sangera w Cambridge pod koniec lat 70. XX wieku w celu sekwencjonowania pierwszych genomów wirusów.
Metoda ta została spopularyzowana przez Craiga Ventera do sekwencjonowania dużych genomów, w szczególności w firmie Celera Genomics . Pierwszym zastosowaniem było sekwencjonowanie genomów bakterii, następnie genomu Drosophila i wreszcie genomu ludzkiego i mysiego . Aby przeprowadzić sekwencjonowanie pełnego genomu przy użyciu tej techniki, tworzone są dwie do trzech bibliotek złożonych z losowych fragmentów genomowego DNA . Pomiędzy bibliotekami fragmenty różnią się zarówno pod względem wielkości, jak i lokalizacji w genomie . Z tych bibliotek sekwencjonuje się, a następnie składa, wiele klonów. Całkowitą sekwencję uzyskuje się przez przetwarzanie wszystkich bibliotek przy użyciu narzędzi bioinformatycznych, przez dopasowanie fragmentów przy użyciu nakładających się sekwencji.
Zaletą nad sekwencjonowaniem przez sekwencjonowanie hierarchiczne jest szybkość techniki i niższy koszt. Wadą jest to, że przetwarzanie komputerowe nie umożliwia zestawienia fragmentów zawierających duże powtarzające się sekwencje, które często występują w genomach ssaków.
Ta metoda jest powszechnie nazywana strzelbą (obrzynką) lub strzelbą z całego genomu (WGS). Ta metafora ilustruje losowy charakter początkowej fragmentacji genomowego DNA: rozpylany jest cały genom, trochę jak rozrzucane są kulki tego typu broni palnej.
Sekwencjonowanie przez hybrydyzację opiera się na wykorzystaniu chipów DNA zawierających od kilkuset (dla chipów pierwszej generacji) do kilku tysięcy oligonukleotydów. Analizowany DNA jest cięty na wiele fragmentów, które są następnie inkubowane na chipie, gdzie będą hybrydyzować z oligonukleotydami, do których są komplementarne. Odczyt chipa (wykrywanie zhybrydyzowanych oligonukleotydów) umożliwia uzyskanie widma sekwencji DNA , czyli jej składu w podsekwencjach n nukleotydów, gdzie n jest wielkością sond na zastosowanym chipie. Komputerowe przetwarzanie widma umożliwia następnie odtworzenie całej sekwencji.
adaptacja techniki Sangera, która wykorzystuje fluorescencję zamiast radioaktywności . Wbudowane dideoksynukleotydy są specyficznie znakowane cząsteczkami fluorescencyjnymi lub „ fluorochromowymi ” fluoroforami (ddATP-JOE, ddCTP-5-FAM, ddGTP-TAMRA i ddTTP-ROX).
Reakcję sekwencjonowania przeprowadza się metodą PCR . Taq polimerazy wykonuje wydłużenie przy wbudowaniu dideoksynukleotydami znakowanego fluorescencyjnie. Zsyntetyzowane fragmenty są następnie rozdzielane przez elektroforezę .
Automatyczne urządzenie pobiera reakcję sekwencji i wstrzykuje ją do kapilary zawierającej polimer poliakryloamidowy . Podczas migracji laserowy system optyczny wykrywa fluorescencję przechodzącą przed okienkiem lasera, która jest emitowana przez ddNTP, który zakańcza fragment pod wpływem wzbudzenia (zielone światło dla JOE „ddATP”, niebieskie dla 5-FAM „ddCTP”, żółte dla TAMRA "ddGTP" i czerwony dla ROX "ddTTP".
Rozdzielając te cząsteczki metodą elektroforezy według ich wielkości, można odczytać na elektroforogramie (lub fluorogramie ) kolejne litery, które pojawiają się w postaci krzywych, których fluorescencja odpowiada podstawie tego kończącego się ddNTP. Oprogramowanie do analizy umożliwia ustalenie zgodności między krzywymi fluorescencji a wprowadzonym nukleotydem.
Informacje są rejestrowane elektronicznie, a zinterpretowana sekwencja jest przechowywana w bazie danych komputera. Mówi się, że ten rodzaj sekwencjonowania charakteryzuje się wysoką przepustowością, ponieważ wiele sekwencji może być przeprowadzanych w tym samym czasie. Rzeczywiście, zgodnie z modelami sekwencera, 1, 6, 12 lub nawet 36 kapilar może działać równolegle, wiedząc, że automat może sukcesywnie wstrzykiwać 96 reakcji sekwencji zawartych w płytce do każdej z kapilar. Długość odtwarzania wynosi około 1 kb na sekwencję. Czas trwania sekwencji to około 10 minut. W ciągu jednej nocy, przy 12 kapilarach, sekwencer może automatycznie uzyskać odczyt 1 Mb.
Porównanie metod sekwencjonowania nowej generacjimetoda | Długość czytania | precyzja | Czytanie przez doświadczenie | czas doświadczenia | koszt za 1 milion baz (w dolarach amerykańskich) | Korzyści | Niedogodności |
---|---|---|---|---|---|---|---|
Sekwencjonowanie pojedynczych cząsteczek w czasie rzeczywistym (Pacific Biosciences) | średnio od 10 000 pz do 15 000 pz (14 000 pz N50); maksymalna długość odczytu > 40 000 baz | 87% | 50 000 na komórkę lub 500-1000 megabaz | 30 minut do 4 godzin | 0,13 USD– 0,60 USD | długie odczyty. Szybki. Wykrywa 4mC, 5mC, 6mA | umiarkowany przepływ, sprzęt może być bardzo drogi |
Półprzewodnik jonowy ( sekwencjonowanie torrent jonów ) | do 400 pz | 98% | do 80 milionów | 2 godziny | 1 zł | najtańszy, szybki sprzęt | błędy homopolimeru |
Pirosekwencjonowanie ( 454 ) | 700 pz | 99,9% | 1 milion | 24 godziny | 10 zł | długie, szybkie czytanie | eksperyment jest kosztowny, błędy homopolimerowe |
Sekwencjonowanie przez syntezę (Illumina) | 50 do 300 pz | 99,9% | do 6 miliardów | 1 do 11 dni | 0,05 do 0,15 USD $ | Wysoki potencjał przepustowości sekwencji, w zależności od modelu sekwencera i pożądanej aplikacji | Sprzęt może być bardzo drogi. Wymaga wysokich stężeń DNA. |
Sekwencjonowanie ligacji (sekwencjonowanie SOLiD) | 50 + 35 lub 50 + 50 pz | 99,9% | nie dotyczy | 20 minut do 3 godzin | 2400 zł | długie odczyty. Przydatne do wielu zastosowań. | Droższe i niewygodne dla dużych projektów sekwencjonowania. Ta metoda wymaga również czasu na klonowanie plazmidu lub etap PCR. |
Nazwisko | Liczba maszyn (na całym świecie) |
---|---|
Illumina HiSeq 2000 | 5490 |
Analizator genomu Illumina 2x | 411 |
Skała 454 | 382 |
ABI SOLID | 326 |
Jonowy potok | 301 |
Illumina MiSeq | 299 |
Jon Proton | 104 |
Bionauki Pacyfiku | 50 |
Oxford Nanopore MinION | 14 |
Illumina NextSeq | 3 |
Sekwencjonowanie nanoporów jest metodą rozwijaną od 1995 roku do sekwencjonowania DNA.
Nanopor to po prostu mały otwór o średnicy wewnętrznej rzędu 1 nanometra. Niektóre porowate transbłonowe białka komórkowe działają jak nanodruty, nanopory zostały również wykonane poprzez wytrawienie nieco większej dziury (kilkadziesiąt nanometrów) w kawałku krzemu.
Teoria sekwencjonowania nanoporów jest następująca: Gdy nanopor zanurzy się w płynie przewodzącym i przyłoży się do niego potencjał (napięcie), można zaobserwować prąd elektryczny spowodowany przewodzeniem jonów przez nanopor. Wielkość prądu jest bardzo wrażliwa na wielkość i kształt nanoporów. Jeśli pojedyncze nukleotydy (zasady), nici DNA lub inne cząsteczki przechodzą przez nanopor lub w jego pobliżu, może to spowodować charakterystyczną zmianę natężenia prądu przepływającego przez nanopor.
Na początku drugiej połowy XX th wieku, stosunek medycynie nadal dominuje chęć zrozumienia i choroby leczyć i różnych zagrożeń dla organizacji. Jednak zrozumienie, jak to działa, znacznie się pogłębiło w ostatnich dziesięcioleciach, w szczególności dzięki ulepszeniu i pojawieniu się różnych technik. Samo pojęcie zdrowia, oznaczające wówczas raczej brak patologii, zostało naturalnie przedefiniowane, by odtąd oznaczać raczej ogólne samopoczucie jednostki, zarówno fizyczne, jak i moralne. W ten sposób zdemokratyzowały się nowe strategie handlowe, oferując każdej jednostce możliwość dbania o własną integralność fizyczną. (leki bez recepty, zdrowa żywność itp.).
Sekwencjonowanie DNA jest techniką leżącą w samym sercu tej redefinicji koncepcji zdrowia i ogólnie związku z „rzeczami żywymi”, ponieważ sugeruje optymalne i spersonalizowane leczenie dla każdej osoby. Rynek danych genetycznych rozwijał się bardzo szybko, a wiele inwestycji od czasu jego powstania pozwoliło na gwałtowny spadek cen.
Pierwszy kompletny sekwencjonowanie ludzkiego genomu została zakończona w 2003 roku i trwała około dziesięciu lat pracy, a całkowita kwota inwestycji 2,7 miliardów $. W tym czasie metoda Sangera była nadal intensywnie używana do odszyfrowania około 3 miliardów par nukleotydów, które składają się na nasze DNA. Pojawiło się wtedy wiele projektów (w szczególności 1000 genomów , ENCODE …) i opracowano nowe maszyny (wspomniane powyżej) w celu wygenerowania pełnej sekwencji ludzkiego genomu za mniej niż 1000 dolarów. Wraz z udoskonaleniem metod sekwencjonowania, cenę częściowego sekwencjonowania genomu ludzkiego w wysokiej jakości oszacowano na 14 mln USD w 2006 roku, relatywnie mniej w porównaniu do projektu zakończonego w 2003 roku. Na koniec 2015 roku cena wygenerowania pojedyncza passa wynosiła około 1500 USD.
Wraz z pojawieniem się tych nowych, znacznie wydajniejszych metod, zgrupowanych pod akronimem NGS , szybszych i tańszych, rynek sekwencjonowania DNA eksplodował i obecnie dostępnych jest wiele zastosowań w różnych dziedzinach. Niektóre firmy, takie jak Illumina, oferują teraz usługę sekwencjonowania DNA, dostępną finansowo dla osób fizycznych.
Sekwencjonowanie DNA może być wykorzystane do określenia sekwencji poszczególnych genów, dużych regionów genetycznych, całych chromosomów lub całych genomów dowolnego organizmu. Sekwencjonowanie DNA stało się kluczową technologią w wielu dziedzinach biologii i innych naukach, takich jak medycyna, kryminalistyka czy antropologia .
W biologii molekularnej sekwencjonowanie genomu umożliwia badanie kodowanych białek , naukowcy identyfikują zmiany w genach i kojarzą je z określonymi chorobami w celu ukierunkowania potencjalnych leków.
Sekwencjonowanie umożliwiło zrozumienie genetycznego pochodzenia niektórych nowotworów, które powstają w wyniku akumulacji mutacji w krytycznych genach, które modyfikują normalne programy proliferacji, różnicowania i śmierci komórek. Kinaza RAS-RAF-MEK-ERK-MAP wiąże się z odpowiedzią komórkową na sygnały wzrostu, aw około 15% ludzkich nowotworów gen RAS jest zmutowany, co powoduje postać onkogenną.
Ponieważ DNA jest informacyjną makrocząsteczką pod względem przekazywania z pokolenia na pokolenie, sekwencjonowanie DNA jest wykorzystywane w biologii ewolucyjnej do badania, w jaki sposób różne organizmy są spokrewnione i jak ewoluowały, w oparciu o wspólne badania między paleogenetami i antropologami. Analiza DNA tkanek ludzkich, głównie kostnych i zębowych, zakopanych na nekropoliach, pozwala określić haplogrupy i oszacować ich pochodzenie biogeograficzne, a także trasy migracji, które mogły przebyć setki lub tysiące lat temu, w celu porównania ich cechy genetyczne z cechami obecnych populacji lub ustalenie niektórych cech fizycznych. Ze względu na spadek cen sekwencjonowania genomu firmy oferują publicznie jako płatną usługę prześledzenia pochodzenia osoby z prostego zestawu do użytku domowego.
Genetycy medyczni mogą sekwencjonować geny u pacjentów, aby ustalić, czy istnieje ryzyko chorób genetycznych. Jest to badanie cech genetycznych osoby. Diagnoza jest zazwyczaj pre- lub postnatalna. Na przykład diagnoza prenatalna może wykryć chorobę dziedziczną odpowiedzialną za poważną niepełnosprawność lub zaburzenia behawioralne i psychologiczne i dać rodzicom zdiagnozowanego dziecka możliwość kontynuowania ciąży. Informacje o wariacjach genetycznych ( polimorfizmy pojedynczego nukleotydu ) również ukierunkowują postępowanie terapeutyczne i umożliwiają poradnictwo genetyczne dla członków rodziny.
Coraz częściej badanie cech genetycznych odbywa się za pomocą wysokoprzepustowego sekwencjonowania DNA (NGS). Ogólnie rzecz biorąc, w chwili obecnej sekwencjonowane są raczej tylko kodujące części genów, w których opisano 2/3 mutacji. NGS umożliwia zatem sekwencjonowanie wszystkich części kodujących genów danej osoby jednocześnie, co nazywa się egzomem .
W diagnostyce prenatalnej DPNI jest uznawane za bezpieczną i wczesną technikę wykrywania zespołu Downa lub innych nieprawidłowości chromosomalnych, a nawet niektórych mutacji punktowych. To nie jest diagnoza, a jedynie badanie przesiewowe. Polega na pobraniu krwi od matki w czasie ciąży. Ta krew naturalnie zawiera niewielką ilość fragmentów DNA płodu, a genetycy nie potrafią oddzielić jej od fragmentów DNA należących do matki, które również można znaleźć we krwi. DPNI to zatem wysokoprzepustowe sekwencjonowanie wszystkich fragmentów DNA krążących we krwi matki, a następnie komputerowa analiza wyników. DPNI to skrót od Prenatal Screening by Non-Invasive Technique. W zależności od wyników wskazane jest potwierdzenie nieprawidłowości, czyli amniopunkcja .
Medycyna rozrodu to dziedzina medycyny badająca fizjologię rozrodu oraz jego patologię, niepłodność. Takie podejście do medycyny ma na celu poprawę zdrowia reprodukcyjnego.
Sekwencjonowanie DNA, w szczególności komórek płciowych, umożliwiło zrozumienie modyfikacji genetycznych powodujących brak równowagi w płodności. Rozważane są przyszłe terapie genetyczne mające na celu zapobieganie chorobom dziedzicznym, na przykład trisomia 21 jest spowodowana brakiem ekspresji genu odpowiedzialnego za inaktywację chromosomu X podczas zapłodnienia. Pojawiają się jednak pytania bioetyczne dotyczące przetwarzania DNA w celu prokreacji.
Sekwencjonowanie o wysokiej przepustowości weszło również do dziedziny mikrobiologii medycznej. Na przykład w bakteriologii, nawet jeśli ten sam gatunek bakterii (np. Staphylococcus aureus ) można znaleźć w dwóch próbkach od różnych pacjentów, niekoniecznie jest to bezpośrednie przeniesienie z pacjenta na pacjenta. Rzeczywiście, w ramach tych samych gatunków bakterii zgrupowanych jest wiele bardzo różnych szczepów, a zatem mają różne genomy. Sekwencjonowanie całego genomu umożliwia, na przykład, określenie, jak różne są te genomy poprzez ilościowe określenie liczby mutacji ( SNP ) między organizmami. Podczas bezpośredniego przenoszenia bakterii z jednego pacjenta na drugiego liczba mutacji różnicowych jest zatem bardzo niska.
Ogólnie rzecz biorąc, wysokoprzepustowe sekwencjonowanie całych genomów bakteryjnych może być przydatne do:
DNA osoby może zostać przeniesione przez kontakt z przedmiotami lub ludźmi. To DNA pochodzi z komórek z różnych matryc, krwi, nasienia, elementów włosa, komórek nabłonka. (Sekwencjonowanie DNA może być stosowane z metodami profilowania DNA w celu identyfikacji sądowej i badania ojcostwa. Należy jednak zauważyć, że test na ojcostwo nie ma mocy prawnej we Francji. tylko wtedy, gdy został zlecony przez sędziego.