W genetyki , genetyczna kopiowanie jest mnożenie materiału genetycznego na chromosomie . Istnieje kilka mechanizmów, które wynikają z duplikacji dużej części chromosomalnej, genu lub sekwencji nukleotydów . Te zmiany w genomie stanowią ważny motor ewolucji genomów. Podwojenie genu tworzy dodatkową kopię uwolnioną od presji selekcyjnej , co może pozwolić na ponowne stopienie się kopii bez szkodliwych konsekwencji dla organizmu . Jest to jeden z ważnych mechanizmów ewolucji molekularnej .
Jednak w wielu przypadkach te zmiany są odpowiedzialne za choroby genetyczne z powodu nadmiaru danych genetycznych, co prowadzi do problemów podczas rozwoju. Ponadto amplifikacja genów może przyczynić się do wzrostu guza . Na przykład onkogen C-myc jest często amplifikowany w wielu guzach .
Podczas swojej ewolucji kilka gatunków eukariotycznych przeszło całkowitą duplikację swojego genomu. Mówimy wtedy o paleoploidyzmie . Na przykład w drożdżach piekarskich ( Saccharomyces cerevisiae ) jego genom został zduplikowany 100 milionów lat temu. Genom wielu roślin jest poliploidalny . Możemy przytoczyć pszenicę, która jest heksaploidalna (6 kopii jej genomu). Ostatnio, francusko-włoska współpraca umożliwiła sekwencjonowania genomu winorośli , Vitis vinifera, który ujawnił, że przodek dwuliściennych roślin przeszedł kilka wydarzeń powielania jego genomu po dywergencji jednoliściennych i dwuliściennych ; przodkowa roślina dwuliścienna musiała być heksaploidalna. Postawiona hipoteza byłaby taka, że ta duplikacja genomu jest przyczyną promieniowania roślin dwuliściennych.
Istnieją dwa mechanizmy umożliwiające całkowitą duplikację genomu:
Powielanie genomów jest rzadkie, ponieważ zmiana dawki genów w zarodku jest często śmiertelna . Z drugiej strony od 30 do 80% roślin to poliploidy, a eksplozja liczby gatunków roślin okrytozalążkowych koreluje z całkowitą duplikacją genomu rośliny przodków. Wyjaśnia to większa tolerancja na zmianę liczby chromosomów u roślin okrytonasiennych w porównaniu ze zwierzętami. Niedawne duplikacje genomu sprzed mniej niż 150 lat zostały zidentyfikowane w wielu roślinach, takich jak salsefia, gdzie gatunki Tragopogon mirus i Tragopogon miscellus pojawiły się około 80 lat temu przez alotetraploidy. Odkrycia te pomagają zrozumieć fenotypowe i genetyczne konsekwencje zmiany ploidii.
Gromadzi się wiele dowodów wskazujących, że podczas ewolucji kręgowców doszło do kilku całkowitych duplikacji genomu. Po eksplozji kambru, około 450 milionów lat temu, miała miejsce pierwsza duplikacja genomu przodka struny, a około 10 milionów lat później, na początku okresu dewonu , nastąpiła druga całkowita duplikacja genomu. Pod koniec dewonu doszło do trzeciej duplikacji genomu u ryb płetwiastych .
Założenie 2RPierwsze szacunki liczby genów u ludzi wykazały, że genom kręgowców jest bardziej złożony niż genom bezkręgowców. Aby wyjaśnić wzrost wielkości genomów kręgowców, Susumu Ohno zaproponował w 1970 r., Że genom kręgowca jest wynikiem jednej lub więcej całkowitych duplikacji genomu. Dziś ta hipoteza jest znana jako hipoteza 2R (2 rundy), ponieważ stwierdza, że 450 milionów lat temu przodek kręgowców przeszedł dwa zdarzenia duplikacji genomu. W latach 90-tych hipoteza ta była niezwykle kontrowersyjna, ponieważ ślady duplikacji genów znikały wraz z ewolucją. Jednak dzisiaj ta hipoteza zgromadziła wiele dowodów genetycznych i filogenetycznych. Jednym z pierwszych argumentów był brak połączenia między większością genów paralogicznych . Rzeczywiście, po segmentalnej duplikacji zduplikowane geny są obecne na tym samym chromosomie, a zatem są powiązane genetycznie. Z drugiej strony, po duplikacji genomu, zduplikowane geny znajdują się na różnych chromosomach. Wreszcie, główny argument przemawiający za hipotezą 2R pochodzi z badania kompleksów genów Hox, które są zgodne z zasadą 4: 1, tj. U bezkręgowców występuje jeden kompleks Hox, a u większości kręgowców cztery kompleksy Hox, co byłoby wynikiem dwóch genomów. wydarzenia związane z powielaniem.
Paralogon HoxKompleks Hox jest zbiorem homeotycznych genów zgrupowane razem na chromosomie kodujące czynniki transkrypcyjne niezbędne do utworzenia osi przód-tył, oraz odcinkowej tożsamości zwierząt. Cztery kompleksy Hox u ludzi znajdują się na chromosomach 2, 7, 12 i 17. Blisko każdego kompleksu znajduje się paralog gen należący do rodziny Dlx , Collagen i / lub ErbB . Zatem paralogon Hox odpowiada kompleksom Hox związanym z genami paralogu zlokalizowanymi w pobliżu kompleksu Hox. Obecność kilku paralogicznych genów w pobliżu kompleksów Hox jest głównym argumentem za hipotezą 2R. Jednak analizy filogenetyczne wykazały, że niektóre geny paralogiczne i geny Hox mają inną historię ewolucyjną, co zaprzecza hipotezie 2R. Niedawno badanie sugeruje, że dwie wzajemne translokacje w kompleksach Hox występujące po drugiej całkowitej duplikacji genomu wyjaśniłyby różnice w ewolucji w obrębie paralogonu Hox.
Założenie 3RW 1998 roku u danio pręgowanego Danio rerio zidentyfikowano siedem kompleksów Hox . Autorzy tego badania zaproponowali, że po dwóch duplikacjach genomu, które wystąpiły u jednego z przodków kręgowców, wystąpiło trzecie zdarzenie duplikacji genomu, szczególnie u ryb teleostajnych, które spowodowało osiem kompleksów Hox, a następnie utratę jednego kompleksu Hox.
Założenie 4RW 2005 roku kanadyjski zespół wykazał, że u łososia atlantyckiego i pstrąga tęczowego, które należą do rodziny łososiowatych , występowało czternaście kompleksów Hox, co sugeruje nową duplikację specyficznego genomu rodziny łososiowatych .
Duplikacja jest czasami opisywana jako częściowa trisomia . Istnieją 2 rodzaje powielania:
Możemy również wyróżnić duplikacje:
Wiele zespołów wynika z duplikacji segmentu chromosomu, na przykład zespół Beckwitha-Wiedemanna lub choroba Charcota-Marie-Tootha typu 1 . Chociaż często jest to szkodliwe dla organizmu, analiza genomów wielu gatunków, w szczególności genomu ludzkiego, ujawniła obecność wielu zduplikowanych regionów.
Sekwencjonowanie i analiza ludzkiego genomu ujawniły, że duże fragmenty chromosomów były podobne. Podczas ewolucji naczelnych 400 segmentów chromosomów przeszło liczne procesy duplikacji wewnątrz chromosomów (między identycznymi chromosomami) i między chromosomami (między różnymi chromosomami), z których niektóre, które stanowią 5% genomu, są specyficzne dla ludzkiego genomu. Te zduplikowane segmenty chromosomów są preferencyjnie zlokalizowane w pobliżu telomerów i centromerów. Ponadto te zduplikowane regiony są wrażliwe na przegrupowania chromosomów i są miejscem przerw w translokacji, delecji lub inwersji. Jednak, chociaż są szkodliwe, zduplikowane fragmenty chromosomów są proporcjonalnie bardziej aktywne transkrypcyjnie niż pojedyncze regiony genomów naczelnych. Ponadto te powtarzające się duplikacje stworzyły nowe rodziny genów, unikalne dla hominoidów.
Chromosom 158,8% chromosomu 15 odpowiada zduplikowanym segmentom chromosomów, z których 50% to duplikacje wewnątrz chromosomów. Na przykład w regionie 15q zidentyfikowano sekwencję „rdzeniową” o 2920 parach zasad. Powtarza się to 37 razy na chromosomie 15, dwukrotnie na chromosomie Y i raz na chromosomie 2 i 10. Analiza różnych sekwencji tej części chromosomu „serca” umożliwiła podsumowanie historii tej sekwencji. psów i myszy zawiera tylko jedną kopię tej sekwencji „serca” na chromosomie odpowiadającym ludzkiemu chromosomowi 2. Tak więc sekwencja ta została skopiowana przez retrotranspozycję na chromosomie 10, a następnie skopiowano większy fragment 15 kilozasad na chromosomie 15. Ten segment DNA o długości 15 Kb został następnie powielony kilka razy na chromosomie 15. Dwie kopie początkowej sekwencji „serca” na chromosom Y jest wynikiem kopiowania sekwencji 40 kb z chromosomu 15. Jak wspomniano wcześniej, zduplikowane regiony są wrażliwymi częściami chromosomu i są wrażliwe na przegrupowania chromosomów. Delecje chromosomów w zduplikowanym regionie 15q11-q13 są przyczyną zespołów Pradera-Williego i Angelmana .
Zespół Beckwitha-WiedemannaZespół Beckwitha-Wiedemanna charakteryzuje się dużymi rozmiarami, makroglossią i organomegalią i skutkuje dużą liczbą przypadków duplikacji ojcowskiego regionu końcowego chromosomu 11 . Ten region chromosomalny zawiera dwa geny niezbędne do regulacji wzrostu; geny IGF2 i H19 . IGF2 jest czynnikiem wzrostu stymulującym proliferację komórek, a H19 koduje niekodujące RNA. Ekspresja tych genów jest silnie regulowana przez złożony mechanizm wdrukowania przez rodziców . Na chromosomie matki gen „IGF2” ulega represji, a ekspresja H19 jest wyrażana, podczas gdy na chromosomie ojcowskim następuje ekspresja genu IGF2 i represja H19 . Zespół wynika z częściowej duplikacji końcowej części ojcowskiego chromosomu 11. Ta duplikacja zapewnia dodatkową kopię genu IGF2 na chromosomie 11, prowadząc do zwiększenia produkcji czynnika wzrostu IGF2.
Konkretny gen można powielić podczas ewolucji. Istnieją cztery główne mechanizmy umożliwiające duplikację genu lub kilku genów:
Duplikacje genów to niezwykle częste zdarzenia. Zatem liczba powtórzeń tego samego genu może się różnić u osobników tego samego gatunku, tworząc w ten sposób polimorfizm liczby powtórzeń . Wzrost liczby genów jest jednak równoważony przez utratę genów, która jest również dość silna, głównie przez dryf genetyczny, ale także przez selekcję przeciwstawną wzrostu stężenia białka generowanego przez wzrost liczby genów kodujących. białko.
Istnieje pięć scenariuszy ewolucyjnych następujących po duplikacji genów:
Podczas ewolucji genomów geny mogą się łączyć lub pękać. Jedną z konsekwencji subfunkcjonalizacji zduplikowanego genu może być rozszczepienie genu na dwa różne geny. Rzeczywiście, w przypadku, gdy oryginalny gen koduje białko z dwiema odrębnymi domenami funkcjonalnymi oznaczonymi I i II, jeden ze zduplikowanych genów gromadzi mutacje (degenerację) w regionie odpowiadającym domenie II, podczas gdy drugi gen gromadzi mutacje w regionie odpowiadającym domena I. Daje to gen 1 kodujący białko z domeną I i drugi gen kodujący białko z domeną II. Ten mechanizm rozszczepienia genów został zademonstrowany u Drosophila podczas badania genu Monkey-king.
Izolacja reprodukcyjna jest procesem niezbędnym do specjacji, ponieważ umożliwia zainicjowanie dywergencji i utrzymanie odrębnych gatunków. Jeśli dwa blisko spokrewnione gatunki są przystosowane do różnych środowisk, ich hybrydy będą gorzej przystosowane do tych środowisk: mówimy o słabości hybryd . Zjawisko to można wyjaśnić modelem niezgodności genów Dobzhansky-Muller opracowanym przez Theodosiusa Dobzhansky'ego w 1936 r. I Hermana Josepha Müllera w 1942 r. Ponowne odkrycie prac Williama Batesona skłoniło niektórych autorów do mówienia o modelu Batesona-Dobzhansky'ego-Mullera. Model proponuje, że negatywne interakcje epistatyczne między dwoma loci prowadzą do osłabienia hybryd. W 2000 roku Michael Lynch i Allan G. Force zaadaptowali model niezgodności genów do duplikacji genów. Zaproponowali, że po duplikacji genów, wzajemna utrata genów jest czynnikiem prowadzącym do izolacji reprodukcyjnej. Tak więc model ten wyjaśniałby korelację między zdarzeniami całkowitej duplikacji genomu a ewolucyjnym promieniowaniem pewnych typów. Na przykład wykazano, że u przodka drożdży piekarskich, które przeszły całkowitą duplikację genomu, szybka utrata zduplikowanych genów sprzyjała pojawieniu się wielu gatunków drożdży poprzez mechanizm niezgodności genów.
Że miRNA są RNA jednoniciowy z 21-23 nukleotydów długości, które regulują post-transkrypcyjną ekspresję genów. W roślinie Arabidopsis thaliana istnieje klasa mikroRNA, które wykazują silną homologię sekwencji ze swoimi genami docelowymi i które pojawiły się niedawno podczas ewolucji. Te mikroRNA są wynikiem odwrotnych duplikacji genów.
Duplikacja tandemowa eksonów odpowiada wewnętrznej duplikacji egzonu w ramach tego samego genu. Ten rodzaj duplikacji jest ważnym źródłem innowacji, ponieważ umożliwia generowanie nowych fs w ramach tego samego białka. Kompleksowa analiza genomów Homo sapiens , Drosophila melanogaster i robaka Caenorhabditis elegans wykazała 12291 przypadków duplikacji eksonów tandemowych. Analiza regionów intronowych ujawniła również 4660 niescharakteryzowanych zduplikowanych egzonów. Spośród tych potencjalnych egzonów 35,1% znajduje się w bazach danych EST, co potwierdza ich potencjalną rolę.
Replikacja tych par zasad jest przyczyną wielu chorób genetycznych, takich jak zespół łamliwego chromosomu X lub pląsawica Huntingtona . W bakterii Streptococcus pneumoniae za oporność na makrolid odpowiada duplikacja 18 par zasad w genie rplV, który koduje rybosomalne białko L22 . Ta duplikacja generuje duplikację 6 aminokwasów w pobliżu miejsca interakcji makrolidu na podjednostce 23S rybosomu, blokując w ten sposób interakcję antybiotyku z rybosomem.
Analiza genomów prokariotycznych ujawniła liczne geny paralogiczne . W zależności od gatunku bakterii udział genów paralogicznych waha się od 7% genomu Rickettsia conorii do 41% u Streptomyces coelicolor . Spośród 106 genomów bakterii zsekwencjonowanych w 2004 r. Średnio 25% genomu bakterii składa się z genów paralogicznych. Istnieje również bardzo silna korelacja między wielkością genomu bakterii a odsetkiem zduplikowanych genów.
Istnieją trzy mechanizmy duplikacji genów u prokariotów:
U Escherichia coli K12 16% genów homologicznych jest ksenologicznych, co sugeruje, że poziomy transfer genów ma niewielki wpływ na odsetek genów paralogicznych. Średnio 15% paralogicznych genów jest zorganizowanych w tandemie, co sugeruje zdarzenie tandemowej duplikacji genów, które może skutkować duplikacją operonu .
U prokariotów nie wykazano całkowitej duplikacji genomu u przodków. Jednak niektóre bakterie są poliploidalne na etapie rozwoju, na przykład Buchnera aphidicola, których liczba kopii genomu zmienia się w zależności od etapu rozwoju żywiciela, zielonej mszycy leśnej .
Większość genomów eukariotycznych zawiera dużą liczbę funkcjonalnych zduplikowanych genów, z których znaczna większość pojawiłaby się 10 do 100 milionów lat temu. Po masowych zdarzeniach duplikacji około 20 do 50% zduplikowanych genów zostaje zachowanych. Ta konserwacja sugeruje istnienie mechanizmu doboru naturalnego, który kompensowałby produkcję pseudogenów . Po duplikacji może nastąpić rozdzielenie funkcji przodków między dwiema kopiami, na przykład w różnych tkankach (zjawisko znane jako niepełna funkcjonalizacja ); pojawienie się nowej funkcji dla jednej z kopii (zjawisko znane jako neofunkcjonalizacja ); każda kopia może doświadczyć utraty lub zmniejszenia ekspresji swoich funkcji przez mutacje zwyrodnieniowe.
Na ewolucję genomu bakterii duży wpływ ma wymiana genów między różnymi gatunkami bakterii. Rzeczywiście, ewolucja szlaków metabolicznych u E. coli wynika głównie z poziomej wymiany genów, jednak wydaje się, że duplikacja genów również przyczynia się do ewolucji bakterii. Preferencyjnie zduplikowane geny biorą udział w metabolizmie aminokwasów , jonów nieorganicznych i regulacji transkrypcji . W przypadku niektórych gatunków ekspansja genów klasy genów została zaproponowana jako ewolucyjna adaptacja. Na przykład złożoność ściany bakteryjnej mykobakterii można wyjaśnić specyficzną duplikacją genów biorących udział w metabolizmie i transporcie lipidów tego rodzaju bakteryjnego .
Bakterie mogą przystosować się do toksyczności antybiotyku dzięki dużej liczbie mechanizmów wynikających z mutacji punktowych lub z poziomego transferu genów . Główne mechanizmy oporności to:
Adaptacja bakterii do antybiotyku odbywa się w dwóch etapach:
Amplifikacje genów są niestabilne i mogą zostać utracone przy braku presji selekcyjnej na drodze rekombinacji homologicznej. Zatem zduplikowane geny mogą być utrzymywane w szczepach bakteryjnych, w których występuje niedobór białka Rec A. Istnieją jednak mechanizmy utraty zduplikowanych genów niezależne od Rec A, które nie są dobrze poznane.
Amplifikacja genu na plazmidzieNa początku lat 70. XX wieku odkrycie plazmidów R niosących geny oporności na antybiotyki pozwoliło po raz pierwszy zademonstrować rolę duplikacji genów w zjawisku oporności na antybiotyki. Plazmid NR1 powiększa się w Proteus mirabilis w obecności niskiego stężenia chloramfenikolu , streptomycyny i sulfonamidu . Wzmocniony obszar plazmid nazwano determinantą-R (r dla oporności) i jest otoczony przez bezpośrednie powtórzenia IS1 ( wstawienia sekwencji 1 ) sekwencje , które umożliwiają amplifikację regionów dzięki homologii sekwencji między sekwencjami IS1 wyniku homologicznej rekombinacji. Pomiędzy siostrą chromatydy . W wielu bakteriach oporność związana z amplifikacją genów na plazmidzie jest często związana z obecnością sekwencji IS. Jednak istnieje kilka przypadków, w których niedoskonałe regiony homologiczne mogą pozwolić na amplifikację genów oporności, takich jak amplifikacja genu tetL na plazmidzie pAMα1, który nadaje oporność na tetracyklinę w Enterococcus faecalis .
Amplifikacja genów na chromosomie bakteryjnymAmplifikacja genów chromosomalnych jest podobna do tej obserwowanej na plazmidach bakteryjnych. Na przykład amplifikację β-laktamazy obserwowano u Escherichia coli i Yersinia enterocolitica nadając oporność na β-laktam przez mechanizmy zależne i niezależne od białka Rec A. Istnieją jednak specyficzne przykłady, w których tylko kilka par zasad jest zduplikowanych. U Staphylococcus aureus i Yersinia enterocolitica duplikacja miejsca wejścia rybosomu genu oporności na makrolid zwanego ermA (dla metylazy oporności na erytromycynę A) prowadzi do stymulacji translacji ermA. Wreszcie, w bakterii Streptococcus pneumoniae za oporność na makrolidy odpowiada duplikacja 18 par zasad w genie rplV, który koduje rybosomalne białko L22 . Ta duplikacja generuje duplikację 6 aminokwasów w pobliżu miejsca interakcji makrolidu na podjednostce 23S rybosomu, blokując w ten sposób interakcję antybiotyku z rybosomem. Większość amplifikacji genów nadających oporność na antybiotyki została zaindukowana w laboratoriach badawczych. W badaniach klinicznych identyfikacja amplifikacji genów jest dość rzadka, prawdopodobnie z powodu niestabilności amplifikacji genów. Podczas badań przesiewowych szczepów Streptococcus agalactiae wyizolowano dwa szczepy oporne na sulfonamidy i trimetoprim z amplifikacją zawierającą operon folCEPBK zaangażowany w syntezę witaminy B9 .