Acide désoxyribonucléique

Page d'aide sur les redirections « ADN » redirige ici. Pour les autres significations, voir ADN (homonymie).
L' ADN nucléaire d'une cellule d' eucaryote est situé dans des chromosomes au sein du noyau.
Structure de la double hélice d'ADN.
Appariement de l' adénine (A) avec la thymine (T, en haut) et de la guanine (G) avec la cytosine (C, en bas). Les liaisons hydrogène sont représentées en pointillés bleus.
Structure chimique de l'ADN illustrant les quatre configurations des paires A T et G C entre les deux armatures de la double hélice, constituées d'une alternance de phosphate et de désoxyribose.

L'acide désoxyribonucléique, ou ADN, est une macromolécule biologique présente dans toutes les cellules ainsi que chez de nombreux virus. L'ADN contient toute l'information génétique, appelée génome, permettant le développement, le fonctionnement et la reproduction des êtres vivants. C'est un acide nucléique, au même titre que l' acide ribonucléique (ARN). Les acides nucléiques sont, avec les peptides et les glucides, l'une des trois grandes familles de biopolymères essentiels à toutes les formes de vie connues.

Les molécules d'ADN des cellules vivantes sont formées de deux brins antiparallèles enroulés l'un autour de l'autre pour former une double hélice. On dit que l'ADN est bicaténaire, ou double brin. Chacun de ces brins est un polymère appelé polynucléotide. Chaque monomère qui le constitue est un nucléotide, lequel est formé d'une base nucléique, ou base azotée — adénine (A), cytosine (C), guanine (G) ou thymine (T) — liée à un ose — ici, le désoxyribose — lui-même lié à un groupe phosphate. Les nucléotides polymérisés sont unis les uns aux autres par des liaisons covalentes entre le désoxyribose d'un nucléotide et le groupe phosphate du nucléotide suivant, formant ainsi une chaîne où alternent oses et phosphates, avec des bases nucléiques liées chacune à un ose. L'ordre dans lequel se succèdent les nucléotides le long d'un brin d'ADN constitue la séquence de ce brin. C'est cette séquence qui porte l'information génétique. Celle-ci est structurée en gènes, qui sont exprimés à travers la transcription en ARN. Ces ARN peuvent être non codantsARN de transfert et ARN ribosomique notamment — ou bien codants : il s'agit dans ce cas d' ARN messagers, qui sont traduits en protéines par des ribosomes. La succession des bases nucléiques sur l'ADN détermine la succession des acides aminés qui constituent les protéines issues de ces gènes. La correspondance entre bases nucléiques et acides aminés est le code génétique. L'ensemble des gènes d'un organisme constitue son génome.

Les bases nucléiques d'un brin d'ADN peuvent interagir avec les bases nucléiques d'un autre brin d'ADN à travers des liaisons hydrogène, qui déterminent des règles d'appariement entre paires de bases : l' adénine et la thymine s'apparient au moyen de deux liaisons hydrogène, tandis que la guanine et la cytosine s'apparient au moyen de trois liaisons hydrogène. Normalement, l'adénine et la cytosine ne s'apparient pas, tout comme la guanine et la thymine. Lorsque les séquences des deux brins sont complémentaires, ces brins peuvent s'apparier en formant une structure bicaténaire hélicoïdale caractéristique qu'on appelle double hélice d'ADN. Cette double hélice est bien adaptée au stockage de l'information génétique : la chaîne oses-phosphates est résistante aux réactions de clivage ; de plus, l'information est dupliquée sur les deux brins de la double hélice, ce qui permet de réparer un brin endommagé à partir de l'autre brin resté intact ; enfin, cette information peut être copiée à travers un mécanisme appelé réplication de l'ADN au cours duquel une double hélice d'ADN est recopiée fidèlement en une autre double hélice portant la même information. C'est en particulier ce qu'il se passe lors de la division cellulaire : chaque molécule d'ADN de la cellule mère est répliquée en deux molécules d'ADN, chacune des deux cellules filles recevant ainsi un jeu complet de molécules d'ADN, chaque jeu étant identique à l'autre.

Dans les cellules, l'ADN est organisé en structures appelées chromosomes. Ces chromosomes ont pour fonction de rendre l'ADN plus compact à l'aide de protéines, notamment d' histones, qui forment, avec les acides nucléiques, une substance appelée chromatine. Les chromosomes participent également à la régulation de l' expression génétique en déterminant quelles parties de l'ADN doivent être transcrites en ARN. Chez les eucaryotes ( animaux, plantes, champignons et protistes), l'ADN est essentiellement contenu dans le noyau des cellules, avec une fraction d'ADN présent également dans les mitochondries ainsi que, chez les plantes, dans les chloroplastes. Chez les procaryotes ( bactéries et archées), l'ADN est contenu dans le cytoplasme. Chez les virus qui contiennent de l'ADN, celui-ci est stocké dans la capside. Quel que soit l'organisme considéré, l'ADN est transmis au cours de la reproduction : il joue le rôle de support de l' hérédité. La modification de la séquence des bases d'un gène peut conduire à une mutation génétique, laquelle peut, selon les cas, être sans conséquence pour l'organisme ou, au contraire, être incompatible avec sa survie. À titre d'exemple, la modification d'une seule base d'un seul gène — celui de la β-globine, une sous-unité protéique de l' hémoglobine A — du génotype humain est responsable de la drépanocytose, une maladie génétique parmi les plus répandues dans le monde.

Propriétés générales

(en) Géométrie de la double hélice d' ADN B montrant le petit et le grand sillon ainsi que le détail des deux types de paires de bases : thymineadénine en haut et cytosineguanine en bas.
Segment d'ADN monocaténaire de séquence C G A T.

L'ADN est un long polymère formé par la répétition de monomères appelés nucléotides. Le premier ADN a été identifié et isolé en 1869 à partir du noyau de globules blancs par le Suisse Friedrich Miescher. Sa structure en double hélice a été mise en évidence en 1953 par le Britannique Francis Crick et l'Américain James Watson [1] à partir des données expérimentales obtenues par les Britanniques Rosalind Franklin et Maurice Wilkins. Cette structure, commune à toutes les espèces, est constituée de deux chaînes polynucléotidiques hélicoïdales enroulées l'une autour de l'autre autour d'un axe commun, avec un pas d'environ 3,4 nm pour un diamètre d'environ 2,0 nm [1]. Une autre étude mesurant les paramètres géométriques de l'ADN en solution donne un diamètre de 2,2 à 2,6 nm avec une longueur par nucléotide de 0,33 nm [2]. Bien que chaque nucléotide soit très petit, les molécules d'ADN peuvent en contenir des millions et atteindre des dimensions significatives. Par exemple, le chromosome 1 humain, qui est le plus grand des chromosomes humains, contient environ 220 millions de paires de bases [3] pour une longueur linéaire de plus de 7 cm.

Dans les cellules vivantes, l'ADN n'existe généralement pas sous forme monocaténaire (simple brin) mais plutôt sous forme bicaténaire (double brin) avec une configuration en double hélice [1]. Les monomères constituant chaque brin d'ADN comprennent un segment de la chaîne désoxyribosephosphate et une base nucléique liée au désoxyribose. La molécule résultant de la liaison d'une base nucléique à un ose est appelée nucléoside ; l'adjonction d'un à trois groupes phosphate à l'ose d'un nucléoside forme un nucléotide. Un polymère résultant de la polymérisation de nucléotides est appelé polynucléotide. L'ADN et l' ARN sont des polynucléotides.

L' ose constituant le squelette de la molécule est le 2’-désoxyribose, dérivé du ribose. Ce pentose alterne avec des groupes phosphate en formant des liaisons phosphodiester entre les atomes no 3’ et no 5’ de résidus de désoxyribose adjacents [4]. En raison de cette liaison asymétrique, les brins d'ADN ont un sens. Dans une double hélice, les deux brins d'ADN sont de sens opposés : ils sont dits antiparallèles. Le sens 5’ vers 3’ d'un brin d'ADN désigne conventionnellement celui de l'extrémité portant un groupe phosphate –PO32− vers l'extrémité portant un groupe hydroxyle –OH ; c'est dans ce sens qu'est synthétisé l'ADN par les ADN polymérases. L'une des grandes différences entre l'ADN et l' ARN est le fait que l' ose du squelette de la molécule est le ribose dans le cas de l'ARN à la place du désoxyribose de l'ADN, ce qui joue sur la stabilité et la géométrie de cette macromolécule.

La double hélice d'ADN est stabilisée essentiellement par deux forces : les liaisons hydrogène entre nucléotides d'une part, et les interactions d'empilement des cycles aromatiques des bases nucléiques d'autre part [5]. Dans l'environnement aqueux de la cellule, les liaisons π conjuguées de ces bases s'alignent perpendiculairement à l'axe de la molécule d'ADN afin de minimiser leurs interactions avec la couche de solvatation et, par conséquent, leur enthalpie libre. Les quatre bases nucléiques constitutives de l'ADN sont l' adénine (A), la cytosine (C), la guanine (G) et la thymine (T), formant respectivement les quatre nucléotides suivants, composant l'ADN :

Classification et appariement des bases nucléiques

Les quatre bases nucléiques de l'ADN sont de deux types : d'une part les purinesadénine et guanine — qui sont des composés bicycliques comprenant deux hétérocycles à cinq et six atomes respectivement, d'autre part les pyrimidinescytosine et thymine — qui sont des composés monocycliques comprenant un hétérocycle à six atomes. Les paires de bases de la double hélice d'ADN sont constituées d'une purine interagissant avec une pyrimidine à travers deux ou trois liaisons hydrogène :

  • une adénine interagissant avec une thymine à travers deux liaisons hydrogène ;
  • une guanine interagissant avec une cytosine à travers trois liaisons hydrogène.

En raison de cette complémentarité, toute l'information génétique portée par l'un des brins de la double hélice d'ADN est également portée à l'identique sur l'autre brin. C'est sur ce principe que repose le mécanisme de la réplication de l'ADN, et c'est sur cette complémentarité entre bases nucléiques que reposent toutes les fonctions biologiques de l'ADN dans les cellules vivantes.

L'ADN de certains virus, tels que les bactériophages PBS1 et PBS2 de Bacillus subtilis, le bactériophage φR1-37 de Yersinia [6] et le phage S6 de Staphylococcus [7], peut remplacer la thymine par l' uracile, une pyrimidine habituellement caractéristique de l' ARN mais normalement absente de l'ADN, où on ne le trouve que comme produit de dégradation de la cytosine.

Appariements non canoniques entre bases nucléiques

Les bases nucléiques s'apparient le plus souvent en formant les paires de bases dites « Watson-Crick » correspondant à deux ou trois liaisons hydrogène établies entre deux bases orientées anti sur les résidus de désoxyribose. Des liaisons hydrogène peuvent cependant également s'établir entre une purine orientée syn et une pyrimidine orientée anti : il s'agit dans ce cas d'un appariement Hoogsteen. Une paire de bases Watson-Crick est susceptible d'établir en plus des liaisons hydrogène de type Hoogsteen avec une troisième base, ce qui permet la formation de structures à trois brins d'ADN.

Sens, antisens et ambisens

(en) Brins d'ADN sens et antisens ; l' ARN transcrit est en vert.
Article détaillé : polarité (acide nucléique).

Seul l'un des brins d'un segment d'ADN constituant un gène est transcrit en ARN fonctionnel, de sorte que les deux brins d'un gène ne sont pas équivalents : celui qui est transcrit en ARN fonctionnel est dit à polarité négative et porte une séquence antisens, tandis que le brin complémentaire — qui peut également être transcrit en ARN, mais non fonctionnel — est dit à polarité positive et porte une séquence d'ADN sens. Le brin transcrit en ARN fonctionnel est parfois appelé brin codant, mais cette désignation n'est valable qu'au sein d'un gène donné car les deux brins d'une même double hélice d'ADN peuvent coder différentes protéines ; on parle alors de brins ambisens [8], [9], [10]. Des ARN sont également transcrits à partir des séquences d'ADN sens — avec par conséquent des séquences d'ARN antisens — aussi bien chez les procaryotes que chez les eucaryotes, mais leur rôle biologique n'est pas entièrement élucidé [11] ; l'une des hypothèses est que ces ARN antisens pourraient intervenir dans la régulation de l' expression génétique à travers l' appariement entre séquences d'ARN sens et antisens, qui sont, par définition, complémentaires [12].

La distinction entre brins d'ADN sens et antisens est brouillée dans certains types de gènes chevauchants, assez rares chez les procaryotes et les eucaryotes mais plus fréquents sur les plasmides et chez les virus, dans lesquels les deux brins d'un même segment d'ADN encodent chacun un ARN fonctionnel différent [13]. Chez les bactéries, ce chevauchement peut jouer un rôle dans la régulation de la transcription des gènes [14] tandis que, chez les virus, les gènes chevauchants accroissent la quantité d'information génétique susceptible d'être encodée dans la petite taille du génome viral [15].

Supertours et surenroulement

Article détaillé : surenroulement de l'ADN.

L'ADN relâché peut être linéaire, comme c'est typiquement le cas chez les eucaryotes, ou circulaire, comme chez les procaryotes. Il peut cependant être entortillé de façon parfois complexe sous l'effet de l'introduction de tours d'hélice supplémentaires ou de la suppression de tours dans la double hélice. La double hélice d'ADN ainsi surenroulée sous l'effet de supertours positifs ou négatifs présente un pas respectivement raccourci ou allongé par rapport à son état relâché : dans le premier cas, les bases nucléiques sont arrangées de façon plus compacte ; dans le second cas, elles interagissent au contraire de façon moins étroite [16]. In vivo, l'ADN présente généralement un surenroulement légèrement négatif sous l'effet d' enzymes appelées ADN topoisomérases [17], qui sont également indispensables pour relâcher les contraintes introduites dans l'ADN lors des processus qui impliquent que la double hélice soit déroulée pour en séparer les deux brins, comme c'est notamment le cas lors de la réplication de l'ADN et lors de sa transcription en ARN [18].

Propriétés physicochimiques de la double hélice

Les liaisons hydrogène n'étant pas des liaisons covalentes, elles peuvent être rompues assez facilement. Il est ainsi possible de séparer les deux brins de la double hélice d'ADN à la façon d'une fermeture à glissière aussi bien mécaniquement que sous l'effet d'une température élevée [19], ainsi qu'à faible salinité, à pH élevé — solution basique — et à pH faible — solution acide, qui altère cependant l'ADN notamment par dépurination. Cette séparation des brins d'un ADN bicaténaire pour former deux molécules d'ADN monocaténaires est appelé fusion ou dénaturation de l'ADN. La température à laquelle 50 % de l'ADN bicaténaire est dissocié en deux molécules d'ADN monocaténaire est dite température de fusion ou température de semi-dénaturation de l'ADN, notée Tm. On peut la mesurer en suivant l' absorption optique à 260 nm de la solution contenant l'ADN : cette absorption augmente au cours du désappariement, ce qu'on appelle hyperchromicité. Les molécules d'ADN monocaténaire libérées n'ont pas de configuration particulière, mais certaines structures tridimensionnelles sont plus stables que d'autres [20].

La stabilité d'une double hélice d'ADN dépend essentiellement du nombre de liaisons hydrogène à briser pour en séparer les deux brins. Par conséquent, plus la double hélice est longue, plus elle est stable. Cependant, les paires G C étant unies par trois liaisons hydrogène au lieu de deux pour les paires A T, la stabilité de molécules d'ADN bicaténaires de même longueur croît avec le nombre de paires G C qu'elles contiennent [21], mesuré par leur taux de GC. Cet effet est renforcé par le fait que les interactions d'empilement entre bases nucléiques d'un même brin d'ADN sont plus fortes entre résidus de guanine et de cytosine, de sorte que la séquence de l'ADN influence également sur sa stabilité. La température de fusion de l'ADN dépend par conséquent de la longueur des molécules, de leur taux de GC, de leur séquence, de leur concentration dans le solvant et de la force ionique dans celui-ci. En biologie moléculaire, on observe que les segments d'ADN bicaténaire dont la fonction implique que les deux brins de la double hélice puissent s'écarter facilement possèdent un taux élevé de paires A T [22] : c'est le cas de la séquence TATAAT typique de la boîte de Pribnow de certains promoteurs.

Géométrie de la double hélice

Vue tridimensionnelle d'une molécule d' ADN B faisant apparaître le grand et le petit sillon.
Double hélice droite (a) et gauche (b).
Configuration d'une paire de bases guaninecytosine dans les formes A, B et Z de l'ADN.

Les deux brins de l'ADN forment une double hélice dont le squelette détermine deux sillons. Ces sillons sont adjacents aux paires de bases et sont susceptibles de fournir un site de liaison pour diverses molécules. Les brins d'ADN n'étant pas positionnés de façon symétrique par rapport à l'axe de la double hélice, ils définissent deux sillons de taille inégale : le grand sillon est large de 2,2 nm tandis que le petit sillon est large de 1,2 nm [23]. Les bords des bases nucléiques sont plus accessibles dans le grand sillon que dans le petit sillon. Ainsi, les protéines, telles que les facteurs de transcription, qui se lient à des séquences spécifiques dans l'ADN bicaténaire le font généralement au niveau du grand sillon [24].

Il existe de nombreux conformères possibles de la double hélice d'ADN. Les formes classiques sont appelées ADN A, ADN B et ADN Z, dont seules les deux dernières ont été observées directement in vivo [4]. La conformation adoptée par l'ADN bicaténaire dépend de son degré d' hydratation, de sa séquence, de son taux de surenroulement, des modifications chimiques des bases qui le composent, de la nature et de la concentration des ions métalliques en solution, voire de la présence de polyamines [25].

  • L' ADN B est la forme la plus courante de la double hélice dans les conditions physiologiques des cellules vivantes [26]. Il ne s'agit cependant pas d'une conformation définie par des paramètres géométriques stricts mais plutôt d'un ensemble de conformations apparentées survenant aux niveaux d'hydratation élevés observés dans les cellules vivantes. Leur étude par cristallographie aux rayons X révèle des diagrammes de diffraction et de diffusion caractéristiques de paracristaux  (en) moléculaires très désordonnés [27]. La forme B est une hélice droite avec des paires de bases perpendiculaires à l'axe de l'hélice passant au centre de l'appariement de ces dernières. Un tour d'hélice a une longueur d'environ 3,4 nm et contient en moyenne 10,4 à 10,5 paires de bases, soit environ 21 nucléotides, pour un diamètre de l'ordre de 2,0 nm. Les bases sont orientées en position anti sur les résidus de désoxyribose, lesquels présentent un plissement endocyclique C2’- endo du cycle furanose. Les deux sillons de cette configuration ont une largeur typique de 2,2 nm pour le grand et de 1,2 nm pour le petit [23].
  • L' ADN A s'observe dans les échantillons d'ADN plus faiblement hydraté, à force ionique plus élevée, en présence d' éthanol ainsi qu'avec les hybrides bicaténaires d'ADN et d' ARN. Il s'agit d'une double hélice droite dont l'axe ne passe plus par les paires de bases. Cette double hélice est plus large, avec un diamètre de l'ordre de 2,3 nm mais un pas de seulement 2,8 nm pour 11 paires de bases par tour d'hélice. Les bases elles-mêmes demeurent orientées en position anti sur les résidus de désoxyribose, mais ces derniers présentent un plissement endocyclique C3’- endo.
  • L' ADN Z est plus contraint que les formes A et B de l'ADN et s'observe préférentiellement dans les régions riches en paires guaninecytosine lors de la transcription de l'ADN en ARN. Il s'agit d'une double hélice gauche, dont l'axe s'écarte significativement des paires de bases. Cette double hélice est plus étroite, avec un diamètre d'environ 1,8 nm et un pas d'environ 4,5 nm pour 12 paires de bases par tour d'hélice. Les pyrimidines sont orientées en position anti sur les résidus de désoxyribose, dont le cycle furanose possède en leur présence un plissement C2’- endo, tandis que les purines sont orientées en position syn sur des résidus de désoxyribose qui possède en leur présence un plissement endocyclique C2’- exo. La forme Z de l'ADN serait notamment provoquée in vivo par une enzyme appelée ADAR1 [28], [29], [30].
De gauche à droite : ADN A, ADN B et ADN Z.
Paramètres structurels indicatifs des trois principales formes d'ADN bicaténaire [31], [32], [33]
Paramètre ADN A ADN B ADN Z
Sens de l'hélice droite droite gauche
Motif répété 1 bp 1 bp 2 bp
Rotation par paire de bases 32,7° 34,3° 60°/2
Paire de bases par tour d'hélice 11 10,5 12
Pas de l'hélice par tour 2,82 nm 3,32 nm 4,56 nm
Allongement de l'axe par paire de bases 0,24 nm 0,32 nm 0,38 nm
Diamètre 2,3 nm 2,0 nm 1,8 nm
Inclinaison des paires de bases sur l'axe de l'hélice +19° −1,2° −9°
Torsion moyenne (propeller twist) +18° +16°
Orientation des substituants des bases
sur les résidus osidiques
anti anti Pyrimidine : anti,
Purine : syn
Plissement / torsion endocyclique du furanose
(Sugar pucker)
C3’- endo C2’- endo Cytosine : C2’- endo,
Guanine : C2’- exo

Géométries particulières et configurations remarquables

  • ADN en épingle à cheveux — Les séquences d'ADN palindromiques peuvent se replier en formant des structures dites tige-boucle ou en épingle à cheveux [35]. Certaines répétitions, particulièrement les répétitions de trinucléotides (CAG)n ou (CTG)n peuvent former des épingles à cheveux imparfaites dans lesquelles les résidus de cytosine et de guanine sont appariés tandis que les résidus d' adénine ou de thymine ne le sont pas [36].
  • ADN ramifié — L'ADN s'effile à une extrémité de la double hélice lorsque les séquences de ses deux brins cessent d'y être complémentaires : les deux brins s'écartent l'un de l'autre et la molécule adopte une configuration en Y. L'ADN peut alors se ramifier si un troisième brin possède une séquence susceptible de s'apparier avec les deux extrémités libres des deux brins effilés. Il se forme alors une structure en Y intégralement bicaténaire. Il est possible d'envisager des ramifications plus complexes avec de multiples branches [42].
Dans d'autres langues
Afrikaans: DNS
አማርኛ: ዲ ኤን ኤ
مصرى: حمض نووى
অসমীয়া: ডি এন এ
башҡортса: ДНК
žemaitėška: DNR
беларуская (тарашкевіца)‎: Дэзоксырыбануклійная кісьля
Bahasa Banjar: Asam deoksiribonukleat
বাংলা: ডিএনএ
Mìng-dĕ̤ng-ngṳ̄: DNA
کوردی: دی ئێن ئەی
čeština: DNA
Cymraeg: DNA
dansk: DNA
Ελληνικά: DNA
English: DNA
Esperanto: DNA
eesti: DNA
فارسی: دی‌ان‌ای
suomi: DNA
føroyskt: DNA
Nordfriisk: DNA
furlan: DNA
客家語/Hak-kâ-ngî: DNA
עברית: DNA
Fiji Hindi: DNA
Kreyòl ayisyen: ADN
Հայերեն: ԴՆԹ
Bahasa Indonesia: Asam deoksiribonukleat
íslenska: DNA
italiano: DNA
Basa Jawa: DNA
қазақша: ДНҚ
ಕನ್ನಡ: ಡಿ.ಎನ್.ಎ
한국어: DNA
Limburgs: DNA
lumbaart: DNA
македонски: ДНК
മലയാളം: ഡി.എൻ.എ.
монгол: ДНХ
Bahasa Melayu: Asid deoksiribonukleik
မြန်မာဘာသာ: ဒီအန်အေ
नेपाली: डी एन ए
नेपाल भाषा: डी एन ए
norsk nynorsk: DNA
norsk: DNA
Novial: DNA
Oromoo: DNA
ਪੰਜਾਬੀ: ਡੀ.ਐੱਨ.ਏ.
Kapampangan: DNA
Papiamentu: ADN
Deitsch: DNA
Piemontèis: DNA
پنجابی: ڈی این اے
română: ADN
русиньскый: ДНА
sicilianu: DNA
Scots: DNA
srpskohrvatski / српскохрватски: DNK
සිංහල: ඩී.එන්.ඒ.
Simple English: DNA
Soomaaliga: DNA
shqip: ADN
Basa Sunda: DNA
svenska: DNA
Kiswahili: DNA
தமிழ்: டி. என். ஏ.
Tagalog: DNA
Türkçe: DNA
oʻzbekcha/ўзбекча: Dezoksiribonuklein kislota
Tiếng Việt: DNA
West-Vlams: DNA
Winaray: DNA
ייִדיש: DNA
Yorùbá: DNA
文言: 脫氧核酸
Bân-lâm-gú: DNA