Séquence (acide nucléique)

(en) Séquence d'un ARN messager faisant apparaître ses codons.

La séquence d'un acide nucléiqueADN ou ARN — est la succession des nucléotides qui le constituent. Cette succession contient l'information génétique portée par ces polynucléotides, de sorte qu'on la qualifie également de séquence génétique. Elle peut être déterminée par des méthodes de séquençage de l'ADN.

Les séquences nucléotidiques sont conventionnellement écrites dans le 5’ → 3’, qui est celui dans lequel sont lues et synthétisées ces biomolécules. Les nucléotides sont représentés conventionnellement par des lettres symbolisant la base nucléique qui les caractérise ; l'IUPAC a défini une nomenclature précise pour écrire les séquences d'acides nucléiques selon l'information que l'on souhaite représenter :

Symbole[1]DescriptionBases représentées
AadénineA1
CcytosineC
GguanineG
TthymineT
UuracileU
WweakAT2
SstrongCG
MaminoAC
KketoGT
RpurineAG
YpyrimidineCT
Bpas A (B vient après A)CGT3
Dpas C (D vient après C)AGT
Hpas G (H vient après G)ACT
Vpas T (V vient après T et U)ACG
N ou -any baseACGT4

Dans la mesure où les acides nucléiques sont des molécules le plus souvent linéaires, leur séquence nucléotidique définit entièrement les liaisons chimiques qui les constituent, de sorte que leur séquence nucléotidique se confond avec leur structure primaire.

Notes et références

  1. (en) Nomenclature Committee of the International Union of Biochemistry (NC-IUB), « Nomenclature for Incompletely Specified Bases in Nucleic Acid Sequences », sur IUBMB, (consulté le 8 avril 2015)
Dans d'autres langues