Secuencia de ADN

Para as técnicas para a determinación da secuencia do ADN ver secuenciación do ADN.
Unha serie de codóns nun fragmento de molécula de ARNm. Cada codón consta de tres nucleótidos, que representan un determinado aminoácido.

A secuencia de ADN é a sucesión de nucleótidos (unidades que forman o ADN) representados por letras (A, T, G, C) que indica a orde en que estes están situados nunha molécula de ADN. Máis en xeral, unha secuencia de ácido nucleico ou de nucleótidos é esa mesma sucesión nun ADN (letas A, T, G, C) ou nun ARN (letras A, U, G, C). Por convención, as secuencias son xeralmente presentadas empezando polo extremo 5' e acabando polo extremo 3'. Como os ácidos nucleicos son xeralmente polímeros lineares (é dicir, non ramificados), especificar a súa secuencia equivale a definir a estrutura covalente da molécula enteira. A secuencia do ácido nucleico constitúe a súa estrutura primaria. Nesa estrutura primaria está codificada a información xenética dos seres vivos, polo que ás veces tamén se usa para ela a expresión secuencia xenética. As secuencias poden lerse a partir do material biolóxico utilizando diversos métodos de secuenciación do ADN.

Ademais da estrutura primaria (non se debe dicir "secuencia primaria"), os ácidos nucleicos teñen estrutura secundaria, terciaria e superiores.

Nucleótidos

Estrutura química do ARN.

Os ácidos nucleicos están formados por unha sucesión de moléculas chamadas nucleótidos unidas entre si por un enlace covalente chamado fosfodiéster. Os nucleótidos están formados por un fosfato, un azucre e unha base nutroxenada. O fosfato nunca varía. O azucre serve para distinguir o ADN (leva o azucre desoxirribosa) do ARN (leva ribosa). A base nitroxenada (ou nucleobase) é o que distingue nun mesmo ácido nucleico un nucleótido doutro, polo que a secuencia dun ácido nucleico é tamén a súa secuencia de nucleótidos ou a súa secuencia de bases. Segundo as bases nitroxenadas que leven hai cinco tipos de nucleótidos habituais nos ácidos nucleicos, que son: adenina (representado por A), guanina (G), citosina (C), timina (T) e uracilo (U). No ADN aparecen A, T, G e C, e no ARN A, U, G e C. Nos ácidos nucleicos bicatenarios, como o ADN, as bases emparéllanse coas da cadea de enfronte formando sempre os pares A-T e G-C mediante o establecemento de pontes de hidróxeno (outros emparellamentos non terían os grupos químicos adecuados para formar esas pontes de hidróxeno). Isto quere dicir que unha cadea é complementaria en bases da outra.

Xeralmente unha secuencia de ADN escríbese coas bases seguidas (sen espazos entre elas) de esquerda a dereita desde o extremo 5' ao 3', por exemplo 5'-AAAGTCTGAC-3'. Durante a tradución de proteínas, os ARNm son traducidos empezando polo extremo 5'. Por exemplo, a secuencia complementaria de 5'-TTAC-3' é 5'-GTAA-3' (obsérvese que as dúas están escritas en sentido 5'-3', pero nun ADN bicatenario estarán colocadas de forma antiparalela, polo que o primeiro T da primeira secuencia terá en fronte o o último A da segunda secuencia, e así as demais).

Notación

Na representación das secuencias de nucleótidos A, T, C, G e U representan a adenina, timina, citosina, guanina e uracilo, pero hai tamén letras para representar a ambigüidade nunha determinada posición, que podería estar ocupada por un nucleótido entre varios posibles. As regras da IUPAC para estes casos son: [1]

  • R = G A (unha purina)
  • Y = T C (unha pirimidina)
  • K = G T (ceto)
  • M = A C (amino)
  • S = G C (enlazamento forte, con tres pontes de hidróxeno)
  • W = A T (enlazamento feble, con dúas pontes de hidróxeno)
  • B = G T C (todos excepto A)
  • D = G A T (todos menos C)
  • H = A C T (todos agás G)
  • V = G C A (todos excepto T)
  • N = A G C T (calquera)

Estes símbolos son tamén válidos para o ARN, pero nese caso U (uracilo) substituiría a T (timina). [1]

Ademais das bases habituais A, C, G, T e U, os ácidos nucleicos poden tamén conter bases modificadas despois de que se formou a cadea do ácido nucleico. No ADN, a base modificada máis común é a 5-metilcitidina (m5C). No ARN, pode haber moitas bases modificadas, como a pseudouridina (Ψ), dihìdrouridina (D), inosina (I), ribotimidina (rT) e 7-metilguanosina (m7G). [2] [3] A hipoxantina e a xantina son dúas das bases que se poden orixinar pola presenza de mutáxenos. [4] De xeito similar, a desaminación da citosina orixina uracilo.

Other Languages