Ácido desoxirribonucleico (ADN)
El ácido desoxirribonucleico, frecuentemente abreviado como ADN (y también DNA, del inglés DeoxyriboNucleic Acid), es un
ácido nucleico que contiene las instrucciones
genéticas usadas en el
desarrollo y el funcionamiento de todos los
organismos vivos conocidos y también de los
virus, excepto algunos cuyo material genético es
ARN (los
retrovirus). La función principal de las
moléculas de ADN es el de ser portador y transmisor entre generaciones de información genética. El ADN a menudo es comparado metafóricamente a un
manual de instrucciones, ya que este contiene las "instrucciones" para construir otros componentes de las
células, como moléculas de
ARN y
proteína. Los segmentos de ADN que llevan la información genética se llaman
genes, aunque otras secuencias de ADN tienen funciones estructurales o están implicadas en la regulación del empleo de esta información genética; de esta manera, el ADN adopta un papel multifuncional y básico.
Químicamente, el ADN es un largo
polímero de unidades simples llamadas
nucleótidos con un armazón hecho de
azúcares y
grupos de fosfato unidos alternativamente entre sí mediante enlaces de tipo
éster. Unido
covalentemente a cada azúcar se encuentra una
base nitrogenada:
adenina,
timina,
citosina o
guanina. La disposición secuencial de estas cuatro
bases a lo largo de la cadena es la que codifica la información. Esta información es interpretada usando el
código genético, que especifica la secuencia de los
aminoácidos de las proteínas, según una correspondencia de un triplete de nucleótidos (
codón) por cada aminoácido. El código es interpretado copiando los tramos de ADN en un ácido nucleico relacionado, el
ácido ribonucleico (ARN), en un proceso llamado
transcripción.
Dentro de las
células, el ADN está organizado en estructuras llamadas
cromosomas. Estos cromosomas se duplican antes de que las
células se dividan, en un proceso llamado
replicación de ADN. Los
organismos Eucariotas (
animales,
plantas, y
hongos) almacenan la inmensa mayoría de su ADN dentro del
núcleo celular y una mínima parte en los orgánulos celulares
mitocondrias, y en los
cloroplastos en caso de tenerlos; en
procariotas (las
bacterias y
archaeas) se encuentra en el
citoplasma de la célula; y en los virus de ADN, se encuentra en el interior de la
cápsida. Las proteínas
cromáticas, como las
histonas, comprimen y organizan el ADN dentro de los cromosomas. Estas estructuras compactas dirigen las interacciones entre el ADN y otras proteínas, ayudando al control de las partes del ADN que son transcritas.
Propiedades físicas y químicas
El ADN es un largo
polímero formado por unidades repetitivas, los
nucleótidos. Una doble cadena de ADN mide de 22 a 26
Ångströms (2,2 a 2,6
nanómetros) de ancho, y una unidad (un nucleótido) mide 3,3 Å (0,33 nm) de largo. Aunque cada unidad individual que se repite es muy pequeña, los polímeros de ADN pueden ser
moléculas enormes que contienen millones de
nucleótidos. Por ejemplo, el cromosoma humano más largo, el
cromosoma número 1, tiene aproximadamente 220 millones de
pares de bases.
En los
organismos vivos, el ADN no suele existir como una molécula individual, sino como una pareja de moléculas estrechamente asociadas. Las dos cadenas de ADN se enroscan sobre sí mismas formando una especie de escalera de caracol, denominada
doble hélice. El modelo de estructura en doble hélice fue propuesto en
1953 por
James Watson y
Francis Crick (el artículo Molecular Structure of Nucleic Acids: A Structure for Deoxyribose Nucleic Acid fue publicado el
25 de abril de
1953 en
Nature).El éxito de éste modelo radicaba en su consistencia con las propiedades físicas y químicas del ADN. El estudio mostraba además que la complementariedad de bases podía ser relevante en su replicación, y también la importancia de la secuencia de bases como portador de información genética. Cada unidad que se repite, el nucleótido, contiene un segmento de la estructura de soporte (azúcar + fosfato), que mantiene la cadena unida, y una
base, que interacciona con la otra cadena de ADN en la hélice. En general, una base ligada a un azúcar se denomina
nucleósido y una base ligada a un azúcar y a uno o más grupos fosfatos recibe el nombre de
nucleótido. Cuando muchos nucleótidos se encuentran unidos, como ocurre en el ADN, el polímero resultante se denomina
polinucleótido.
Apareamiento de bases
Un par AT con dos puentes de hidrógeno. Los puentes de hidrógeno se muestran como líneas discontinuas.
La dóble hélice de ADN se mantiene estable mediante la formación de
puentes de hidrógeno entre las bases asociadas a cada una de las dos hebras. Para la formación de un
enlace de hidrógeno una de las bases debe presentar un "donador" de hidrógenos con un átomo de hidrógeno con carga parcial positiva (-NH2 o -NH) y la otra base debe presentar un grupo "aceptor" de hidrógenos con un átomo cargado electronegativamente (C=O o N). Los nucleótidos de cada una de las dos cadenas que forman el ADN establecen una asociación específica mediante puentes de hidrógeno con los correspondientes de la otra cadena. Cada tipo de base en una hebra forma un enlace únicamente con un tipo de base en la otra hebra, lo que se denomina "complementariedad de las bases". Según esto, las purinas forman enlaces con las pirimidinas, de forma que A se enlaza sólo con T, y C sólo con G. La organización de dos nucleótidos apareados a lo largo de la doble hélice se denomina apareamiento de bases. Este emparejamiento corresponde a la observación ya realizada por
Erwin Chargaff (1905-2002), que mostró que la cantidad de adenina era muy similar a la cantidad de timina, y que la cantidad de citosina era igual a la cantidad de guanina en el ADN. Esta observación permitió establecer la hipótesis de que una purina siempre mostraba afinidad con una pirimidina. La doble hélice se estabiliza además por el efecto
hidrofóbico y el apilamiento que no están influenciados por la secuencia de bases del ADN. Como los puentes de hidrógeno no son
enlaces covalentes, pueden romperse y formarse de nuevo de forma relativamente sencilla. Por esta razón las dos hebras de la doble hélice pueden separarse como una cremallera, bien por fuerza mecánica o alta
temperatura. Como resultado de esta complementariedad, toda la información contenida en la secuencia de doble hebra de la hélice de ADN está duplicada en cada hebra, lo cual es fundamental durante el proceso de replicación del ADN. En efecto, esta interacción reversible y específica entre pares de bases complementarias es crítica para todas las funciones del ADN en los organismos vivos.
Los dos tipos de pares de bases forman un número diferente de pares de hidrógeno: AT forman dos puentes de hidrógeno, y GC forman tres puentes de hidrógeno (ver imágenes). El par de bases GC es por tanto más fuerte que el par de bases AT. Como consecuencia, tanto el porcentaje de pares de bases GC como la longitud total de la doble hélice de ADN determinan la fuerza de la asociación entre las dos hebras de ADN. Dobles hélices largas de ADN con alto contenido en GC tienen hebras que interaccionan más fuerte que dobles hélices cortas con alto contenido en AT. En biología, partes de la doble hélice de ADN que necesitan separarse fácilmente, como la TATAAT Pribnow box en algunos
promotores, tienden a tener un alto contenido en AT, lo que permite que las hebras se separen más fácilmente. En el laboratorio, la fuerza de esta interacción puede medirse, buscando la temperatura requerida para romper los puentes de hidrógeno, la
temperatura de fusión (también denominado valor Tm, del inglés melting temperature). Cuando todas las pares de bases en una doble hélice se funden, las hebras se separan en solución en dos hebras completamente independientes. Estas moléculas de ADN de hebra simple no tienen una única forma común, sino que algunas conformaciones son más estables que otras. Puentes de hidrógeno
La adhesión de las dos hebras de ácido nucleico se debe a un tipo de unión
química conocido como enlace de hidrógeno o
puente de hidrógeno. Los puentes de hidrógeno son uniones más débiles que los típicos
enlaces químicos covalentes, tales como los que conectan los átomos en cada hebra de ADN, pero más fuertes que interacciones hidrófobas individuales, enlaces de Van der Waals, etc. El hecho que las hebras de la hélice de ADN estén unidas mediante puentes de hidrógeno hace que éstas puedan separarse entre sí con relativa facilidad, por ejemplo mediante un incremento de la temperatura, quedando intactas en sus componentes. La fortaleza relativa de la unión entre las dos hebras del ADN reside en la suma de gran cantidad de enlaces de hidrógeno a lo largo de las dos hebras paralelas.De esta manera se forman dos enlaces de hidrógeno por cada unión A=T y tres por cada emparejamiento C≡G.
Estructura
El ADN es una
molécula bicatenaria; es decir: está formada por dos cadenas dispuestas de forma antiparalela y con las bases nitrogenadas enfrentadas. En su estructura tridimensional, se distinguen distintos niveles:
Estructura primaria:
Secuencia de nucleótidos encadenados. Es en estas cadenas donde se encuentra la información genética, y dado que el esqueleto es el mismo para todos, la diferencia de la información radica en la distinta secuencia de bases nitrogenadas. Esta secuencia presenta un código, que determina una información u otra, según el orden de las bases.
Estructura secundaria:
Es una estructura en doble hélice. Permite explicar el almacenamiento de la información genética y el mecanismo de duplicación del ADN. Fue postulada por Watson y Crick, basándose en: primero, la difracción de rayos X que habían realizado Franklin, Wilkins; y segundo,la equivalencia de bases de Chargaff, que dice que la suma de adeninas más guaninas es igual a la suma de timinas más citosinas.
Es una cadena doble, dextrógira o levógira según el tipo de ADN. Ambas cadenas son complementarias, pues la adenina de una se une a la timina de la otra, y la guanina de una a la citosina de la otra. Ambas cadenas son antiparalelas, pues el extremo 3´ de una se enfrenta al extremo 5´ de la otra.
Existen tres modelos de ADN. El ADN de tipo B es el más abundante y es el descubierto por Watson y Crick.
Estructura terciaria
Se refiere a como se almacena el ADN en un
volumen reducido. Varía según se trate de organismos
procariotas o
eucariotas:
2. En procariotas: se pliega como una súper-hélice en forma, generalmente, circular y asociada a una pequeña cantidad de proteínas. Lo mismo ocurre en las
mitocondrias y en los
cloroplastos.
3. En eucariotas: el empaquetamiento ha de ser más complejo y compacto y para esto se necesita la presencia de proteínas, como son las
histonas y otras de naturaleza no histónica (en los
espermatozoides estas proteínas son las protaminas ).
Sense y antisense
Una secuencia de ADN se denomina sense (en español, sentido) si su secuencia es la misma que la secuecia de un
ARN mensajero que se traduce en una proteína. La secuencia de la hebra de ADN complementaria se denomina antisense (antisentido). En diferentes zonas de una hebra de ADN pueden existir tanto secuencias sense como antisense (es decir, ambas hebras contienen secuencias sense y antisense). Tanto en procariotas como en eucariotas se producen ARNs con secuencias antisense, pero la función de esos ARNs no está completamente clara. Se ha propuesto que los ARNs antisense están implicados en la regulación de la
expresión génica mediante apareamiento ARN-ARN. En unas pocas secuencias de ADN en procariotas y eucariotas (este hecho es más frecuente en
plásmidos y
virus), la distinción entre hebras sense y antisense es más difusa, debido a que tienen genes superpuestos. En estos casos, algunas secuencias de ADN tienen una función doble, codificando una proteína cuando se lee a lo largo de una hebra, y una segunda proteína cuando se lee en la dirección contraria a lo largo de la otra hebra. En
bacterias, esta superposición puede estar involucrada en la regulación de la
transcripción del gen, mientras que en virus, los genes superpuestos aumentan la cantidad de información que puede codificarse en el diminuto genoma viral.
Superenrollamiento
El ADN puede retorcerse como una cuerda en un proceso que se denomina
superenrollamiento del ADN («supercoiling», en inglés). Cuando el ADN está en un estado "relajado", una hebra normalmente gira alrededor del eje de la doble hélice una vez cada 10.4 pares de bases, pero si el ADN está retorcido las hebras pueden estar unidas bien más estrechamente o más relajadamente. Si el ADN está retorcido en la dirección de la hélice, éste es un superenrollamiento positivo, y las bases se mantienen juntas de forma más estrecha. Si el ADN se retuerce en la dirección opuesta, éste es un superenrollamiento negativo, y las bases se alejan. En la Naturaleza, la mayor parte del ADN tiene un ligero superenrollamiento negativo que es producido por
enzimas denominadas
topoisomerasas. Estas enzimas también son necesarias para liberar las fuerzas de torsión introducidas en las hebras de ADN durante procesos como la
transcripción y la
replicación.
Daño del ADN
El ADN puede resultar dañado por muchos tipos de
mutágenos, que cambian la secuencia del ADN:
agentes alquilantes, además de
radiación electromagnética de alta energía, como luz
ultravioleta y
rayos X. El tipo de daño producido en el ADN depende del tipo de mutágeno. Por ejemplo, la luz UV puede dañar al ADN produciendo dímeros de
timina, que se forman por ligamiento cruzado entre bases
pirimidínicas. Por otro lado, oxidantes tales como
radicales libres o el
peróxido de hidrógeno producen múltiples daños, incluyendo modificaciones de bases, sobre todo guanina, y roturas de doble hebra (double-strand breaks). En una célula humana cualquiera, alrededor de 500 bases sufren daño oxidativo cada día.De estas lesiones oxidativas, las más peligrosas son las roturas de doble hebra, ya que son difíciles de reparar y pueden producir
mutaciones puntuales,
inserciones y
deleciones de la secuencia de ADN, así como
translocaciones cromosómicas. Muchos mutágenos se posicionan entre dos pares de bases adyacentes, por lo que se denominan
agentes intercalantes. La mayoría de los agentes intercalantes son moléculas
aromáticas y planas, como el
bromuro de etidio, la
daunomicina, la
doxorubicina y la
talidomida. Para que un agente intercalante pueda integrarse entre dos pares de bases, éstas deben separarse, distorsionando las hebras de ADN y abriendo la doble hélice. Esto inhibe la
transcripción y la
replicación del ADN, causando toxicidad y mutaciones. Por ello, los agentes intercalantes del ADN son a menudo
carcinógenos: el
benzopireno, las
acridinas, la
aflatoxina y el
bromuro de etidio son ejemplos bien conocidos. Sin embargo, debido a su capacidad para inhibir la replicación y la transcripción del ADN, estas toxinas también se utilizan en
quimioterapia para inhibir la rápida expansión de las células
cancerosas.
Funciones biológicas
Las funciones biológicas del ADN incluyen el almacenamiento de información (
Genes y genoma), la codificación de proteínas (
Transcripción y traducción) y su autoduplicación (
Replicación del ADN) para asegurar la transmisión de la información a las células hijas durante la división celular.
Genes y genoma
El ADN se puede considerar como un almacén de información (mensaje) que contiene toda la información necesaria para construir y sostener el organismo en el que reside, y que se transmite de generación en generación. El conjunto de información que cumple esta función en un organismo dado se denomina
genoma, y el ADN que lo constituye, ADN genómico.
El ADN genómico (que se organiza en moléculas de
cromatina que a su vez se ensamblan en
cromosomas) se encuentra en el
núcleo celular de los
eucariotas, además de pequeñas cantidades en las
mitocondrias y
cloroplastos. En
procariotas, el ADN se encuentra en un cuerpo de forma irregular denominado
nucleoide.
El ADN codificante
La información genética de un
genoma está contenida en los
genes, y al conjunto de toda la información que corresponde a un organismo se le denomina su
genotipo. Un gen es una unidad de
herencia y es una región de ADN que influye en una característica particular de un organismo (como el color de ojos, por ejemplo). Los genes contienen un "marco de lectura abierto" (open reading frame) que puede transcribirse, además de
secuencias reguladoras, tales como
promotores y
enhancers, que controlan la transcripción del marco de lectura abierto.
Desde este punto de vista, las obreras de este mecanismo son las proteínas. Estas pueden ser estructurales como las proteínas de los
músculos,
cartílagos, pelo, etc., o bien funcionales como la
hemoglobina, o las innumerables
enzimas del organismo. La función principal de la herencia es la especificación de las proteínas, siendo el ADN una especie de plano o receta para producirlas. Unas veces la modificación del ADN provoca la disfunción proteica, generando lo que llamamos
enfermedad; otras veces, las modificaciones darán lugar a cambios beneficiosos, lo que conocemos como
evolución.
Las alrededor de treinta mil proteínas diferentes en el cuerpo humano están constituidas por veinte
aminoácidos diferentes, y una molécula de ADN debe especificar la secuencia en que se unen dichos aminoácidos.
En el proceso de elaborar una proteína, el ADN de un gen se lee y se transcribe a ARN. Este ARN sirve como mensajero entre el ADN y la maquinaria que elaborará las proteínas y por eso recibe el nombre de
ARN mensajero o ARNm. El ARN mensajero sirve de molde a la maquinaria que elabora las proteínas, para que ensamble los aminoácidos en el orden preciso para
armar la proteína.
El
dogma central de la biología molecular establece que el flujo de actividad y de información es: ADN →
ARN → proteína.
En la actualidad se supone que este "dogma" debe ser ampliado, pues se han encontrado otros flujos de información: en algunos organismos (virus de ARN) la información fluye de ARN a ADN; este proceso se conoce como "transcripción inversa o reversa", también llamada "retrotranscripción". Adicionalmente, se sabe que existen secuencias de ADN que se transcriben a ARN y son funcionales como tales, sin llegar a traducirse nunca a proteína: son los ARN no codificantes, como es el caso de los
ARN interferentes.
El ADN no codificante ("ADN basura")
El ADN en el genoma de un organismo podría dividirse conceptualmente en dos, el que codifica las proteínas (los genes) y el que no codifica. En muchas
especies, sólo una pequeña fracción del
genoma codifica proteínas. Por ejemplo, sólo alrededor del 1.5% del genoma humano consiste de
exones que codifican proteínas, mientras que más del 50% consiste de ADN no codificante.El ADN no codificante (también denominado
ADN basura o junk DNA) corresponde a secuencias del genoma que no generan una proteína (procedentes de transposiciones, duplicaciones, translocaciones y recombinaciones de virus, etc.), incluyendo los
intrones. Corresponde a más del 90% de nuestro genoma, que cuenta con 20.000 ó 25.000 genes. Inicialmente se pensaba que el ADN no codificante no tenía utilidad alguna, pero distintos estudios recientes apuntan a la inexactitud de esta hipótesis. Entre otras funciones, se postula que el llamado "ADN basura" regula la
expresión diferencial de los genes. Por ejemplo, algunas secuencias tienen afinidad hacia proteínas especiales que tienen la capacidad de unirse al ADN (como los homeodominios, los complejos receptores de hormonas esteroides, etc.), con un papel importante en el control de los mecanismos de trascripción y replicación. Estas secuencias se llaman frecuentemente "secuencias reguladoras", y los investigadores asumen que sólo se ha identificado una pequeña fracción de las que realmente existen. La presencia de tanto ADN no codificante en genomas eucarióticos y las diferencias en tamaño del genoma entre especies representan un misterio que es conocido como el "enigma del valor de C". Recientemente un grupo de investigadores de la
Universidad de Yale afirma que ha descubierto una secuencia de ADN no codificante ("basura") que sería el responsable de que los seres humanos hayan desarrollado la capacidad de agarrar y/o manipular objetos o herramientas.
Por otro lado, algunas secuencias de ADN desempeñan un papel estructural en los cromosomas: los
telómeros y
centrómeros contienen pocos o ningún gen codificante de proteínas, pero son importantes para estabilizar la estructura de los cromosomas. Algunos genes no codifican proteínas, pero sí se transcriben en ARN:
ARN ribosómico,
ARN de transferencia,
ARN de interferencia (ARNi, que son ARN que bloquean la expresión de genes específicos). La estructura de intrones y exones de algunos genes (como los de inmunoglobulinas y protocadherinas) son importantes por permitir
cortes y empalmes alternativos del pre-
ARN mensajero que hacen posible la síntesis de diferentes proteínas a partir de un mismo gen (sin esta capacidad no existiría el sistema inmune, por ejemplo). Algunas secuencias de ADN no codificante representan
pseudogenes que tienen valor evolutivo ya que permiten la creación de nuevos genes con nuevas funciones. Otros ADN no codificantes proceden de la duplicación de pequeñas regiones del ADN; esto tiene mucha utilidad ya que el rastreo de estas secuencias repetitivas permite estudios sobre el linaje humano.
Transcripción y traducción
Artículos principales:
Transcripción (genética) y
Traducción (genética)En un
gen, la secuencia de nucleótidos a lo largo de una hebra de ADN se
transcribe a un
ARN mensajero (ARNm) y esta secuencia a su vez se
traduce a una
proteína que un organismo es capaz de sintetizar o "expresar" en uno o varios momentos de su vida, usando la información de dicha secuencia.
La relación entre la secuencia de nucleótidos y la secuencia de
aminoácidos de la proteína viene determinada por el
código genético, que se utiliza durante el proceso de traducción o
síntesis de proteínas. La unidad codificadora del código genético es un grupo de tres nucleótidos (triplete), representado por las tres letras iniciales de las bases nitrogenadas (por ej., ACT, CAG, TTT). Los tripletes del ADN se transcriben en sus bases complementarias en el ARN mensajero, y en este caso los tripletes se denominan
codones (para el ejemplo anterior, UGA, GUC, AAA). En el ribosoma cada codón del ARN mensajero interacciona con una molécula de
ARN de transferencia (ARNt o tRNA) que contenga el triplete complementario, denominado anticodón. Cada ARNt porta el aminoácido correspondiente al codón de acuerdo con el
código genético, de modo que el ribosoma va uniendo los aminoácidos para formar una nueva proteína de acuerdo con las "instrucciones" de la secuencia del ARNm. Existen 64 codones posibles, por lo cual corresponde más de uno para cada aminoácido; algunos codones indican la terminación de la síntesis, el fin de la secuencia codificante; estos codones de terminación o codones de parada son UAA, UGA y UAG (en inglés, nonsense codons o stop codons).
Replicación del ADN
Es la capacidad que tiene el ADN de hacer copias o réplicas de su molécula. Este proceso es fundamental para la transferencia de la información genética de generación en generación. Las moléculas se replican de un modo semiconservativo. La doble hélice se separa y cada una de las cadenas sirve de molde para la síntesis de una nueva cadena complementaria. El resultado final son dos moléculas idénticas a la original.
El proceso de replicación de ADN es la base de la
herencia del
material genético. Se basa en la duplicación de la información genética y su posterior división, ya que en toda
célula que va a dividirse la
cromatina debe duplicarse para poder repartirse por igual en cada una de las células hijas. Para ello las dos cadenas complementarias que componen la
doble hélice de ADN (molécula madre) deben separarse para poder formar dos nuevas cadenas, cada una de las cuales es complementaria a una de las cadenas de la
molécula madre.
Este tipo de duplicación de ADN se llama replicación semiconservativa, porque cada una de las dos moléculas hijas contiene la mitad (una de las cadenas de ADN) de la molécula madre. La duplicación semiconservativa tiene lugar precisamente por el hecho de que la secuencia de las
bases que la constituyen se conserva, de forma que la secuencia de cada molécula madre sirve de molde para formar la secuencia de dos moléculas hijas.
Así, la
cromátida de ADN de cada célula forma una doble hélice que presenta una cadena vieja procedente de la molécula madre y otra recién sintetizada. La replicación es semiconservativa, bidireccional y semidiscontínua.
Interacciones ADN-proteínas
Todas las funciones del ADN dependen de sus interacciones con proteínas. Estas interacciones pueden ser no-específicas, o bien la proteína puede unirse de forma específica a una única secuencia de ADN. También pueden unirse enzimas, y de éstas, son particularmente importantes las polimerasas que copian las secuencia de bases del ADN durante la transcripción y la replicación.
Interacciones específicas
Un grupo bien definido de proteínas de unión a ADN son las que se unen específicamente a ADN de hebra simple (ssDNA). En humanos, la proteína A de replicación es la mejor conocida de su familia y se utiliza en procesos en los que la doble hélice se separa, como la
replicación del ADN, la
recombinación o la
reparación del ADN. Estas proteínas parecen estabilizar el ADN de hebra simple, protegiéndolo para evitar que formen estructuras en tallo-lazo (stem-loop) o que se degrade por
nucleasas.
Sin embargo, otras proteínas han evolucionado para unirse específicamente a secuencias particulares de ADN. La especificidad de la interacción de las proteínas con el ADN procede de los múltiples contactos con los extremos de las bases de ADN, lo que les permite "leer" la secuencia del ADN. La mayoría de esas interacciones con las bases occurren en la hendidura mayor, donde las bases son más accesibles.Las que se han estudiado con mayor detalle son los diferentes
factores de transcripción, que son proteínas que regulan la transcripción. Cada factor de transcripción se une a una secuencia concreta de ADN y activa o inhibe la transcripción de los genes que presentan estas secuencias próximas a sus promotores. Los factores de transcripción pueden efectuar ésto de dos formas:
en primer lugar, pueden unirse a la polimerasa de ARN responsable de la transcripción, bien directamente o a través de otras proteínas mediadoras; esto aproxima la polimerasa al promotor y permite el inicio de la transcripción. Alternativamente, los factores de transcripción pueden unirse a
enzimas que modifican las histonas del promotor; esto modifica la accesibilidad del molde de ADN a la polimerasa. Como los ADN diana pueden encontrarse por todo el
genoma del organismo, cambios en la actividad de un tipo de factor de transcripción puede afectar a miles de genes. En consecuencia, estas proteínas son frecuentemente las dianas de los procesos de
transducción de señales que controlan las respuestas a cambios ambientales o diferenciación y desarrollo celular.
Enzimas que modifican el ADN
Nucleasas y ligasas
Las
nucleasas son
enzimas que cortan las hebras de ADN mediante la
catálisis de la
hidrólisis de los
enlaces fosfodiéster. Las nucleasas que hidrolizan
nucleótidos a partir de los extremos de las hebras de ADN se denominan exonucleasas, mientras que las endonucleasas cortan en el interior de las hebras. Las nucleasas que se utilizan con mayor frecuencia en
biología molecular son las
enzimas de restricción, endonucleasas que cortan el ADN en secuencias específicas. Por ejemplo, la enzima
EcoRV que se muestra a la izquierda reconoce la secuencia de 6 bases 5′-GATATC-3′ y hace un corte en ambas hebras en la línea vertical indicada, generando dos moléculas de ADN con los extremos romos. Otras enzimas de restricción generan sin embargo extremos cohesivos, ya que cortan de forma diferente las dos hebras de ADN. En la naturaleza, estas enzimas protegen las
bacterias contra las infecciones de
fagos, al digerir el ADN del fago cuando entra a través de la pared bacteriana, actuando como un mecanismo de defensa. En
biotecnología, estas nucleasas específicas de la secuencias de ADN se utilizan en la
clonación molecular y en la técnica de
Huella genética.
Las enzimas denominadas
ADN ligasas pueden reunir hebras de ADN cortadas o rotas. Las ligasas son particularmente importantes en la
replicación de la hebra rezagada de ADN, ya que unen los fragmentos cortos de ADN generados en la
horquilla de replicación para formar una copia completa del molde de ADN. También se utilizan en la
reparación del ADN y en la
recombinación genética.
Evolución del metabolismo de ADN
El ADN contiene la información genética que permite a la mayoría de los organismos vivientes funcionar, crecer y reproducirse. Sin embargo, no está claro durante cuánto tiempo ha ejercido esta función en los ~3000 millones de años de la
historia de la vida, ya que se ha propuesto que las formas de vida más tempranas podrían haber utilizado
ARN como material genético. El ARN podría haber funcionado como la parte central de un metabolismo primigenio, ya que puede transmitir información genética y simultáneamente actuar como
catalizador formando parte de las
ribozimas. Este antiguo
Mundo de ARN donde los ácidos nucléicos funcionarían como catalizadores y como almacenes de información genética podría haber influido en la
evolución del
código genético actual, basado en cuatro
nucleótidos. Esto se debería a que el número de bases únicas en un organismo es un compromiso entre un número pequeño de bases (lo que aumentaría la precisión de la replicación) y un número grande de bases (que a su vez aumentaría la eficiencia catalítica de las ribozimas).
Desgraciadamente, no disponemos de evidencia directa de los sistemas genéticos ancestrales, por que la recuperación del ADN a partir de la mayor parte de los fósiles es imposible. Esto se debe a que el ADN es capaz de sobrevivir en el medio ambiente durante menos de un millón de años, y luego empieza a degradarse lentamente en fragmentos de menor tamaño en solución. Algunas investigaciones pretenden que se ha obtenido ADN más antiguo, por ejemplo un informe sobre el aislamiento de una bacteria viable a partir de un cristal salino de 250 millones de años de antigüedad, pero estos datos son controvertidos.
Sin embargo, pueden utilizarse herramientas de evolución molecular para inferir los genomas de organismos ancestrales a partir de organismos contemporáneos. En muchos casos, estas inferencias son suficientemente fiables, de manera que una biomolécula codificada en un genoma ancestral puede resucitarse en el laboratorio para ser estudiada hoy. Una vez que la biomolécula ancestral se ha resucitado, sus propiedades pueden ofrecer inferencias sobre ambientes y estilos de vida primigenios. Este proceso se relaciona con el campo emergente de la Paleogenética experimental.
A pesar de todo, el proceso de trabajo hacia atrás desde el presente tiene limitaciones inherentes, razón por la cual otros investigadores tratan de elucidar el mecanismo evolutivo trabajando desde el origen de la Tierra hacia delante en el tiempo. Dada suficiente información sobre la química en el cosmos, la manera en la que las sustancias cósmicas podrían haberse depositado en la Tierra, y las transformaciones que podrían haber tenido lugar en la superficie terrestre primigenia, tal vez podríamos ser capaces de aprender sobre los orígenes para desarrollar modelos de evolución de la información genética hacia delante en el tiempo (ver también el artículo sobre el
origen de la vida).