Genetica Molecular
Genetica Molecular
Genetica Molecular
1
Mutación en el DNA
▪Espontánea vs inducida
▪Somática vs germinal
4
Mutación en el DNA
• Alineamiento incorrecto
10
La tautomería
11
Alineamiento incorrecto
13
Lesiones
espontáneas
Desaminación del DNA
14
Lesiones espontáneas
• Análogos de bases
16
Mutaciones
inducidas
• Agentes químicos
• Modificación de bases
inducidas químicamente
(genera emparejamientos
incorrectos)
18
Mutaciones inducidas
• Agentes químicos
19
Agentes físicos
Mutaciones inducidas
20
Mutaciones inducidas
Agentes físicos
Radiaciones ionizantes
▪Roturas cromosómicas - roturas de doble cadena
(efectos letales)
21
Lesiones del DNA que requieren reparación
22
Mecanismos de reparación del DNA
23
2
4
Mecanismos de
reparación del DNA
• Reparación directa
• Reparación por
escisión de
nucleótidos: Corrige
los errores
voluminosos que la
escisión de base no
reconoce (bloqueo de
la horquilla de
replicación o del
complejo
transcripcional).
27
Reparación por escisión de nucleótido
• DNA helicasa
28
Reparación por escisión de nucleótido
Función Componente
Helicasa UvrD
29
Reparación por escisión de nucleótido (E. Coli)
31
Reparación por escisión de nucleótido en humanos
33
Reparación de desapareamientos post-replicativos o apareamiento
incorrecto de base o MisMatch Repair (MMR)
Función Componente
MutL
Reparación de errores
MutH (endonucleasa)
MutU (UvrD helicasa)
34
Reparación de desapareamientos post-replicativos (MMR)
Sistema MMR
La cadena hija permanece sin metilar en las secuencias GATC varios minutos
después de su síntesis Fig 14-29 .- Genes VII., Lewis. 35
Mecanismos de reparación del DNA
36
Mecanismos de reparación del DNA
Recombinación a nivel molecular
▪Unión de extremos no homólogos - NHEJ (propenso a error)
37
Mecanismos de reparación del DNA
Roturas de doble cadena
▪Proceso fundamental para la recombinación meiótica. Papel
esencial de la proteína SPO II (Levaduras)
38
Mecanismos de reparación del DNA
Modelo de decisión temprana
39
Mecanismos de reparación del DNA
Modelo de Holliday
40
Mecanismos de reparación del DNA
41
EXPRESIÓN DEL GENOMA
• ¿Qué es un gen?
• ¿Qué papel juegan las regiones promotoras y terminales de los
genes?
• ¿Qué se entiende por ‘expresión génica’ y qué procesos
involucra?
• ¿Cómo se llaman los grupos de tres bases consecutivas del ADN?
¿Y los del ARN mensajero?
• Las dos hebras de ADN se orientan en sentidos opuestos. ¿Qué
implicaciones tiene esta característica en la expresión génica?
Gen
• Cuando los promotores carecen de estos elementos proximales se dice que son genes
constitutivos o de mantenimiento. Da igual que los genes constitutivos se expresen de
forma muy abundante, como que se transcriban a baja velocidad, puesto que lo importante
es que lo hagan de manera continua y no regulada.
Elementos Distales
Aisladores (insulator): se trata de secuencias cortas (alrededor de 50 nt) que impiden que
los potenciadores y los silenciadores actúen más allá de ellas.
A todos los aisladores se les une la proteína CTCF (CCCTC binding factor por ser ésta la
secuencia presente en todos los aisladores encontrados en vertebrados) que presenta 11
dedos de Zn. No son meras barreras físicas sino que intervienen directamente en la
regulación.
ARN Polimerasas
• Factores generales:
• Necesarios para el comienzo de la síntesis
de ARN a partir de todos los promotores
de clase II (genes codificantes).
• Junto a la Pol ARN II forman un complejo
alrededor del punto de inicio de la
transcripción, y determinan en punto
concreto de inicio de ésta; este complejo
constituye el complejo de transcripción
basal.
Factores corriente arriba(upstream) o situados en 5'
Significado en
Significado en
Código
Organismo Codón Código
Mitocondria
Nuclear
l
Todos UGA FIN Trp
Levadura CUX Leu Thr
Drosophila AGA Arg Ser
Humano, bovino AGA, AGC Arg FIN
Met
Humano, bovino AUA Ile
(iniciación)
AUU, AUC, Met
Ratón Ile
AUA (iniciación)
• La primera base del anti codón leído en dirección (5´--3´; esta se aparea con la 3 base
del codón) determina el numero de codones que pueden ser reconocidos por el tRNA.
• Cuando un aminoácido es especificado por varios codones diferentes, los codones que
difieren en cualquiera de las 2 primeras bases requieren tRNA diferentes.
• Cuando un aminoácido es
especificado por varios codones
diferentes, los codones que difieren en
cualquiera de las 2 primeras bases
requieren tRNA diferentes.
Mutación con cambio de sentido
no sinónima
• ADN: 5' - ... CTG ACT CCT GAG GAG AAG TCT ... - 3'
• 3' - ... GAC TGA GGA CTC CTC TTC AGA ... - 5'
• ARNm: 5' - ... CUG ACU CCU GAG GAG AAG UCU ... - 3'
• Hb normal: ... Leu Thr Pro Glu Glu Lys Ser...
• ADN: 5' - ... CTG ACT CCT GTG GAG AAG TCT ... - 3'
• 3' - ... GAC TGA GGA CAC CTC TTC AGA ... - 5'
• ARNm: 5' - ... CUG ACU CCU GUG GAG AAG UCU ... - 3'
• HbS: ... Leu Thr Pro Val Glu Lys Ser...
Mutaciones con cambio de sentido
silenciosas
• ADN: 5' - ... CTG ACT CCT GAG GAG AAG TCT ... - 3'
• 3' - ... GAC TGA GGA CTC CTC TTC AGA ... - 5'
• ARNm: 5' - ... CUG ACU CCU GAG GAG AAG UCU ... - 3'
• Hb normal: ... Leu Thr Pro Glu Glu Lys Ser...
• ADN: 5' - ... CTG ACT CCT GAA GAG AAG TCT ... - 3'
• 3' - ... GAC TGA GGA CAT CTC TTC AGA ... - 5'
• ARNm: 5' - ... CUG ACU CCU GAA GAG AAG UCU ... - 3'
• HbS: ... Leu Thr Pro Glu Glu Lys Ser...
ejercicio
• https://www.ncbi.nlm.nih.gov/nuccore/J0027
7.1
• MTEYKLVVVGAGGVGKSALTIQLIQNHFVDEYDPTIEDSYRKQV
VIDGETCLLDILDTAGQEEYSAMRDQYMRTGEGFLCVFAINNTKSFEDIHQYREQIKR
EL PROCESO DE TRADUCCIÓN: LA
BIOSÍNTESIS DE PROTEÍNAS
La última etapa del flujo de información genética
Procariota Eucariota
Los ARNm suelen tener una vida menor Los ARNm suelen tener una vida mayor
Los ARNm sufren procesos de síntesis mucho más Los ARNm sufren procesos de síntesis mucho más
sencillos, la traducción puede empezar antes de que complejos. La transcripción y la traducción ocurren en
finalice la transcripción. lugares distintos
En los ARN policistrónicos existe una secuencia de Shine- No presentan la secuencia de de Shine-Dalgarno,
Dalgarno* en el 5’UTR por cada cistrón. presentan la secuencia Kozak
Sistemas de traducción en: citosol Sistemas de traducción en: citosol, mitocondria y
cloroplastos
El transcrito primario resultante de la transcripción se La cadena polipeptídica recién liberada del ribosoma no
puede utilizar directamente como ARNm para la suele ser funcional y requiere de procesos de
codificación de proteínas plegamiento y procesamiento postraduccional
5'--ACCAUGG- mRNA
EL PROCESO DE TRADUCCIÓN
Requiere:
• Ribososmas
• ARNm
• Aminoácidos activados
• ARNt
• Energía (ATP, GTP,)
• Iones de magnesio
• Factores proteicos no ribosomales (interaccionan con
moléculas de aminoacil-ARNt, con los ribosomas y el
ARNm)
• Enzimas no ribosomales
Ribosomas
• Componentes moleculares de la síntesis
• Son organelos celulares donde el ARNm es
traducido. Esta formado por dos
subunidades, y cada una de ellas contiene
ARNr y proteínas ribosomales.
• En la traducción, el ARNm pasa a través del
ribosoma, donde los codones son Subunidad grande
Subunidad
reconocidos por los ARNt que van unidos a
pequeña
su aminoácido específico.
• Cada subunidad ribosomal esta compuesta
por ARNt (ARN ribosomal) y proteínas 3'
ribosomales.
• En las células eucarióticas, las unidades
grandes son las 60S y contienen a los ARNt
28S, 5.8S y 5S más cerca de 50 proteínas ARNm
5'
ribosomales. La unidad pequeña es 40S y En eucariotas: se almacenan generalmente
contiene al ARNt 18S, más cerca de 30 en el lumen del RER. Luego maduración en
proteínas. Golgi. Estan presentes citosol mitocondria y
citoplasma
Salida
RIBOSOMAS Tunel
Peptidiltransferasa
Aminoacido
GTPasa
Iniciación en Procariota
FUNCIONES DE LOS RIBOSOMAS
• Traen al “templete” la molécula con el amino ácido apropiado.
• Durante el funcionamiento las subunidades pueden asociarse y disociarse.
• La decodificación: Se mueven a lo largo del mRNA descifrando el código para la
conversión de un nucleótido a su secuencia de amino ácidos. En condiciones
normales, el error es mínimo: un aminoácido equivocado por cada 10.000 lecturas.
• La actividad de transferencia peptídica, o peptidil-transferasa: Catalizan la
formación del enlace peptídico entre amino ácidos utilizando ATP o GTP. La
peptidil-transferasa es una actividad enzimática ligada a la subunidad mayor del
ribosoma.
• Altman y Cech descubrieron en 1981 que ciertos RNA pueden estar dotados que
capacidad enzimática. Premio Nobel de Química en 1989.
• Translocación: cambio de los ARNt de posición en el ribosoma.
Componentes moleculares de la
síntesis 3: ARNt
• Los ARNt llevan a los aminoácidos a los
ribosomas durante la traducción, para ser
ensamblados en una cadena polipeptídica.
• Los ARNt son codificados por los genes.
• Todos los ARNt tienen tamaño y forma
similar.
• Todos los ARNt tienen el triplete CCA en la
terminal 3', donde los aminoácidos se
pegan.
• La otra "terminal" de la molécula de ARNt
es el anticodón, el cual durantte la
traducción, "lee" que coincida el codón del
ARNm.
Los componentes moleculares de la
síntesis 1: ARNm
• El ARN mensajero tiene un principio, una secuencia y un final.
• El ARNm varía en longitud.
La secuencias del ARNm varían debido a que las secuencias de los aminoácidos
codificados difieren, al principio y al final.
Funciones de Aminoacil-ARNt-sintetasa:
Se encargan de unir de manera específica cada aminoácido con su(s) ARNt
correspondiente(s)
Poseen capacidad autocorrectora o de lectura de pruebas, rompiendo el enlace
formado si la relación aminoácido-ARNt no es la correcta
El proceso se llama aminoacilación o "carga".
Al haber 20 aminoácidos, también hay 20 aminoacil-ARNt sintetasas.
Todos los ARNt con el mismo aminoácido son cargados por la misma enzima.
ACTIVACIÓN DEL AMINOÁCIDO
Fases proceso de traducción
• Activación de los aminoácidos
• Iniciación
• Crecimiento (elongación)
• Terminación
• Modificaciones o procesamiento
EUCARIOTA PROCARIOTA
PROCARIOTA
INICIACIÓN
PROCARIOTAS
• El complejo de inicio se forma por
unión de las subunidades del
ribosoma y el iniciador (met-ARNt) al
principio del códon del ARNm.
• Interacción del ribosoma 40S y el
metionil-ARNti se produce
directamente con el primer triplete
de iniciación próximo al extremo 5’
del ARNm (Secuencia Shine-Dalgarno)
+ Primer aa: N-formil-metionina.
(siempre)
• COMPLEJO DE INICIACIÓN
– N-formil-metionina en bacterias
– Metionina en la célula eucariota.
FACTORES DE INICIACIÓN
• IF3: Se une a la subunidad ribosómica 30S;
impide la asociación prematura de la
subunidad 50S; mejora la especificidad Secuencia
Shine-Dalgarno complejo de
del sitio P hacia fMet-tRNAfMet pre iniciación
• IF2-GTP (forma activa): Se une al fMet-
tRNA y facilita la unión a la subunidad
ribosómica 30S. Estimula la unión de este
al complejo iniciación
• IF1: ??? Reciclaje ribosomas. Evita la
unión prematura del tRNA al sitio A
Disociación del ribosoma 70S. La unión de los factores IF1 e IF3 a la subunidad 30S
evita que se una de nuevo a la subunidad50S.
Eucromatina y Heterocromatina.
El cariotipo.
La palabra cromosoma procede del griego y significa "cuerpo que se tiñe". La palabra cromatina
significa "sustancia que se tiñe". El cromosoma, como ya hemos dicho en el tema anterior, es el
material genético organizado. En el caso de los organismos eucariontes el cromosoma nace
fundamentalmente de la interacción entre el ADN, las histonas y las proteínas no histónicas.
Los cromosomas eucarióticos son moléculas muy largas de ADN doble hélice en interacción
con proteínas (histonas y no histonas) que se pueden encontrar desde estados relajados o
poco compactados como en los núcleos de las células en interfase hasta en estados altamente
compactados como sucede en la metafase mitótica.
La cromatina fue inicialmente definida por Fleming (1882) como "la sustancia que constituye los
núcleos interfásicos y que muestra determinadas propiedades de tinción". Esta definición, al
igual que la inicial de cromosoma es puramente citológica. Sin embargo, desde el punto de
vista genético, tanto la cromatina como el cromosoma son el material genético organizado.
Algunos autores piensan que la cromatina es solamente la interacción entre el ADN y las
histonas. Otros consideran que en la estructura de la cromatina también intervienen las
proteínas no histónicas, e incluso algunos autores piensan que el ARN también juega un papel
importante en la estructura de la cromatina.
Principales componentes
Los principales componentes que se obtienen cuando se aísla la cromatina de los núcleos
interfásicos son el ADN, las histónicas, las proteínas no histónicas y el ARN. Si se toma como
unidad de comparación la cantidad de ADN, los demás componentes aparecen en las
siguientes proporciones:
La cantidad de las proteínas no histónicas puede variar de unos tejidos a otros en el mismo
individuo y dentro del mismo tejido a lo largo del desarrollo.
Las Histonas
Las son proteínas básicas, ricas en residuos de lisina y arginina, que muestran un elevado
conservadurismo evolutivo y que interacción con el ADN formando una subunidad que se repite
a lo largo de la cromatina denominada Nucleosoma.
Los principales tipos de histonas que se han aislado en los núcleos interfásicos en diferentes
especies eucariontes son: H1, H2A, H2B, H3 y H4. Las características más sobresalientes de
estas histonas aparecen en la siguiente tabla:
Contenido en moles %
de V. cambio
Histona Nº residuos Pm Lys/Arg Modificación
evolutivo
Lys Arg
H1 213 21.000 27,7 1,4 19,78 Fosforilación 4
Fosforilación,
H2A 129 13.900 10,9 9,3 1,17 1
acetilación
Fosforilación,
H2B 125 13.774 15,2 6,1 2,49 1
acetilación
Acetilación,
H3 135 15.273 9,6 13,3 0,72 metilación 0,1
fosforilación
Acetilación,
H4 102 11.236 10,8 13,7 0,79 metilación 0,06
fosforilación
La velocidad del cambio evolutivo se mide como el número de cambios por cada 100
aminoácidos por cada 100 millones de años
Además de estas histonas, también existen otras que son específicas de tejido como es la
histona H5 muy rica en lisina (25 moles%) específica de eritrocitos nucleados de vertebrados
no mamíferos, y de las histonas del esperma.
Una de las características más destacables es su elevado conservadurismo evolutivo, sobre
todo de las histonas H3 y H4. La histona H4 de guisante y de timo de ternera se diferencian
solamente en dos aminoácidos. Esta dato, indica que las interacciones entre el ADN y las
histonas para formar la cromatina deben ser muy semejantes en todos los organismos
eucariontes.
Los genes para las histonas se encuentran agrupados en nichos (o clusters) que se repiten
decenas o centenas de veces (erizo de mar). Cada cluster o grupo contiene el siguiente orden
de los genes para histonas: H1-H2A-H3-H2B-H4. Los genes para las histonas son ricos en
pares G-C ya que codifican proteínas con elevado contenido en Lys y Arg, pero están
separados por secuencias espaciadoras ricas en pares A-T.
El nucleosoma
Un nucleosoma típico está asociado a 200 pares de bases (pb) y está formado por una médula
("core") y un ligador (o "linker"). La médula está formada por un octámero constituido por dos
subunidades de las siguientes histonas: H2A, H2B, H3 y H4. Se trata de un dímero de las
histonas (H2A, H2B, H3 y H4)2. Los trabajos de A. Klug y colaboradores (1980) sobre la
disposición de las histonas en la médula del nucleosoma le valieron el Premio Nobel de
Química en 1982.
Alrededor de la médula se enrolla el ADN (140 pb) dando casi dos vueltas (una vuelta y tres
cuartos). El resto del ADN (60 pb) forma parte del ligador ("linker") y está interaccionando con la
histona H1. La cantidad de ADN asociado con un nucleosoma varia de una especie a otra, de
154 pb a 241 pb, esta variación se debe fundamentalmente a la cantidad de ADN asociada al
ligador ("linker").
Las fibras de ADN dúplex desnudo tienen un grosor de 20 Å. La asociación del ADN con las
histonas genera los nucleosomas que muestran unos 100 Å de diámetro, a su vez los
nucleosomas se pueden enrollar helicoidalmente para formar un solenoide (una especie de
muelle) que constituye las fibras de cromatina de los núcleos intefásicos con un diámetro
aproximado de 300 Å. Los solenoides pueden volverse a enrollar para dar lugar a
supersolenoides con un diámetro de 4.000 Å a 6.000 Å que constituirían las fibras de los
cromosomas metafásicos.
Médula ("core") del Nucleosoma Formación del Solenoide (papel de la histona H1)
Las proteínas cromosómicas no histónicas son proteínas diferentes de las histonas que se
extraen de la cromatina de los núcleos con ClNa 0.35M (solución salina), tienen un alto
contenido en aminoácidos básicos (25% o más), alto contenido en aminoácidos ácidos (20-
30%), una elevada proporción de prolina (7%), bajo contenido en aminoácidos hidrofóbicos y
una alta movilidad electroforética. Las proteínas cromosómicas no histónicas que se extraen de
la cromatina de los núcleos varían mucho dependiendo de la técnica de aislamiento empleada.
Un grupo de estas proteínas cromosómicas no histónicas presentan alta movilidad
electrofóretica y se denominan abreviadamente HMG (grupo de alta movilidad). Se han
detectado más de 20 proteínas HMG, habiéndose encontrado las proteínas HMG-1, HMG-2 ,
HMG-14 y HMG-17 en todas las especies de mamíferos, aves y peces estudiadas hasta el
momento. Las proteínas HMG-1 y HMG-2 se encuentran sólo en el núcleo, están implicadas en
la replicación, se unen preferentemente a ADN de hélice sencilla, desenrollan el ADN dúplex y
se estima que existe una molécula de HMG-1 ó HMG-2 por cada 15 nucleosomas. Las
proteínas HMG-14 y HMG-17 se encuentran en el núcleo y en el citoplasma, están
relacionadas con la regulación de la transcripción y se estima que existe una molécula de
HMG14 ó HMG-17 por cada 10 nucleosomas.
Muchos estudios citogenéticos muestran que los cromosomas están claramente enrollados
cuando se observan al microscopio, un buen ejemplo de esta situación son los cromosomas de
los núcleos de algunos protozoos. El diámetro de las fibras de solenoides (enrollamiento
helicoidal de las fibras de nucleosomas) observadas en núcleos en interfase es de 30 nm, sin
embargo, el diámetro observado al microscopio para las fibras cromosómicas durante la división
celular es de 700 nm. Por tanto, se han tenido que producir nuevos superenrollamientos. ¿De
qué forma se producen estos nuevos niveles de compactación?.
La evidencia existente hasta el momento sugiere que las fibras de solenoides (30 nm) formarían
los lazos o dominios que emanan del armazón proteico y que este armazón estaría a su vez
enrollado formando una espiral.
Lazos en cromosomas sin extraer
Organización en Dominios y Armazón proteico
(Laemmli)
Los dominios de ADN parecen estar unidos al armazón proteico por unas regiones específicas
denominadas abreviadamente SARs (regiones de asociación específicas) que se detectan
cuando los cromosomas metafásicos desprovistos de histonas se tratan con endonucleasas de
restricción. Después de este tratamiento quedan regiones de ADN unidas al armazón que a su
vez resisten la digestión con exonucleasas gracias a que están protegidas por una proteína.
Cuando se digiere esta proteína, las regiones de ADN protegidas contienen secuencias que se
sabe que son especificas para la unión de topoisomerasas. Estas regiones regiones de unión
especificas de los dominios al armazón proteico son las regiones SARs.
El ARN, al igual que sucedía en el caso de la organización del nucleoide bacteriano, parece
jugar algún papel en el plegamiento del cromosoma eucariótico. Al menos en humanos y en
Drosophila se han encontrado evidencias de este papel estructural del ARN. Sin embargo, hay
que tener en cuenta que el armazón proteico descrito por Laemmli y colaboradores (1977) no
se ve afectado por el tratamiento con ARNasa. Podría ser que las propias proteínas del
armazón protegieran al ARN de la acción de la ARNasa. En cualquier caso, es conveniente
recordar que el ADN del cromosoma bacteriano también está organizado en dominios y que el
ARN podría jugar algún papel en el mantenimiento de dicha estructura. En organismos con
características intermedias entre las de procariontes y eucariontes como los dinoflagelados,
también existen existen datos que apoyan el papel estructural del ARN en la organización
cromosómica.
El valor C se defina como la cantidad de ADN por genoma haploide (un solo juego
cromosómico) en estado de un cromatidio (en fase G1). En el caso de la especie humana con
2n=46 cromosomas, especie diploide (2n), con dos juegos de cromosomas, uno recibido del
padre y otro de la madre, cada uno formado por 23 cromosomas, el valor C sería la cantidad
de ADN correspondiente a un juego de 23 cromosomas en estado de un solo cromatidio (en
fase G1 antes del periodo S de síntesis). Una forma mucho más sencilla de definir el valor C, en
el caso de las especies diploides, con dos juegos cromosómicos, sería el contenido de ADN de
un gameto de la especie. Un espermatozoide humano y un óvulo humano (gametos) contienen
23 cromosomas en estado de un cromatidio, el valor C sería la cantidad de ADN de los 23
cromatidios de un gameto humano.
Grupo
Especie Valor C (pb)
Taxonómico
Algas Pyrenomas salina 6,6 x 105
Mycoplasma Mycoplasma pneumoniae 1,0 x 106
Bacterias Escherichia coli 4,2 x 106
Levaduras Saccharonyces cerevisiae 1,3 x 107
Hongos D. discoideum 5,4 x 107
Nematodos Caenorhabditis elegans 8,0 x 107
Insectos Drosophila melanogaster 1,4 x 108
Aves Gallus domesticus 1,2 x 109
Anfibios Xenopus laevis 3,1 x 109
Mamíferos Homo sapiens 3,3 x 109
La paradoja del valor C surge cuando se compara la cantidad de ADN o tamaño del genoma
con las funciones para las que lleva información:
La cantidad de ADN de una especie eucarionte es mucho mayor que la esperada para codificar
enzimas o proteínas. En la especie humana se estima que existen 100.000 genes diferentes
que codifican proteínas, el tamaño medio de una proteína es de 500 aminoácidos (1.500 pares
de bases), por tanto necesitaríamos 1,5 x 108 pares de bases. La especie humana tiene 2,8
picogramos de ADN y cada picogramo equivale a 9,1 x 108 pares de bases (2,8 x 9,1 x 108
pares de bases = 25,48 x 108 pb). Por tanto, solamente alrededor de un 6% del ADN humano
estaría destinado a codificar proteínas. ¿Que función tendría el 94% restante?.
Hoy sabemos que los genes en eucariontes son mucho más largos que la secuencia necesaria
para codificar una proteína (existen intrones o zonas que no se traducen a aminoácidos). Por
tanto, disminuye la cantidad de ADN de función desconocida. Sin embargo, sigue existiendo
una enorme cantidad de ADN cuya función no estaría identificada.
Por otro lado, existen especies con una complejidad evolutiva semejante que presentan una
enorme variación en la cantidad de ADN. Recuerde el ejemplo de los anfibios, en los que la
cantidad de ADN varia entre 9 x 108 y 9 x 1010 pb. Es difícil creer que esta variación pueda
reflejar una diferencia de 100 veces en el número de genes necesarios para especificar dos
especies de anfibios. Por consiguiente necesitamos otro tipo de explicación. Una posible
explicación es como veremos la existencia de duplicaciones, genes que están en más de una
copia en el genoma de los individuos. Esto nos lleva a considerar la existencia de distintos tipos
de secuencias en el genoma de las especies eucarióticas.
EUCROMATINA Y HETEROCROMATINA
La cromatina o sustancia que compone los núcleos de las células y que resulta de la interacción
del ADN con las proteínas histónicas, no histónicas y ARN; puede presentar distintos grados de
empaquetamiento o contracción.
Cuando los cromosomas se tiñen con sustancias químicas que se unen al ADN aparecen
regiones densamente teñidas y regiones menos densamente teñidas.
La cromatina mayoritaria, la que constituye la mayor parte del núcleo recibe el nombre de
eucromatina y la minoritaria el de heterocromatina. La heterocromatina puede aparecer más
densamente teñida que la eucromatina (heteropicnosis positiva) o menos densamente teñida
que la eucromatina (heteropicnosis negativa). La aplicación de determinados tratamientos
experimentales en combinación con diferentes tipos de tinción de los cromosomas, puede
producir la aparición de zonas heterocromáticas en los cromosomas de muchas especies.
Diferencias citológicas: A nivel estructural, en los nucleos interfásicos, existe una mayor
grado de enrollamiento o empaquetamiento en la heterocromatina que en la eucromatina.
La forma en la que se mantiene esta diferencia aun no es conocida.
En la especie humana, todos los cromosomas X que están en exceso de uno aparecen más
intensamente teñido que el resto de los cromosomas (heteropicnosis positiva) en los núcleos de
células en interfase. Por tanto, las mujeres normales que tienen dos cromosomas X, tienen un
cromosoma X que aparece más intensamente teñido y que está inactivado. Sin embargo,
durante las primeras etapas del desarrollo embrionario (durante los 16 primeros días de
gestación en la especie humana) ambos cromosomas X son activos.
Forma: En metafase mitótica los cromosomas ya han pasado por un periodo de síntesis
de ADN y están constituidos por dos cromatidios o cromatidas idénticas en grosor y
longitud. Los cromosomas en estado de dos cromatidios han alcanzado su máximo grado
de contracción y están en el centro de la célula, en la placa ecuatorial. La forma de los
cromosomas viene determinada por la posición del centrómero o constricción primaria,
región por la que los cromatidios interaccionan con las fibras del huso acromático para
separarse a polos distintos. El centrómero aparece menos teñido que el resto del
cromosoma. La mayoría de los cromosoma de las especies eucarióticas tienen el
centrómero localizado en una región concreta.
Tamaño: Los cromosomas sufren grandes variaciones en su tamaño a lo largo del ciclo
celular, pasando de estar muy poco compactados (interfase) a estar muy compactados
(metafase), por tal motivo, los estudios sobre el tamaño suelen realizarse en metafase
mitótica. Además, es necesario tener en cuenta que los tratamientos para teñir los
cromosomas y para obtener las metafase mitóticas influyen de manera muy importante en
el tamaño de los cromosomas. En cualquier caso, en general es posible decir que hay
especies eucarióticas con cromosomas grandes y especies con cromosomas pequeños.
Las monocotiledóneas (vegetales) y los anfibios y ortópteros (animales) poseen
cromosomas muy largos (10 a 20 micras). Las dicotiledóneas, las algas, los hongos y la
mayoría de las especies animales poseen cromosomas pequeños (longitud inferior a 5
micras). Naturalmente, existen algunas excepciones en los ejemplos citados. El
cromosoma 1 humano tiene 0,235 pg de ADN, que equivalen a una longitud total de ADN
doble hélice 7,3 cm y en metafase mitótica presenta una longitud aproximada de 0,001
cm.
Número: Las células somáticas de la mayoría de las especies eucarióticas tienen dos
juegos de cromosomas, se trata de especies diploides, con un juego de cromosomas
materno y otro paterno. El número de cromosomas se denomina número diploide y se
representa como 2n. El número de cromosomas de un juego cromosómico y que se
corresponde con el número de cromosomas de un gameto de la especie se le denomina
número haploide y se representa como n. Todos los cromosomas de las células
somáticas aparecen por parejas de cromosomas homólogos (uno procedente del padre y
otro de la madre) existiendo por tanto n parejas de homólogos. Los dos cromosomas
homólogos tienen información para los mismos tipos de genes, aunque no poseen
idéntica secuencia de bases nitrogenadas, ya que en un posición determinada o locus
puede encontrase la información que determina el color azul de ojos mientras que en el
homólogo puede existir información para el color marrón. Sin embargo, los dos
cromatidios hermanos de un mismo cromosoma poseen exactamente la misma
información genética (la misma secuencia de bases nitrogenadas). El número de
cromosomas 2n varía mucho de unas especies a otras y no existe relación entre el
número de cromosomas, existen especies vegetales con pocos cromosomas como
Haplopappus gracilis (2n=4), Crepis capillaris (2n=6) y Secale cereale (2n=14) , especies
vegetales con bastantes cromosomas como Triticum aestivum (2n=42) y especies
vegetales con muchos cromosomas como Ophioglossum petiolatum (n >500). En
animales sucede algo semejante, hay especies con pocos cromosomas como la hormiga
australiana Myrmecia pilosula cuyos machos tienen un cromosoma (2N01) y las hembras
dos cromosomas (2n=2), especies con bastantes cromosomas como la humana Homo
sapiens (2n=46) y especies con muchos cromosomas como el lepidoptero Lysandra
atlantica (2n=434-466). No existe ninguna relación entre el número de cromosomas 2n y
la complejidad evolutiva, ni entre el número de cromosomas y la cantidad de ADN. Un
ejemplo claro de esta situación es el de los ciervos del género Muntiacus en el que hay
especies muy similares (denominadas especies gemelas) una con 2n=6 (M. muntjak) y
otra con 2n=46 (M. reevesi).
Tabla tomada del libro de Genética Moderna (F. J. Ayala y J. A. Kiger). Ed. Omega. 1984.
EL CARIOTIPO
El cariotipo de una especie se obtiene cuando a partir de varias células en metafase mitótica de
muchos individuos distintos de la especie se determina el número, forma y tamaño de los
cromosomas. En las especies diploides, como la especie humana, el número de cromosomas
normal (el más frecuente) es 2n=46, de manera que existen 22 pares de autosomas y un par
de cromosomas sexuales. Como se trata de una especie diploide, con dos juegos de
cromosomas (dos genomios), uno de origen materno (23 cromosomas) y otro de origen paterno
(23 cromosomas), todos los cromosomas están por parejas de homólogos.
Una vez fijado el número cromosómico normal, se procede a elegir la mejor célula disponible de
una metafase mitótica en la que todos los cromosomas estén bien definidos y separados.
Seguidamente se realiza una foto de dicha célula y después se recortan todos los cromosomas.
Una vez recortados todos los cromosomas, se ordenan por parejas con el brazo corto hacia
arriba, posteriormente se ordenan por tamaños (de mayor a menor) y dentro de un tamaño
semejante por la posición del centrómero ( de metacéntricos a submetacéntricos, acrocéntricos
y telocentricos). En el caso de existir cromosomas sexuales diferenciados, como sucede en la
especie humana, los cromosomas sexuales ( X e Y) pueden colocarse en el grupo que les
corresponde por tamaños o bien pueden colocarse formando el par sexual separados de los
autosomas (cromosomas no sexuales).
Cuando no existían las técnicas de bandeo cromosómico era muy difícil diferenciar unas
parejas cromosómicas de otras en algunas especies, ya que el único criterio para ordenarlos
era el tamaño y la posición relativa del centrómero (longitudes relativas de cada brazo).
Metafase mitótica de un varón sin bandear Metafase mitótica de un varón con bandas G
Sin embargo, con las técnicas de bandeo cromosómico que se desarrollaron posteriormente fue
mucho más fácil identificar los diferentes pares de cromosomas.
Caritipo: Ordenación de los cromosomas por parejas, tamaño y posición del centrómero.
Idiograma: Representación esquemática mediante un dibujo a escala, que incluya las bandas
e interbandas, del cariotipo de una especie.
Cromatidio: El cromatidio es una doble hélice de ADN lineal. Existen experimentos, realizados
en Vicia faba, en los que se demuestra que en la replicación el cromatidio se comporta como
una doble hélice de ADN (Taylor y col. 1957). Los cromosomas pueden estar en estado de un
solo cromatidio (período G1, anafase y telofase) o bien en estado de dos cromatidos después
de haber pasado por el preíodo de Síntesis (S) como sucede en el periodo G2, profase y
metafase.
Telómero: Son los extremos de los brazos cromosómicos y tienen una estructura especial
(formación de ADN cuadruplexo) que protege al cromosoma de su degradación por los
extremos y que además permite la replicación de los extremos cromosómicos mediante la
actuación de encimas específicas como las telomerasas. Los telómeros poseen extremos 3'
monocatenarios (de una sola hélice) constituidos por una secuencia corta rica en Guanina que
está repetida en tándem cientos de veces. En la siguiente tabla se indican algunas secuencias
teloméricas encontradas en humanos, protozoos, algas y vegetales:
Centrómero: Zona por la que el cromosoma interacciona con las fibras del huso acromático en
las anafases mitóticas y meióticas y que es responsable de los movimientos cromosómicos que
tienen lugar durante estas fases. Las estructuras centroméricas que interaccionan con las fibras
del huso se denominan cinetocoros. En la estructura del centrómero también intervienen
proteínas centróméricas. Es la constricción primaria y aparece menos teñida que el resto del
cromosoma. Los análisis llevados a cabo en Saccharomyces cerevisiae (levadura) han
permitido aislar el ADN centromérico (ADN CEN) de todos sus cromosomas, habiéndose
encontrado que en todos los centrómeros estudiados existen tres regiones muy conservadas,
en la siguiente tabla se indican dichas regiones:
Los virus y las bacterias presentan secuencias que en su inmensa mayoría están una sola vez
en el genoma. Las bacterias poseen algunos genes que están repetidos muy pocas veces,
entre 5 y 10, como los genes que llevan información para el ARN ribosómico (ARN-r).
Los distintos tipos de secuencias que se observan en el ADN de organismos eucarióticos son
los siguientes:
Genes o secuencias de copia única. En general, la mayor parte de los genes que
codifican para polipéptidos, los llamados genes estructurales, se encuentran en una sola
copia en el genoma.
- ADN-r: los genes que llevan información para el ARN-r , que se encuentran
localizados en una zona concreta de los cromosomas que es el Organizador
nucleolar (NOR). Esta zona aparece menos teñida que el resto del cromosoma
(heteropicnosis negativa). En D. melanogaster existen unas 130 copias de estos
genes, en Xenopus laevis alrededor de 400 a 500 copias por genoma haploide. En
algunos organismos como Neurospora crassa se encuentran dispersos por el
genoma en vez de en tándem.
- ADN-5S: los genes que codifican para el ARN-5S que forma parte de la subunidad
grande de los ribosomas. En D. melanogaster existen 200 copias, en Xenopus laevis
25.000 y en la especie humana 2.000.
- ADN-h: genes para las histonas: aparecen en familias o “cluster” que incluyen los
cinco genes (H1, H2A, H2B, H3 y H4) y que están repetidas decenas de veces
(Xenopus laevis) o centenas de veces (erizo de mar).
- ADN-a: genes para anticuerpos o inmunoglobulinas. La región variable de los
anticuerpos o inmunoglobulinas (500 secuencias no idénticas entre si).
También existen secuencias de ADN que se han originado por duplicación de otras
existentes, que derivan de familias multigénicas en tándem (genes de histonas o genes
para ARN-r) y que se encuentran aislados (separados de su familia) y dispersos por el
genoma. Este tipo de secuencias recibe el nombre de Orfones.
Telómeros: secuencias repetidas con función conocida pero que no codifican para ningún
ARN o proteína. Los extremos de los cromosomas o telómeros tienen una secuencia de
ADN repetida en tándem. Esta secuencia en el caso del ciliado Tetrahymena es TTGGGG
y en humanos es TTAGGG. Esta secuencia este repetida varias veces en el extremo de
los cromosomas (telómero) y tiene la propiedad de aparearse consigo misma formando
enlaces de hidrógeno entre guaninas (situación inusual). Este autoapareamiento
suministra un extremo 3’ libre que permite la replicación de los extremos de las moléculas
de ADN doble hélice lineal.
Los organismos eucariontes además de poseer ADN en el núcleo, también tienen ADN en
orgánulos citoplásmicos. Las especies vegetales contienen en el citoplasma de sus células
cloroplastos y mitocondrias, mientras que las células de especies animales contienen
mitocondrias en su citoplasma. Al igual que el ADN nuclear está organizado en cromosomas,
también el ADN de los orgánulos citoplásmicos está organizado en cromosomas.
ADN Mitocondrial: El ADN mitocondrial (ADNmt) es una molécula doble hélice circular cuyo
tamaño varía de unas especies a otras. El tamaño del ADN miotocondrial es las especies
animales es inferior al de las especies vegetales y oscila entre 15 y 18 Kpb. En los hongos
oscila entre 18 y 78 Kpb y en las plantas varía entre 250 y 2.500 Kpb. El ADNmt humano tienen
16.800 pb.
Cloroplasto
Los cloroplastos presentan regiones que se tiñen intensamente con colorantes de ADN, dichas
regiones se denominan nucleoides. El número de cloroplastos varía de unas células a otras
dentro de la misma especie y de unas especies a otras. Las células de hojas de la remolacha
contienen en su citoplasma alrededor de 40 cloroplastos, cada cloroplasto posee entre 14 y
18nucleoides y cada nucleoide puede estar constituido por 4 a 8 moléculas de DNcp. Por tanto,
una célula de remolacha puede llegar a contener 40 x 18 x 8 = 5760 moléculas de ADNcp doble
hélice circular. En maíz se estime que existen entre 20 y 40 móleculas de ADNcp doble hélice
circular por cada cloroplasto.
En Chlamydomonas reindardii existe un solo cloroplasto por célula que contiene entre 500 y
1500 móleculas de ADNcp doble hélice circular empaquetadas en varios nucleoides.
Transcripción.
Iniciación de la transcripción.
Elongación de la transcripción.
Terminación de la transcripción.
Procesamiento alternativo.
Autoprocesamiento.
Teniendo en cuenta que en las células eucariontes los cromosomas (material genético
organizado) se encuentran en el núcleo y que la información que contienen los cromosomas
(los genes) se expresa en el citoplasma, se supuso que tendría que haber alguna molécula
intermediaria en el flujo de la información desde el ADN a las proteínas. Jacob y Monod en
1961 propusieron la Hipótesis del mensajero: "debe existir una molécula que transporte la
información fielmente desde el ADN hasta las proteínas". En ese mismo año Brenner y
colaboradores (1961) demostraron la existencia del este intermediario que resultó ser una
molécula de ácido ribonucleico que se denominó ARN mensajero (ARN-m). Posteriormente, el
ARN-m tenía que ser traducido a proteína.
Este esquema central de flujo de la información pronto fue modificado, ya que en algunos virus
cuyo material hereditario es ARN, la información se conserva o mantiene mediante replicación
del ARN. Además, también se comprobó que la información no va siempre del ADN hacia el
ARN (ADN→ARN), en algunos casos la información puede fluir del ARN hacia el ADN
(ARN→ADN), es decir sintetizar ADN tomando como molde ARN , teniendo lugar el fenómeno
de la transcripción inversa. H. Temin recibió el Premio Nobel en 1975 por sus descubrimientos
en relación con la interacción entre los virus tumorales y el material genético en la célula, en
particular por el descubrimiento de la transcripción inversa en virus ARN-ADN.
Por tal causa, en una ciencia como la Genética no debería emplearse la palabra "dogma" ya
que como acabamos de ver en muy poco tiempo el fundamento central de la Biología Molecular
propuesto por Crick tuvo que ser modificado.
TRANSCRIPCIÓN
La transcripción consiste en la síntesis de ARN tomando como molde ADN y significa el paso
de la información contenida en el ADN hacia el ARN. La transferencia de la información del
ADN hacia el ARN se realiza siguiendo las reglas de complementaridad de las bases
nitrogenadas y es semejante al proceso de transcripción de textos, motivo por el que ha
recibido este nombre. El ARN producto de la transcripción recibe el nombre de transcrito.
Volkin y Astrachan (1957) demostraron que después de la infección de E. coli por el fago T2
aumenta la síntesis de ARN y que este ARN inducido por la infección de T2 tiene una vida
media muy corta. Infectaron bacterias con el fago T2 en un medio que contenía uridina tritiada,
base nitrogenada específica del ARN (pulso), y después las pasaron a un medio con uridina
normal no marcada (caza). El ARN recuperado después del pulso estaba marcado, pero el
obtenido después de la caza no lo estaba, lo que indicaba que el ARN tenía una vida media
muy corta. Por último cuando se comparó el porcentaje de los diferentes tipos de nucleótidos
del ARN sintetizado inmediatamente después de la infección por T2 y del ADN del fago, se
observó que era muy parecido, sugiriendo este resultado que el ARN sintetizado después de la
infección por T2 procedía del ADN del fago.
LAS ARN POLIMERASAS Y LOS DISTINTOS TIPOS DE ARN
El ARN suele tener una sola hélice o cadena de nucleótidos pudiendo formar una amplia gama
estructuras tridimensionales diferentes. El ARN contiene como azúcar a la ribosa y las bases
nitrogenadas mayoritarias que posee son adenina (A), guanina (G), citosina (C) y uracilo (U).
Por tanto, el uracilo (U) es característico del ARN. También se han encontrado bases poco
frecuentes que forman parte del ARN, como son: la pseudouridina (ψ), metilguanosina (mG),
dimetilguanosina (m2G), metilinosina (mI) y dihidrouridina (DHU, UH2).
En las células existen diferentes tipos de ARN. Por un lado están los ARN funcionales, o ARN
que tienen una función o actividad en la célula y que no se traducen a proteína. Dentro de esta
categoría están el ARN ribosómico (ARN-r) que forma parte de los ribosomas que intervienen
en la traducción, los ARN transferentes (ARN-t) cuya función es transportar a los aminoácidos
durante el proceso de traducción, los ARN nucleares pequeños (ARN-np) que interaccionan con
proteínas formando los complejos de ribonucleoproteínas necesarios para el procesamiento de
los transcritos en el núcleo y los ARN citoplásmicos pequeños (ARNcp) que intervienen en el
trasporte de los polipéptidos en las células eucarióticas.
Por otro lado, están los ARN informativos que son los que se van a traducir a proteínas. Estos
ARN informativos son los ARN mensajeros (ARN-m). En bacterias el transcrito primario, tal y
como se sintetiza ya es el ARN-m maduro que se traduce a proteínas. En eucariontes, el ARN
recién transcrito se denomina ARN heterogéneo nuclear (ARN-hn) y es un pre-ARN-m que es
procesado antes de convertirse en el ARN-m maduro que posteriormente se traducirá a
proteína.
En bacterias, existe solamente una ARN polimerasa que es capaz de sintetizar todos los tipos
de ARN, el ribosómico, el transferente y los mensajeros. La ARN polimerasa de E. coli está
formada por varios polipéptidos, el núcleo central del enzima tiene dos cadenas de tipo α (peso
molecular de 40.000), una β (peso molecular de 155.000) otra β' (peso molecular de 165.000).
Además, la enzima completa u holoenzima tiene la subunidad σ o factor σ (peso molecular de
95.000)que es necesario para iniciar la transcripción. La subunidad σ una vez inciada la
transcripción se libera y el núcleo central prosigue con la elongación del ARN.
En bacterias, con mucha frecuencia, los ARN-m son poligénicos o policistrónicos, de manera
que un solo ARN-m contiene información para la síntesis de varios polipéptidos distintos.
Habitualmente se trata de genes que comparten un sistema común que controla su expresión
(operón).
Sin embargo, en eucariontes hay diferentes polimerasas encargadas de sintetizar distintos tipos
de ARN.
La ARN polimerasa III transcribe los precursores de los ARN transferentes (ARN-t), los
ARN nucleares y citoplásmicos de pequeño tamaño y los genes para el ARN 5S que
forma parte de la subunidad grande de los ribosomas.
Las ARN polimerasas eucarióticas son bastante más complejas que las de E. coli, poseen
subunidades semejantes o correspondientes a las de E. coli y otras que no lo son.
Las ARN polimerasas o trasncriptasas, a diferencia de lo que ocurre con las ADN polimerasas,
carecen de función "correctora de pruebas". Esta diferencia se debe en primer lugar a que los
transcritos son cortos y la probabilidad de que uno de los ARN posea una alteración es baja, y
en segundo lugar a que la vida media de los ARN es corta y pronto se vuelve a sintetizar otro
ARN nuevo. Por consiguiente el que exista un ARN con una alteración no es grave ya que
durará poco y será remplazado pronto por otro nuevo sin la alteración. Sin embargo, un error en
la replicación del ADN puede transmitirse a todas las células que deriven por división de la
célula afectada.
Otra manera de comprobar que existe complementaridad entre el ADN y el ARN es realizar
experimentos de hibridación, de manera que el ADN se desnaturaliza y se mezcla con el ARN
que se sintetiza en su presencia, cuando se lleva a cabo la renaturalización (mediante un
enfriamiento lento), se producen híbridos ADN-ARN. Las moléculas híbridas ADN-ARN se
pueden distinguir mediante centrifugación en gradiente de CsCl ya que presentan una densidad
diferente a la de las dobles hélices ADN-ADN. La aparcición de moléculas híbridas ADN-ARN
solo es posible si existen segmentos largos de complementarios, por tanto estos resultados
indican que el transcrito es complementario del ADN parental.
Por ejemplo, Marmur y Greenspan (1963) comprobaron que en el fago SP8 que infecta a
Bacillus subtilis, las dos hélices de su ADN se pueden separar mediante desnaturalización,
enfriamiento rápido para mantenerlas separadas y posterior centrifugación en gradiente de
densidad de CsCl. Por consiguiente, este virus posee una hélice ligera (L) y otra hélice pesada
(H) con distinta relación de purinas/pirimidinas. Si se renaturaliza (enfriamiento lento) el ARN
sintetizado después de la infección de B. subtillis por el virus y se hibrida por separado con el
ADN de la hélice L y con el ADN de la hélice H, se puede comprobar que el ARN solamente
híbrida con el ADN de la hélice H. Por tanto, en el virus SP8 todos los genes se transcriben
utilizando como molde (hélice codificadora) la hélice H. La transcripción es asimétrica.
Hayashi y col. (1963) demostraron que el fago ØX174 cuyo material hereditario es ADN circular
de una hélice, denominada hélice (+), cuando infecta a E. coli, pasa por una forma replicativa
de doble hélice, la nueva hélice de ADN sintetizada después de la infección se la llama hélice (-
). La hélice (-) sirve de molde durante las últimas etapas de la infección para producir mediante
una replicación asimétrica nuevas hélices (+) del ADN del virus que se introducirán en el interior
de las cápsides ya formadas. A su vez, comprobaron que el ARN que se sintetiza
inmediatamente después de infectar a E. coli, solamente hibrida con el ADN de la hélice (-). Por
consiguiente, todos los genes de este virus se transcriben utilizando como molde (hélice
codificadora) la hélice (-). La transcripción es asimétrica.
En los organismos eucariontes, para cada gen solamente se transcribe un hebra de ADN (la
codificadora), de forma que genes distintos del mismo cromosoma pueden utilizar como
codificadora una hélice diferente a la de otros genes.
INICIACIÓN DE LA TRANSCRIPCIÓN
El inicio de la transcripción necesita que el factor σ esté unido al núcleo central de la ARN
polimerasa. Existen unas secuencias de ADN específicas y necesarias para que la holoenzima
reconozca el lugar de comienzo de la transcripción, dichas secuencias específicas se
denominan secuencias promotoras. Pribnow (1975) aisló y secuenció las regiones de ADN que
quedaban protegidas por la ARN polimerasa después de someterlas a digestión con ADNasa
pancreática. Siguiendo este método se secuenciaron los primeros promotores de fagos como el
T7 y l, y del promotor del operón lactosa. Pribnow observó una secuencia de unos 7 pares de
bases que se encontraba 10 bases antes de la primera que se transcribe y que aparecía en la
mayoría de los fragmentos protegidos por la ARN polimerasa. Esta secuencia se la denominó
Caja de Pribnow y es: 5' TATPuATPu 3'.
Cuando se analizan las secuencias de las regiones anteriores a la primera base que se
transcribe aparecen dos regiones cortas que muestran un parecido o similitud bastante grande,
la primera región se encuentra 10 bases antes de la primera que se transcribe (Caja de
Pribnow) y la segunda se localiza 35 bases antes. El estudio de muchas regiones promotoras
de diferentes genes permite determinar las secuencias que aparecen con mayor frecuencia y
establecer lo que se denomina las secuencias promotoras consenso o ideales.
Los resultados obtenidos en E. coli después de analizar 100 regiones promotoras son los
siguientes:
Factores que actúan aguas arriba: reconocen secuencias consenso cortas situadas
antes del punto de iniciación cuya actividad no está regulada, de manera que se unen a
cualquier promotor que contenga estas secuencias.
Los promotores que tienen secuencias que solamente son reconocidas por factores basales y
factores que actúan aguas arriba, corresponden a genes que se expresan de manera
constitutiva (se expresan siempre) en todos los tejidos. Se trata de los genes encargados del
metabolismo básico de la célula involucrados en el buen funcionamiento celular. A estos genes
se les ha denominado genes ("Housekeeping genes"), es decir, los genes que guardan o
mantienen la casa.
Los promotores de la ARN pol I (transcribe los precursores del ARN ribosómico) tienen dos
secuencias ricas en pares GC y que muestran una homología del 85%, una secuencia de 65 pb
denominada núcleo que incluye la primera base que se transcribe (de -45 a +20) y una segunda
secuencia unos 70 pb antes (aguas arriba) que actúa como elemento de control y que va desde
la posición -107 a la -180.
Los promotores de la ARN pol III (transcriben ARN-t, ARN-5S y ARN de tamaño pequeño)
contienen secuencias de reconocimiento situadas después de la primera base que se transcribe
(aguas abajo), a este tipo de promotores se les denomina promotores internos (están dentro del
gen). Se han encontrado en los promotores de ARN-t y ARN-5S pero no se han descrito en
ARN de tamaño pequeño.
Los promotores de la ARN pol II son más variables que los de las ARN pol I y pol III pero a
pesar de esta variación tienen una estructura general bastante conservada, de manera que se
han reconocido al menos tres secuencias canónicas o consenso situadas en las regiones -25
(caja TATA, con la secuencia TATAAAA), -75 (caja CAAT con la secuencia GGCCAATCT) y
-90 (caja GC con la secuencia GGGCGG). La caja TATA es equivalente a la caja de Pribnow de
los promotores de bacterias y se la denomina caja de Hogness.
El punto de iniciación de la transcripción en eucariontes suele ser una adenina flanqueada por
pirimidinas, aceptándose la existencia de una región iniciadora (Inr) con el siguiente tipo de
secuencia: Pir-Pir-C-A-Pir-Pir-Pir-Pir-Pir.
ELONGACIÓN DE LA TRANSCRIPCIÓN
La elongación de la transcripción no necesita del factor σ, una vez iniciada la trasncripción el
factor sigma se suelta y el núcleo central de la ARN polimerasa comienza a sinterizar el ARN
en la dirección 5' P → 3'OH a partir de ribonucleósidos trifosfato libres que sirven de sustrato al
enzima. Parece ser que se van produciendo desenrollamientos parciales del ADN de la región
que se está transcribiendo y que la velocidad de transcripción en E. coli a 37º C es de 2500
ribonucleótidos por minuto (aproximadamente 42 ribonucleótidos por segundo).
TERMINACIÓN DE LA TRANSCRIPCIÓN
La terminación de la transcripción en E. coli puede tener lugar por dos mecanismos distintos:
Terminación dependiente de la actuación del factor proteico rho (ρ) que es un hexámero
formado por 6 subunidades. Los ARN que presentan señales de terminación
dependientes de rho (ρ) no suelen presentar el lazo en horquilla seguido de uracilos. Par
que se produzca la terminación de la transcripción, el factor rho (ρ) reconocería una
secuencia específica del ARN denominada sitio rut y se uniría a ella para posteriormente
tirar del ARN y soltarlo de la ARN polimerasa. Las secuencias rut suelen estar un poco
antes (aguas arriba) del lugar en el que la ARN polimerasa termina la transcripción.
El ARN precursor del ARN transferente de bacterias tiene una región "líder" por el extremo 5' y
una "trailer" por el extremo 3' que desaparecen durante el procesamiento gracias a la acción de
la ARNasa P y de la ARNasa Q. A veces se encuentra la información para dos ARN-t distintos
en el mismo ARN precursor, existiendo entre ambos una región espaciadora que se transcribe,
de forma que la estructura del ARN precurso es la siguiente: 5' Líder - ARN-t1 - Espaciador
transcrito - ARN-t2 - Trailer 3'. Posteriormente, la ARNasa P y la ARNasa Q cortan el precursor
liberando los dos ARN transferentes.
Los genes para el ARN ribosómico en eucariontes se encuentran repetidos en tandem del
orden de cien veces en la región del organizador nucleolar (NOR). En el caso de la especie
humana existen varios cromosomas con regiones organizadoras nucleolares, en particular,
cinco pares de cromosomas, los pares 13, 14, 15, 21 y 22. En cada región NOR cada gen ADN-
r tiene un promotor y un terminador y está separado del siguiente por una región espaciadora
que no se transcribe. El ARN precursor (recién transcrito) del ARN ribosómico tiene un
coeficiente de sedimentación 45S y su estructura es la siguiente: 5' Líder- precursor del ARN
18S - Espaciador trasncrito - precursor del ARN 5,8S - Espaciador transcrito - precursor del
ARN 28S 3'. Posteriormente, diferentes ARNasas y endonuclesas producen cortes en el ARN
45S que dan lugar al ARN 18S de la subunidad pequeña de los ribosomas y a los ARN 28S y
5,8S que forman parte de la subunidad grande de los ribosomas. Los genes para el ARN 5S de
eucariontes se localizan en otra región diferente de los cromosomas eucarióticos.
Adición de una caperuza o protección por el extremo 5'P del ARN-hn que entre otras
cosas lo protege de su degradación por dicho extremo. Esta caperuza ("capping" o
abreviadamente tapón o "cap") consiste en la adición de un residuo de 7-metilguanosina
mediante el establecimiento de un enlace trifosfato. Existen tres tipos de caperuzas, cap0
solamente está metilada la primera base (la guanina), cap1 está metilada también la
segunda base (es el tipo más frecuente de caperuza) y cap2 en el que también está
metilada la tercera base. Otra posible función de la caperuza del extremo 5'P es la
suministrar una estructura que sea reconocible por el ribosoma para iniciar la traducción.
Adición por el extremo 3'OH de una cola de Poli-A, esta cola de poli-A consiste en la
adición de 150 a 200 residuos de adenina por el extremo 3'OH. En primer lugar una
endonucleasa corta el ARN y después una Poli A polimerasa añade la cola de Poli A. La
longitud de la cola de Poli A varia en eucariontes, es de 150 a 200 nucleótidos en células
de mamíferos, y de 50 a 60 residuos en levaduras. Los ARN de histonas no tienen
poliadenilación por el extremo 3'OH, sufren un procesamiento diferentes por ese extremo.
La función de la cola de Poli A se cree que puede servir para evitar la degradación por del
ARN pos ese extremo e intervenir en el transporte del ARN hacia el citoplasma.
En adenovirus se demostró por P. A. Sharp y R. J. Roberts (1977) que el ARN-m y el ADN del
gen correspondiente no coincidían con exactitud al hibridar, de manera que aparecían lazos de
ADN monocatenarios. Por tanto, había segmentos del ADN del gen que no estaban
representados en el ARN-m maduro. Por consiguiente, los genes estaban fragmentados o en
piezas. Por sus trabajos Sharp y Roberts recibieron el Premio Nobel en 1993. Posteriormente,
se comprobó la estructura en Intrones y Exones (genes fragmentados) de los genes
eucarióticos. La primera evidencia se obtuvo con los genes de la β-globina de conejo y de la
ovoalbúmina de gallina. Los genes de la β-globina de conejo y ratón tienen tres exones y dos
intrones, mientras que el de la ovoalbumina de gallina tiene 7 intrones y 7 exones.
Los resultados obtenidos indicaban que hay una zona del ARN-m maduro que no hibrida con el
ADN del gen de la β-globina ya que en el centro se observa la aparición de un lazo de ADN
doble hélice y a ambos lados la existencia de dos lazos R. Sin embargo, el ARN-hn (recién
transcrito) hibrida en toda su longitud con el ADN del gen de la β-globina sin que aparezcan en
el centro zonas o lazos de ADN doble hélice. Por tanto, parece que la diferencia existente en el
tamaño del ARN-hn y del ARN-m se debe a que existiría un procesamiento que eliminaría una
parte del centro del ARN-hn. Estas regiones del ADN del gen de la β-globina que no se
traducen en aminoácidos en la proteína recibieron el nombre de Intrones y aquellas que sí se
traducen en aminoácidos son los Exones. En el siguiente esquema se da una interpretación a
los resultados obtenidos cuando se hibrida el ARN-m con el ADN del gen de la β-globina.
En el gen del factor VIII de coagulación humano el tamaño de los exones varía entre 69 y 3106
pb y posee intrones de hasta 32.400 pb. El número de intrones y exones y su tamaño es muy
variable de unos genes a otros dentro de la misma especie. El número de genes que poseen un
solo intrón varía mucho de unas especies a otras, en Levadura (Saccharomyces cerevisiae) es
el 95%, en D. melanogaster el 17% y en mamíferos el 6%.
También se han detectado intrones en los genes que codifican para el ARN-r, por ejemplo en el
ARN 28S en D. melanogaster . Igualmente, en ARN-t de Tyr en levadura se ha detectado un
intrón de 14 bases justo antes del extremo 3' del triplete del anticodón. Posteriormente se han
detectado intrones en posiciones semejantes en otros ARN-t (ser, phe, leu, etc).
La eliminación de los intrones se lleva a cabo mediante un mecanismo de corte en las regiones
de paso de exón a intrón y de intrón a exón para eliminar los intrones y de unión posterior de
los exones sucesivos. Este mecanismo de corte y unión ha recibido el nombre de "splicing" en
inglés. Cuando se analizan las secuencias de las regiones de paso de intrón a exón y de exón a
intrón se encuentra unas secuencias bastante conservadas, en casi todos los casos aparece la
secuencia GU en el punto de corte 5' del intrón y AG en el punto de corte 3'. Estas secuencias
son reconocidas por moléculas de ARN nucleares pequeñas (ARNnp) que interaccionan con
proteínas formando partículas ribonucleoproteicas pequeñas que constituyen lo que se ha
denominado el "espliceosoma".
PROCESAMIENTO ALTERNATIVO
También se ha observado que en diferentes tejidos de un mismo individuo o en el mismo tejido
en diferentes momentos del desarrollo se pueden producir procesamientos distintos del mismo
ARNhn, como consecuencia en cada tejido o momento del desarrollo se produce un ARN-m
maduro diferente que da lugar a una polipéptido distinto. Un ejemplo de procesamiento
alternativo es lo que sucede en el tiroides y en el hipotálamo en los que el mismo ARNhn da
lugar con procesamientos diferentes al péptido de calcitonina en el tiroides y al péptido CGRP
en el hipotálamo. Otro ejemplo de procesamiento alternativo es el caso del transcrito primario
del gen de la α-tropomiosina en músculo estriado, músculo liso, cerebro y fibroblasto. En los
dos ejemplos citados de procesamiento alternativo se mantiene el orden relativo de los exones.
AUTOPROCESAMIENTO
Existen muchos ejemplos de moléculas de ARN que pueden realizar el autoprocesmiento de
sus intrones sin necesidad de la ayuda de proteínas. Estas moléculas de ARN que pueden
actuar como una enzima con propiedades catalíticas se han denominado ribozimas. Esta
capacidad de autoprocesamiento de algunos moléculas de ARN fue descubierta por Cech y
colaboradores en 1981 estudiando el ARN 35S precursor del ARN-r 26S de Tetrahymena
thermophila (ciliado). La molécula del ARN-r 26S contiene un intrón de 400 bases que se
autoprocesa. T. Cech recibió en 1989 el Premio Nobel por el descubrimientos de los ARN con
propiedades catalíticas.
Autoprocesamiento de un intrón T. Cech
Existen dos tipos de intrones que se autoprocesan, los del grupo I en los que el producto de
eliminación del intrón es una molécula lineal y los del grupo II en los que el producto de
eliminación del intrón es una molécula en forma de lazo. En el grupo I se encuentran los
transcritos primarios de algunos virus que infectan a E. coli, los transcritos primarios de
Tetrahymena, en mitocondrias y cloroplastos, y en algunos ARN-t primarios de bacterias. En el
grupo II se encuentran algunos ARN-t primarios y algunos transcritos primarios de mitocondrias
y cloroplastos.