LA TRIADA GENÓMICA: 2ª PARTE: EL PROYECTO GENOMA HUMANO Y ENCODE
JOSÉ MIGUEL PARRA MD
Aunque ideas sobre genética se conocen desde Aristóteles, el verdadero concepto es relativamente reciente, los primeros que dieron algunos visos de realidad fueron Lamarck hacia 1800 con su idea de la herencia de los caracteres adquiridos y Mendel con su teoría de caracteres dominantes y caracteres recesivos que muchos años más adelante se llamarían genes recesivos y dominantes, aparecida en 1866 en una revista científica de un pequeño pueblo Checo, allí se quedó olvidada durante 34 años.
En 1882 Walther Flemming, el investigador alemán de la estructura celular, comenzó a utilizar los recién descubiertos tintes de anilina para teñir los núcleos de las células y descubrió que teñían una estructura en forma de cinta en el interior del núcleo por lo que la llamó cromatina, años después se descubrió que la cromatina está formada por lo que ahora llamamos cromosomas (derivados de ese nombre), quienes a su vez contienen ADN. En 1870 Oskar Hertwig, estudiando los erizos de mar descubrió que el espermatozoide penetraba en el ovulo y los 2 núcleos se fundían corroborado por el Belga Beneden quien estudiaba una lombriz Ascaris con 4 grandes cromosomas, descubriendo que el número de cromosomas se mantenía igual o sea que al producirse el espermatozoide y el ovulo quedaban con la mitad de los cromosomas y al unirse se completaba el número de cromosomas, proceso que llamó meiosis (del griego disminuir). Igualmente descubrió que el número de cromosomas era igual en cada especie. De lo que había en el interior lo descubrió Avery en el Rockefeller center y le dio el nombre de ácido desoxirribonucleico (ADN). El químico Ruso Lervene encontró que constaba de 4 bases: Adenina timina, guanina y citosina que se agrupaban a lo largo de una estructura que las mantenía unidas pero no se sabía cómo era esa estructura.
Luego de desaciertos, plagios y fracasos finalmente Watson y Crick pudieron descifrar la estructura del ADN que publicaron en Nature en abril de 1953 y que les valió el premio nobel de Medicina de 1962, era una doble cadena y dio nacimiento a la biología molecular. Separada la pareja, Crick se quedó en Cambridge y siguió trabajando especialmente investigando en la replicación del DNA, luego de varios años se dirigió a San Diego escribió un libro fantasioso en el que plantea que la vida fue traída a la tierra por extraterrestres.
Por su parte Watson regresó a EE. UU., donde ocupó un buen puesto en Harvard para continuar el estudio del DNA escribió un par de libros autobiográficos sobre su descubrimiento. Una vez descubierta la estructura del DNA, aparentemente quedaría fácil definir el genoma humano, o sea identificar los 100.00 genes que se suponía tenía el ser humano así que encargaron en 1988 a Watson de ese proyecto quien al poco tiempo lo abandonó.
El verdadero proyecto de secuenciación del genoma humano se inició en 1990, constituyéndose en el mayor proyecto de investigación biomédica de la historia. Con un presupuesto inicial de 3 mil millones de dólares y la participación de un Consorcio Público Internacional, formado por EEUU, Reino Unido, Japón, Francia, Alemania, China y otros países, tenía como objetivo último la consecución de la secuencia completa del genoma humano, es decir, el texto lineal constituido por la secuencia de las cuatros bases químicas del ADN que contiene las instrucciones para construir un ser humano., el proyecto se dio por concluido en el 2003, dos años antes de lo previsto. Otros objetivos del proyecto eran la secuenciación de genomas de otros organismos modelos de los que había un amplio conocimiento previo, como la bacteria Escherichia coli, la levadura Saccaromyces cerevisiae, el gusano Caenorhabditis elegans, o la mosca del vinagre Drosophila melanogaster. También tuvo un papel destacado el estudio de las implicaciones éticas, legales y sociales que se derivarían de los resultados del proyecto, puesto que algunos investigadores diversificaron este descubrimiento como la clonación de animales e incluso a la de seres humanos o la de alimentos transgénicos. Ocho años después del inicio del proyecto público apareció en escena una empresa privada, Celera genomics, presidida por el brillante y revolucionario científico Craig J. Venter, que lanzó el reto de conseguir la secuencia humana en un tiempo récord, antes del previsto por el Consorcio Público. Proponía una estrategia de secuenciación alternativa a la secuenciación jerárquica que seguía el Consorcio, la secuenciación aleatoria (shotgun), con la que ya se había conseguido secuenciar el primer genoma celular en 1995, el de la bacteria Haemophilus influenzae. Empieza a partir de ese momento una carrera apasionante por la conquista del genoma humano, que acabaría finalmente en tablas. El 26 de junio de 2000, en un acto auspiciado por el presidente Bill Clinton y que tuvo como escenario la Casa Blanca, se encontraron los dos máximos representantes de las partes en competición, Craig Venter por Celera, y el director del Consorcio Público, Francis Collins. Se anunció de forma conjunta la consecución de dos borradores de la secuencia completa del genoma humano. Las publicaciones correspondientes de ambas secuencias no aparecieron hasta febrero de 2001. El Consorcio Público publicó su secuencia en la revista Nature, mientras que Celera lo hizo en Science. Tres años después, en 2004, el Consorcio publica la versión final o completa del genoma humano.
Pero esto apenas fue el inicio para descifrar el código genético. Para empezar, se encontraron 30.000 genes no los 100.000 que se suponían y lo tienen todas las células del cuerpo, la diferenciación y especialización de cada una de ellas obedece a una serie de mecanismos de inhibición y estimulación que permiten su crecimiento de las células.
El objetivo del Proyecto Genoma Humano era determinar todos nuestros genes (las regiones del ADN humano que codifican proteínas) con objeto de utilizar dicha información en la prevención y tratamiento de enfermedades. Una vez terminado el estudio se supo que dicho objetivo era muy optimista y que muy pocas enfermedades tienen como único origen en mutaciones de los genes, Cuál fue la sorpresa para todos cuando se percataron de que en realidad no habían hecho nada más que rasgar la punta del iceberg. No solo la solución no estaba en los genes, sino que el compendio de mecanismos que llevan asociados para regular su expresión se presentaba casi inexpugnable. El estudio del genoma de miles de personas con diferentes enfermedades permitió determinar miles de loci asociados con enfermedades humanas, pero la mayoría aumentan muy poco la probabilidad de padecer dicha enfermedad, por lo que su valor diagnóstico es muy limitado. Lo sorprendente es que solo el 5% de estas variantes se encuentran en las regiones codificantes del ADN (los genes) y en las implicadas en la regulación directa de la expresión génica (promotores, represores o sitios donde se acoplan los factores de transcripción). El resto, el 95% de estas variantes, se encuentra en la parte no codificante del ADN.
Por ello se inició un nuevo proyecto: El proyecto ENCODE (del inglés Encyclopedia of DNA Elements), En 2012, se publicaron los resultados y se pueden considerar como una de las mayores revoluciones en la biología molecular contemporánea. demostró que al menos un 80% del genoma humano tiene algún tipo de actividad biológica a través de sus productos los RNA.
Hoy en día sabemos que las regiones no codificantes del ADN, que regulan y controlan la expresión de los genes, son mucho más prometedoras que los genes en biomedicina. la mayoría de las enfermedades humanas en las que está implicado el ADN están relacionadas con variaciones, incluso de un solo nucleótido, en regiones no codificantes asociadas la regulación de la expresión génica.
El ADN se enrolla sobre unas proteínas, o histonas, formando nucleosomas que representan la unidad estructural de la cromatina que es como se encuentra el material genético en el núcleo celular. La organización de la cromatina se caracteriza por unos grandes dominios espaciales -o territorios- que abarcan gran parte de los cromosomas. Estos territorios se conocen como dominios de la cromatina (“chromatin domains” en inglés) y son parecidos en todas las células del organismo, pero estos contienen a su vez unos sub-dominios que son muy variables y pueden presentar distinto grado de compactación.
El DNA se trascribe a otra molécula que es la que realmente es la que ordena y forma las proteínas: El RNA. Aunque aparentemente La estructura del DNA es una sola cadena, en realidad consta de 2 partes, analogando a un texto, una se llama EXÓN que correspondería a la palabra y otra se llama INTRÓN que correspondería al espacio entre 2 palabras, al replicarla a RNA pasa a una primera cadena o preARN mensajero que tiene la cadena completa y que es sometida a “splicing” (corte) que elimina los intrones para así conformar el ARN mensajero y este es el que entra al ribosoma.
La trascripción o inhibición para la formación de una proteína, depende de varios factores, algunos internos como las histonas, el RNA. Y otros externos, como la metilación o acetilación del DNA. La forma como estos factores actúan y cuáles son los mecanismos que lo producen se estudia en otro proyecto que surgió luego del proyecto ENCODE y es el PROYECTO EPIGENOMA HUMANO.