Imputación & Genética

Key Takeaways

La imputación completa vacíos en el código de ADN utilizando marcadores circundantes para inferir la información genética faltante.
Funciona porque los marcadores se heredan en tramos llamados haplotipos, permitiendo la inferencia de marcadores basados en su contexto.
Aunque es confiable, la imputación tiene una tasa de error más alta que leer directamente el ADN por varias razones.

Dado el enorme tamaño del genoma humano, ¿cómo pueden los científicos ser precisos y eficientes al producir resultados de pruebas de ADN? ¿Y qué sucede cuando la muestra de ADN de una persona tiene parcialmente "código de ADN" ilegible? Los científicos genéticos tienen un método que acelera el proceso y completa "vacíos," mientras sigue proporcionando resultados de pruebas de ADN extremadamente precisos.

¿Qué es la Imputación?

En las ciencias, la imputación es el proceso de utilizar valores observados de un conjunto de datos para completar información de valores faltantes en ese mismo conjunto de datos. En términos simples, es como reemplazar letras faltantes en una palabra basándose en las letras que ya puedes ver.

Los científicos utilizan el método de imputación de genotipos para completar la información faltante cuando están analizando el código de ADN de alguien. Ocasionalmente, no es posible leer el genotipo de un marcador de ADN específico, por lo que se utiliza la imputación para inferir la identidad de un marcador faltante basado en el ADN circundante.

Los científicos a menudo utilizan la imputación cuando han leído una fracción del genoma de una persona, pero no han secuenciado todo su ADN. Hay decenas de millones de sitios en tu ADN donde puedes ser diferente de otra persona, pero los científicos típicamente solo analizan varios miles a unos pocos millones cuando buscan conjuntos específicos de marcadores. Luego utilizan la imputación para averiguar cómo se ve el resto del ADN. En otros casos, si ha habido un error cuando intentan leer por primera vez parte del ADN, pueden regresar y corregir su error utilizando la imputación.

Por qué escribimos esto

Cómo Funciona la Imputación

AncestryDNA^® utiliza la imputación al procesar su muestra de ADN para completar partes de los datos de su secuencia de ADN que no pudimos leer.

Dos hechos principales sobre nuestro ADN hacen posible la imputación.

Los cientos de miles de marcadores que los científicos analizan están alineados, uno tras otro, a lo largo de largas piezas de ADN llamadas cromosomas.
Las personas tienden a heredar tramos de ADN (en lugar de marcadores individuales) de sus padres biológicos. Los tramos de marcadores de ADN que se heredan frecuentemente juntos se llaman haplotipos.

Lo que esto significa es que cuando una persona hereda un marcador genético para, digamos, un rasgo como sensibilidad al dulce, de uno de sus padres biológicos, también obtendrá muchos de los marcadores de ese padre que rodean el marcador específico. En otras palabras, una persona heredará un tramo de marcadores—o haplotipo—que incluye el marcador de sensibilidad al dulce.

Es como el ejemplo que se muestra arriba. Digamos que te falta una sola letra en una palabra: MAIL_OX. Probablemente puedas adivinar que la letra que falta es B, y la palabra es "mailbox." Imagina que la B es el marcador para la sensibilidad al dulce. Incluso si no vemos la B en nuestro análisis de tu ADN, podemos adivinar qué es a partir de los marcadores que la rodean.

El marcador para aquellos que no son sensibles a los sabores dulces tendrá letras diferentes a su alrededor. Imagina que es la T en la palabra "fortune." Así que si por alguna razón no podemos leer el marcador de sensibilidad al dulce, podemos observar los marcadores que lo rodean. Si vemos MAIL_OX, entonces sabemos que esta persona tiene el marcador de sensibilidad al dulce. Y si vemos FOR_UNE, entonces sabremos que la persona no tiene ese marcador. En este ejemplo, MAILBOX y FORTUNE representan haplotipos distintos.

Cómo el código del ADN ayuda con la imputación

Por supuesto, el ADN no tiene palabras en inglés, pero tiene una especie de alfabeto compuesto por 4 letras: A (de adenina), C (de citosina), G (de guanina) y T (de timina).

Por ejemplo, digamos que en el marcador para el rasgo de sensibilidad al dulce, "sí" a la sensibilidad al dulce es una C y "no" es una T. Si no podemos leer la letra en ese marcador, podemos imputarla a partir de los marcadores circundantes en el resto del haplotipo.

Este ejemplo del mundo real de imputación muestra parte del código del ADN alrededor del marcador de sensibilidad al dulce, dándote una idea de cómo funcionan las cosas.

Código del ADN alrededor de "sí" al marcador de sensibilidad al dulce, que está en rojo:

Código del ADN alrededor de "no" al marcador de sensibilidad al dulce, que está en rojo:

Si no pudiéramos leer el marcador específico pero viéramos esto, entonces se podría inferir o imputar el marcador de sensibilidad dulce:

¿Qué tan precisa es la imputación?

Si bien es confiable, la imputación tiene una tasa de error más alta que simplemente leer el ADN. Aquí hay varias razones por las cuales la precisión de la imputación puede verse afectada:

Los marcadores circundantes pueden ser demasiado similares para distinguirlos fácilmente. Esto puede dificultar la distinción de los diferentes haplotipos e imputar cualquier dato faltante que contengan.
Los haplotipos y sus frecuencias pueden variar entre poblaciones. Esta variación puede, a veces, llevar a sesgos en los resultados de imputación.
Si el marcador que no se puede leer está cerca del final de un cromosoma, entonces puede que no haya suficientes marcadores a cada lado para actuar como indicadores.

Estas son solo algunas de las formas en que la imputación puede ser a veces menos confiable que leer directamente el ADN.

Imputación & Genética

Key Takeaways

¿Qué es la Imputación?

Cómo Funciona la Imputación

Cómo el código del ADN ayuda con la imputación

¿Qué tan precisa es la imputación?

Polygenic Risk Score

Types of DNA Testing

Non-Coding DNA