HOPS: una puntuación cuantitativa revela que la pleiotropía horizontal generalizada en la variación genética humana está impulsada por la poligenicidad extrema de los rasgos y las enfermedades humanas

Definiendo la pleiotropía

Definimos el alcance de la pleiotropía como aplicable sólo a las variantes genéticas y, en particular, a las variantes investigadas como parte de los GWAS. Como efectos, estamos considerando los resultados fenotípicos medidos por GWASs. Por tanto, según nuestra definición, pleiotropía significa que una variante muestra asociaciones significativas en los GWAS de múltiples rasgos. Además, restringimos el alcance de la pleiotropía que estamos considerando para incluir sólo la pleiotropía horizontal y excluir la pleiotropía vertical (Fig. 1). Para elaborar esta distinción, supongamos que hemos identificado una variante que influye en dos rasgos diferentes, el rasgo A y el rasgo B. En la pleiotropía vertical, los rasgos mismos están biológicamente relacionados, de modo que el efecto de la variante en el rasgo A realmente causa el efecto en el rasgo B. Una característica clave de la pleiotropía vertical es que dos rasgos que están biológicamente relacionados deberían estarlo independientemente de qué gen o variante específica esté causando el efecto. Esto induce la correlación entre los tamaños de los efectos de los GWAS en los dos rasgos a través de un conjunto completo de variantes. Por ejemplo, esperamos que cualquier variante que aumente el colesterol LDL también aumente el riesgo de enfermedad arterial coronaria, porque sospechamos que es el propio aumento del colesterol LDL el que provoca un mayor riesgo de enfermedad. Esto da lugar a una correlación entre los tamaños del efecto de las variantes para el colesterol LDL y la enfermedad arterial coronaria, que se ha detectado en múltiples estudios . La metodología de la aleatorización mendeliana utiliza esta correlación prevista dentro de un conjunto determinado de variantes para formular una prueba estadística de las relaciones causales entre los rasgos, que ahora se utiliza ampliamente para el descubrimiento biológico . Ampliamos esta metodología para utilizar todo el conjunto de SNVs evaluados por GWAS, tratando una correlación a nivel de GWAS entre dos rasgos como evidencia de una relación pleiotrópica vertical entre estos rasgos.

Fig. 1
figure1

Esquema de los diferentes tipos de pleiotropía. Estudios previos distinguen entre pleiotropía vertical, donde los efectos sobre un rasgo están mediados por los efectos sobre otro rasgo, y pleiotropía horizontal, donde los efectos sobre múltiples rasgos son independientes

En el caso de la pleiotropía horizontal, una variante individual actúa sobre los rasgos A y B sin reflejar ninguna relación a nivel de rasgo entre ellos. A diferencia de la pleiotropía vertical, dado que no estamos considerando el efecto a nivel de variante como evidencia de una relación entre los dos rasgos, no podemos detectar la pleiotropía horizontal mediante la detección de correlaciones entre los rasgos. En su lugar, cada variante pleiotrópica horizontal actúa por su propio y único mecanismo. Estas variantes pleiotrópicas particulares, por lo tanto, deberían mostrar una relación entre los dos rasgos que se desvía de la relación que inferiríamos de la correlación de los tamaños del efecto en todo el genoma entre ellos. Esta desviación de la correlación entre los rasgos no es una predicción de ningún tipo de modelo de pleiotropía, sino que simplemente se desprende de nuestra definición del término «pleiotropía horizontal»: cualquier par de rasgos cuyos tamaños de efecto están correlacionados a través de todas las variantes está por definición relacionado por pleiotropía vertical, mientras que cualquier variante cuyos efectos sobre dos rasgos se desvían sustancialmente de la relación a nivel de rasgo entre esos rasgos está por definición mostrando pleiotropía horizontal.

Una puntuación cuantitativa para la pleiotropía

Hemos desarrollado un método para medir la pleiotropía horizontal utilizando datos estadísticos resumidos de GWASs en múltiples rasgos. Nuestro método se basa en la aplicación de un procedimiento de blanqueo estadístico a un conjunto de asociaciones variante-rasgo de entrada, que elimina las correlaciones entre los rasgos causados por la pleiotropía vertical y normaliza los tamaños de los efectos en todos los rasgos. Utilizando las puntuaciones Z de las asociaciones descorrelacionadas, medimos dos componentes relacionados pero distintos de la pleiotropía: la magnitud total del efecto sobre los rasgos blanqueados (puntuación de «magnitud», denominada Pm) y el número total de rasgos blanqueados afectados por una variante (puntuación de «número de rasgos», denominada Pn). Ambas puntuaciones se escalan por el número de rasgos y se multiplican por 100, de modo que la puntuación final representa el valor tal y como se mediría en un conjunto de datos de 100 rasgos. Esta puntuación de pleiotropía cuantitativa de dos componentes nos permite medir tanto la magnitud (puntuación de la magnitud de la pleiotropía Pm) como la cantidad (puntuación del número de rasgos de la pleiotropía Pn) de la pleiotropía horizontal para todos los SNV en el genoma humano. En principio, son cantidades distintas: la puntuación de magnitud Pm mide el tamaño total del efecto pleiotrópico de una variante en todos los rasgos, mientras que la puntuación del número de rasgos Pn mide el número de efectos pleiotrópicos distintos que tiene una variante. Una variante con una puntuación Pm alta y una puntuación Pn baja tiene un gran efecto repartido en un pequeño número de rasgos; una variante con una puntuación Pm baja y una puntuación Pn alta tiene sólo un efecto menor en general, pero ese efecto está repartido en un gran número de rasgos; y una variante con puntuaciones altas en ambos componentes tiene un gran efecto que está repartido en un gran número de rasgos. Dado que esperamos que estas puntuaciones estén fuertemente influenciadas por el desequilibrio de enlaces (LD), regresamos Pm y Pn contra las puntuaciones LD para producir una puntuación corregida por LD (\( {P}_m^{mathrm{LD}} y \( {P}_m^{mathrm{LD}}) (Figs. 2 y 3; Métodos).

Fig. 2
figure2

Contribuciones del desequilibrio de ligamiento (LD) y la poligenicidad a la pleiotropía horizontal. Además del sentido normal de la pleiotropía horizontal, se espera que tanto el desequilibrio de ligamiento (LD) como la poligenicidad contribuyan a la pleiotropía horizontal. En el caso de la pleiotropía horizontal inducida por el LD, dos SNVs vinculados tienen efectos independientes sobre diferentes rasgos que parecen pleiotrópicos debido al vínculo entre los SNVs. En el caso de la pleiotropía horizontal inducida por la poligenicidad, dos rasgos altamente poligénicos tienen un solapamiento en su huella poligénica

Fig. 3
figura3

Método de puntuación de pleiotropía de dos componentes. (i) recogemos las estadísticas de asociación del Biobanco del Reino Unido, (ii) las procesamos utilizando el blanqueo de Mahalanobis, (iii) calculamos los dos componentes de nuestra puntuación de pleiotropía (Pm y Pn) basándonos en las estadísticas de asociación blanqueadas, (iv) utilizamos las puntuaciones de LD para corregir la pleiotropía inducida por LD (\( {P}_m^{mathrm{LD}} \) y \( {P}_n^{mathrm{LD}} \), y (v) utilizar valores P basados en permutaciones para corregir la arquitectura poligénica (\( {P}_m^P \) y \( {P}_n^P \))

Calcular la significación de la pleiotropía

Calculamos los valores P para los dos componentes de nuestra puntuación de pleiotropía utilizando dos procedimientos diferentes, correspondientes a dos expectativas nulas diferentes.

  1. Valores P teóricos (puntuación de pleiotropía cruda o puntuación de pleiotropía corregida por LD ), calculados de forma análoga a los valores P de los estudios de asociación genética, incluidos los GWAS, basados en un escenario nulo en el que las variantes no presentan efectos pleiotrópicos sobre los rasgos observados.

  2. Valores P empíricos (puntuación de pleiotropía corregida por poligenicidad/LD ), calculados por permutación de las distribuciones observadas de los rasgos blanqueados. Estos valores P se basan en un escenario nulo en el que las variantes pueden tener efectos significativos sobre uno o más rasgos, pero los efectos de cada variante sobre cada rasgo son independientes y el número de variantes con efectos sobre múltiples rasgos no es más de lo que cabría esperar por azar.

  3. Esta corrección empírica de la poligenicidad es necesaria porque la poligenicidad es un factor importante que puede producir pleiotropía. Por ejemplo, se ha estimado que aproximadamente 100.000 loci independientes son causales para la altura en los humanos . Si el número total de loci independientes en el genoma humano es de aproximadamente 1 millón, esto corresponde a cerca del 10% del genoma humano que tiene un efecto sobre la altura. Si imaginamos múltiples fenotipos con esta misma arquitectura genética altamente poligénica, deberíamos esperar un solapamiento sustancial entre los loci causales para múltiples rasgos diferentes, incluso en ausencia de una verdadera relación causal entre los rasgos, lo que da lugar a una pleiotropía horizontal (Fig. 2).

    Potencia para detectar la pleiotropía en simulaciones

    Realizamos un estudio de simulación para evaluar el rendimiento de nuestra puntuación de pleiotropía de dos componentes. Simulamos 800.000 variantes que controlaban 100 rasgos, variando la heredabilidad de la escala de responsabilidad por rasgo h2 y la proporción de variantes causales pleiotrópicas y no pleiotrópicas. Para introducir el LD en las simulaciones, utilizamos la arquitectura de LD real de 800.000 SNV de la población europea de 1000 Genomes. Simulamos las puntuaciones Z de forma independiente para cada SNV y luego propagamos el LD para un SNV dado «contaminando» su puntuación Z de acuerdo con las puntuaciones Z de los SNVs en LD con él. Bajo el modelo nulo, todas las asociaciones rasgo-variante eran independientes, y no se añadía pleiotropía horizontal. En los modelos de pleiotropía añadida, elegimos al azar una fracción de variantes causales y las forzamos a tener asociaciones simultáneas con múltiples rasgos. El estudio de simulación mostró que ambos componentes de la puntuación de pleiotropía tenían una buena potencia para detectar la pleiotropía horizontal (Fig. 4) y que la corrección de LD reduce drásticamente la dependencia de la puntuación de pleiotropía de LD (Archivo adicional 1: Figura S1). Bajo la hipótesis nula de no pleiotropía horizontal añadida, la tasa de falsos positivos estaba bien controlada para ambas puntuaciones cuando había una baja heredabilidad o pocas variantes causales. Sin embargo, cuando hay muchas variantes causales y una alta heredabilidad por variante, la puntuación de pleiotropía corregida por LD (\( {P}_m^{mathrm{LD}} \) y \( {P}_n^{mathrm{LD}} \)) detecta un gran exceso de variantes pleiotrópicas, debido al solapamiento serendípico entre variantes causales sin pleiotropía explícitamente inducida. El valor P empírico corregido por LD/poligenicidad (\( {P}_m^P \) y \( {P}_n^P \)) no detecta esta pleiotropía serendípica en la misma proporción alta.

    Fig. 4
    figure4

    Estudio de simulación que muestra la tasa de falsos positivos (a,b,c,d) y la potencia (e,f,g,h) de la puntuación de pleiotropía de dos componentes. La fila superior muestra el rendimiento en variantes simuladas no pleiotrópicas (la línea negra muestra una tasa de falsos positivos del 5%); la fila inferior muestra el rendimiento en variantes pleiotrópicas (la línea negra muestra una potencia del 80%). Las simulaciones se realizaron tanto para \( {P}_m^{mathrm{LD}} (izquierda) como para \( {P}_n^{mathrm{LD}}} (derecha), y tanto sin corrección por poligenicidad (a,c,e,g) como con la corrección (b,f,d,h), con una heredabilidad por variante que va de 0.0002 a 0,2, la proporción de loci causales no pleiotrópicos va de 0 a 1%, y la proporción de loci causales pleiotrópicos va de 0,1 a 1%. Nuestro método tiene un buen poder para detectar la pleiotropía en los rasgos altamente heredables, aunque su poder se ve reducido por la poligenicidad extrema. La poligenicidad extrema también aumenta la tasa de falsos positivos, aunque este efecto es corregido por nuestra corrección de poligenicidad

    En presencia de pleiotropía horizontal añadida, nuestro enfoque tuvo poder para detectar pleiotropía con una heredabilidad por variante h2 tan pequeña como 0,002 si no hay variantes causales no pleiotrópicas. En presencia de variantes causales tanto pleiotrópicas como no pleiotrópicas, la detección de pleiotropía fue más difícil, pero nuestro enfoque todavía tenía una potencia apreciable para detectar variantes pleiotrópicas, que aumentaba con el incremento de la heredabilidad por variante y disminuía con el incremento del número de variantes causales no pleiotrópicas. La adición de la corrección por arquitectura poligénica (\( {P}_m^P \) y \( {P}_n^P \)) redujo esta potencia sólo ligeramente. La potencia de nuestro método no se redujo sustancialmente al aumentar el número de rasgos afectados por las variantes pleiotrópicas (Archivo adicional 1: Figura S2) o al añadir una estructura de correlación realista entre los rasgos (Archivo adicional 1: Figura S3).

    El estudio de pleiotropía en todo el genoma (GWPS) revela una pleiotropía omnipresente

    Para aplicar nuestro método a datos de asociación humanos reales, utilizamos estadísticas de asociación GWAS para 372 rasgos médicos hereditarios medidos en 337.119 individuos del Biobanco del Reino Unido . Calculamos con éxito nuestra puntuación de pleiotropía de dos componentes para 767.057 variantes de todo el genoma y realizamos un estudio de pleiotropía de todo el genoma (GWPS), por analogía con un GWAS estándar (Fig. 3; Métodos). El archivo adicional 1: La figura S4 muestra los gráficos de cuantiles resultantes (gráficos Q-Q). Observamos una inflación significativa tanto para la puntuación de magnitud corregida por LD \( {P}_m^{mathrm{LD}} como para la puntuación del número de rasgos \( {P}_n^{mathrm{LD}}) (prueba U de Mann-Whitney P < 10-300 para ambos). Además, observamos en ambas puntuaciones que la pleiotropía horizontal estaba ampliamente distribuida en el genoma, en lugar de estar localizada en unos pocos loci específicos (archivo adicional 1: Figura S5). La prueba de una estrategia alternativa para calcular la matriz de correlación del fenotipo utilizando todos los SNVs produjo resultados comparables (Pearson r = 0,995 y 0,964 para \( {P}_m^{mathrm{LD} \) y \( {P}_n^{mathrm{LD} \) respectivamente) a nuestra estrategia de utilizar un conjunto de SNVs para tener en cuenta LD (r2 < 0.1) (Archivo adicional 1: Figura S6).

    La pleiotropía es impulsada por la poligenicidad

    Aplicamos el cálculo del valor P empírico basado en la permutación (puntuación de pleiotropía corregida por poligenicidad/LD: \( {P}_m^P \) y \( {P}_n^P \)) para corregir la arquitectura poligénica conocida de los rasgos y probar si algún loci es pleiotrópico en mayor medida de lo que cabría esperar debido a la poligenicidad. Archivo adicional 1: Las figuras S7 y S8 muestran los gráficos Q-Q y Manhattan resultantes. En contraste con los resultados de la puntuación de pleiotropía corregida por LD (\( {P}_m^{mathrm{LD}} \) y \( {P}_n^{mathrm{LD}} \)), no encontramos pleiotropía significativamente por encima de lo que se esperaría de la arquitectura poligénica conocida de los rasgos: hay un número dramáticamente menor de loci con niveles significativos de pleiotropía en todo el genoma después de corregir la arquitectura poligénica, y la distribución de la puntuación de pleiotropía en todo el genoma muestra menos pleiotropía de lo esperado (prueba U de Mann-Whitney P < 10-300 tanto para ( {P}_m^P \) como para \( {P}_n^P \)).

    Como prueba adicional de si la pleiotropía que observamos es impulsada por la poligenicidad, calculamos la poligenicidad de los mismos 372 rasgos heredables del Biobanco del Reino Unido. Medimos la poligenicidad utilizando una versión del factor de inflación genómica corregida mediante la puntuación LD \( {\lambda}_{mathrm{GC}}^c \) . A continuación, estratificamos estos rasgos por \( {\lambda}_{mathrm{GC}^c \) después de controlar la heredabilidad (Métodos) y calculamos la puntuación de pleiotropía corregida por LD de dos componentes y los valores P para cada componente de forma independiente para cada variante en el genoma utilizando cada uno de estos bins de rasgos. Observamos que ambas puntuaciones dependen en gran medida de la poligenicidad, y que los tramos de menor poligenicidad en cada clase de heredabilidad muestran muy poca inflación. (Fig. 5; Archivo adicional 1: Tabla S1). En conjunto, estos resultados sugieren que la poligenicidad extrema impulsa la pleiotropía horizontal y que esto tiene un efecto extremadamente grande en la arquitectura genética de los fenotipos humanos.

    Fig. 5
    figure5

    Parcelas de cuantiles-cuantiles (Q-Q) que muestran la inflación de la puntuación de pleiotropía en función de la poligenicidad. Las variantes se estratifican en 4 lotes de unos 80 rasgos cada uno por heredabilidad, y luego se subdividen en 5 lotes de unos 20 rasgos cada uno por poligenicidad, medida por el factor de inflación genómica corregido \( {\lambda}_{mathrm{GC}^c \). Los tonos más oscuros representan una baja poligenicidad y los tonos más claros representan una alta poligenicidad. Todos los paneles muestran los valores P transformados en -log10. Las líneas negras muestran el valor esperado bajo la hipótesis nula

    La distribución de la puntuación de pleiotropía en todo el genoma da una idea de la arquitectura genética

    Además de observar la inflación de la puntuación de pleiotropía en todo el genoma, también podemos obtener información de la distribución de la puntuación de pleiotropía en un nivel más granular.

    La Figura 6a muestra la distribución de la puntuación de pleiotropía para SNVs independientes (LD podado a un umbral de r2 < 0.1) en comparación con la expectativa bajo la hipótesis nula de ningún efecto pleiotrópico. Observamos un gran exceso en la puntuación del número de rasgos \( {P}_n^{mathrm{LD}}, y un exceso más pequeño pero aún muy significativo en la magnitud total del efecto pleiotrópico \( {P}_m^{mathrm{LD}}). Este exceso proviene en parte de una larga cola de loci altamente pleiotrópicos que pasan el umbral de significación en todo el genoma (línea discontinua en la Fig. 6a), pero es principalmente impulsado por la pleiotropía débil entre los loci que no alcanzan la significación en todo el genoma.

    Fig. 6
    figure6

    Distribución de la puntuación de pleiotropía entre variantes (a), genes (b) y rasgos (c). a La distribución global de \ ( {P}_m^{mathrm{LD}} (izquierda) y \ ( {P}_n^{mathrm{LD}}) (derecha) para las 767.057 variantes probadas. La distribución esperada bajo la hipótesis nula de no pleiotropía se muestra en rojo y la distribución observada se muestra en azul. La línea vertical representa el valor de la puntuación de pleiotropía correspondiente a la significación en todo el genoma (P < 5 × 10- 8). Un total de 1769 (\( {P}_m^{mathrm{LD} \)) y 643 (\( {P}_n^{mathrm{LD} \)) variantes no se representan en aras de la claridad, porque tienen valores extremos para la puntuación de pleiotropía. b La distribución de la puntuación media de pleiotropía para las variantes codificantes en cada gen para \( {P}_m^{mathrm{LD}} \) (izquierda) y \( {P}_n^{mathrm{LD}} \) (derecha). Los diez genes más importantes están representados en el lado derecho de los gráficos, mientras que los genes con una puntuación de pleiotropía de 0 están representados en el lado izquierdo de los gráficos. c La contribución de las variantes pleiotrópicas a 82 rasgos complejos y enfermedades. La contribución de las variantes pleiotrópicas se calcula como el coeficiente de correlación entre el valor absoluto de las puntuaciones Z y la puntuación de pleiotropía entre las variantes que son significativas para el genoma.de la puntuación de pleiotropía (P < 5 × 10- 8 para \( {P}_m^{mathrm{LD}} \) y \( {P}_n^{mathrm{LD}} \) respectivamente)

    La puntuación de pleiotropía está correlacionada con la función molecular y biológica

    Para investigar más a fondo las propiedades de las variantes pleiotrópicas, examinamos los efectos de varias anotaciones funcionales y bioquímicas en nuestra puntuación de pleiotropía corregida por LD (\( {P}_m^{mathrm{LD}}) y \( {P}_n^{mathrm{LD}}) (Tabla 1; Métodos). Utilizando las anotaciones de Ensembl Variant Effect Predictor , observamos que ambos componentes de la puntuación de pleiotropía son mayores en promedio en las regiones transcritas (codificación y UTR) que en las regiones intergénicas no codificantes. Este resultado fue confirmado y ampliado por las anotaciones de Roadmap Epigenomics , que mostraron que las regiones cuyas configuraciones de cromatina estaban asociadas con regiones activamente transcritas, promotores, potenciadores y sitios de unión de factores de transcripción tenían niveles significativamente más altos de ambos componentes de la puntuación de pleiotropía, mientras que la heterocromatina y los estados de cromatina quiescente tenían niveles significativamente más bajos. Al investigar las marcas histónicas individuales, descubrimos que tanto la marca histónica represiva H3K27me3 como la marca histónica activadora H3K27ac estaban asociadas con niveles elevados de pleiotropía, aunque la marca activadora H3K27ac tenía un efecto mayor. Esto puede indicar que estar bajo una regulación activa en absoluto produce mayores niveles de pleiotropía, tanto si esa regulación es represiva como activadora.

    Tabla 1 Análisis de enriquecimiento funcional de la puntuación de pleiotropía

    También utilizamos datos del proyecto Genotipo-Expresión Tisular para medir la conexión entre los efectos transcripcionales y nuestra puntuación de pleiotropía (Tabla 1). En consonancia con la observación anterior de que las regiones funcionales tenían puntuaciones de pleiotropía más altas, encontramos que las variantes que fueron identificadas como cis eQTLs para cualquier gen en cualquier tejido tenían puntuaciones de pleiotropía más altas en promedio. Dentro de los eQTLs, también observamos correlaciones significativas entre nuestra puntuación de pleiotropía y el número de genes (\( {P}_m^{mathrm{LD}} \): r = 0,036, P < 2.2 × 10- 16; \( {P}_n^{mathrm{LD}} \): r = 0,035, P < 2,2 × 10- 16) y tejidos (\( {P}_m^{mathrm{LD}} \): r = 0.062, P < 2,2 × 10- 16; \( {P}_n^{mathrm{LD}} \): r = 0,059, P < 2,2 × 10- 16) donde la variante fue anotada como un eQTL, mostrando que nuestra puntuación de pleiotropía está relacionada con las medidas transcripcionales de pleiotropía.

    Finalmente, encontramos que las variantes que son eQTLs para genes cuyos ortólogos están asociados con múltiples fenotipos medibles en ratones o levadura tienen puntuaciones de pleiotropía más altas, lo que demuestra que nuestra puntuación de pleiotropía también está relacionada con la pleiotropía en organismos modelo.

    Todos estos resultados son consistentes cuando se utiliza la puntuación de pleiotropía corregida por poligenicidad/LD (\( {P}_m^P \) y \( {P}_n^P\Big) \), indicando que la asociación de la pleiotropía con la función molecular y biológica no está impulsada exclusivamente por la arquitectura altamente poligénica (archivo adicional 2).

    El estudio de pleiotropía en todo el genoma identifica nuevos loci biológicos

    Por analogía con los GWAS estándar, nuestra metodología GWPS puede identificar variantes individuales que tienen un nivel significativo de pleiotropía horizontal en todo el genoma. Utilizando la puntuación de magnitud corregida por LD \( {P}_m^{mathrm{LD}}, identificamos 74.335 variantes en 8093 loci independientes con un nivel significativo de pleiotropía horizontal en todo el genoma, mientras que utilizando la puntuación de número de rasgos corregida por LD \( {P}_n^{mathrm{LD}}) identificamos 18,393 variantes en 2859 loci independientes con un nivel significativo de pleiotropía horizontal en todo el genoma, todos los cuales también son identificados por la puntuación de magnitud corregida por LD \( {P}_m^{mathrm{LD}}) (Métodos, archivo adicional 1: Tabla S2). Aplicando el mismo análisis a la puntuación de pleiotropía corregida por poligenicidad/LD, utilizando la puntuación de magnitud corregida por poligenicidad/LD \( {P}_m^P \) no se identificaron loci significativos en todo el genoma, pero utilizando la puntuación de número de rasgos corregida por poligenicidad/LD \( {P}_n^P \) se identificaron 2674 variantes en 432 loci. Llamativamente, la mayoría de los loci significativos en \( {P}_n^{mathrm{LD}} \) (1519 de 2859) o \( {P}_n^P \) (294 de 432), junto con una considerable minoría de loci significativos en \( {P}_m^{mathrm{LD}} \) (2934 de 8093), no tienen ninguna entrada en el catálogo de GWAS del NHGRI-EBI, lo que significa que nunca han sido reportados como un locus asociado en ningún GWAS publicado. Estos loci representan una clase de variación genética poco reconocida que tiene múltiples efectos débiles o intermedios que son significativos en conjunto, pero ningún efecto fuerte específico sobre un rasgo en particular. El análisis de enriquecimiento funcional de los genes cercanos a estos loci significativos en todo el genoma implica una amplia gama de funciones biológicas, incluyendo la adhesión celular, la modificación postraduccional de las proteínas, el citoesqueleto, los factores de transcripción y las cascadas de señalización intracelular (archivo adicional 3). Los loci significativos en \ P_n^P \ P muestran un subconjunto de funciones más centrado, con un mayor papel para las proteínas nucleares que regulan la transcripción y el estado de la cromatina, lo que sugiere que estas son las funciones que exhiben pleiotropía horizontal más allá del nivel de base inducido por la poligenicidad. El papel de estos nuevos loci y estos procesos biológicos en la genética y la biología humanas puede ser un área fructífera para el estudio futuro, con el potencial para el descubrimiento biológico.

    Los loci pleiotrópicos se replican en conjuntos de datos GWAS independientes

    Como conjuntos de datos de replicación, utilizamos dos fuentes adicionales de estadísticas de resumen GWAS para calcular nuestra puntuación de pleiotropía corregida por LD (\( {P}_m^{mathrm{LD} \) y \( {P}_n^{mathrm{LD} \): GWASs y meta-análisis previamente publicados para 73 rasgos y enfermedades complejas humanas, que recopilamos y curamos manualmente de la literatura (Métodos, Archivo adicional 1: Tabla S3) ; y un estudio previamente publicado de 430 metabolitos sanguíneos medidos en 7824 adultos europeos . Para todas las variantes cubiertas por el Biobanco del Reino Unido, pudimos calcular nuestra puntuación de pleiotropía de forma independiente utilizando estos dos conjuntos de datos (Fig. 7). En el conjunto de datos de rasgos y enfermedades, observamos que el 57% de los loci \( {P}_m^{mathrm{LD}} y el 38% de los loci \( {P}_n^\mathrm{LD}} se replicaron, mientras que en el conjunto de datos de metabolitos sanguíneos observamos que el 17% de los loci de ( {P}_m^{mathrm{LD}} y el 12% de los loci de ( {P}_n^{mathrm{LD}}) se replicaron, en comparación con el 5% de los loci de ( {P}_m^{mathrm{LD}}) y el 6% de los loci de ( {P}_n^{mathrm{LD}}) que se esperaban por azar según un modelo nulo basado en permutaciones. Este alto nivel de replicación utilizando conjuntos independientes de estadísticas de resumen de GWAS sugiere que nuestra puntuación de pleiotropía está capturando una propiedad biológica subyacente, en lugar de un artefacto del estudio del Biobanco del Reino Unido.

    Fig. 7
    figure7

    Análisis de replicación para el estudio de pleiotropía de todo el genoma. Utilizamos 372 rasgos médicos heredables del Biobanco del Reino Unido como nuestro conjunto de datos de descubrimiento, y conjuntos de datos independientes de 73 rasgos y enfermedades complejas y 430 metabolitos sanguíneos como conjuntos de datos de replicación. En cada caso, la fracción esperada de replicación se determinó empíricamente utilizando un análisis de permutación

    La pleiotropía está correlacionada con rasgos complejos y enfermedades específicas

    Para caracterizar las asociaciones fenotípicas de estos loci, utilizamos nuestro conjunto de datos de replicación de las estadísticas de resumen de GWAS publicadas para 73 rasgos cuantitativos humanos y enfermedades, más nueve rasgos adicionales que excluimos de nuestro conjunto de datos de replicación para un total de 82 (Métodos). No podemos calcular directamente el grado de pleiotropía que muestran estos rasgos, ya que nuestra definición de pleiotropía horizontal se aplica sólo a las variantes individuales y no se aplica a los rasgos. Sin embargo, podemos identificar los rasgos cuyas asociaciones de variantes GWAS están correlacionadas con nuestra puntuación de pleiotropía, que en cierto sentido representa los rasgos que contribuyen más a nuestra señal de pleiotropía horizontal generalizada. La Figura 6c muestra las correlaciones entre nuestra puntuación de pleiotropía corregida por LD (\( {P}_m^{mathrm{LD}} y \( {P}_n^{mathrm{LD}})) y las estadísticas de asociación para estos 82 rasgos y enfermedades. Los rasgos más correlacionados fueron los antropométricos, como el índice de masa corporal, la circunferencia de la cintura y la cadera, y la altura; ciertos niveles de lípidos en sangre, incluidos el colesterol total y los triglicéridos; y la esquizofrenia. Se sabe que todos estos rasgos son altamente poligénicos y heterogéneos. Los rasgos menos correlacionados incluyen varias mediciones de la sensibilidad a la insulina y la respuesta a la glucosa, como el índice de sensibilidad a la insulina (ISI), ciertas características de la morfología cerebral y el biomarcador inflamatorio lipoproteína (a). Esto puede deberse en parte al bajo tamaño de la muestra de los GWAS correspondientes. Sin embargo, estas correlaciones no parecen estar impulsadas exclusivamente por el tamaño de la muestra: en los casos en los que se han realizado múltiples GWAS para el mismo rasgo en submuestras de la población (por ejemplo, sólo hombres, sólo mujeres y combinados), el tamaño de la muestra sólo afecta marginalmente a la correlación (archivo adicional 1: tabla S4). Otro factor que contribuye puede ser la heredabilidad: la altura, en particular, se encuentra entre los rasgos más heredables que examinamos, mientras que el ISI y los rasgos de la morfología cerebral se encuentran entre los menos.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *