HOPS: una puntuación cuantitativa revela que la pleiotropía horizontal generalizada en la variación genética humana está impulsada por la poligenicidad extrema de los rasgos y las enfermedades humanas
Definiendo la pleiotropía
Definimos el alcance de la pleiotropía como aplicable sólo a las variantes genéticas y, en particular, a las variantes investigadas como parte de los GWAS. Como efectos, estamos considerando los resultados fenotípicos medidos por GWASs. Por tanto, según nuestra definición, pleiotropía significa que una variante muestra asociaciones significativas en los GWAS de múltiples rasgos. Además, restringimos el alcance de la pleiotropía que estamos considerando para incluir sólo la pleiotropía horizontal y excluir la pleiotropía vertical (Fig. 1). Para elaborar esta distinción, supongamos que hemos identificado una variante que influye en dos rasgos diferentes, el rasgo A y el rasgo B. En la pleiotropía vertical, los rasgos mismos están biológicamente relacionados, de modo que el efecto de la variante en el rasgo A realmente causa el efecto en el rasgo B. Una característica clave de la pleiotropía vertical es que dos rasgos que están biológicamente relacionados deberían estarlo independientemente de qué gen o variante específica esté causando el efecto. Esto induce la correlación entre los tamaños de los efectos de los GWAS en los dos rasgos a través de un conjunto completo de variantes. Por ejemplo, esperamos que cualquier variante que aumente el colesterol LDL también aumente el riesgo de enfermedad arterial coronaria, porque sospechamos que es el propio aumento del colesterol LDL el que provoca un mayor riesgo de enfermedad. Esto da lugar a una correlación entre los tamaños del efecto de las variantes para el colesterol LDL y la enfermedad arterial coronaria, que se ha detectado en múltiples estudios . La metodología de la aleatorización mendeliana utiliza esta correlación prevista dentro de un conjunto determinado de variantes para formular una prueba estadística de las relaciones causales entre los rasgos, que ahora se utiliza ampliamente para el descubrimiento biológico . Ampliamos esta metodología para utilizar todo el conjunto de SNVs evaluados por GWAS, tratando una correlación a nivel de GWAS entre dos rasgos como evidencia de una relación pleiotrópica vertical entre estos rasgos.
En el caso de la pleiotropía horizontal, una variante individual actúa sobre los rasgos A y B sin reflejar ninguna relación a nivel de rasgo entre ellos. A diferencia de la pleiotropía vertical, dado que no estamos considerando el efecto a nivel de variante como evidencia de una relación entre los dos rasgos, no podemos detectar la pleiotropía horizontal mediante la detección de correlaciones entre los rasgos. En su lugar, cada variante pleiotrópica horizontal actúa por su propio y único mecanismo. Estas variantes pleiotrópicas particulares, por lo tanto, deberían mostrar una relación entre los dos rasgos que se desvía de la relación que inferiríamos de la correlación de los tamaños del efecto en todo el genoma entre ellos. Esta desviación de la correlación entre los rasgos no es una predicción de ningún tipo de modelo de pleiotropía, sino que simplemente se desprende de nuestra definición del término «pleiotropía horizontal»: cualquier par de rasgos cuyos tamaños de efecto están correlacionados a través de todas las variantes está por definición relacionado por pleiotropía vertical, mientras que cualquier variante cuyos efectos sobre dos rasgos se desvían sustancialmente de la relación a nivel de rasgo entre esos rasgos está por definición mostrando pleiotropía horizontal.
Una puntuación cuantitativa para la pleiotropía
Hemos desarrollado un método para medir la pleiotropía horizontal utilizando datos estadísticos resumidos de GWASs en múltiples rasgos. Nuestro método se basa en la aplicación de un procedimiento de blanqueo estadístico a un conjunto de asociaciones variante-rasgo de entrada, que elimina las correlaciones entre los rasgos causados por la pleiotropía vertical y normaliza los tamaños de los efectos en todos los rasgos. Utilizando las puntuaciones Z de las asociaciones descorrelacionadas, medimos dos componentes relacionados pero distintos de la pleiotropía: la magnitud total del efecto sobre los rasgos blanqueados (puntuación de «magnitud», denominada Pm) y el número total de rasgos blanqueados afectados por una variante (puntuación de «número de rasgos», denominada Pn). Ambas puntuaciones se escalan por el número de rasgos y se multiplican por 100, de modo que la puntuación final representa el valor tal y como se mediría en un conjunto de datos de 100 rasgos. Esta puntuación de pleiotropía cuantitativa de dos componentes nos permite medir tanto la magnitud (puntuación de la magnitud de la pleiotropía Pm) como la cantidad (puntuación del número de rasgos de la pleiotropía Pn) de la pleiotropía horizontal para todos los SNV en el genoma humano. En principio, son cantidades distintas: la puntuación de magnitud Pm mide el tamaño total del efecto pleiotrópico de una variante en todos los rasgos, mientras que la puntuación del número de rasgos Pn mide el número de efectos pleiotrópicos distintos que tiene una variante. Una variante con una puntuación Pm alta y una puntuación Pn baja tiene un gran efecto repartido en un pequeño número de rasgos; una variante con una puntuación Pm baja y una puntuación Pn alta tiene sólo un efecto menor en general, pero ese efecto está repartido en un gran número de rasgos; y una variante con puntuaciones altas en ambos componentes tiene un gran efecto que está repartido en un gran número de rasgos. Dado que esperamos que estas puntuaciones estén fuertemente influenciadas por el desequilibrio de enlaces (LD), regresamos Pm y Pn contra las puntuaciones LD para producir una puntuación corregida por LD (\( {P}_m^{mathrm{LD}} y \( {P}_m^{mathrm{LD}}) (Figs. 2 y 3; Métodos).