HOPS: a quantitative score reveals pervasive horizontal pleiotropy in human genetic variation is driven by extreme polygenicity of human traits and diseases

Defining pleiotropy

We definiëren de reikwijdte van pleiotropie in enge zin als alleen van toepassing op genetische varianten en in het bijzonder varianten die onderzocht zijn als onderdeel van GWASs. Als effecten beschouwen we fenotypische uitkomsten die door GWASs worden gemeten. Volgens onze definitie betekent pleiotropie dus dat één variant significante associaties vertoont over GWASs van meerdere kenmerken. Bovendien beperken we de reikwijdte van pleiotropie tot horizontale pleiotropie en sluiten we verticale pleiotropie uit (Fig. 1). Om dit onderscheid nader toe te lichten: stel dat we een variant hebben geïdentificeerd die invloed heeft op twee verschillende eigenschappen, eigenschap A en eigenschap B. Bij verticale pleiotropie zijn de eigenschappen zelf biologisch verwant, zodat het effect van de variant op eigenschap A feitelijk het effect op eigenschap B veroorzaakt. Een belangrijk kenmerk van verticale pleiotropie is dat twee eigenschappen die biologisch verwant zijn, verwant moeten zijn ongeacht welk specifiek gen of welke variant het effect veroorzaakt. Dit leidt tot correlatie tussen GWAS effectgroottes op de twee eigenschappen over een hele set van varianten. Wij verwachten bijvoorbeeld dat elke variant die het LDL-cholesterol verhoogt ook het risico op coronaire hartziekten verhoogt, omdat wij vermoeden dat het de verhoging van het LDL-cholesterol zelf is die het verhoogde ziekterisico veroorzaakt. Dit resulteert in een correlatie tussen de effectgrootte van varianten voor LDL-cholesterol en coronaire hartziekte, die in meerdere studies is vastgesteld. De methodologie van Mendeliaanse randomisatie gebruikt deze voorspelde correlatie binnen een gegeven set van varianten om een statistische test te formuleren voor causale relaties tussen eigenschappen, die nu op grote schaal wordt gebruikt voor biologische ontdekking. Wij breiden deze methodologie uit door gebruik te maken van de volledige set SNVs geëvalueerd door GWAS, en behandelen een GWAS-brede correlatie tussen twee kenmerken als bewijs van een verticale pleiotrope relatie tussen deze kenmerken.

Fig. 1
figure1

Schematische weergave van verschillende soorten pleiotropie. Eerdere studies maken onderscheid tussen verticale pleiotropie, waarbij effecten op één eigenschap worden gemedieerd door effecten op een andere eigenschap, en horizontale pleiotropie, waarbij effecten op meerdere eigenschappen onafhankelijk zijn

In het geval van horizontale pleiotropie werkt een individuele variant op eigenschappen A en B zonder een relatie op eigenschapniveau tussen die eigenschappen te weerspiegelen. In tegenstelling tot verticale pleiotropie kunnen we horizontale pleiotropie niet detecteren door correlaties tussen kenmerken te detecteren, omdat we het effect op variantniveau niet beschouwen als bewijs van een relatie tussen de twee kenmerken. In plaats daarvan werkt elke horizontaal pleiotrope variant via zijn eigen unieke mechanisme. Deze specifieke pleiotrope varianten zouden dus een verband tussen de twee eigenschappen moeten vertonen dat afwijkt van het verband dat we zouden afleiden uit de genoombrede correlatie van effectgroottes tussen die eigenschappen. Deze afwijking van de correlatie tussen kenmerken is geen voorspelling van een of ander pleiotropiemodel, maar volgt gewoon uit onze definitie van de term “horizontale pleiotropie”: elk paar kenmerken waarvan de effectgroottes gecorreleerd zijn over alle varianten heen, is per definitie gerelateerd door verticale pleiotropie, terwijl elke variant waarvan de effecten op twee kenmerken substantieel afwijken van de relatie tussen die kenmerken op het niveau van het kenmerk, per definitie horizontale pleiotropie vertoont.

Een kwantitatieve score voor pleiotropie

Wij hebben een methode ontwikkeld om horizontale pleiotropie te meten met behulp van samenvattende statistische gegevens van GWASs op meerdere kenmerken. Onze methode berust op het toepassen van een statistische “whitening” procedure op een set van input variant-trait associaties, die correlaties tussen kenmerken veroorzaakt door verticale pleiotropie verwijdert en effect sizes normaliseert over alle kenmerken. Met behulp van de decorrelatie Z-scores van de associaties meten we twee verwante maar verschillende componenten van pleiotropie: de totale grootte van het effect op gewitte kenmerken (“grootte”-score, Pm) en het totale aantal gewitte kenmerken dat door een variant wordt beïnvloed (“aantal kenmerken”-score, Pn). Beide scores worden vervolgens geschaald door het aantal kenmerken en vermenigvuldigd met 100, zodat de eindscore de waarde weergeeft zoals die zou worden gemeten in een dataset van 100 kenmerken. Deze uit twee componenten bestaande kwantitatieve pleiotropiescore stelt ons in staat zowel de grootte (pleiotropie-magnitudescore Pm) als de kwantiteit (pleiotropie-aantal kenmerken-score Pn) van horizontale pleiotropie voor alle SNV’s in het menselijk genoom te meten. In principe zijn dit verschillende grootheden: de magnitudescore Pm meet de totale pleiotrope effectgrootte van een variant over alle kenmerken, terwijl de aantal kenmerken-score Pn het aantal afzonderlijke pleiotrope effecten meet die een variant heeft. Een variant met een hoge Pm-score en een lage Pn-score heeft een groot effect, verspreid over een klein aantal kenmerken; een variant met een lage Pm-score en een hoge Pn-score heeft over het geheel genomen slechts een klein effect, maar dat effect is verspreid over een groot aantal kenmerken; en een variant met hoge scores op beide componenten heeft een groot effect dat verspreid is over een groot aantal kenmerken. Aangezien wij verwachten dat deze scores sterk beïnvloed worden door het linkage disequilibrium (LD), drukken wij Pm en Pn uit tegen de LD-scores om een voor LD gecorrigeerde score te verkrijgen ({P}_m^{LD}} \) en \( {P}_m^{LD} \)) (Fig. 2 en 3; Methoden).

Fig. 2
figure2

Bijdragen van linkage disequilibrium (LD) en polygeniciteit aan horizontale pleiotropie. Naast de normale betekenis van horizontale pleiotropie wordt verwacht dat zowel linkage disequilibrium (LD) als polygeniciteit tot horizontale pleiotropie bijdragen. In het geval van LD-geïnduceerde horizontale pleiotropie hebben twee gekoppelde SNV’s onafhankelijke effecten op verschillende kenmerken die door de koppeling tussen de SNV’s pleiotroop lijken. In het geval van polygeniciteit-geïnduceerde horizontale pleiotropie hebben twee sterk polygene kenmerken een overlapping in hun polygene voetafdruk

Fig. 3
figure3

Twee-component pleiotropiescore methode. We (i) verzamelen associatiestatistieken van de UK Biobank, (ii) verwerken deze met behulp van Mahalanobis whitening, (iii) berekenen de twee componenten van onze pleiotropiescore (Pm en Pn) op basis van de gewitte associatiestatistieken, (iv) gebruiken LD-scores om te corrigeren voor door LD veroorzaakte pleiotropie (\( {P}_m^{\mathrm{LD}} \) en \( {P}_n^{\mathrm{LD}} \)), en (v) permutatiegebaseerde P-waarden gebruiken om te corrigeren voor polygene architectuur (\( {P}_m^P \) en \( {P}_n^P \))

Berekening van de significantie van pleiotropie

We berekenen P-waarden voor de twee componenten van onze pleiotropiescore volgens twee verschillende procedures, die overeenkomen met twee verschillende nulverwachtingen.

  1. Theoretische P-waarden (ruwe pleiotropiescore of LD-gecorrigeerde pleiotropiescore), berekend analoog aan P-waarden voor genetische associatiestudies, waaronder GWAS, gebaseerd op een nulscenario waarin varianten geen pleiotropische effecten op waargenomen kenmerken vertonen.

  2. Empirische P-waarden (polygeniciteit/LD-gecorrigeerde pleiotropiescore ), berekend door permutatie van de waargenomen verdelingen van gewitte kenmerken. Deze P-waarden zijn gebaseerd op een nulscenario waarin varianten significante effecten kunnen hebben op een of meer kenmerken, maar de effecten van elke variant op elke eigenschap onafhankelijk zijn en het aantal varianten met effecten op meerdere kenmerken niet meer is dan op grond van toeval zou worden verwacht.

Deze empirische correctie voor polygeniciteit is nodig omdat polygeniciteit een belangrijke factor is die pleiotropie kan veroorzaken. Er wordt bijvoorbeeld geschat dat ongeveer 100.000 onafhankelijke loci verantwoordelijk zijn voor de lengte bij de mens. Als het totale aantal onafhankelijke loci in het menselijke genoom ongeveer 1 miljoen bedraagt, komt dit overeen met ongeveer 10% van het menselijke genoom dat een effect heeft op de lengte. Als we ons meerdere fenotypen voorstellen met dezelfde zeer polygene genetische architectuur, moeten we een aanzienlijke overlap verwachten tussen causale loci voor meerdere verschillende kenmerken, zelfs als er geen echt causaal verband tussen de kenmerken is, wat resulteert in horizontale pleiotropie (Fig. 2).

Kracht om pleiotropie te detecteren in simulaties

We voerden een simulatiestudie uit om de prestaties van onze twee-componenten pleiotropiescore te evalueren. We simuleerden 800.000 varianten die 100 kenmerken controleerden, waarbij we de per-trait liability scale erfelijkheidsgraad van alle kenmerken h2 en de proportie pleiotrope en niet-pleiotrope causale varianten varieerden. Om LD in de simulaties te introduceren, gebruikten we echte LD architectuur van 800.000 SNVs van 1000 Genomes Europese populatie. We gesimuleerde Z-scores onafhankelijk voor elke SNV en vervolgens propageren LD voor een bepaalde SNV door “vervuilen” zijn Z-score volgens de Z-scores van de SNV’s in LD met het. In het nulmodel waren alle trait-variant associaties onafhankelijk, en werd geen horizontale pleiotropie toegevoegd. Onder de toegevoegde-pleiotropie modellen kozen we willekeurig een fractie van de causale varianten en dwongen we hen om gelijktijdige associaties met meerdere kenmerken te hebben. De simulatie studie toonde aan dat beide componenten van de pleiotropie score een goede power hadden om horizontale pleiotropie te detecteren (Fig. 4) en dat de LD correctie de afhankelijkheid van de pleiotropie score van LD drastisch vermindert (Extra bestand 1: Figuur S1). Onder de nulhypothese van geen toegevoegde horizontale pleiotropie, was het vals-positief percentage goed gecontroleerd voor beide scores wanneer er een lage erfelijkheidsgraad was of weinig causale varianten. Echter, wanneer er veel causale varianten en een hoge per-variant erfelijkheidsgraad, de LD-gecorrigeerde pleiotropie score ({P}_m ^ {LD} \) en {P}_n ^ {P}_mathrm {LD} \)) detecteert een groot overschot van pleiotrope varianten, als gevolg van serendipitous overlap tussen causale varianten zonder expliciet geïnduceerde pleiotropie. De voor LD/polygeniciteit gecorrigeerde empirische P-waarde (\( {P}_m^P \) en \( {P}_n^P \)) detecteert deze serendipitische pleiotropie niet in dezelfde hoge mate.

Fig. 4
figure4

Simulatiestudie met het percentage vals-positieven (a,b,c,d) en het vermogen (e,f,g,h) van de uit twee componenten bestaande pleiotropiescore. De bovenste rij toont de prestaties voor niet-pleiotrope gesimuleerde varianten (de zwarte lijn toont 5% vals-positieve percentages); de onderste rij toont de prestaties voor pleiotrope varianten (de zwarte lijn toont 80% power). Simulaties werden uitgevoerd voor zowel \( {P}_m^{\mathrm{LD}}) (links) als \( {P}_n^{\mathrm{LD}}) (rechts), en zowel zonder correctie voor polygeniciteit (a,c,e,g) als met de correctie (b,f,d,h), met per-variant erfelijkheidsgraad variërend van 0.0002 tot 0,2, proportie niet-pleiotrope causale loci variërend van 0 tot 1%, en proportie pleiotrope causale loci variërend van 0,1 tot 1%. Onze methode heeft een goed vermogen om pleiotropie voor sterk overerfbare eigenschappen te detecteren, hoewel dit vermogen door extreme polygeniciteit wordt gereduceerd. Extreme polygeniciteit verhoogt ook het vals-positieve percentage, maar dit effect wordt gecorrigeerd door onze polygeniciteitscorrectie

In aanwezigheid van toegevoegde horizontale pleiotropie was onze aanpak in staat om pleiotropie te detecteren met een per-variant erfelijkheidsgraad h2 van slechts 0,002 als er geen niet-pleiotrope oorzakelijke varianten zijn. In aanwezigheid van zowel pleiotrope als niet-pleiotrope causale varianten, was het opsporen van pleiotropie moeilijker, maar onze benadering had nog steeds een merkbare power om pleiotrope varianten op te sporen, die toenam met toenemende per-variante erfelijkheidsgraad en afnam met toenemend aantal niet-pleiotrope causale varianten. Het toevoegen van de correctie voor polygene architectuur (\( {P}_m^P \) en \( {P}_n^P \)) verminderde dit vermogen slechts licht. De kracht van onze methode werd niet substantieel verminderd door het aantal kenmerken te verhogen dat beïnvloed werd door pleiotrope varianten (Extra bestand 1: Figuur S2) of door een realistische correlatiestructuur tussen de kenmerken toe te voegen (Additional file 1: Figuur S3).

Genome-wide pleiotropy study (GWPS) reveals pervasive pleiotropy

Om onze methode toe te passen op echte menselijke associatie data, gebruikten we GWAS associatie statistieken voor 372 erfelijke medische kenmerken gemeten in 337.119 individuen uit de UK Biobank . We berekenden met succes onze twee-componenten pleiotropie score voor 767.057 varianten genoom-breed en voerden een genoom-brede pleiotropie studie (GWPS) uit, naar analogie van een standaard GWAS (Fig. 3; Methodes). Additional file 1: Figuur S4 toont de resulterende quantiel-quantiel plots (Q-Q plots). We zagen een significante inflatie voor zowel de LD-gecorrigeerde magnitude score \( {P}_m^{\mathrm{LD}} \) en het aantal eigenschappen score \( {P}_n^{\mathrm{LD}} \) (Mann-Whitney U test P < 10-300 voor beide). Bovendien zagen we bij beide scores dat horizontale pleiotropie wijd verspreid was over het genoom, in plaats van gelokaliseerd te zijn op een paar specifieke loci (Additional file 1: Figuur S5). Het testen van een alternatieve strategie voor het berekenen van het fenotype-correlatie matrix met behulp van alle SNV’s leverde vergelijkbare resultaten (Pearson r = 0,995 en 0,964 voor respectievelijk {P}_m^{LD}}) en {P}_n^{LD}}) onze strategie van het gebruik van een gesnoeide set van SNV’s om rekening te houden voor LD (r2 < 0.1) (Additional file 1: Figure S6).

Pleiotropie wordt gedreven door polygeniciteit

We pasten de permutatie-gebaseerde empirische P waarde berekening toe (polygeniciteit/LD-gecorrigeerde pleiotropie score: \om te corrigeren voor de bekende polygene architectuur van kenmerken en om te testen of er loci zijn die in sterkere mate pleiotroop zijn dan op grond van polygeniciteit verwacht zou worden. Additional file 1: Figuren S7 en S8 tonen de resulterende Q-Q plots en Manhattan plots. In tegenstelling tot de resultaten van de LD gecorrigeerde pleiotropie score (\( {P}_m^{LD}} \) en \( {P}_n^{\mathrm{LD}} \)), vinden we geen pleiotropie aanzienlijk hoger dan wat zou worden verwacht van de bekende polygene architectuur van eigenschappen: Er zijn dramatisch minder loci met genoombrede significante niveaus van pleiotropie na correctie voor polygene architectuur, en de genoombrede verdeling van de pleiotropiescore laat minder pleiotropie zien dan verwacht (Mann-Whitney U test P < 10-300 voor zowel ( {P}_m^P \) als ( {P}_n^P \)).

Als een extra test of de pleiotropie die we waarnemen wordt aangedreven door polygeniciteit, hebben we de polygeniciteit berekend van dezelfde 372 erfelijke kenmerken uit de UK Biobank. We hebben de polygeniciteit gemeten met behulp van een versie van de genomische inflatiefactor, gecorrigeerd met de LD-score ({\lambda}_{\mathrm{GC}}^c \) . Vervolgens stratificeerden we deze kenmerken door {\lambda}_{\mathrm{GC}}^c \) na controle voor erfelijkheidsgraad (Methodes) en berekenden de twee-component LD-gecorrigeerde pleiotropie score en P-waarden voor elke component onafhankelijk voor elke variant in het genoom met behulp van elk van deze bakken van kenmerken. We zagen dat beide scores sterk afhankelijk zijn van polygeniciteit, met de laagste-polygeniciteit bins in elke erfelijkheids klasse die zeer weinig inflatie vertonen. (Fig. 5; Additional file 1: Tabel S1). Alles bij elkaar suggereren deze resultaten dat extreme polygeniciteit horizontale pleiotropie aanstuurt en dat dit een extreem groot effect heeft op de genetische architectuur van menselijke fenotypes.

Fig. 5
figure5

Quantiel-quantiel (Q-Q) plots die de inflatie van de pleiotropiescore laten zien als functie van polygeniciteit. Varianten zijn gestratificeerd in 4 batches van ongeveer 80 kenmerken elk op basis van erfelijkheidsgraad, en vervolgens onderverdeeld in 5 batches van ongeveer 20 kenmerken elk op basis van polygeniciteit, zoals gemeten door de gecorrigeerde genomische inflatiefactor ( {\lambda}_{mathrm{GC}}^c \). Donkerder tinten staan voor lage polygeniciteit en lichter tinten voor hoge polygeniciteit. Alle panelen tonen -log10 getransformeerde P-waarden. De zwarte lijnen tonen de verwachte waarde onder de nulhypothese

Genoombrede verdeling van de pleiotropiescore geeft inzicht in de genetische architectuur

Naast het waarnemen van de genoombrede inflatie van de pleiotropiescore kunnen we ook inzicht krijgen in de verdeling van de pleiotropiescore op een meer granulair niveau.

Figuur 6a toont de verdeling van de pleiotropiescore voor onafhankelijke SNV’s (LD gesnoeid tot een drempel van r2 < 0,1) vergeleken met de verwachting onder de nulhypothese van geen pleiotropisch effect. We zien een grote overmaat in de score voor het aantal kenmerken \( {P}_n^{\mathrm{LD}}), en een kleinere maar nog steeds zeer significante overmaat in de totale grootte van het pleiotrope effect \( {P}_m^{\mathrm{LD}}). Deze overmaat is deels te wijten aan een lange staart van zeer pleiotrope loci die de drempel van genoombrede significantie halen (stippellijn in Fig. 6a), maar wordt vooral aangedreven door zwakke pleiotropie onder loci die geen genoombrede significantie halen.

Fig. 6
figure6

Verdeling van de pleiotropiescore over varianten (a), genen (b), en kenmerken (c). a De globale verdeling van \( {P}_m^{\mathrm{LD}} \) (links) en \( {P}_n^{\mathrm{LD}} \) (rechts) voor de 767.057 geteste varianten. De verwachte verdeling onder de nulhypothese van geen pleiotropie wordt in rood weergegeven en de waargenomen verdeling in blauw. De verticale lijn vertegenwoordigt de waarde van de pleiotropie score die overeenkomt met genoom-brede significantie (P < 5 × 10- 8). In totaal zijn 1769 ({P}_m^{\mathrm{LD}}) en 643 ({P}_n^{\mathrm{LD}})) varianten voor de duidelijkheid niet weergegeven, omdat ze extreme waarden voor de pleiotropiescore hebben. b De verdeling van de gemiddelde pleiotropiescore voor coderende varianten in elk gen voor {P}_m^{LD}} (links) en {P}_n^{\mathrm{LD}}} (rechts). De top tien genen staan rechts in de grafieken, terwijl genen met een pleiotropie score van 0 links in de grafieken staan. c De bijdrage van pleiotrope varianten aan 82 complexe kenmerken en ziekten. De bijdrage van pleiotrope varianten wordt berekend als de correlatiecoëfficiënt tussen de absolute waarde van de Z-scores en de pleiotropie score tussen varianten die genoombreed significant zijn voor de pleiotropie score.breed significant zijn voor de pleiotropie score (P < 5 × 10- 8 voor respectievelijk {P}_m^{\mathrm{LD}}) en {P}_n^{\mathrm{LD}}))

Pleiotropie score is gecorreleerd met moleculaire en biologische functie

Om de eigenschappen van pleiotropische varianten verder te onderzoeken, onderzochten we de effecten van verschillende functionele en biochemische annotaties op onze LD-gecorrigeerde pleiotropie score ({P}_m^{\mathrm{LD}} \) en \( {P}_n^{\mathrm{LD}} \)) (Tabel 1; Methoden). Met behulp van annotaties van Ensemblant Variant Effect Predictor zagen we dat beide componenten van de pleiotropie score gemiddeld hoger zijn in transcribente regio’s (coderende en UTR) dan in intergene niet-coderende regio’s. Dit resultaat werd bevestigd en uitgebreid door annotaties van Roadmap Epigenomics , waaruit bleek dat regio’s waarvan de chromatine configuraties werden geassocieerd met actief getranscribeerde regio’s, promotors, enhancers, en transcriptiefactor bindingsplaatsen significant hogere niveaus van beide componenten van de pleiotropie score hadden, terwijl heterochromatine en quiescent chromatine staten significant lagere niveaus hadden. Onderzoekend naar individuele histon markeringen, vonden we dat zowel de repressieve histon markering H3K27me3 als de activerende histon markering H3K27ac geassocieerd waren met verhoogde niveaus van pleiotropie, hoewel de activerende markering H3K27ac een groter effect had. Dit kan erop wijzen dat actieve regulering tot hogere niveaus van pleiotropie leidt, of die regulering nu repressief of activerend is.

Tabel 1 Functionele verrijkingsanalyse van de pleiotropiescore

We hebben ook gegevens van het Genotype-Weefsel Expressie-project gebruikt om het verband tussen transcriptionele effecten en onze pleiotropiescore te meten (Tabel 1). In overeenstemming met de eerdere observatie dat functionele regio’s hogere pleiotropie scores hadden, vonden we dat varianten die werden geïdentificeerd als cis eQTLs voor elk gen in elk weefsel gemiddeld hogere pleiotropie scores hadden. Binnen eQTLs zagen we ook significante correlaties tussen onze pleiotropie score en het aantal genen ({P}_m^{LD}}: r = 0.036, P < 2.2 × 10- 16; \( {P}_n^{\mathrm{LD}}): r = 0.035, P < 2.2 × 10- 16) en weefsels (\( {P}_m^{\mathrm{LD}}): r = 0.032, P < 2.2 × 10- 16) en weefsels (\( {P}_m^{\mathrm{LD}}): r = 0.062, P < 2.2 × 10- 16; \( {P}_n^{\mathrm{LD}}) \): r = 0.059, P < 2.2 × 10- 16) waar de variant geannoteerd was als een eQTL, waaruit blijkt dat onze pleiotropie score gerelateerd is aan transcriptionele maten van pleiotropie.

Ten slotte vonden we dat varianten die eQTLs zijn voor genen waarvan de orthologs geassocieerd zijn met meerdere meetbare fenotypen in muizen of gist, hogere pleiotropie scores hebben, waaruit blijkt dat onze pleiotropie score ook gerelateerd is aan pleiotropie in modelorganismen.

Al deze resultaten zijn consistent bij gebruik van de polygeniciteit/LD gecorrigeerde pleiotropie score (\( {P}_m^P \) en \( {P}_n^P\Big) \), wat aangeeft dat de associatie van pleiotropie met moleculaire en biologische functie is niet uitsluitend gedreven door zeer polygene architectuur (Additional file 2).

Genoom-brede pleiotropie studie identificeert nieuwe biologische loci

Naar analogie van standaard GWAS, kan onze GWPS methodologie identificeren individuele varianten die een genoom-breed significant niveau van horizontale pleiotropie hebben. Met behulp van de LD-gecorrigeerde magnitudescore ({P}_m^{\mathrm{LD}}) identificeerden we 74.335 varianten in 8093 onafhankelijke loci met een genoombreed significant niveau van horizontale pleiotropie, terwijl we met behulp van de LD-gecorrigeerde aantal eigenschappen score ({P}_n^{\mathrm{LD}}) 18.000 varianten in 2859 onafhankelijke loci identificeerden,393 varianten in 2859 onafhankelijke loci met een genoom-breed significant niveau van horizontale pleiotropie, die ook allemaal worden geïdentificeerd door de LD-gecorrigeerde magnitude score ( {P}_m^{\mathrm{LD}}) \) (Methoden, Additional file 1: Tabel S2). Toepassing van dezelfde analyse op de polygeniciteit / LD-gecorrigeerde pleiotropie score, met behulp van de polygeniciteit / LD-gecorrigeerde magnitude score ( {P}_m ^P \) geïdentificeerd geen genoom-brede significante loci, maar met behulp van de polygeniciteit / LD-gecorrigeerd aantal kenmerken score ( {P}_n ^P \) geïdentificeerd 2674 varianten in 432 loci. Opvallend is dat een meerderheid van de loci die significant zijn in {P}_n^{mathrm{LD}} \) (1519 van 2859) of {P}_n^P \) (294 van 432), samen met een aanzienlijke minderheid van loci die significant zijn in {P}_m^mathrm{LD}} \) (2934 van 8093), hebben geen vermelding in de NHGRI-EBI GWAS catalogus, wat betekent dat ze nooit gerapporteerd werden als een geassocieerde locus in een gepubliceerde GWAS. Deze loci vertegenwoordigen een ondergewaardeerde klasse van genetische variatie die meerdere zwakke tot intermediaire effecten heeft die collectief significant zijn, maar geen specifiek sterk effect op een bepaalde eigenschap. Functionele verrijkingsanalyse op genen in de buurt van deze genoombreed significante loci impliceert een breed scala aan biologische functies, waaronder celadhesie, post-translationele modificatie van eiwitten, cytoskelet, transcriptiefactoren, en intracellulaire signalering cascades (Additional file 3). Loci die significant zijn in \( {P}_n^P \) laten een meer gerichte subset van functies zien, met een grotere rol voor nucleaire eiwitten die transcriptie en chromatine status reguleren, wat suggereert dat dit de functies zijn die horizontale pleiotropie vertonen voorbij het basisniveau geïnduceerd door polygeniciteit. De rol van deze nieuwe loci en deze biologische processen in de menselijke genetica en biologie kan een vruchtbaar gebied zijn voor toekomstige studie, met het potentieel voor biologische ontdekking.

Pleiotrope loci repliceren in onafhankelijke GWAS datasets

Als replicatie datasets gebruikten we twee extra bronnen van GWAS samenvattende statistieken om onze LD-gecorrigeerde pleiotropie score te berekenen (\( {P}_m^{\mathrm{LD}} \) en \( {P}_n^{\mathrm{LD} \)): eerder gepubliceerde GWASs en meta-analyses voor 73 menselijke complexe kenmerken en ziekten, die we handmatig uit de literatuur hebben verzameld en gecureerd (Methods, Additional file 1: Table S3) ; en een eerder gepubliceerde studie van 430 bloedmetabolieten gemeten bij 7824 Europese volwassenen . Voor alle varianten die door de UK Biobank werden gedekt, waren wij in staat om onze pleiotropie score onafhankelijk van elkaar te berekenen met behulp van deze twee datasets (Fig. 7). In de traits and diseases dataset zagen we dat 57% van de {P}_m^{LD}} loci en 38% van de {P}_n^{LD}} loci repliceerden, terwijl we in de bloedmetabolieten dataset, zagen we dat 17% van de \( {P}_m^{mathrm{LD}} \) loci en 12% van de \( {P}_n^{mathrm{LD}} \) loci repliceerden, vergeleken met 5% van de \( {P}_m^{mathrm{LD}} \) loci en 6% van de \( {P}_n^{mathrm{LD}} \) loci die door toeval verwacht werden volgens een op permutatie gebaseerd nulmodel. Deze hoge replicatiegraad bij gebruik van onafhankelijke sets van GWAS-samenvattende statistieken suggereert dat onze pleiotropiescore een onderliggende biologische eigenschap vastlegt, eerder dan een artefact van de UK Biobank studie.

Fig. 7
figure7

Replicatieanalyse voor de genoomwijde pleiotropiestudie. We gebruikten 372 erfelijke medische kenmerken uit de UK Biobank als onze detectiedataset, en onafhankelijke datasets van 73 complexe kenmerken en ziekten en 430 bloedmetabolieten als replicatiedatasets. In elk geval werd de verwachte replicatiefractie empirisch bepaald met behulp van een permutatieanalyse

Pleiotropie is gecorreleerd met specifieke complexe kenmerken en ziekten

Om de fenotypische associaties van deze loci te karakteriseren, gebruik gemaakt van onze replicatie dataset van gepubliceerde GWAS samenvattende statistieken voor 73 menselijke kwantitatieve kenmerken en ziekten, plus negen extra kenmerken die we uitgesloten hebben van onze replicatie dataset voor een totaal van 82 (Methodes). We kunnen de mate van pleiotropie van deze kenmerken niet rechtstreeks berekenen, omdat onze definitie van horizontale pleiotropie alleen van toepassing is op individuele varianten en niet op kenmerken. We kunnen echter wel eigenschappen identificeren waarvan de GWAS-variantassociaties gecorreleerd zijn met onze pleiotropiescore, die in zekere zin de eigenschappen vertegenwoordigt die het meest bijdragen tot ons signaal van alomtegenwoordige horizontale pleiotropie. Figuur 6c toont de correlaties tussen onze LD-gecorrigeerde pleiotropie score ({P}_m^{LD}}) en {P}_n^{LD}}) en de associatie statistieken voor deze 82 kenmerken en ziekten. De sterkst gecorreleerde kenmerken waren antropometrische kenmerken zoals de body mass index, taille- en heupomtrek, en lengte; bepaalde bloedlipidenwaarden, waaronder totaal cholesterol en triglyceriden; en schizofrenie. Al deze kenmerken staan bekend als zeer polygeen en heterogeen. Tot de minst gecorreleerde kenmerken behoren verschillende metingen van insulinegevoeligheid en glucoserespons, zoals de insulinegevoeligheidsindex (ISI), bepaalde kenmerken van de hersenmorfologie en de ontstekingsbiomarker lipoproteïne (a). Dit kan gedeeltelijk te wijten zijn aan de geringe steekproefomvang van de overeenkomstige GWASs. Deze correlaties lijken echter niet uitsluitend te worden bepaald door de steekproefgrootte: in gevallen waarin meerdere GWASs voor dezelfde eigenschap zijn uitgevoerd op deelmonsters van de bevolking (bijvoorbeeld alleen mannen, alleen vrouwen, en gecombineerd), beïnvloedt de steekproefgrootte de correlatie slechts marginaal (Additional file 1: Table S4). Een andere factor die kan bijdragen is erfelijkheid: lengte, in het bijzonder, behoort tot de meest erfelijke eigenschappen die we onderzochten, terwijl ISI en de kenmerken van de hersenmorfologie tot de minst erfelijke behoren.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *