variabler med tidsvarierande effekter och Cox-modellen: vissa statistiska begrepp illustrerade med en prognostisk faktorstudie i bröstcancer

överlevnadsanalys

i många studier är den primära variabeln av intresse en fördröjning, såsom tiden från cancerdiagnos till en viss händelse av intresse., Denna händelse kan vara död, och därför kallas analysen av sådana data ofta som överlevnadsanalys. Händelsen av intresse kan inte ha inträffat vid tidpunkten för den statistiska analysen, och på samma sätt kan ett ämne förloras för uppföljning innan händelsen observeras. I sådana fall sägs data att censureras vid tidpunkten för analysen eller vid den tidpunkt då patienten förlorades för uppföljning. Censurerade data ger fortfarande lite information eftersom även om vi inte vet det exakta datumet för händelsen, vet vi att det inträffade senare än censurtiden.,

både Kaplan-Meier-metoden och Cox proportional hazards (PH) – modellen gör det möjligt för en att analysera censurerade data och att uppskatta överlevnadssannolikheten, S (t), det är sannolikheten att ett ämne överlever längre än en tid t. statistiskt tillhandahålls denna sannolikhet av överlevnadsfunktionen S(t) = P (t > t), där T är överlevnadstiden. Kaplan Meier-metoden uppskattar överlevnadssannolikheten icke-parametriskt, det vill säga förutsatt att ingen specifik underliggande funktion ., Flera tester är tillgängliga för att jämföra överlevnadsfördelningarna mellan grupper, inklusive log-rank och Mann-Whitney-Wilcoxon-testen . Cox PH-modellen står för flera riskfaktorer samtidigt. Det innebär inte någon fördelning, eller form för överlevnadsfunktionen, men den momentana incidensen av händelsen modelleras som en funktion av tid och riskfaktorer.,

den momentana farofrekvensen vid tidpunkten t, även kallad momentana incidens, död, eller felfrekvens, eller risk, är den momentana sannolikheten att uppleva en händelse vid tiden t, med tanke på att händelsen inte har inträffat ännu. Det är en händelsehastighet per tidsenhet och får variera över tiden. Precis som risken för händelser per tidsenhet, kan man göra en analogi genom att överväga den hastighet som ges av en bil hastighetsmätare, som representerar avståndet tillryggalagd per tidsenhet. Antag att händelsen av intresse är döden, och vi är intresserade av dess association med n covariates, X1, X2,…,, Xn, då ges faran av:

(1)

baseline hazard rate h0(t) är en ospecificerad icke-negativ funktion av tiden. Det är den tidsberoende delen av faran och motsvarar farofrekvensen när alla kovariatvärden är lika med noll. β1, β2, …, ßn är koefficienterna för regressionsfunktionen ß1x1 + ß2x2+… ßnxn., Antag att vi är intresserade av en enda kovariat då är risken:

(2)

(3)

Om du tar x2 = x1 + 1, minskar riskkvoten till HR = exp(β) och motsvarar till följd av en enhetsökning i den förklarande variabeln x på risken för händelse. Eftersom β = log (HR) kallas β log hazard ratio. Även om farofrekvensen hx (t) tillåts variera över tiden, är riskkvoten HR konstant; detta är antagandet om proportionella faror., Om HR är större än 1 (β > 0), ökar händelserisken för individer med kovariatvärde x2 jämfört med individer med kovariatvärde x1, medan en HR lägre än 1 (β < 0) indikerar en minskad risk. När HR inte är konstant över tiden sägs variabeln ha en tidsvarierande effekt; till exempel kan effekten av en behandling vara stark omedelbart efter behandlingen men bleknar med tiden. Detta bör inte förväxlas med en tidsvarierande kovariat, som är en variabel vars värde inte är fast över tiden, till exempel rökningsstatus., Faktum är att en person kan vara en icke-rökare, då en rökare, då en icke-rökare. Observera dock att en variabel kan vara både tidsvarierande och ha en effekt som ändras över tiden.

i en Cox PH-modell uppskattas HR genom att överväga varje gång t vid vilken en händelse inträffar. Vid uppskattning av den totala HR under den fullständiga uppföljningsperioden ges samma vikter till den mycket tidiga HR som påverkar nästan alla individer och till mycket sena HR som påverkar endast de mycket få individer som fortfarande är i riskzonen. HR är således i genomsnitt över händelsetiderna., Vid proportionella risker påverkas den totala personalstyrkan inte av detta viktningsförfarande. Om däremot HR ändras över tiden, det vill säga farofrekvensen inte är proportionell, kan lika viktning leda till en icke-representativ HR och kan ge partiska resultat . Det bör noteras att HR är i genomsnitt över händelsetiderna snarare än över uppföljningstiden. Det är oförändrat om tidsskalan ändras utan att störa beställningen av händelser.,

exempel

vi tillämpade några av de presenterade metoderna på bröstcancerpatienter eftersom tidsvarierande effekter har rapporterats, t .ex. för nodal-eller hormonreceptorstatus. Vi studerade kvinnor med icke-metastatisk, operativ bröstcancer som genomgick operation mellan 1989 och 1993 vid vår institution, och som inte fick tidigare neoadjuvant behandling. Uteslutningskriterier inkluderade en tidigare historia av bröstcancer, samtidig kontralateral bröstcancer och patologiska data saknas., Uppföljning utfördes enligt kraven i europeisk god klinisk praxis och bestod av regelbundna fysiska undersökningar, och årliga röntgen mammogram, och ytterligare bedömningar vid misstänkta metastaser. Kliniska och patologiska egenskaper analyserades enligt den sjukhusinspelade filen vid tidpunkten för behandlingsstart. Patologisk tumörstorlek (≤eller > 20 mm) mättes på färska kirurgiska prov. En modifierad version av Scarff-Bloom-Richardson betygssystemet användes (SBR klass i, II, eller III)., PVI (ja, nej) definierades som förekomst av neoplastiska emboli inom entydig vaskulär lymfatisk eller kapillär lumina i områden intill brösttumören. Undersökande immuno-histokemiska analyser utfördes på en vävnadsmikroarray (TMA) för att bedöma hormonreceptorstatus (hrec) (positiv om ER-positiv och/eller progesteronreceptorpositiv). Er-och PgR-uttrycksnivåer utvärderades halvkvantitativt enligt ett standardprotokoll med avstängningsvärden vid 10% positiva tumörceller. HER2 uttryck nivå utvärderades enligt Herceptest poängsystem ., Mib1 uttrycksnivå utvärderades halvkvantitativt. Information om alla faktorer fanns tillgänglig för 979 kvinnor (Tabell 1). Medianuppföljningstiden var 14 år (95% konfidensintervall: 13,7 – 14,2) och 264 kvinnor utvecklade metastaser.

Tabell 1 egenskaper hos studiepopulationen.

arbetsexempel

prognostiska faktorer valdes ursprungligen utifrån aktuell kunskap om risken för metastaser., De analyserades nästa med hjälp av en konventionell Cox-regressionsmodell; alla var statistiskt signifikanta på 5% – nivån i univariata analyser och infördes sedan på en multivariat Cox-modell., Risken för metastaser ökade för kvinnor med yngre ålder jämfört med äldre ålder; grade II-och III-tumörer jämfört med grade i-tumörer; stor jämfört med små tumörstorlekar; lymfkörtelengagemang jämfört med inget engagemang; och PVI jämfört med no PVI (ytterligare file 1: Estimated log hazard ratios (log(HR))) och hazard ratios (HR = exp()) med 95% konfidensintervall (95% CI) och p-värden för modellkovariater vid montering av en multivariat konventionell Cox-modell och en Cox-modell med time-by-covariate interaktioner.)., Baserat på denna modell påverkade alla variabler, men hormonreceptorn, Her2 och mib1-status, signifikant risken för metastaser.

bedömning av icke-proportionalitet: grafisk strategi

i närvaro av en kategorisk variabel kan man plotta Kaplan-Meier-överlevnadsfördelningen, S(t), som en funktion av överlevnadstiden, för varje nivå av kovariaten. Om pH-antagandet är uppfyllt bör kurvorna stadigt glida ifrån varandra., Man kan också tillämpa en omvandling av Kaplan-Meier survival curves och rita funktionsloggen(-log(S(t))) som en funktion av log survival time, där log representerar den naturliga logaritmen funktionen. Om farorna är proportionella bör de stratumspecifika log-minus-log-tomterna uppvisa konstanta skillnader, det vill säga vara ungefär parallella. Dessa visuella metoder är enkla att genomföra men har begränsningar. När kovariaten har mer än två nivåer, Kaplan-Meier tomter är inte användbara för kräsna icke-proportionalitet eftersom graferna blir rörig ., På samma sätt, även om pH-antagandet inte kan brytas, är log-minus-log-kurvorna sällan helt parallella i praktiken och tenderar att bli glesa vid längre tidpunkter och därmed mindre exakta. Det är inte möjligt att kvantifiera hur nära parallellen är tillräckligt nära och därmed hur proportionell farorna är. Beslutet att acceptera PH-hypotesen beror ofta på om dessa kurvor korsar varandra. Som ett resultat kan beslutet att acceptera PH-hypotesen vara subjektivt och konservativt , eftersom man måste ha starka bevis (korsningslinjer) för att dra slutsatsen att pH-antagandet bryts., Med tanke på dessa begränsningar föreslår vissa att man tillhandahåller standardfel till dessa tomter . Detta tillvägagångssätt kan dock vara beräkningsintensivt och är inte direkt tillgängligt i vanliga datorprogram. Kaplan-Meier och log-minus-log tomter finns tillgängliga från de flesta vanliga statistiska paket (Tabell 2).

Tabell 2 statistisk programvara

arbetsexempel (forts.)

Kaplan-Meier överlevnadskurvor och log-minus-logdiagram visas för vissa variabler (figurerna 1 och 2)., Kaplan-Meier survival curves tycktes stadigt glida ifrån varandra för alla utom hormonreceptorstatus, Her2-status och mib1-status. Log-minus log tomter såg ungefär parallellt för ålder, storlek på tumören, lymfkörtel engagemang, och PVI. Återigen tenderade tomter för hormonreceptorstatus, Her2-status och mib1-status att indikera ett brott mot pH-antagandet. Det fanns också viss misstanke om SBR-klassen.,

Figure 1

Kaplan-Meier survival curves for SBR grade, tumour size, PVI, hormone receptor status.

Figure 2

Log(-log(survival)) curves as a function of time (log scale) for SBR grade, tumour size, PVI, hormone receptor status.,

bedömning av icke-proportionalitet: modellering och teststrategier

grafiska metoder för kontroll av pH-antagandet ger inte ett formellt diagnostiskt test, och bekräftande metoder krävs. Det finns flera alternativ för testning och redovisning av icke-proportionalitet.

Cox föreslog att bedöma avvikelse från icke-proportionalitet genom att införa en konstruerad tidsberoende variabel, det vill säga lägga till en interaktionsperiod som innebär tid för Cox-modellen och testa för dess betydelse ., Antag att man är intresserad av att utvärdera om någon variabel X har en tidsvarierande effekt. En tidsberoende variabel skapas genom att bilda en interaktionsperiod (produkt) mellan prediktorn, X (kontinuerlig eller kategorisk) och en funktion av tiden t (F(t) = T, T2, log(t)…). Genom att lägga till denna interaktion i modellen (ekvation 2) blir faran då:

(5)

riskförhållandet ges av HR(t) = HX+1(t)/hx(t) = exp för en enhetsökning i variabeln X och är tidsberoende genom funktionen f(t)., Om γ >0 (γ< 0), ökar HR (minskar) över tiden. Testning för icke-proportionalitet av farorna är likvärdig med testning Om γ skiljer sig väsentligt från noll. Man kan använda olika tidsfunktioner som polynom eller exponentiellt förfall men ofta är mycket enkla fasta funktioner av tid som linjära eller logaritmiska funktioner föredragna . Denna modellering ger också uppskattningar av riskkvoten vid olika tidpunkter eftersom värdena t tid kan monteras i funktionen riskkvot., Tidsberoende variabler ger en flexibel metod för att utvärdera avvikelse från icke-proportionalitet och en metod för att bygga en modell för beroende av relativ risk över tiden. Detta tillvägagångssätt bör dock användas med försiktighet. Om den valda tidsfunktionen är felspecificerad kommer den slutliga modellen inte att vara lämplig. Detta är en nackdel med denna metod över mer flexibelt tillvägagångssätt.

arbetsexempel (forts)

Vi skapade tid-för-kovariat interaktioner för varje variabel av modellen, genom att införa produkter mellan variablerna och en linjär funktion av tiden., Som visas i ytterligare fil 1 (uppskattad log hazard ratio(log (HR)) och hazard ratio (HR = exp ()) med 95% konfidensintervall (95% CI) och p-värden för modellkovariater vid montering av en multivariat konventionell Cox-modell och en Cox-modell med tid-för-kovariat interaktioner.), signifikanta tid-för-kovariat-interaktioner involverade SBR-klassen, hormonreceptorstatus, Her2-status och PVI (p < 0.05). Dessa resultat visade således att riskkvoterna i samband med dessa faktorer inte var konstanta över tiden., Parametrarna () associerade med de flesta interaktioner var negativa, vilket tyder på att riskkvoterna minskade över tiden. Den uppskattade riskkvoten i samband med en SBR grad II (jämfört med Grad I) som en funktion av tid t gavs av: HR(t) = exp(1.71 – 0.14 t). Hazard ratio var 4, 8, 3, 6 respektive 2, 7 vid 1, 3 respektive 5 år. På samma sätt var det uppskattade riskförhållandet associerat med hormonreceptorstatus: HR(t) = exp(0, 73 – 0, 14 t), det vill säga riskförhållanden på 1, 8, 1, 3 och 1, 0 vid 1, 3 respektive 5 år., Medan den konventionella Cox-modellen inte visade någon signifikant effekt för hormonreceptorer, hade Her2 och Mib1, dessa variabler en signifikant effekt en gång vid samtidig interaktion inkluderades.

avvikelse från icke-proportionalitet kan också undersökas med hjälp av residualerna i modellen. En återstående mäter skillnaden mellan de observerade uppgifterna och de förväntade uppgifterna enligt modellens antagande. Schoenfeld residualer beräknas och rapporteras vid varje feltid under PH-antagandet, och som sådan definieras inte för censurerade ämnen ., De definieras som kovariatvärdet för individen som misslyckades minus dess förväntade värde förutsatt att modellens hypoteser hålls. Det finns en separat Rest för varje individ för varje kovariat. En jämn plot av Schoenfeld residuals kan sedan användas för att direkt visualisera log hazard ratio . Om farorna står i proportion till riskerna är Schoenfeld residuals oberoende av tid. Således är en tomt som tyder på ett icke-slumpmässigt mönster mot tiden bevis på icke-proportionalitet., Grafiskt är denna metod mer tillförlitlig och lättare att tolka än att plotta funktionen log(-log(S(t)) som presenterades tidigare. Förekomsten av ett linjärt förhållande med tiden kan testas genom att utföra en enkel linjär regression och en testtrend. En lutning som skiljer sig avsevärt från noll skulle vara bevis mot proportionalitet: en ökande (minskande) trend skulle tyda på en ökande (minskande) riskkvot över tiden., Det rekommenderas att noggrant titta på den återstående tomten förutom att utföra detta test eftersom vissa mönster kan vara uppenbara på tomterna (kvadratiska, logaritmiska), men förbli oupptäckta av det statistiska testet. Dessutom kan otillbörligt inflytande av extremvärden bli uppenbart . Även om metoden baserad på de jämnade Schoenfeld residuals ger tidsberoende uppskattningar, kan det ha vissa nackdelar ., Osäkerhetsuppskattningarna i samband med de resulterande tidsberoende uppskattningarna kan vara svåra att använda i praktiken, och den tillhandahållna estimatorn kanske inte har goda statistiska egenskaper, t.ex. konsekvens. Viktigt är att p-värden som härrör från trendtester baserade på Schoenfeld-residualerna erhålls oberoende för varje kovariat av modellen, förutsatt att Cox-modellen är motiverad för modellens andra kovariater. som sådan bör resultaten tolkas noggrant. Tester baserade på Schoenfeld residuals kan enkelt implementeras i de flesta vanliga statistiska paket (Tabell 2).,

arbetsexempel (cont’)

för varje kovariat ritades skalade Schoenfeld-residualer över tiden och tester för en noll lutning utfördes. Motsvarande p-värden samt p-värdet i samband med ett globalt test av icke-proportionalitet redovisas i tabell 3. Det globala testet föreslog starka bevis på icke-proportionalitet (p < 0.01). Variabler som mest sannolikt skulle bidra till icke-proportionalitet var SBR-klassen (p < 0,01), PVI (p = 0,05) och hormonreceptorstatus (p = 0,05)., Dessa numeriska fynd tyder på ett icke-konstant riskförhållande för dessa variabler. Residuals hjälper till att visualisera log hazard ratio över tiden för varje kovariat (figur 3). Vi lade till streckade och prickade linjer som representerar null-effekten (null log hazard ratio) och det genomsnittliga log hazard ratio som uppskattas av den konventionella Cox-modellen. När det gäller SBR-klassen föreslog tomterna en stark effekt under de första fem åren. Denna effekt tenderade att minska efteråt., På samma sätt förändrades effekten av PVI över tiden, med återigen högre risker för metastaser under de första åren, och sedan tenderade denna effekt att försvinna. När det gäller hormonreceptorstatus föreslog tomter att en negativ status ökade risken för metastaser tidigt och blev skyddande efteråt.

tabell 3 Test för icke-proportionalitet baserat på de skalade Schoenfeld-residualerna från den konventionella Cox-modellen (se Tabell 1).,
Figure 3

Scaled Schoenfeld residuals for SBR grade, PVI, and hormone receptor status (with 95% confidence interval).

The cumulative sum of Schoenfeld residuals, or equivalently the observed score process can also be used to assess proportional hazards ., Grafiskt ritas den observerade poängprocessen mot tiden för varje variabel av modellen, tillsammans med simulerade processer som förutsätter att den underliggande Cox-modellen är sann, det vill säga antar proportionella risker. Varje avvikelse från den observerade poängprocessen från de simulerade är bevis mot proportionalitet. Dessa tomter kan sedan användas för att bedöma när bristen på passform är närvarande. I synnerhet är en observerad poäng långt över den simulerade processen en indikation på en effekt högre än den genomsnittliga, och omvänt., Denna metod är särskilt väl illustrerad i en nyligen publicerad av Cortese et al. . Goodness-of-fit tester kan genomföras baserat på de kumulativa residualerna. Det kumulativa residualbaserade tillvägagångssättet övervinner vissa nackdelar som uppstått med Schoenfeld-residualerna, eftersom de resulterande estimatörerna tenderar att ha bättre statistiska egenskaper och motiverade p-värden härleds . Metoden med kumulativa residualer implementeras i vissa standardstatistiska paket (Tabell 2).

arbetsexempel (cont’)

tester baserade på kumulativa residualer presenteras i Tabell 4., Vid 5% signifikansnivå föreslår teststatistik icke-konstant effekt över tiden för tumörens grad, liksom statusen för hormonreceptorerna, her2 och Mib1. För illustration ritade vi också den resulterande poängprocessen för vissa variabler (Figur 4). I enlighet med teststatistiken baserad på de kumulativa residualerna observerar vi stark avvikelse från de observerade processerna från de simulerade kurvorna under modellen för klass-och hormonreceptorstatus. Dessa tomter är särskilt användbara för att identifiera var bristen på passform är närvarande., Till exempel föreslår den initiala positiva poängprocessen associerad med hormonreceptorer att effekten av denna variabel initialt är högre än den genomsnittliga effekten och därmed lägre än den genomsnittliga effekten efteråt. Det vill säga risken för metastaser ökar initialt för kvinnor med både negativa hormonreceptorer jämfört med den genomsnittliga risken och minskade därefter.

Tabell 4 Test för icke-proportionalitet baserat på kumulativa residualer från den konventionella Cox-modellen (se Tabell 1).,
Figur 4

observerade score process för SBR grade, lymfkörtel engagemang och hormonreceptorstatus (med 95% konfidensintervall).

ett annat enkelt tillvägagångssätt för att testa tidsvarierande effekter av kovariater innebär att man monterar olika Cox-modeller under olika tidsperioder. Faktum är att även om pH-antagandet inte kan hålla över hela uppföljningsperioden, kan det hålla över ett kortare tidsfönster., Om det inte finns ett intresse för ett visst gränsvärde kan två delmängder av data skapas baserat på medianhändelsetiden . Det innebär att en första analys utförs genom att censurera alla som fortfarande är i riskzonen efter denna tidpunkt, och en andra genom att endast överväga de ämnen som fortfarande är i riskzonen därefter. I sådana fall är tolkningen av modellerna villkorad av överlevnadstidens längd, och resultaten bör därför tolkas med försiktighet., Även om analysperioden förkortas bör man fortfarande se till att pH-antagandet inte bryts inom dessa reducerade tidsperioder. Dessutom, eftersom färre händelsetider beaktas, analyser kan drabbas av en minskad effekt. Slutligen, även om denna metod är särskilt enkel att implementera och kan ge tillräcklig information i vissa inställningar, det vill säga om man är intresserad av ett korttidsfönster, bör det noteras att denna metod inte direkt testar pH-antagandet, och en annan parametrisering skulle behövas för att utföra ett sådant test.,

arbetsexempel (forts)

mediantiden var 4,3 år. En Cox-modell användes för att censurera alla som fortfarande är i riskzonen efter 4,3 år, medan endast de personer som fortfarande är i riskzonen efter denna tidpunkt inkluderades i en annan modell (ytterligare Fil 2: uppskattade riskförhållanden (exp()) med 95% konfidensintervall (95% CI) och p-värden för modellkovariater i två oberoende Cox-modeller under två olika tidsperioder.)., Alla variabler men ålder var statistiskt signifikanta i den första modellen som negativ hormonreceptorstatus, positiv Her2-status och mib1-positiv status var associerade med en ökad risk för metastaser. Hos kvinnor som fortfarande är i riskzonen efter 4,3 år, var yngre ålder, större tumörstorlek och lymfkörtelns involvering associerad med en ökad risk för metastaser. Effekterna av andra variabler har försvunnit. Intressant, hormonreceptor negativ status hade en signifikant skyddande effekt i denna andra modell (HR = 0.,5), medan den första analysen föreslog en signifikant ökad risk för (HR = 1.7). Tester för icke-proportionalitet baserade på de kumulativa residualerna föreslog en bestående tidsvarierande effekt av betyget för analysen begränsad till de första 4.3 åren.

det är också möjligt att redogöra för icke-proportionalitet genom att partitionera tidsaxeln enligt Moreau et al. . Tidsaxeln är uppdelad och farokvoterna beräknas sedan inom varje intervall. Således är testning för icke-proportionalitet likvärdig med testning om den tidsspecifika HR är signifikant olika., Resultaten kan dock ibland drivas av antalet tidsintervaller, och tidsintervaller bör därför väljas noggrant.

att överge antagandet om proportionella risker, och som sådan Cox-modellen, är ett annat alternativ. Faktum är att andra kraftfulla statistiska modeller är tillgängliga för att ta hänsyn till tidsvarierande effekter, inklusive tillsatsmodeller, accelererade feltidsmodeller, regressionssplinesmodeller eller fraktionella polynom .,

slutligen kan man utföra en statistisk analys stratifierad av variabeln som misstänks ha en tidsvarierande effekt; denna variabel bör därför kategoriseras eller kategoriseras. Varje stratum k har en distinkt utgångsrisk, men gemensamma värden för koefficientvektorn β, det vill säga risken för en individ i stratum k är hk(t) = exp(ßx) stratifiering förutsätter att de andra kovariaten verkar på samma sätt i varje stratum, det vill säga HRs är likartade över strata., Även om stratifiering är effektiv för att ta bort problemet med icke-proportionalitet och enkel att genomföra, har det vissa nackdelar. Viktigast, stratifiering av en icke-proportionell variabel utesluter uppskattning av dess styrka och dess test inom Cox-modellen. Detta tillvägagångssätt bör därför väljas om man inte är direkt intresserad av att kvantifiera effekten av den variabel som används för stratifiering., Dessutom kan en stratifierad Cox-modell leda till förlust av makt, eftersom mer av uppgifterna används för att uppskatta separata farofunktioner .denna inverkan beror på antalet ämnen och strata. Om det finns flera variabler med tidsvarierande risker skulle detta kräva att modellen stratifieras på dessa flera faktorer, vilket återigen sannolikt kommer att minska den totala effekten.

Lämna ett svar

Din e-postadress kommer inte publiceras. Obligatoriska fält är märkta *