Overlevelse analyse
I mange undersøgelser, at den primære variabel af interesse, er en forsinkelse, som tiden fra kræft diagnose til en særlig begivenhed, der er af interesse., Denne begivenhed kan være død, og derfor betegnes analysen af sådanne data ofte som overlevelsesanalyse. Begivenheden af interesse kan ikke have fundet sted på tidspunktet for den statistiske analyse, og tilsvarende kan et individ gå tabt til opfølgning, før begivenheden observeres. I sådanne tilfælde siges data at blive censureret på tidspunktet for analysen eller på det tidspunkt, hvor patienten gik tabt til opfølgning. Censurerede data bringer stadig nogle oplysninger, da selvom vi ikke kender den nøjagtige dato for begivenheden, ved vi, at det skete senere end censureringstiden.,
Både Kaplan-Meier-metoden og Cox proportional hazards (PH) modellen tillader en at analysere censureret data , og til at estimere sandsynligheden for overlevelse, S(t), som er sandsynligheden for, at et emne, der overlever uden noget tid t. Statistisk set er denne sandsynlighed er fastsat af overlevelse-funktionen S(t) = P (T > t), hvor T er overlevelse. Kaplan Meier-metoden estimerer overlevelsessandsynligheden ikke-parametrisk, det vil sige under forudsætning af ingen specifik underliggende funktion ., Flere tests er tilgængelige for at sammenligne overlevelsesfordelingerne på tværs af grupper, herunder log-rank og Mann-.hitney-.ilco .on-testene . Co.PH-modellen tegner sig for flere risikofaktorer samtidigt. Det betyder ikke posit nogen fordeling, eller form for overlevelse funktion, imidlertid, den øjeblikkelige forekomst af begivenheden er modelleret som en funktion af tid og risikofaktorer.,
den øjeblikkelige farehastighed på tidspunktet t, også kaldet øjeblikkelig forekomst, død eller fejlrate eller risiko, er den øjeblikkelige Sandsynlighed for at opleve en begivenhed på tidspunktet t, da begivenheden ikke har fundet sted endnu. Tidsenhed, og får lov til at variere over tid. Ligesom risikoen for begivenheder pr. tidsenhed kan man lave en analogi ved at overveje hastigheden givet af et bilhastighedsmåler, som repræsenterer den tilbagelagte afstand pr.tidsenhed. Antag, at begivenheden af interesse er død, og vi er interesseret i sin tilknytning til n kovariater ,11 ,22,…,, Xn, så den risiko er givet ved:
baseline hazard rate h0(t) er en uspecificeret ikke-negativ funktion af tiden. Det er den tidsafhængige del af faren og svarer til farehastigheden, når alle kovariate værdier er lig med nul. β1, β2, …, ßn er koefficienterne for regressionsfunktionen ß1 .1 + ß2 .2 +… ßn .n., Antag, at vi er interesseret i en enkelt covariate så faren er:
Under x2 = x1 + 1, hazard ratio reducerer til HR = exp(β), og det svarer til effekten af en enhed stigning i den forklarende variabel X på risikoen for begivenheden. Da β = log (HR), betegnes β Som log ha .ard ratio. Selv om farehastigheden H. (t) får lov til at variere over tid, er fareforholdet HR konstant; dette er antagelsen om forholdsmæssige farer., Hvis HR er større end 1 (β > 0), hvis risikoen er større for personer med covariate værdi x2 i forhold til emner med covariate værdi x1, mens en HR lavere end 1 (β < 0), viser en nedsat risiko. Når HR ikke er konstant over tid, siges variablen at have en tidsvarierende effekt; for eksempel kan effekten af en behandling være stærk umiddelbart efter behandlingen, men falmer med tiden. Dette bør ikke forveksles med en tidsvarierende kovariat, som er en variabel, hvis værdi ikke er fast over tid, såsom rygestatus., Faktisk kan en person være en ikke-ryger, så en ryger, så en ikke-ryger. Bemærk dog, at en variabel kan være både tidsvarierende og have en effekt, der ændrer sig over tid.
i en co.PH-model estimeres HR ved at overveje hver gang t, hvor en begivenhed opstår. Ved estimering af den samlede HR over hele opfølgningsperioden gives de samme vægte til den meget tidlige HR, der påvirker næsten alle personer, og til meget sent HR, der kun påvirker de meget få personer, der stadig er i fare. HR er således i gennemsnit over begivenhedstiderne., I tilfælde af forholdsmæssige farer påvirkes den samlede HR ikke af denne vægtningsprocedure. Hvis HR på den anden side ændrer sig over tid, dvs .farehastighederne ikke er proportionale, kan lige vægtning resultere i en ikke-repræsentativ HR og kan give partiske resultater. Det skal bemærkes, at HR er i gennemsnit over begivenhedstiderne snarere end over opfølgningstiden. Det er uændret, hvis tidsskalaen ændres uden at forstyrre rækkefølgen af begivenheder.,
eksempel
vi anvendte nogle af de præsenterede metoder til brystkræftpatienter, da der er rapporteret tidsvarierende effekter, såsom for nodal-eller hormonreceptorstatus . Vi studerede kvinder med ikke-metastatisk, operabel brystkræft, der gennemgik operation mellem 1989 og 1993 på vores institution, og som ikke modtog tidligere neoadjuvant-behandling. Udelukkelseskriterier omfattede en tidligere historie med brystkarcinom, samtidig kontralateral brystkræft, og patologiske data mangler., Opfølgningen blev udført i henhold til de europæiske krav til god klinisk praksis og bestod af regelmæssige fysiske undersøgelser og årligt Røntgenmammogram og yderligere vurderinger i tilfælde af mistanke om metastaser. Kliniske og patologiske egenskaber blev analyseret i henhold til den hospitalsindspillede fil på tidspunktet for behandlingsstart. Patologisk tumorstørrelse (or eller > 20 mm) blev målt på friske kirurgiske prøver. En modificeret version af Scarff-Bloom-Richardson grading system blev anvendt (SBR grade I, II eller III)., PVI (Ja, Nej) blev defineret som tilstedeværelsen af neoplastisk emboli inden for utvetydig vaskulær lymfatisk eller kapillær lumen i områder, der støder op til brysttumoren. Der blev udført sonderende immunhistokemiske analyser på en vævsmikroarray (TMA) for at vurdere hormonreceptorstatus (hrec) (positiv, hvis er-positiv og/eller progesteronreceptor-positiv). ER-og PGR-ekspressionsniveauer blev evalueret semikvantitativt i henhold til en standardprotokol med afskæringsværdier ved 10% positive tumorceller. HER2-ekspressionsniveau blev evalueret i henhold til Herceptest-scoringssystemet ., Mib1 ekspressionsniveau blev evalueret semikvantitativt. Oplysninger om alle faktorer var tilgængelige for 979 kvinder (tabel 1). Median opfølgningstiden var 14 år (95% konfidensinterval: 13, 7-14, 2), og 264 kvinder udviklede metastaser.
arbejdseksempel
de prognostiske faktorer blev oprindeligt valgt ud fra den aktuelle viden om risiko for metastaser., De blev derefter analyseret ved hjælp af en konventionel Co. – regressionsmodel; alle var statistisk signifikante på 5% – niveauet i de univariate analyser og blev derefter indtastet på en multivariat Co. – model., Risikoen for metastaser blev øget for kvinder med yngre alder i forhold til ældre alder; klasse II og III tumorer i forhold til kvalitet jeg tumorer; stor i forhold til små tumor størrelser; lymfeknude involvering i forhold til ingen deltagelse; og PVI i forhold til ingen PVI (Ekstra fil 1: Forventede log-hazard ratios (log(T)), og hazard ratios (HR = exp()) med 95% konfidensintervaller (95% CI) og p-værdier for model med kovariater ved montering af en multivariat konventionelle Cox-model og en Cox model med tid-af-covariate interaktioner.)., Baseret på denne model påvirker alle variabler, men hormonreceptor, HER2 og Mib1 status signifikant risikoen for metastaser.
Vurdering af ikke-proportionalitet: Grafisk strategi
I tilstedeværelse af en kategorisk variabel, man kan plotte Kaplan-Meier survival distribution, S(t), som funktion af overlevelse tid, for hvert niveau af covariate. Hvis PH-antagelsen er opfyldt, skal kurverne støt glide fra hinanden., Man kan også anvende en transformation af Kaplan-Meier overlevelseskurverne og plotte funktionsloggen (- log(s (t))) som en funktion af logoverlevelsestiden, hvor log repræsenterer den naturlige logaritmefunktion. Hvis farerne er proportionale, skal de stratumspecifikke log-minus-log plots udvise konstante forskelle, det vil sige være omtrent parallelle. Disse visuelle metoder er enkle at implementere, men har begrænsninger. Når kovariatet har mere end to niveauer, er Kaplan-Meier-plot ikke nyttige til kræsne ikke-proportionalitet, fordi graferne bliver rodet ., Tilsvarende, selvom ph-antagelsen muligvis ikke overtrædes, log-minus-log-kurverne er sjældent perfekt parallelle i praksis, og har tendens til at blive sparsomme på længere tidspunkter, og dermed mindre præcise. Det er ikke muligt at kvantificere, hvor tæt på parallel er tæt nok, og dermed hvor proportional farerne er. Beslutningen om at acceptere PH-hypotesen afhænger ofte af, om disse kurver krydser hinanden. Som et resultat kan beslutningen om at acceptere PH-hypotesen være subjektiv og konservativ, da man skal have stærke beviser (krydsende linjer) for at konkludere , at PH-antagelsen overtrædes., I betragtning af disse begrænsninger foreslår nogle at give standardfejl til disse tomter . Denne tilgang kan dog være beregningsmæssigt intensiv og er ikke direkte tilgængelig i standard computerprogrammer. Kaplan-Meier og log-minus-log plots er tilgængelige fra de fleste standard statistiske pakker (tabel 2).
Arbejdsgruppe eksempel (cont’)
Kaplan-Meier survival kurver og log-minus-log plot er vist for nogle variabler (figur 1 og 2)., Kaplan-Meier-overlevelseskurverne syntes at glide støt fra hinanden for alle undtagen hormonreceptorstatus, HER2-status og mib1-status. Log-minus log plots kiggede omtrent parallelt for alder, størrelse af tumoren, lymfeknude involvering, og PVI. Igen havde plot for hormonreceptorstatus, HER2-status og mib1-status en tendens til at indikere en overtrædelse af PH-antagelsen. Der var også en vis mistanke med hensyn til SBR-karakteren.,
Vurdering af ikke-proportionalitet: Modellering og test strategier
Grafiske metoder til kontrol af PH antagelse ikke en formel diagnostiske test, og bekræftende tilgang er påkrævet. Flere muligheder for test og regnskab for ikke-proportionalitet er tilgængelige.
Cox foreslået at vurdere afgang fra ikke-proportionalitet ved at indføre en konstrueret tidsafhængige variable, det er, at tilføje en interaktion begreb, der involverer tid til Cox-modellen, samt test for dens betydning ., Antag, at man er interesseret i at evaluere, om nogle variable X har en tidsvarierende effekt. En tidsafhængig variabel oprettes ved at danne en interaktion (produkt) term mellem forudsigeren,. (kontinuerlig eller kategorisk) og en funktion af tiden t(F(T) = t, t2, log (t),…). At tilføje denne interaktion, at den model (ligning 2), fare-så bliver det:
hazard ratio er givet ved T(t) = hx+1(t)/hx(t) = exp for en enheds stigning i den variable X, og er afhængige af tid gennem funktionen f(t)., Hvis γ > 0 (γ< 0), øges HR (falder) over tid. Prøvning for farernes manglende proportionalitet svarer til prøvning, Hvis γ er væsentligt forskellig fra nul. Man kan bruge forskellige tidsfunktioner såsom polynomium eller eksponentiel forfald, men ofte foretrækkes meget enkle faste tidsfunktioner, såsom lineære eller logaritmiske funktioner . Denne modellering tilgang giver også skøn af hazard ratio på forskellige tidspunkter, da værdier t af tid kan være monteret i hazard ratio funktion., Tidsafhængige variabler giver en fleksibel metode til at evaluere afvigelse fra ikke-proportionalitet og en tilgang til opbygning af en model for afhængighed af relativ risiko over tid. Denne fremgangsmåde bør dog anvendes med forsigtighed. Faktisk, hvis funktionen af den valgte tid er forkert angivet, vil den endelige model ikke være passende. Dette er en ulempe ved denne metode over mere fleksibel tilgang.
arbejdseksempel (cont’)
Vi skabte tid-for-kovariate interaktioner for hver variabel i modellen ved at introducere produkter mellem variablerne og en lineær funktion af tiden., Som vist i Ekstra Fil 1 (Anslået log-hazard ratios (log(T)), og hazard ratios (HR = exp()) med 95% konfidensintervaller (95% CI) og p-værdier for model med kovariater ved montering af en multivariat konventionelle Cox-model og en Cox model med tid-af-covariate interaktioner.), betydelig af-covariate interaktioner involveret SBR klasse, hormon-receptor status, Her2-status, og PVI (p < 0.05). Disse resultater indikerede således, at fareforholdene forbundet med disse faktorer ikke var konstante over tid., De parametre (), der er forbundet med de fleste interaktioner var negative, hvilket tyder på, at hazard ratios var faldende over tid. Den estimerede risiko-forhold, der er forbundet med en SBR klasse II (i forhold til klasse I) som funktion af tiden t givet ved: T(t) = exp(1.71 – 0.14 t). Ha .ard ratio var 4.8, 3.6 og 2.7 ved henholdsvis 1, 3 og 5 år. Tilsvarende skønnes hazard ratio, der er forbundet med hormon-receptor status var: HR(t) = exp(0.73 – 0.14 t), der er hazard ratios 1.8, 1.3, og 1,0 ved henholdsvis 1, 3 og 5 år., Mens den konventionelle Co.-model ikke viste nogen signifikant effekt for hormonreceptorer, Her2 og Mib1, havde disse variabler en signifikant effekt, når tid-for-kovariate interaktioner var inkluderet.
afvigelse fra ikke-proportionalitet kan også undersøges ved hjælp af modellens rester. En resterende måler forskellen mellem de observerede data, og de forventede data under antagelse af modellen. Schoenfeld-rester beregnes og rapporteres ved hver fejltid under PH-antagelsen og er som sådan ikke defineret for censurerede forsøgspersoner ., De er defineret som den kovariate værdi for den enkelte, der mislykkedes minus dens forventede værdi under forudsætning af hypoteserne i modelhold. Der er en separat rest for hver enkelt person for hver kovariat. Et glat plot af Schoenfeld-resterne kan derefter bruges til direkte at visualisere logfareforholdet . Schoenfeld-resterne er uafhængige af tiden, hvis farens proportionalitet antages. Således er et plot, der tyder på et ikke-tilfældigt mønster mod tiden, tegn på manglende proportionalitet., Grafisk er denne metode mere pålidelig og lettere at fortolke end at plotte log(-log(s(t)) – funktionen præsenteret tidligere. Tilstedeværelsen af et lineært forhold til tiden kan testes ved at udføre en simpel lineær regression og en testtrend. En hældning, der er væsentligt forskellig fra nul, ville være bevis for proportionalitet: en stigende (faldende) tendens ville indikere et stigende (faldende) fareforhold over tid., Det anbefales at se nøje på det resterende plot ud over at udføre denne test, da nogle mønstre kan være tydelige på plottene (kvadratisk, logaritmisk), men forbliver uopdaget af den statistiske test. Desuden kan overdreven indflydelse fra outliers blive åbenlyst . Selvom metoden baseret på de glatte Schoenfeld-rester giver tidsafhængige estimater, kan den have nogle ulemper ., De usikkerhedsestimater, der er forbundet med de resulterende tidsafhængige estimater, kan være vanskelige at bruge i praksis, og den leverede estimator har muligvis ikke gode statistiske egenskaber, såsom konsistens. Det er vigtigt, at p-værdier, der er resultatet af trendtest baseret på Schoenfeld-rester, opnås uafhængigt for hver kovariat i modellen, forudsat at co. – modellen er berettiget for de andre kovariater i modellen; som sådan skal resultaterne fortolkes omhyggeligt. Test baseret på Schoenfeld-resterne kan let implementeres i de fleste standardstatistiske pakker (tabel 2).,
arbejdseksempel (cont’)
For hver kovariat blev skalerede Schoenfeld-rester afbildet over tid, og test for en nulhældning blev udført. De tilsvarende p-værdier samt den p-værdi, der er forbundet med en global test af ikke-proportionalitet, er angivet i tabel 3. Den globale test antydede stærke beviser for ikke-proportionalitet (p < 0, 01). Variabler, der anses for mest sandsynligt, at bidrage til en ikke-proportionalitet var SBR klasse (p < 0.01), PVI (p = 0,05) og hormon-receptor status (p = 0,05)., Disse numeriske fund tyder på et ikke konstant ha .ard ratio for disse variabler. Rester hjælpe med at visualisere log-hazard ratio over tid for hver covariate (figur 3). Vi tilføjede stiplede og stiplede linjer, der repræsenterer henholdsvis null-effekten (null log ha .ard ratio) og det gennemsnitlige log ha .ard ratio estimeret af den konventionelle Co. – model. Med hensyn til SBR-karakteren antydede tomterne en stærk effekt i de første fem år. Denne effekt havde en tendens til at falde bagefter., Tilsvarende ændrede virkningen af PVI over tid, med igen højere risiko for metastaser i de første år, og så havde denne effekt tendens til at forsvinde. Med hensyn til hormonreceptorstatus foreslog plots, at en negativ status øgede risikoen for metastaser tidligt og blev beskyttende bagefter.
The cumulative sum of Schoenfeld residuals, or equivalently the observed score process can also be used to assess proportional hazards ., Grafisk, den observerede score proces er plottet versus tid for hver variabel af modellen, sammen med simulerede processer under forudsætning af den underliggende Co.model er sandt, det vil sige, under forudsætning af proportionale farer. Enhver afvigelse af den observerede score proces fra de simulerede dem er bevis mod proportionalitet. Disse grunde kan derefter bruges til at vurdere, hvornår manglen på pasform er til stede. Især er en observeret score langt over den simulerede proces en indikation af en effekt, der er højere end den gennemsnitlige, og omvendt., Denne metode er især godt illustreret i en nylig publikation af Cortese et al. . Godhed-of-fit-test kan implementeres baseret på de kumulative rester. Den kumulative residuals baseret tilgang overvinder nogle ulemper med Schoenfeld rester, da resulterende estimatorer tendens til at have bedre statistiske egenskaber, og begrundede p-værdier er afledt . Den kumulative residuals tilgang er implementeret i nogle standard statistiske pakker (tabel 2).
arbejdseksempel (fortsat)
Test baseret på kumulative rester er vist i tabel 4., På signifikansniveauet på 5% antyder teststatistikker ikke-konstant effekt over tid for tumorens kvalitet såvel som status for hormonreceptorerne, her2 og Mib1. Til illustration, vi også plottet den resulterende score proces for nogle variabler (figur 4). I overensstemmelse med teststatistikken baseret på de kumulative rester observerer vi stærk afgang af de observerede processer fra de simulerede kurver under modellen for klasse-og hormonreceptorstatus. Disse grunde er især nyttige til at identificere, hvor manglen på pasform er til stede., For eksempel antyder den indledende positive score-proces, der er forbundet med hormonreceptorer, at effekten af denne variabel oprindeligt er højere end den gennemsnitlige effekt og dermed lavere end den gennemsnitlige effekt bagefter. Det vil sige, at risikoen for metastaser øges oprindeligt for kvinder med begge negative hormonreceptorer sammenlignet med den gennemsnitlige risiko og faldt bagefter.
en anden enkel tilgang til test af tidsvarierende effekter af kovariater involverer montering af forskellige Co.-modeller i forskellige tidsperioder. Selvom ph-antagelsen muligvis ikke holder over den komplette opfølgningsperiode, kan den holde over et kortere tidsvindue., Medmindre der er interesse for en bestemt cut-off-tidsværdi, kan der oprettes to undergrupper af data baseret på medianhændelsestiden . Det vil sige, at en første analyse udføres ved at censurere alle, der stadig er i fare ud over dette tidspunkt, og en anden ved kun at overveje de personer, der stadig er i fare derefter. I sådanne tilfælde er fortolkningen af modellerne betinget af længden af overlevelsestiden, og resultaterne skal derfor fortolkes med forsigtighed., Selv hvis analyseperioden forkortes, skal man stadig sikre, at PH-antagelsen ikke krænkes inden for disse reducerede tidsperioder. Desuden, da færre begivenhedstider overvejes, analyser kan lide af en nedsat effekt. Endelig, selvom denne metode er særlig enkel at implementere og muligvis giver tilstrækkelig information i nogle indstillinger, det vil sige, hvis man er interesseret i et kort tidsvindue, skal det bemærkes, at denne metode ikke direkte tester PH-antagelsen, og en anden parametrizationation ville være nødvendig for at udføre en sådan test.,
arbejdseksempel (fortsat)
medianbegivenheden var 4,3 år. En Cox-model, der blev anvendt censurerer alle stadig i fare efter 4,3 år, mens kun de emner, der er stadig risiko ud over dette tidspunkt var omfattet af en anden model (Ekstra fil 2: Estimeret hazard ratios (exp()) med 95% konfidensintervaller (95% CI) og p-værdier for model med kovariater i to uafhængige Cox modeller for to forskellige perioder.)., Alle variabler, men alder var statistisk signifikant i den første model som negative hormon receptor status, positive Her2-status og Mib1 positiv status var forbundet med en øget risiko for metastaser. Hos kvinder, der stadig var i fare over 4, 3 år, var yngre alder, større tumorstørrelse og lymfeknudeinddragelse forbundet med en øget risiko for metastaser. Virkningerne af andre variabler er forsvundet. Interessant nok havde hormonreceptor negativ status en signifikant beskyttende virkning i denne anden model (HR = 0.,5), mens den første analyse antydede en signifikant øget risiko for (HR = 1.7). Test for ikke-proportionalitet baseret på de kumulative rester antydede en vedvarende tidsvarierende effekt af karakteren for analysen begrænset til de første 4.3 år.
det er også muligt at redegøre for manglende proportionalitet ved at opdele tidsaksen som foreslået af Moreau et al. . Tidsaksen er opdelt, og ha .ard ratio estimeres derefter inden for hvert interval. Test for ikke-proportionalitet svarer således til test, hvis den tidsspecifikke HR er væsentligt anderledes., Resultaterne kan dog undertiden drives af antallet af tidsintervaller, og tidsintervaller bør derfor vælges omhyggeligt.at opgive antagelsen om proportionale farer, og som sådan Co. – modellen, er en anden mulighed. Faktisk er andre kraftfulde statistiske modeller tilgængelige for at tage højde for tidsvarierende effekter, herunder additive modeller, accelererede fejltidsmodeller, regressionsspændingsmodeller eller fraktionerede polynomier .,
endelig kan man udføre en statistisk analyse stratificeret af variablen, der mistænkes for at have en tidsvarierende effekt; denne variabel skal således være kategorisk eller kategoriseres. Hvert stratum k har en særlig baseline hazard, men fælles værdier for den koefficient, der er vektor β, der er fare for, at en person i stratum k hk(t) = exp(ßx) Stratifying forudsætter, at den anden kovariater handler på samme måde i hvert stratum, der er, HRs er ens på tværs af lag., Selvom stratificering er effektiv til at fjerne problemet med ikke-proportionalitet og enkel at implementere, har det nogle ulemper. Det vigtigste er, at stratificering med en ikke-proportional variabel udelukker estimering af dens styrke og dens test inden for Co. – modellen. Denne fremgangsmåde bør således vælges, hvis man ikke er direkte interesseret i at kvantificere effekten af den variabel, der anvendes til stratificering., Desuden kan en stratificeret Co. – model føre til et tab af strøm, fordi flere af dataene bruges til at estimere separate farefunktioner; denne påvirkning afhænger af antallet af forsøgspersoner og lag. Hvis der er flere variabler med tidsvarierende risici, ville dette kræve, at modellen stratificeres på disse flere faktorer, hvilket igen sandsynligvis vil mindske den samlede effekt.