Proměnné s časem-různé efekty a Cox model: Některé statistické pojmy ilustrovány prognostický faktor studium v prsu

analýza Přežití

V mnoha studiích, primární proměnné je zpoždění, jako je doba od diagnózy rakoviny k určité události zájmu., Tato událost může být smrt, a proto je analýza těchto údajů často označována jako analýza přežití. K události zájmu nemuselo dojít v době statistické analýzy a podobně může být subjekt ztracen pro sledování před pozorováním události. V takovém případě se říká, že data jsou cenzurována v době analýzy nebo v době, kdy byl pacient ztracen pro sledování. Cenzurovaná data stále přinášejí nějaké informace, protože ačkoli neznáme přesné datum události, víme, že k ní došlo později než cenzurovaný čas.,

Oba Kaplan-Meierova metoda a Cox proporcionálních rizik (PH) modelu umožnit, aby jeden k analýze cenzorovaných dat , a odhadnout pravděpodobnost přežití, S(t), že je pravděpodobnost, že subjekt přežije za nějaký čas t. Statisticky, tato pravděpodobnost je poskytována funkce přežití S(t) = P (T > t), kde T je doba přežití. Metoda Kaplan Meier odhaduje pravděpodobnost přežití neparametricky, tj., K dispozici je několik testů pro porovnání distribucí přežití napříč skupinami, včetně testů log-rank a Mann-Whitney-Wilcoxon . Model Cox PH představuje více rizikových faktorů současně. Nepředstavuje žádnou distribuci ani tvar pro funkci přežití, nicméně okamžitá incidence události je modelována jako funkce času a rizikových faktorů.,

okamžitá míra rizika v čase t, také volal okamžitá incidence, úmrtí, nebo míra selhání, nebo riziko, je okamžitá pravděpodobnost výskytu události v čase t, vzhledem k tomu, že události dosud nedošlo. Jedná se o rychlost události za jednotku času, a je povoleno měnit v průběhu času. Stejně jako riziko událostí za jednotku času lze analogicky uvažovat o rychlosti dané rychloměrem automobilu, který představuje ujetou vzdálenost za jednotku času. Předpokládejme, že událost zájmu je smrt, a máme zájem o jeho spojení s n kovariáty, X1, X2,…,

(1)

základní míra nebezpečnosti h0(t) je nespecifikovanou ne-negativní funkcí času. Je to časově závislá část nebezpečí a odpovídá míře nebezpečnosti, když jsou všechny kovariátové hodnoty rovny nule. β1, β2, …, ßn jsou koeficienty regresní funkce ß1x1 + ß2x2 +… – Ano., Předpokládejme, že máme zájem o jeden veličinou pak nebezpečí je:

(2)

(3)

x2 = x1 + 1, poměr rizika snižuje HR = exp(β) a odpovídá účinku jedné jednotky zvýšení vysvětlující proměnné X na rizikové události. Vzhledem k tomu, β = log(HR), β se označuje jako poměr log nebezpečnosti. Přestože se míra nebezpečnosti hx (t) může v průběhu času měnit, poměr nebezpečnosti HR je konstantní; to je předpoklad proporcionálních rizik., Pokud je HR je větší než 1 (β > 0), případě je zvýšené riziko pro předměty s proměnnou hodnota x2 ve srovnání se subjekty s proměnnou hodnotu x1, zatímco HR nižší než 1 (β < 0) znamená nižší riziko. Když HR není konstantní v průběhu času, proměnná se říká, že má časově proměnlivý účinek; například účinek léčby může být silný ihned po léčbě, ale časem mizí. To by nemělo být zaměňováno s časově proměnnými kovariance, což je proměnná, jejíž hodnota není stanovena v průběhu času, jako je například kouření., Ve skutečnosti může být člověk Nekuřák, pak kuřák, pak Nekuřák. Všimněte si však, že proměnná může být časově proměnná a má účinek, který se v průběhu času mění.

v modelu Cox PH se HR odhaduje zvážením pokaždé t, když nastane událost. Při odhadu celkové HR v průběhu celého období sledování, stejné váhy jsou vzhledem k velmi brzy HR, které ovlivňují téměř všechny osoby a až velmi pozdě HR ovlivňuje jen velmi málo jedinců stále v ohrožení. HR je tedy v průměru za dobu události., V případě poměrných rizik není celkový HR tímto váhovým postupem ovlivněn. Pokud se naopak HR v průběhu času mění, to znamená, že míra nebezpečnosti není úměrná, pak stejné vážení může mít za následek nereprezentativní HR a může mít zkreslené výsledky . Je třeba poznamenat, že HR je v průměru v průběhu doby události spíše než v průběhu času sledování. Nezmění se, pokud se změní časové měřítko, aniž by došlo k narušení uspořádání událostí.,

Příklad:

Jsme aplikovali některé z prezentovaných metod u pacientů s rakovinou prsu jako časově proměnné efekty byly hlášeny, např. uzlové nebo stav hormonálních receptorů, . Studovali jsme ženy s nemetastatickým, operabilním karcinomem prsu, které podstoupily operaci v letech 1989 až 1993 v naší instituci a které nedostaly předchozí neoadjuvantní léčbu. Kritéria vyloučení zahrnovala předchozí anamnézu karcinomu prsu, souběžnou kontralaterální rakovinu prsu a chybějící patologická data., Sledování bylo provedeno podle požadavků Evropské správné klinické praxe a sestávalo z pravidelných fyzických vyšetření a ročního rentgenového mamografu a dalších hodnocení v případě podezření na metastázy. Klinické a patologické charakteristiky byly analyzovány podle souboru zaznamenaného v nemocnici v době zahájení léčby. Velikost patologického nádoru (≤nebo > 20 mm) byla měřena na čerstvých chirurgických vzorcích. Byla použita upravená verze systému třídění Scarff-Bloom-Richardson (SBR stupeň I, II nebo III)., PVI (Ano, Ne) byla definována jako přítomnost nádorových embolů v jednoznačné cévní, lymfatického nebo kapilární lumina v oblastech přilehlých k prsu nádor. Průzkumné imunohistochemické analýzy byly provedeny na tkáňové microarray (TMA), aby posoudila hormon receptor (HRec) stav (pozitivní, pokud se ER-pozitivní a/nebo progesteronu receptor -pozitivní). Hladiny exprese ER a PgR byly hodnoceny Polo-kvantitativně podle standardního protokolu s mezními hodnotami u 10% pozitivních nádorových buněk. Úroveň exprese Her2 byla vyhodnocena podle bodovacího systému Herceptest ., Úroveň exprese mib1 byla hodnocena Polo-kvantitativně. Informace o všech faktorech byly k dispozici pro 979 žen (tabulka 1). Medián follow-up byl 14 let (95% interval spolehlivosti: 13.7 – 14.2) a 264 žen vyvinula metastáz.

Tabulka 1 Charakteristika studované populace.

Pracovní příklad:

prognostické faktory byly původně vybrány na základě současných poznatků týkajících se riziko metastáz., Oni byli vedle analyzovány pomocí konvenční Cox regresní model; všechny byly statisticky významné na 5% hladině v jednorozměrných analýz, a pak byly zadány na multivariační Coxova modelu., Riziko metastáz byla zvýšena u žen s mladším věku ve srovnání se starším věku; stupeň II a III nádorů oproti třídě jsem nádorů; velké srovnání malých nádorů velikosti; lymfatických uzlin ve srovnání s žádnou účast; a PVI ve srovnání s č. PVI (Další soubor 1: Odhadované hodnoty log poměry rizik (log(H)), a poměr rizika (HR = exp()) s 95% intervaly spolehlivosti (95% CI) a p-hodnoty pro model kovariancí při montáži více konvenční Cox model a Cox model s časově-kovariance interakce.)., Na základě tohoto modelu všechny proměnné, ale hormonální receptor, stav Her2 a Mib1, významně ovlivnily riziko metastáz.

Hodnocení non-proporcionalita: Grafické strategie

V přítomnosti kategorické proměnné, lze pozemek Kaplan-Meier survival distribuce, S(t), jako funkci přežití na čase, pro každou úroveň veličinou. Pokud je předpoklad PH splněn, křivky by se měly neustále oddělovat., Lze také použít transformaci křivek přežití Kaplan-Meier a vykreslit protokol funkcí (- log(s (t))) jako funkci doby přežití protokolu, kde log představuje přirozenou funkci logaritmu. Pokud jsou rizika úměrná, měly by stratum specific log-minus-log parcely vykazovat konstantní rozdíly, tj. Tyto vizuální metody se snadno implementují, ale mají omezení. Když kovariát má více než dvě úrovně, Kaplan-Meier pozemky nejsou užitečné pro náročné non-proporcionality, protože grafy stanou přeplněný ., Podobně, i když předpoklad PH nemusí být porušen, křivky log-minus-log jsou v praxi zřídka dokonale paralelní a mají tendenci být řídké v delších časových bodech, a tedy méně přesné. Není možné kvantifikovat, jak blízko k rovnoběžce je dostatečně blízko, a tak jak úměrná jsou rizika. Rozhodnutí přijmout hypotézu PH často závisí na tom, zda se tyto křivky navzájem překračují. Jako výsledek, rozhodnutí přijmout PH hypotéza může být subjektivní a konzervativní , protože člověk musí mít silné důkazy (crossing lines) k závěru, že PH předpoklad je porušen., S ohledem na tato omezení někteří navrhují poskytnout těmto grafům standardní chyby . Tento přístup však může být výpočetně náročný a není přímo dostupný ve standardních počítačových programech. Grafy Kaplan-Meier a log-minus-log jsou k dispozici z většiny standardních statistických balíčků (Tabulka 2).

Tabulka 2 Statistický software

Pracovní příklad (cont‘)

Kaplan-Meierovy křivky přežití a log-log grafy jsou zobrazeny pro některé proměnné (obrázky 1 a 2)., Zdálo se, že křivky přežití Kaplan-Meier se neustále oddělují od všech, kromě stavu hormonálního receptoru, stavu Her2 a stavu mib1. Log-minus log pozemky vypadal přibližně rovnoběžně s věkem, velikost nádoru, postižení lymfatických uzlin, a PVI. Opět platí, že pozemky pro stav hormonálního receptoru, stav Her2 a stav mib1 měly tendenci naznačovat porušení předpokladu pH. Tam bylo také nějaké podezření, pokud jde o SBR grade.,

Figure 1

Kaplan-Meier survival curves for SBR grade, tumour size, PVI, hormone receptor status.

Figure 2

Log(-log(survival)) curves as a function of time (log scale) for SBR grade, tumour size, PVI, hormone receptor status.,

Hodnocení non-proporcionalita: Modelování a testování strategií

Grafické metody pro kontrolu PH předpokladu, neposkytují formální diagnostický test, a potvrzující přístupy jsou zapotřebí. K dispozici je několik možností testování a účtování neúměrnosti.

Cox navrhl posoudit odklon od proporcionality zavedením konstruované časově závislé proměnné, tj. přidání interakčního termínu, který zahrnuje čas do Coxova modelu, a test jeho významu ., Předpokládejme, že jeden má zájem o vyhodnocení, zda má nějaká proměnná x časově odlišný účinek. Časově závislá proměnná je vytvořena tím, že tvoří interakce (produktu) termín mezi prediktorem, X (spojité nebo kategorické), a funkce času t (f(t) = t, t2, log(t), …). Přidání této interakce do modelu (rovnice 2), hazard, pak se stane:

(5)

poměr je dán tím, že H(t) = hx+1(t)/hx(t) = exp pro jednotku zvýšit v proměnné X, a je závislé na čase prostřednictvím funkce f(t)., Pokud γ >0 (γ < 0), pak se HR v průběhu času zvyšuje (snižuje). Zkoušení nedůměrnosti nebezpečí odpovídá zkouškám, pokud se γ výrazně liší od nuly. Lze použít různé časové funkce, jako je polynom nebo exponenciální rozpad, ale často jsou preferovány velmi jednoduché pevné funkce času, jako jsou lineární nebo logaritmické funkce . Tento modelovací přístup také poskytuje odhady poměru nebezpečnosti v různých časových bodech, protože hodnoty t času mohou být namontovány do funkce poměru nebezpečnosti., Proměnné závislé na čase poskytují flexibilní metodu pro vyhodnocení odklonu od proporcionality a přístupu k budování modelu závislosti relativního rizika v průběhu času. Tento přístup by však měl být používán s opatrností. Pokud je zvolená funkce času špatně specifikována, konečný model nebude vhodný. To je nevýhoda této metody oproti flexibilnějšímu přístupu.

Working example (cont‘)

pro každou proměnnou modelu jsme vytvořili čas od času interakce zavedením produktů mezi proměnnými a lineární funkcí času., Jak je uvedeno v Další Soubor 1 (Odhad log poměry rizik (log(H)), a poměr rizika (HR = exp()) s 95% intervaly spolehlivosti (95% CI) a p-hodnoty pro model kovariancí při montáži více konvenční Cox model a Cox model s časově-kovariance interakce.), významný čas-za-kovariance interakce SBR stupeň, stav hormonálních receptorů, Her2 status, a PVI (p < 0.05). Tyto výsledky tedy naznačovaly, že poměry nebezpečnosti spojené s těmito faktory nebyly v průběhu času konstantní., Parametry () spojené s většinou interakcí byly negativní, což naznačuje, že poměry nebezpečnosti v průběhu času klesaly. Odhadovaný poměr rizika spojený s SBR grade II (versus grade I) jako funkce času T byl dán: HR(t) = exp(1.71 – 0.14 t). Poměry nebezpečnosti byly 4, 8, 3, 6 a 2, 7 v 1, 3 a 5 letech. Také odhadovaný poměr rizik spojených s hormonální receptor stav byl: H(t) = exp(0.73 – 0.14 t), že je nebezpečí poměry 1.8, 1.3, 1.0 v, respektive 1, 3 a 5 let., Zatímco konvenční Cox model neprokázaly žádný významný účinek na hormonální receptory, Her2 a Mib1, tyto proměnné měly významný účinek, když si čas od veličinou interakce nebyly zahrnuty.

odklon od proporcionality lze také prozkoumat pomocí zbytků modelu. Zbytkový měří rozdíl mezi pozorovanými údaji a očekávanými údaji za předpokladu modelu. Schoenfeld reziduí jsou vypočteny a hlášeny v každém okamžiku selhání podle předpokladu PH, a jako takové nejsou definovány pro cenzurované předměty ., Jsou definovány jako kovariátní hodnota pro jednotlivce, který selhal mínus jeho očekávaná hodnota za předpokladu, že hypotézy modelu drží. Pro každého jednotlivce existuje samostatný zbytek pro každý kovariát. Hladký pozemek schoenfeldových reziduí pak lze použít k přímé vizualizaci poměru rizika log. Za předpokladu proporcionality nebezpečí jsou schoenfeldovy reziduí nezávislé na čase. Spiknutí naznačující náhodný vzor proti času je tedy důkazem non-proporcionality., Graficky je tato metoda spolehlivější a snadněji interpretovatelná než Vykreslování funkce log(-log(s(t)) prezentované dříve. Přítomnost lineárního vztahu s časem může být testována provedením jednoduché lineární regrese a testovacího trendu. Sklon výrazně odlišný od nuly by byl důkazem proti proporcionalitě: rostoucí (klesající) trend by v průběhu času naznačoval rostoucí (klesající) poměr rizika., Kromě provedení tohoto testu se doporučuje pečlivě podívat na zbytkový pozemek, protože některé vzory mohou být patrné na pozemcích (kvadratické, logaritmické), ale statistickým testem zůstávají nezjištěny. Navíc může být zřejmý nepřiměřený vliv odlehlých hodnot . Ačkoli metoda založená na vyhlazených zbytcích Schoenfeldu poskytuje časově závislé odhady, může mít některé nevýhody ., Odhady nejistoty spojené s výslednými odhady závislými na čase mohou být v praxi obtížné a poskytnutý odhad nemusí mít dobré statistické vlastnosti, jako je konzistence. Důležitější je, že p-hodnoty vyplývající z trendu testy založené na Schoenfeld odchylky jsou získány nezávisle pro každou proměnnou modelu, za předpokladu, že Cox model je oprávněné pro ostatní proměnné modelu; jako takový, výsledky by měly být interpretovány opatrně. Testy založené na zbytcích Schoenfeldu lze snadno implementovat ve většině standardních statistických balíčků (Tabulka 2).,

Pracovní příklad (cont‘)

Pro každou proměnnou, měřítko Schoenfeld odchylky byly vyneseny v průběhu času, a testy o nulové svahu byly provedeny. Odpovídající hodnoty p, stejně jako hodnota p spojená s globálním testem proporcionality jsou uvedeny v tabulce 3. Globální test navrhl silné důkazy o proporcionalitě (p < 0.01). Proměnné, které považuje za pravděpodobné, že přispívají k non-proporcionality byly SBR třídy (p < 0.01), PVI (p = 0,05) a stav hormonálních receptorů (p = 0,05)., Tato číselná zjištění naznačují neměnný poměr rizika pro tyto proměnné. Zbytky pomáhají vizualizovat poměr rizika log v průběhu času pro každý kovariát (obrázek 3). Přidali jsme přerušované a tečkované čáry představující respektive nulový efekt (null log hazard ratio) a v průměru log poměr odhadované konvenční Cox model. Pokud jde o stupeň SBR, pozemky naznačovaly silný účinek během prvních pěti let. Tento účinek se později snižoval., Podobně se vliv PVI v průběhu času změnil, s opět vyšším rizikem metastáz v prvních letech, a pak tento účinek měl tendenci mizet. O stav hormonálních receptorů, pozemky navrhl, že negativní stav zvýšené riziko metastáz brzy, a stal ochranné později.

Tabulka 3 Test pro non-proporcionality na základě zmenšen Schoenfeld odchylky od běžných Cox model (viz tabulka 1).,
Figure 3

Scaled Schoenfeld residuals for SBR grade, PVI, and hormone receptor status (with 95% confidence interval).

The cumulative sum of Schoenfeld residuals, or equivalently the observed score process can also be used to assess proportional hazards ., Graficky, pozorované skóre proces je vynesou do grafu proti času pro každou proměnnou modelu, simulované procesy, za předpokladu, že základní Cox model je pravda, že je, za předpokladu, že proporcionálních rizik. Jakýkoli odklon sledovaného skóre od simulovaných je důkazem proti proporcionalitě. Tyto pozemky pak mohou být použity k posouzení, kdy je nedostatek fit. Zejména pozorované skóre výrazně nad simulovaným procesem je známkou účinku vyššího než průměr a naopak., Tato metoda je zvláště dobře ilustrována v nedávné publikaci Cortese et al. . Testy mohou být realizovány na základě kumulativních reziduí. Kumulativní zbytky přístup založený překonává některé nevýhody setkal s Schoenfeld rezidua, protože výsledné odhady mají tendenci mít lepší statistické vlastnosti a oprávněné p-hodnoty jsou odvozeny . Přístup kumulativních reziduí je implementován v některých standardních statistických balíčcích (Tabulka 2).

pracovní příklad (cont‘)

testy založené na kumulativních zbytcích jsou uvedeny v tabulce 4., Na 5% hladině významnosti, test statistiky naznačují, non-konstantní účinek v průběhu času pro stupeň nádoru, stejně jako stav hormonálních receptorů, her2, a Mib1. Pro ilustraci jsme také vykreslili výsledný proces skóre pro některé proměnné (obrázek 4). V souladu s testovací statistiky založené na kumulativní odchylky, pozorujeme silný odklon pozorovaných procesů od simulované křivky pod model pro stupeň a stav hormonálních receptorů. Tyto pozemky jsou zvláště užitečné při identifikaci, kde je nedostatek fit., Například, počáteční pozitivní skóre proces spojený s hormonální receptory, naznačuje, že vliv této proměnné je zpočátku vyšší než průměrný účinek, a tedy nižší, než průměrný efekt později. To znamená, že riziko metastáz se zvyšuje zpočátku pro ženy s negativní hormonální receptory, ve srovnání s průměrným rizikem, a poté snížil.

Tabulka 4 Test pro non-proporcionality založené na Kumulativní odchylky od běžných Cox model (viz tabulka 1).,
Obrázek 4

Pozorované skóre proces pro SBR třídy, lymfatických uzlin a stav hormonálních receptorů (s 95% intervalem spolehlivosti).

Další jednoduchý přístup pro testování časově proměnné efekty dalších proměnných zahrnuje montáž různých Cox modely pro různá časová období. Přestože předpoklad pH nemusí trvat po celou dobu sledování, může se držet v kratším časovém okně., Pokud není zájem o určitou časovou hodnotu přerušení, lze vytvořit dvě podmnožiny dat na základě mediánu času události . To je první analýza se provádí cenzuru všichni stále v ohrožení mimo tento časový bod, a druhý tím, že zvažuje pouze ty předměty stále v ohrožení poté. V takovém případě je interpretace modelů podmíněna délkou doby přežití a výsledky by proto měly být interpretovány s opatrností., I když je doba analýzy zkrácena, je třeba zajistit, aby předpoklad PH nebyl porušen v těchto zkrácených časových obdobích. Vzhledem k tomu, že se zvažuje méně časů událostí, analýzy mohou trpět sníženou silou. Konečně, i když tato metoda je zvláště jednoduché implementovat a mohou zajistit dostatek informací v některých nastavení, které je, pokud je zájem v krátké časové okno, je třeba poznamenat, že tato metoda není přímo testování PH předpoklad, a různé parametrizace by bylo zapotřebí k provedení takové zkoušky.,

pracovní příklad (cont‘)

střední doba události byla 4, 3 roku. Cox model byl aplikován cenzurovat všichni stále v ohrožení po 4,3 let, přičemž pouze tyto subjekty stále v ohrožení mimo tento časový bod byly zahrnuty v jiném modelu (Další soubor 2: Odhadovaný poměr rizika (exp()) s 95% intervaly spolehlivosti (95% CI) a p-hodnoty pro model proměnné ve dvou nezávislých Cox modely pro dvě různá období.)., Všechny proměnné věku, ale byly statisticky významné v prvním modelu jako negativní stav hormonálních receptorů, Her2 pozitivní stav a Mib1 pozitivitu byly spojeny se zvýšeným rizikem metastáz. U žen, které jsou stále ohroženy po 4,3 letech, byl mladší věk, větší velikost nádoru a postižení lymfatických uzlin spojen se zvýšeným rizikem metastáz. Účinky jiných proměnných zmizely. Je zajímavé, že negativní stav hormonálního receptoru měl v tomto druhém modelu významný ochranný účinek (HR = 0.,5), zatímco první analýza navrhla významné zvýšené riziko (HR = 1, 7). Testy pro non-proporcionality založené na kumulativní odchylky navrhl trvalé časově proměnným účinkem třídy pro analýzu omezit na první 4,3 let.

je také možné zohlednit non-proporcionality rozdělením časové osy, jak navrhuje Moreau et al. . Časová osa je rozdělena a poměry nebezpečnosti se pak odhadují v každém intervalu. Testování na non-proporcionalitu je tedy ekvivalentní testování, pokud se časově specifické HR výrazně liší., Výsledky však mohou být někdy poháněny počtem časových intervalů a časové intervaly by proto měly být pečlivě vybrány.

opouštět předpoklad proporcionálních rizik, a jako takový, model Cox, je další možností. Ostatní mocní statistické modely jsou k dispozici na účet pro časově proměnné efekty, včetně aditivní modely, accelerated failure time modely, regresní spline modely nebo zlomkové polynomy .,

nakonec lze provést statistickou analýzu stratifikovanou proměnnou, u které existuje podezření, že má časově odlišný účinek; tato proměnná by tedy měla být kategorická nebo kategorizována. Každou vrstvu k má odlišné základní nebezpečnost, ale společné hodnoty koeficientu vektoru β, který je nebezpečí pro jedince ve skupině k je hk(t) = exp(ßx) Stratifikace předpokládá, že ostatní proměnné se chovají stejným způsobem v každé vrstvě, to je to, HRs jsou podobné napříč vrstev., Ačkoli stratifikace je účinná při odstraňování problému non-proporcionality a snadno implementovat, má některé nevýhody. A co je nejdůležitější, stratifikace neproporcionální proměnnou vylučuje odhad její síly a jejího testu v modelu Cox. Tento přístup by tedy měl být zvolen, pokud člověk nemá přímý zájem kvantifikovat účinek proměnné použité pro stratifikaci., Navíc, stratifikovaném Cox model může vést ke ztrátě energie, protože více údajů, které jsou používány k odhadu samostatné rizikové funkce; tento dopad bude záviset na počtu jedinců a vrstev . Pokud existuje několik proměnných s časově odlišnými riziky, vyžadovalo by to rozvrstvení modelu na těchto více faktorech, což opět pravděpodobně sníží celkový výkon.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *