Analiza przeżycia
w wielu badaniach podstawową zmienną zainteresowania jest opóźnienie, takie jak czas od diagnozy raka do określonego zdarzenia., Zdarzenie to może być śmiercią, i z tego powodu analiza takich danych jest często określany jako analiza przeżycia. Zdarzenie będące przedmiotem zainteresowania mogło nie nastąpić w czasie analizy statystycznej i podobnie podmiot może zostać utracony w celu obserwacji przed zaobserwowaniem zdarzenia. W takim przypadku mówi się, że dane są cenzurowane w czasie analizy lub w czasie, gdy pacjent został utracony do obserwacji. Dane ocenzurowane nadal przynoszą pewne informacje, ponieważ chociaż nie znamy dokładnej daty wydarzenia, wiemy, że miało ono miejsce później niż czas cenzury.,
zarówno metoda Kaplana-Meiera, jak i model proporcjonalnych zagrożeń Coxa (PH) pozwalają na analizę ocenzurowanych danych i oszacowanie prawdopodobieństwa przeżycia, S(T), czyli prawdopodobieństwa, że podmiot przeżyje ponad pewien czas t. statystycznie Prawdopodobieństwo to jest zapewnione przez funkcję przeżycia S(T) = P (T > t), gdzie T jest czasem przeżycia. Metoda Kaplana Meiera ocenia prawdopodobieństwo przeżycia nieparametrycznie, czyli nie przyjmując żadnej konkretnej funkcji bazowej ., Dostępnych jest kilka testów w celu porównania rozkładu przeżycia między grupami, w tym log-rank i testy Manna-Whitneya-Wilcoxona . Model PH Coxa odpowiada za wiele czynników ryzyka jednocześnie. Nie zakłada żadnego rozkładu ani kształtu dla funkcji przeżycia, jednak chwilowa częstość występowania zdarzenia jest modelowana jako funkcja czasu i czynników ryzyka.,
chwilowy wskaźnik zagrożenia w czasie t, zwany także chwilowym zdarzeniem, śmiercią lub niepowodzeniem lub ryzykiem, jest chwilowym prawdopodobieństwem wystąpienia zdarzenia w czasie t, biorąc pod uwagę, że zdarzenie nie miało jeszcze miejsca. Jest to szybkość zdarzeń na jednostkę czasu i może się zmieniać w czasie. Podobnie jak ryzyko zdarzeń w jednostce czasu, można dokonać analogii, biorąc pod uwagę prędkość podaną przez prędkościomierz samochodu, który reprezentuje odległość przebytą w jednostce czasu. Załóżmy, że interesującym wydarzeniem jest śmierć i interesuje nas jej związek z kowariantami N, X1, X2, …,, Xn, wtedy zagrożenie jest podane przez:
Początkowy Współczynnik zagrożenia h0(t) jest nieokreśloną nieujemną funkcją czasu. Jest zależną od czasu częścią zagrożenia i odpowiada współczynnikowi zagrożenia, gdy wszystkie wartości kowariantne są równe zeru. β1, β2, …, ßn są współczynnikami funkcji regresji ß1×1 + ß2×2+… / align = „left” / , Załóżmy, że jesteśmy zainteresowani pojedynczą współzmiennością, wtedy zagrożenie wynosi:
biorąc x2 = x1 + 1, współczynnik ryzyka zmniejsza się do HR = EXP(β) i odpowiada wpływowi wzrostu jednej jednostki zmiennej objaśniającej X na ryzyko zdarzenia. Ponieważ β = log (HR), β jest określany jako log współczynnik ryzyka. Chociaż współczynnik ryzyka hx (t) może się zmieniać w czasie, współczynnik ryzyka HR jest stały; jest to założenie proporcjonalnego zagrożenia., Jeśli HR jest większy niż 1 (β > 0), ryzyko wystąpienia zdarzenia jest większe u pacjentów z wartościami współzmiennymi x2 w porównaniu do pacjentów z wartościami współzmiennymi x1, podczas gdy HR niższy niż 1 (β < 0) wskazuje na zmniejszenie ryzyka. Gdy HR nie jest stała w czasie, mówi się, że zmienna ma wpływ zmienny w czasie; na przykład efekt leczenia może być silny natychmiast po leczeniu, ale zanika z czasem. Nie należy tego mylić z kowariantą zmienną czasową, która jest zmienną, której wartość nie jest stała w czasie, np. stan palenia., Rzeczywiście, osoba może być Niepalący, a następnie palacz, a następnie Niepalący. Należy jednak pamiętać, że zmienna może być zmienna w czasie i mieć wpływ, który zmienia się w czasie.
w modelu PH Coxa wartość HR jest szacowana poprzez uwzględnienie każdorazowego t, w którym wystąpi zdarzenie. Przy szacowaniu ogólnej wartości HR w całym okresie obserwacji, takie same wagi mają bardzo wczesne wartości HR, które dotyczą prawie wszystkich osób, oraz bardzo późne wartości HR, które dotyczą tylko nielicznych osób, które nadal są zagrożone. HR jest zatem uśredniony w czasie wydarzeń., W przypadku zagrożeń proporcjonalnych ta procedura ważenia nie wpływa na ogólną wartość HR. Z drugiej strony, jeżeli HR zmienia się w czasie, to znaczy, że współczynniki ryzyka nie są proporcjonalne, to równe ważenie może skutkować NIEREPREZENTATYWNYM HR i może przynieść stronnicze wyniki . Należy zauważyć, że HR jest uśredniany w czasie zdarzeń, a nie w czasie obserwacji. Nie zmienia się, jeśli skala czasu jest zmieniana bez zakłócania kolejności zdarzeń.,
przykład
niektóre z prezentowanych metod stosowaliśmy u pacjentek z rakiem piersi ze względu na zmiany w czasie, takie jak np. stan węzłów czy receptorów hormonalnych . Badaliśmy kobiety z nie przerzutowym, operacyjnym rakiem piersi, które przeszły operację w latach 1989-1993 w naszej placówce i które nie otrzymały wcześniejszego leczenia neoadiuwantowego. Kryteria wykluczenia obejmowały raka piersi w wywiadzie, równoczesny przeciwstronny rak piersi oraz brak danych patologicznych., Badania kontrolne przeprowadzono zgodnie z wymogami Dobrej Praktyki Klinicznej w Europie i obejmowały regularne badania fizykalne, roczną mammografię rentgenowską oraz dodatkowe oceny w przypadku podejrzenia przerzutów. Cechy kliniczne i patologiczne zostały przeanalizowane zgodnie z dokumentacją zapisaną w szpitalu w momencie rozpoczęcia leczenia. Rozmiar guza patologicznego (≤lub > 20 mm) mierzono na świeżych próbkach chirurgicznych. Zastosowano zmodyfikowaną wersję systemu klasyfikacji Scarff-Bloom-Richardson (SBR grade I, II Lub III)., PVI (tak, nie) definiowano jako obecność zatorów nowotworowych w obrębie Luminy limfatycznej lub kapilarnej w obszarach sąsiadujących z guzem piersi. Badania immuno-histochemiczne przeprowadzono na mikromacierzu tkankowym (TMA) w celu oceny stanu receptora hormonalnego (hrec) (dodatniego, jeśli ER-dodatniego i (lub) receptora progesteronowego). Poziom ekspresji ER i PgR oceniano półilościowo według standardowego protokołu z wartościami odcięcia dla 10% dodatnich komórek nowotworowych. Poziom ekspresji Her2 oceniano zgodnie z systemem punktacji Herceptest ., Poziom ekspresji Mib1 oceniano półilościowo. Informacje o wszystkich czynnikach uzyskano dla 979 Kobiet (tabela 1). Mediana czasu obserwacji wynosiła 14 lat (95% przedział ufności: 13,7-14,2), a u 264 kobiet wystąpiły przerzuty.
przykład roboczy
czynniki prognostyczne zostały wstępnie wybrane na podstawie aktualnej wiedzy dotyczącej ryzyka przerzutów., Następnie zostały one przeanalizowane przy użyciu konwencjonalnego modelu regresji Coxa; wszystkie były istotne statystycznie na poziomie 5% w analizach jednowymiarowych, a następnie zostały wprowadzone do wielowymiarowego modelu Coxa., Ryzyko wystąpienia przerzutów było większe u kobiet w młodszym wieku niż u starszych; guzy II i III stopnia w porównaniu z guzami i stopnia; guzy duże w porównaniu z guzami małymi; zajście węzłów chłonnych w porównaniu z brakiem zajścia; oraz PVI w porównaniu z brakiem zajścia (dodatkowy plik 1: szacunkowe współczynniki ryzyka log (log(HR)) i współczynniki ryzyka (HR = exp()) z 95% przedziałem ufności (95% CI) i wartości p dla współzmiennych modelowych w przypadku dopasowania wielowymiarowy konwencjonalny model Coxa i model Coxa z oddziaływaniami czas-po-kowariantnymi.)., W oparciu o ten model, wszystkie zmienne, ale receptor hormonu, HER2 i mib1 status, znacząco wpłynęły na ryzyko przerzutów.
ocena braku proporcjonalności: Strategia graficzna
w obecności zmiennej kategorycznej można wykreślić rozkład przeżycia Kaplana-Meiera, S(t), jako funkcję czasu przeżycia, dla każdego poziomu współzmienności. Jeśli założenie PH jest spełnione, krzywe powinny stale się od siebie oddalać., Można również zastosować transformację krzywych przeżycia Kaplana-Meiera i wykreślić log funkcji (- log (S (t))) jako funkcję czasu przeżycia logu, gdzie log reprezentuje funkcję logarytmu naturalnego. Jeżeli zagrożenia są proporcjonalne, wykresy log-minus-log powinny wykazywać stałe różnice, czyli być w przybliżeniu równoległe. Te wizualne metody są proste do wdrożenia, ale mają ograniczenia. Gdy współzmienność ma więcej niż dwa poziomy, wykresy Kaplana-Meiera nie są przydatne do rozróżniania nieproporcjonalności, ponieważ wykresy stają się zaśmiecone ., Podobnie, chociaż założenie PH nie może zostać naruszone, krzywe log-minus-log rzadko są idealnie równoległe w praktyce i stają się rzadkie w dłuższych punktach czasowych, a tym samym mniej precyzyjne. Nie można określić ilościowo, jak blisko równoległości jest wystarczająco blisko, a tym samym jak proporcjonalne są zagrożenia. Decyzja o przyjęciu hipotezy PH często zależy od tego, czy krzywe te krzyżują się ze sobą. W rezultacie decyzja o zaakceptowaniu hipotezy PH może być subiektywna i konserwatywna, ponieważ trzeba mieć mocne dowody (linie krzyżujące się), aby stwierdzić, że założenie PH jest naruszone., W związku z tymi ograniczeniami niektórzy sugerują wprowadzenie standardowych błędów do tych działek . Takie podejście może jednak być intensywne obliczeniowo i nie jest bezpośrednio dostępne w standardowych programach komputerowych. Wykresy Kaplana-Meiera i log-minus-log są dostępne w większości standardowych pakietów statystycznych (Tabela 2).
przykład roboczy (cont')
krzywe przeżycia Kaplana-Meiera i wykresy log-minus-log są wyświetlane dla niektórych zmiennych (Rys. 1 i 2)., Krzywe przeżycia Kaplana-Meiera wydawały się stopniowo oddalać od siebie dla wszystkich oprócz statusu receptora hormonalnego, statusu Her2 i statusu mib1. Wykresy log-minus wyglądały w przybliżeniu równolegle ze względu na wiek, wielkość guza, zajęcie węzłów chłonnych i PVI. Ponownie, wykresy dotyczące statusu receptora hormonalnego, statusu Her2 i statusu mib1 wskazywały na naruszenie założenia PH. Pojawiły się też pewne podejrzenia co do stopnia SBR.,
ocena braku proporcjonalności: strategie modelowania i testowania
graficzne metody sprawdzania założenia PH nie zapewniają formalnego testu diagnostycznego i wymagane są metody potwierdzające. Dostępnych jest wiele opcji testowania i rozliczania braku proporcjonalności.
Cox zaproponował ocenę odejścia od nieproporcjonalności poprzez wprowadzenie skonstruowanej zmiennej zależnej od czasu, czyli dodanie do modelu Coxa terminu interakcji obejmującego czas i sprawdzenie jego znaczenia ., Załóżmy, że interesuje nas ocena, czy jakaś zmienna X ma wpływ zmienny w czasie. Zmienna zależna od czasu jest tworzona przez tworzenie interakcji (iloczynu) między predyktorem, X (ciągłym lub kategorycznym), a funkcją czasu t (f(t) = t, T2, log (t), …). Dodając tę interakcję do modelu (równanie 2), zagrożenie staje się następujące:
współczynnik ryzyka jest określony przez HR(t) = hx+1(t) / hx(t) = exp dla przyrostu jednostki zmiennej X i jest zależny od czasu za pomocą funkcji f(t)., Jeśli γ >0 (γ< 0), to HR wzrasta (maleje) w czasie. Badanie na nieproporcjonalność zagrożeń jest równoważne badaniu, jeśli γ różni się znacząco od zera. Można używać różnych funkcji czasu, takich jak wielomian lub rozkład wykładniczy, ale często bardzo proste stałe funkcje czasu, takie jak funkcje liniowe lub logarytmiczne są preferowane . To podejście modelowania dostarcza również oszacowania współczynnika ryzyka w różnych punktach czasowych, ponieważ wartości T czasu mogą być włączone do funkcji współczynnika ryzyka., Zmienne zależne od czasu zapewniają elastyczną metodę oceny odejścia od braku proporcjonalności oraz podejście do budowania modelu zależności ryzyka względnego w czasie. Takie podejście należy jednak stosować ostrożnie. W rzeczywistości, jeśli funkcja wybranego czasu jest źle określona, ostateczny model nie będzie odpowiedni. Jest to wadą tej metody w stosunku do bardziej elastycznego podejścia.
przykład roboczy (cont')
stworzyliśmy interakcje czas-po-kowariantne dla każdej zmiennej modelu, wprowadzając produkty między zmiennymi i liniową funkcję czasu., Jak pokazano w pliku dodatkowym 1 (szacowane współczynniki ryzyka log (log (HR)) i współczynniki ryzyka (HR = exp()) z 95% przedziałami ufności (95% CI) i wartościami p dla współzmiennych modeli przy dopasowaniu wielowymiarowego konwencjonalnego modelu Coxa i modelu Coxa z współzmiennymi interakcjami czas po współzmiennych.(p < 0,05). Wyniki te wykazały zatem, że współczynniki ryzyka związane z tymi czynnikami nie były stałe w czasie., Parametry () związane z większością interakcji były ujemne, co sugeruje, że współczynniki ryzyka malały w czasie. Szacowany współczynnik ryzyka związany z ii stopniem SBR (w porównaniu do I stopnia) w funkcji czasu t został określony przez: HR ( t) = exp(1,71 – 0,14 t). Współczynniki ryzyka wynosiły odpowiednio 4, 8, 3, 6 i 2, 7 po 1, 3 i 5 latach. Podobnie szacowany współczynnik ryzyka związany ze statusem receptora hormonalnego wynosił: HR(t) = exp(0,73 – 0,14 t), czyli współczynniki ryzyka wynoszące odpowiednio 1,8, 1,3 i 1,0 po 1, 3 i 5 latach., Podczas gdy konwencjonalny model Coxa nie wykazywał istotnego wpływu na receptory hormonalne, Her2 i Mib1, zmienne te miały znaczący wpływ po uwzględnieniu interakcji współzmiennych.
A rezydualny mierzy różnicę między obserwowanymi danymi, a oczekiwanymi danymi przy założeniu modelu. Pozostałości schoenfelda są obliczane i raportowane w każdym czasie awarii zgodnie z założeniem PH i jako takie nie są definiowane dla ocenzurowanych obiektów ., Są one definiowane jako wartość kowariantna dla jednostki, która nie powiodła się minus jego wartość oczekiwana przy założeniu hipotez posiadania modelu. Istnieje osobna rezydualna dla każdej jednostki dla każdej kowariancji. Gładki Wykres pozostałości Schoenfelda można następnie wykorzystać do bezpośredniej wizualizacji współczynnika ryzyka log . Zakładając proporcjonalność zagrożeń, pozostałości Schoenfelda są niezależne od czasu. Tak więc Wykres sugerujący nieprzypadkowy wzór na czas jest dowodem braku proporcjonalności., Graficznie metoda ta jest bardziej niezawodna i łatwiejsza do zinterpretowania niż wykreślenie przedstawionej wcześniej funkcji log (- log (S (t)). Obecność liniowej zależności z czasem można sprawdzić, wykonując prostą regresję liniową i trend testowy. Nachylenie znacznie różniące się od zera byłoby dowodem na proporcjonalność: rosnąca (malejąca) tendencja wskazywałaby na rosnący (malejący) współczynnik ryzyka w czasie., Zaleca się, aby dokładnie przyjrzeć się pozostałym wykresom oprócz wykonywania tego testu, ponieważ niektóre wzory mogą być widoczne na wykresach (kwadratowe, logarytmiczne), ale pozostają niewykryte przez badanie statystyczne. Ponadto nieuzasadniony wpływ wartości odstających może stać się oczywisty . Chociaż metoda oparta na wygładzonych resztkach Schoenfelda zapewnia szacunki zależne od czasu, może mieć pewne wady ., Szacunki niepewności związane z wynikającymi szacunkami zależnymi od czasu mogą być trudne do wykorzystania w praktyce, a Estymator dostarczony może nie mieć dobrych właściwości statystycznych, takich jak spójność. Co ważne, wartości p wynikające z badań trendu opartych na pozostałościach Schoenfelda są uzyskiwane niezależnie dla każdej kowariancji modelu, przy założeniu, że model Coxa jest uzasadniony dla innych kowariancji modelu; jako takie wyniki powinny być interpretowane ostrożnie. Testy oparte na pozostałościach Schoenfelda można łatwo wdrożyć w większości standardowych pakietów statystycznych (Tabela 2).,
przykład roboczy (cont')
dla każdej kowariantnej, skalowane pozostałości Schoenfelda zostały wykreślone w czasie i przeprowadzono testy dla zerowego nachylenia. Odpowiednie wartości p, jak również wartość p związana z globalnym testem braku proporcjonalności przedstawiono w tabeli 3. Globalny test sugerował silne dowody braku proporcjonalności (p < 0.01). Zmienne, które uznano za najbardziej prawdopodobne, aby przyczynić się do braku proporcjonalności, to stopień SBR (p < 0, 01), PVI (p = 0, 05) i status receptora hormonalnego (P = 0, 05)., Te wyniki liczbowe sugerują niestały współczynnik ryzyka dla tych zmiennych. Pozostałości pomagają wizualizować współczynnik ryzyka log w czasie dla każdej kowariancji (Rysunek 3). Dodaliśmy przerywane i przerywane linie reprezentujące odpowiednio efekt zerowy (null log hazard ratio) I uśredniony log hazard ratio szacowany przez konwencjonalny model Coxa. W odniesieniu do klasy SBR działki sugerowały silny efekt w ciągu pierwszych pięciu lat. Efekt ten zmniejszył się później., Podobnie wpływ PVI zmieniał się w czasie, ponownie większe ryzyko przerzutów w pierwszych latach, a następnie efekt ten miał tendencję do znikania. Jeśli chodzi o status receptora hormonalnego, wykresy sugerowały, że negatywny status zwiększał ryzyko wystąpienia przerzutów we wczesnym okresie, a później stał się ochronny.
The cumulative sum of Schoenfeld residuals, or equivalently the observed score process can also be used to assess proportional hazards ., Graficznie obserwowany proces punktacji jest wykreślany w czasie dla każdej zmiennej modelu, wraz z symulowanymi procesami, zakładając, że bazowy model Coxa jest prawdziwy, to znaczy, zakładając proporcjonalne zagrożenia. Każde odejście procesu oceny obserwowanej od symulowanego jest dowodem na proporcjonalność. Działki te mogą być następnie wykorzystane do oceny, gdy brak dopasowania jest obecny. W szczególności obserwowany wynik znacznie powyżej symulowanego procesu jest wskaźnikiem efektu wyższego niż przeciętny i odwrotnie., Metoda ta jest szczególnie dobrze zilustrowana w niedawnej publikacji Cortese et al. . Testy dobroci dopasowania mogą być realizowane w oparciu o skumulowane pozostałości. Skumulowane residuals oparte podejście pokonuje pewne wady napotkane z residuals Schoenfelda, ponieważ wynikowe estymatory mają tendencję do lepszych właściwości statystycznych, a uzasadnione wartości p są wyprowadzane . Metoda skumulowanych pozostałości jest wdrażana w niektórych standardowych pakietach statystycznych (Tabela 2).
przykład roboczy (cont')
testy oparte na skumulowanych pozostałościach przedstawiono w tabeli 4., Na poziomie istotności 5% statystyki badania sugerują nie stały wpływ w czasie dla stopnia guza, a także stanu receptorów hormonalnych, her2 i Mib1. Dla ilustracji wykreśliliśmy również wynikający proces punktacji dla niektórych zmiennych (Rysunek 4). Zgodnie ze statystykami badań na podstawie skumulowanych pozostałości obserwujemy silne odejście obserwowanych procesów od symulowanych krzywych w modelu dla stopnia i statusu receptora hormonalnego. Działki te są szczególnie przydatne w identyfikacji, gdzie brak dopasowania jest obecny., Na przykład początkowy proces dodatniego wyniku związany z receptorami hormonalnymi sugeruje, że efekt tej zmiennej jest początkowo wyższy niż średni efekt, a zatem niższy niż średni efekt później. Oznacza to, że ryzyko przerzutów zwiększa się początkowo u kobiet z zarówno negatywnymi receptorami hormonalnymi w porównaniu do średniego ryzyka, a następnie zmniejsza się.