生存分析
多くの研究では、関心のある主な変数は、癌診断から関心のある特定のイベントまでの時間などの遅延である。, このイベントは死である可能性があり、このため、そのようなデータの分析は、多くの場合、生存分析と呼ばれています。 関心のある事象は、統計的分析の時点では発生していない可能性があり、同様に、被験者は、事象が観察される前に追跡調査に失われる可能性がある。 そのような場合、データは、分析時または患者が追跡調査に失われた時点で打ち切られると言われる。 検閲されたデータは、イベントの正確な日付はわかりませんが、検閲時間よりも遅く発生したことを知っているため、いくつかの情報をもたらします。,統計的には、この確率は生存関数S(t)=P(T>t)によって提供されます。Tは生存時間です。 Kaplan Meier法は、生存確率をノンパラメトリックに推定する、つまり、特定の基礎となる関数がないと仮定します。, 対数ランク検定やMann-Whitney-Wilcoxon検定など、グループ間の生存分布を比較するためのいくつかの検定が利用可能です。 Cox PHモデルは複数のリスク要因を同時に説明します。 生存関数の分布や形状は仮定していませんが、事象の瞬時発生率は時間と危険因子の関数としてモデル化されています。,
時間tにおける瞬間的なハザード率は、瞬時発生率、死亡率又は故障率、又はリスクとも呼ばれ、イベントがまだ発生していないことを考えると、時間tにおいてイベントが発生する瞬間確率である。 これは単位時間当たりのイベントの割合であり、時間の経過とともに変化することが許されます。 単位時間当たりのイベントのリスクと同様に、単位時間当たりの移動距離を表す車の速度計によって与えられる速度を考慮することによって類推 関心のあるイベントが死であり、n個の共変量X1、X2、との関連に興味があるとします。.., Xnの場合、ハザードは次のように与えられます。
ベースラインハザード率h0(t)は、指定されていない非負の時間関数です。 これは、ハザードの時間依存部分であり、すべての共変量値がゼロに等しい場合のハザード率に対応します。 β1, β2, …、λnは回帰関数λ1×1+λ2×2+の係数である。.. ———–, 単一の共変量に興味があると仮定すると、ハザードは次のようになります。
x2=x1+1とすると、ハザード比はHR=exp(β)に減少し、イベントのリスクに対する説明変数xの一つの単位の増加の効果。 Β=log(HR)なので、βは対数ハザード比と呼ばれます。 ハザード率hx(t)は時間の経過とともに変化することが許されますが、ハザード比HRは一定であり、これは比例ハザードの仮定です。, HRが1より大きい場合(β>0)、共変量値x2を持つ被験者のイベントリスクは共変量値x1を持つ被験者と比較して増加し、1より小さいHR(β<0)はリスクの減少を示します。 HRが時間の経過とともに一定でない場合、変数は時変効果を有すると言われ、例えば、治療の効果は治療直後に強くなり得るが、時間とともに退色する。 これは、喫煙ステータスなど、時間の経過とともに値が固定されていない変数である時変共変量と混同しないでください。, 確かに、人は非喫煙者、次に喫煙者、次に非喫煙者になることができます。 ただし、変数は時変であり、時間の経過とともに変化する効果があることに注意してください。Cox PHモデルにおいて、HRは、事象が発生する各時間tを考慮することによって推定される。 完全なフォローアップの期間にわたる全面的なHRを推定するとき、同じ重量はほとんどすべての個人に影響を与える非常に早いHRと危険にまだ非常に少数の個人だけに影響を与える非常に遅いHRに与えられる。 したがって、HRはイベント時間にわたって平均化される。, 比例ハザードの場合、全体のHRはこの重み付け手順の影響を受けません。 一方、HRが時間の経過とともに変化する、すなわちハザード率が比例しない場合、等しい重み付けが非代表的HRになり、偏った結果が生じる可能性があ HRは、追跡時間よりもむしろ事象時間にわたって平均されることに留意されたい。 イベントの順序を乱すことなくタイムスケールが変更された場合は変更されません。,
例
結節性またはホルモン受容体状態などの時間変化する効果が報告されているため、提示された方法のいくつかを乳癌患者に適用した。 私たちは、私たちの施設で1989年から1993年の間に手術を受け、以前のneoadjuvant治療を受けていない非転移性、手術可能な乳癌を有する女性を研究しました。 除外基準には、乳がんの既往歴、同時対側乳がん、および病理学的データの欠落が含まれていた。, フォローアップは、ヨーロッパの良好な臨床実Practiceの要件に従って行われ、定期的な身体検査、および毎年のX線マンモグラム、および転移が疑われる場合の追加評価で構成されていた。 臨床的および病理学的特徴は、治療開始時の病院記録ファイルに従って分析された。 病理学的腫瘍サイズ(λまたは>20mm)を新鮮な外科標本で測定した。 Scarff-Blome-Richardsonグレーディングシステムの修正版を使用した(SBRグレードi、II、またはIII)。, PVI(はい、いいえ)は、乳房腫瘍に隣接する領域における明白な血管リンパ管または毛細血管管腔内における腫瘍性塞栓の存在として定義された。 探索免疫組織化学的解析は、ホルモン受容体(HRec)状態(ER陽性および/またはプロゲステロン受容体陽性の場合)を評価するために組織マイクロアレイ(TMA) ERおよびPgR発現レベルは、10%陽性腫瘍細胞でのカットオフ値を有する標準プロトコルに従って半定量的に評価した。 Her2発現レベルは、Herceptestスコアリングシステムに従って評価した。, Mib1発現レベルを半定量的に評価した。 すべての要因に関する情報は、979人の女性に利用可能であった(表1)。 フォローアップ時間の中央値は14年(95%信頼区間:13.7-14.2)であり、264人の女性が転移を発症した。
実例
予後因子は、最初に転移のリスクに関する現在の知識に基づいて選択された。, それらは次に慣習的なCox回帰モデルを使用して分析されました;すべては単変量分析の5%のレベルで統計的に有意であり、次に多変量Coxモデルに入, 追加ファイル1:推定ログハザード比(log(HR))、およびハザード比(HR=exp())95%信頼区間(95%CI)およびモデル共変量のp値を用いて、多変量従来Coxモデルを当てはめたときのモデル共変量に対するp値を用いた。そして、時間ごとの共変量相互作用を持つcoxモデル。)., このモデルに基づいて、すべての変数が、ホルモン受容体、Her2およびMib1状態は、有意に転移のリスクに影響を与えた。
非比例性の評価:グラフィカル戦略
カテゴリ変数の存在下で、共変量の各レベルについて、生存時間の関数としてKaplan-Meier生存分布S(t)をプロットすることができます。 PHの仮定が満たされる場合、曲線は着実に離れてドリフトする必要があります。, また、Kaplan-Meier生存曲線の変換を適用し、log(-log(S(t)))を対数生存時間の関数としてプロットすることもできます。logは自然対数関数を表します。 ハザードが比例している場合、地層固有の対数-マイナス対数プロットは一定の差を示す必要があります。 これらの視覚的なメソッドは実装が簡単ですが、制限があります。 共変量が二つ以上のレベルを持つ場合、Kaplan-Meierプロットは、グラフが雑然となるため、非比例性を見分けるのには役に立ちません。, 同様に、PHの仮定に違反することはないかもしれませんが、対数-マイナス-対数曲線は実際には完全に平行であることはめったになく、より長い時点で疎になる傾向があり、したがって精度が低くなります。 並列にどれだけ近いか、したがってハザードがどれだけ比例しているかを定量化することはできません。 PH仮説を受け入れる決定は、多くの場合、これらの曲線が互いに交差するかどうかに依存する。 その結果、PH仮説を受け入れるという決定は、PH仮定が違反していると結論づけるための強力な証拠(交差線)を持たなければならないため、主観的かつ, これらの制約の中で、あら提供する標準誤差はこれらを推定した。 このアプローチができる演算集中型とは直接利用できるようにします標準的なコンピュータプログラム. Kaplan-Meierおよびlog-minus-logプロットは、ほとんどの標準的な統計パッケージから入手できます(表2)。
作業例(cont’)
カプラン-マイヤー生存曲線とログ-マイナス-ログプロットは、いくつかの変数(図1および図2)について示されています。, カプラン-マイヤー生存曲線は着実にホルモン受容体の状態、Her2の状態、およびmib1の状態を除くすべてのために離れてドリフトするように見えた。 対数マイナス対数プロットは、年齢、腫瘍の大きさ、リンパ節の関与、およびPVIについてほぼ平行に見えた。 再び、ホルモン受容体状態、Her2状態、およびmib1状態のプロットは、PH仮定の違反を示す傾向があった。 SBRグレードに関してもいくつかの疑いがありました。,
非比例性の評価:モデリングとテスト戦略
PH仮定をチェックするためのグラフィカルな方法は、正式な診断テストを提供せず、確 非比例性のテストおよび会計のための多数の選択は利用できる。
Coxは、構築された時間依存変数を導入すること、すなわちCoxモデルに時間を含む相互作用項を追加し、その意義をテストすることによって、非比例性からの逸脱を評価することを提案した。, ある変数Xが時変効果を持つかどうかを評価することに興味があるとします。 時間依存変数は、予測子X(連続またはカテゴリカル)と時間tの関数(f(t)=t,t2,log(t),)との間に交互作用(積)項を形成することによって作成されます。..). この交互作用をモデル(式2)に加えると、ハザードは次のようになります。
ハザード比は、変数Xの単位増加に対してHR(t)=hx+1(t)/hx(t)=expで与えられ、関数f(t)によって時間依存します。, √>0(√<0)の場合、HRは時間の経過とともに増加(減少)します。 ハザードの非比例性のテストは、σがゼロと大きく異なる場合のテストと同等です。 多項式または指数関数的減衰などの異なる時間関数を使用することができますが、しばしば線形または対数関数などの非常に単純な固定された時間関数が好まれます。 このモデリングアプローチは、時間の値tをハザード比関数に適合させることができるため、異なる時点でのハザード比の推定値も提供します。, 時間依存変数は、非比例性からの逸脱を評価するための柔軟な方法と、時間の経過に伴う相対リスクの依存性のモデルを構築するためのアプローチ ただし、この方法は慎重に使用する必要があります。 実際、選択された時間の関数が誤って指定されている場合、最終的なモデルは適切ではありません。 これは、より柔軟なアプローチよりもこの方法の欠点です。
作業例(cont’)
変数と時間の線形関数の間の積を導入することにより、モデルの各変数に対して時間ごとの共変量相互作用を作成しました。, 追加ファイル1(推定ログハザード比(log(HR))、およびハザード比(HR=exp())に示されているように、95%信頼区間(95%CI)および多変量従来のCoxモデルおよびCoxモデルを時間ごと共変量相互作用で近似する場合のモデル共変量のp値を使用します。)、重要な時間による共変量相互作用は、SBRグレード、ホルモン受容体の状態、Her2の状態、およびPVI(p<0.05)を関与した。 これらの結果は,これらの因子に関連するハザード比が経時的に一定ではないことを示した。, ほとんどの相互作用に関連するパラメータ()は負であり、ハザード比が時間の経過とともに減少していることを示唆しています。 時間tの関数としてのSBRグレードII(対グレードI)に関連する推定ハザード比は、HR(t)=exp(1.71-0.14t)によって与えられた。 ハザード比は4.8、3.6、および2.7でそれぞれ1、3、および5年であった。 同様に、ホルモン受容体の状態に関連付けられている推定ハザード比は、HR(t)=exp(0.73-0.14t)、すなわち1.8、1.3、および1.0のハザード比であり、それぞれ1、3、および5年であった。, 従来のCoxモデルは、ホルモン受容体、Her2およびMib1に対して有意な効果を示さなかったが、これらの変数は、時間ごとの共変量相互作用が含まれてい
非比例性からの逸脱は、モデルの残差を使用して調べることもできます。 残差は、モデルの仮定の下で観測されたデータと期待されるデータとの差を測定します。 Schoenfeld残差は、PH仮定の下ですべての故障時間で計算され、報告され、そのように打ち切られた被験者に対して定義されていません。, それらは、失敗した個体の共変量値から、モデルの仮説が成立すると仮定して期待値を引いたものとして定義されます。 各共変量に対して各個人に対して別々の残差があります。 次に、Schoenfeld残差の滑らかなプロットを使用して、対数ハザード比を直接視覚化できます。 ハザードの比例性を仮定すると、シェーンフェルト残差は時間に依存しません。 したがって、時間に対する非ランダムなパターンを示唆するプロットは、非比例性の証拠です。, グラフィカルには、このメソッドは、前に示したlog(-log(S(t))関数をプロットするよりも信頼性が高く、解釈が容易です。 時間との線形関係の存在は、単純な線形回帰およびテスト傾向を実行することによってテストすることができます。 ゼロとは大きく異なる傾きは、比例性に反する証拠であり、増加(減少)傾向は、時間の経過とともに増加(減少)するハザード比を示すであろう。, いくつかのパターンがプロット上で明らかであるかもしれませんが(二次、対数)、統計的検定によって検出されないままであるため、この検定を実行する さらに、外れ値の過度の影響が明らかになる可能性があります。 平滑化されたSchoenfeld残差に基づく方法は時間依存推定値を提供しますが、いくつかの欠点があります。, 結果として得られる時間依存推定値に関連する不確定性推定値は、実際には使用するのが困難であり、提供される推定量は、一貫性などの良好な統計的特性を持たない可能性がある。 重要なことに、Schoenfeld残差に基づく傾向検定から得られるp値は、Coxモデルがモデルの他の共変量に対して正当化されると仮定して、モデルの各共変量に対して独立して取得されます。したがって、結果は慎重に解釈される必要があります。 Schoenfeld残差に基づく検定は、ほとんどの標準的な統計パッケージで簡単に実装できます(表2)。,
作業例(cont’)
各共変量について、スケーリングされたSchoenfeld残差を時間の経過とともにプロットし、ゼロ傾きの検定を実行しました。 対応するp値、および非比例性の大域的検定に関連するp値を表3に報告します。 グローバルテストは、非比例性の強力な証拠を示唆しました(p<0.01)。 非比例性に寄与する可能性が最も高いと考えられる変数は、SBRグレード(p<0.01)、PVI(p=0.05)およびホルモン受容体状態(p=0.05)であった。, これらの数値であることを示唆するものである。非常に危険率はこれらの変数. 残差は、各共変量に対する対数ハザード比を経時的に可視化するのに役立ちます(図3)。 従来のCoxモデルによって推定されたヌル効果(ヌル対数ハザード比)および平均対数ハザード比をそれぞれ表す破線および点線を追加した。 SBRグレードに関しては,プロットは最初の五年間にわたって強い効果を示唆した。 この効果はその後減少する傾向があった。, 同様に、PVIの影響は時間の経過とともに変化し、初期の転移のリスクが再び高くなり、この効果は消失する傾向があった。 ホルモン受容体状態に関しては,陰性状態は早期に転移のリスクを増加させ,その後保護的になったことが示唆された。
The cumulative sum of Schoenfeld residuals, or equivalently the observed score process can also be used to assess proportional hazards ., グラフィカルには、観測されたスコア過程は、基礎となるCoxモデルが真であると仮定する、つまり比例ハザードを仮定するシミュレーション過程とともに、 出発の観点から、模擬したものであることが比例を思料す. これらのプロットを使用して、適合の欠如がいつ存在するかを評価することができます。 特に、シミュレーションされたプロセスを十分に上回る観測されたスコアは、平均よりも高い効果の指標であり、逆に逆である。, この方法は、Corteseらによる最近の刊行物において特によく示されている。 . 適合度検定は、累積残差に基づいて実装できます。 累積残差ベースのアプローチは、結果として得られる推定量がより良い統計的性質を有する傾向があり、正当化されたp値が導出されるため、Schoenfeld残差で遭遇するいくつかの欠点を克服する。 累積残差アプローチは、いくつかの標準的な統計パッケージで実装されています(表2)。
作業例(cont’)
累積残差に基づくテストを表4に示します。, 5%の有意水準で、テスト統計量はホルモンの受容器、her2およびMib1の状態と同様、腫瘍の等級のための非一定した効果をそのうちに提案します。 説明のために、いくつかの変数について得られたスコアプロセスもプロットしました(図4)。 累積残差に基づく検定統計量に従って,グレードとホルモン受容体状態に対するモデルの下でシミュレーションされた曲線から観測された過程の強い逸脱を観察した。 これらのプロットは、適合の欠如が存在する場所を特定するのに特に役立ちます。, 例えば、ホルモン受容体に関連する初期陽性スコアプロセスは、この変数の効果が最初は平均効果よりも高く、その後の平均効果よりも低いことを すなわち、転移のリスクは、両方の陰性ホルモン受容体を有する女性では、平均リスクと比較して最初に増加し、その後減少する。
共変量の時変効果をテストするための別の簡単なアプローチは、異なる期間に対して異なるCoxモデルを近似することを含みます。 実際、PH仮定は完全な追跡期間にわたって保持されないかもしれないが、より短い時間枠にわたって保持され得る。, 特定のカットオフ時間値に関心がない限り、データの二つのサブセットは、イベント時間の中央値に基づいて作成することができます。 つまり、第一の分析は、この時点を超えてまだ危険にさらされているすべての人を検閲することによって行われ、第二の分析は、その後まだ危険にさら このような場合、モデルの解釈は生存時間の長さに基づいて条件付きであり、結果は慎重に解釈されるべきである。, 分析期間が短縮されたとしても、これらの短縮された期間内にPH仮定が違反しないことを保証する必要があります。 さらに、より少ないイベント時間が考慮されるので、分析は減少した電力に苦しむ可能性がある。 最後に、この方法は特に実装が簡単で、いくつかの設定で十分な情報を提供するかもしれませんが、つまり、短い時間ウィンドウに興味がある場合は、この方法はPH仮定を直接テストするものではなく、そのようなテストを実行するために別のパラメータ化が必要であることに注意する必要があります。,
作業例(cont’)
イベント時間の中央値は4.3年でした。 Coxモデルは4.3年後にまだ危険にさらされているすべての人を打ち切り、この時点を超えてまだ危険にさらされている被験者のみが別のモデル(追加ファイル2:推定ハザード比(exp())に含まれ、95%信頼区間(95%CI)と二つの独立したCoxモデルにおけるモデル共変量のp値が二つの異なる期間にわたって含まれていた。)., ホルモン受容体陰性状態、Her2陽性状態およびMib1陽性状態が転移のリスク増加と関連していたため、年齢を除くすべての変数は最初のモデルで統計的に有意であった。 まだ4.3歳を過ぎたリスクのある女性では、若い年齢、より大きな腫瘍サイズ、およびリンパ節の関与は、転移のリスクの増加と関連していた。 他の変数の影響は消えてしまいました。 興味深いことに、ホルモン受容体陰性状態は、この第二のモデルで有意な保護効果を有していた(HR=0。,5)、最初の分析は(HR=1.7)のための有意な増加リスクを示唆しながら。 累積残差に基づく非比例性のテストは、最初の4.3年に制限された分析のグレードの永続的な時変効果を示唆しました。また、Moreau et al.によって提案された時間軸を分割することによって非比例性を説明することも可能である。 . 時間軸が分割され、各間隔内でハザード比が推定されます。 したがって、非比例性のテストは、時間固有のHRが著しく異なる場合のテストと同等です。, しかし、結果は時間間隔の数によって駆動されることがあり、時間間隔は慎重に選択する必要があります。
比例ハザードの仮定を放棄すること、そしてCoxモデルは別の選択肢です。 実際、加法モデル、加速故障時間モデル、回帰スプラインモデル、または分数多項式など、時変効果を説明するために他の強力な統計モデルが利用可能です。,
最後に、時間変化効果があると疑われる変数によって層別化された統計分析を実行することができます。 つまり、階層k内の個人のハザードはhk(t)=exp(σx)です。階層別では、他の共変量が各階層で同じように作用していること、つまり、HRsが層間で類似していることを前提としています。, 層別化は非比例性と実装が簡単な問題を取り除くのに効果的ですが、いくつかの欠点があります。 最も重要なことは、非比例変数による層別化は、その強度の推定とCoxモデル内でのテストを排除することです。 したがって、このアプローチは、層別化に使用される変数の効果を定量化することに直接関心がない場合に選択されるべきである。, さらに、階層化されたCoxモデルは、より多くのデータが別々のハザード関数を推定するために使用されるため、電力の損失につながる可能性があります。 時間的に変化するリスクを持つ変数がいくつかある場合、これはこれらの複数の要因でモデルを階層化する必要があり、これは再び全体の検出力を低下させる可能性があります。