1 / 21

Survival Analysis

Survival Analysis. Mgr. Pavel Tuček, Ph.D. Olomouc 10.03.2010. Praktický „Background“.

teryl
Download Presentation

Survival Analysis

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Survival Analysis Mgr. Pavel Tuček, Ph.D. Olomouc 10.03.2010

  2. Praktický „Background“ • Předmětem analýzy přežívání je vyšetřévání jedné nebo více skupin objektů, kde pro každý jednotlivý objekt máme dánu událost (selhání), která nastává po nějakém časovém intervalu (doba do selhání, doba přežití). Příklady doby do selhání zahrnují dobu životnosti součástek, dobu přežívání pacientů v klinických experimentech, dobu trvání stávek, delku doby nezaměstnanosti, dobu potřebnou k vykonání nějakého specifického úkolu….

  3. Praktický „Background“ • Problémy, které se nejčastěji řeší jsou tedy odhad pravděpodobnostního rozložení doby přežití v dané skupině nebo statistické porovnání dob přežití v několika skupinách. Pokud navíc máme pro každý objekt i několik vysvětlujících proměnných, můžeme analyzovat jejich vliv k na dobu přežívání. Možnost výskytu neúplných pozorování zabraňuje použití klasických metod. Tyto údaje dávají pouze informaci, že za sledovanou dobu k danému jevu nedošlo - cenzorování

  4. Proč? • Mohu porovnávat průběh křivek přežívání mezi dvěma nebo více skupinami • Mohu odhadnout “poločas“ trvání (délky života) spolu s konfidenčním intervalem • Mohu testovat vliv kvantitativních proměnných i faktorů na průběh křivky – Cox proportional hazard model, předpokládá konstatní násobné zvýšení či snížení míry rizika

  5. Úvod • Survivalanalysis, doménou jsou lékařské aplikace • Obecně pro data, ve kterých docházík tzv. cenzoringu (censoring) • Nejčastější tzv. rightcensoring: sleduji dobu existence jedince nebo jevu a v určitém okamžiku své pozorování ukončím, ale jedinec žije dál, nevím jak dlouho • Leftcensoring x intervalový cenzoring je většinou nepoužitelný • Pro data bez cenzoringu existují jednoduššímetody (analýza délek života regresí – normální nebo generalizedlinearmodels)

  6. Příklady • Pedagogika • zanechání studia • začátek studia na vysoké škole • Ekonomie • bankrot • délka stávky • žádost o pomoc v nezaměstnanost • Lékařské vědy • smrt • relaps • objevení symptomů • začátek nemoci • Sociologie • rozvod • změna zaměstnání • zanechání kouření • první použití drogy

  7. ealExample

  8. Funkce přežití • T je náhodná veličina, která popisuje dobu do selhání. • Při popisu rozdělení náhodného chování časů přežití se používá funkce přežití S(t), která udává pro čas t pravděpodobnost přežití jedince: S(t)=P(T≥t), • Protože se jedná o pravděpodobnost, nabývá funkce pouze kladných hodnot a má klesající průběh s tím, jak se pravděpodobnost přežití jedince zmenšuje.

  9. Funkce přežití Hustota náhodné veličiny T Intenzita selhání (riziková funkce – hazard function)) Vzájemný vztah:

  10. Rozdělení pstí pro dobu selhání • Exponenciální • Gamma rozdělení – intenzita má komplikované vyjádření – dva parametry • Weibullovo rozdělení • Log-normální rozdělení – intenzita není monotónní a má opět dva parametry • Inverzní Gaussovo rodělení – není vhodné pro cenzory

  11. Řešení pomocí MLE

  12. Neparametrický přístup • Pro nás se tedy situace zjednodušila na dva nejběžnější přístupy a to je metoda LIFE-TABLE (epidemiologie, pojišťovnictví, geovědy) a přesnější KAPLAN-MEIEROVY odhady („product limit“, užívá se všude ) • Podstatné je rozdělit sledovaný časový úsek na podintervaly. Používat se bude následující označení:

  13. Neparametrický přístup • ni – počet živých jedinců • li – počet ztracených během Ii • pi – pravděpodobnost přežití období Ii, když na počátku toho období byl naživu • wi + li – počet cenzorovaných pozorování v Ii • di – počet selhání během Ii • wi – počet ukončení bez selhání během Ii

  14. Neparametrický přístup • Potom pro pravděpodobnost přežití platí • Metodou LIFE-TABLE se tedy dají odhadnout neznámé pipomocípi=1-di/ni’, kdeni’=ni-0.5(wi+li).Výsledný odhad je pak

  15. Neparametrický přístup • Pro zajímavost se dá spočítat i velice hodnotný odhad variance pro tyto odhady. Vychází z Greenwoodovy formule a je ve tvaru: • Bohužel se tato metoda nehodí pro malá pozorování!!!!!

  16. KAPLAN MEIER • Daleko efektivnější je následující úvaha: Pozorujeme data v následující struktuře uspořádaných dvojic: (Y(1),δ1),…, (Y(n),δn), kde Y je čas a δje binární atribut. • Rozptyl se dá opět dopočítat pomocí dříve ukázané formule. Dá se rovněž dokázat asymptotická normalita 

  17. Testování • Pro testování rozdílů, shody, neshody a náhody se dá použít navržených testů GEHANUV (Zobecněný wilcox, resp. Mann-whitney) a MANTEL-HANZELUV (založen na posloupnosti čtyřpolních tabulek)

  18. Back to ealWorld

  19. BOX - COX • Cox navrhl modelovat vztah mezi nezávislými proměnnými a funkcí rizika. Jeho přístup vychází z modelové rovnice: • Častěji se modelová rovnice vyjadřuje v logaritmickém tvaru:

  20. Hazard atio

  21. Dík za pozornost

More Related