Predikce počtu léčených pacientů s kolorektálním karcinomem (C18-C21) v ČR v roce 2011
L. Dušek, R. Vyzula, J. Abrahámová, J. Fínek, L. Petruželka, J. Vorlíček, O. Májek, J. Koptíková, T. Pavlík, J. Mužík
1. Metodika predikce
Cílem projektu je poskytnout informační základ pro racionální diskuzi o nákladech protinádorové terapie a o počtech léčených pacientů. Zpráva je shrnutím predikcí počtu pacientů pro rok 2011. Konkrétními výstupy projektu jsou následující materiály (vždy pro vybrané modelové diagnózy):
- audit populačních dat Národního onkologického registru a definice referenčního souboru
- odhady incidence pro rok 2011 a počty nově diagnostikovaných pacientů, kteří budou protinádorově léčeni v primární terapii
- odhady prevalence dle různých stadií onemocnění k roku 2011 a odhady počtu pacientů, kteří prodělají relaps/progresi nádorového onemocnění a budou léčeni v roce 2011
- metodické standardy a referenční data, která umožní další rozvíjení provedených analýz (jiné diagnózy, jiná léčiva, další modality protinádorové terapie, regionální analýzy aj.).
1.1. Zdrojová data
K analýzám byla použita pouze validní populační data, oficiálně získaná od zákonem určených správců. Data byla analyzována v anonymizované podobě, tedy bez přímých i nepřímých identifikátorů konkrétní osoby, pacienta. Konkrétně jde o následující zdroje:
- Národní onkologický registr ČR
- Demografická data populace ČR a registr zemřelých
- Expertní odhady zaměřené na hodnoty, které není možné z populačních dat věrohodně získat: pravděpodobnost diseminovaných relapsů u různých stadií onemocnění v různou dobu od ukončení primární terapie a pravděpodobnost absolvování různých linií léčby u metastatických onemocnění.
1.2. Definice referenčního souboru dat pro klinická hodnocení a analýzu nákladů
Korektní definice referenčních dat je základem věrohodnosti analýz, což je zvláště významné u prediktivních modelů. Chceme-li definovat populační rámec pro hodnocení výsledků a nákladů péče, musíme z populačních registrů čerpat údaje s jistým omezením:
- Data musí být aktuální a musí reflektovat současnou situaci českého zdravotnictví. Historické trendy mohou být velmi zavádějící. Zásadní jsou údaje od pacientů, kteří skutečně prošli zdravotnickým zařízením a byli léčeni. Počty pacientů diagnostikovaných např. při pitvě sice mají epidemiologický význam, ale hodnocení nákladů nijak neovlivňují.
Této analýze jsme podrobili Národní onkologický registr ČR. Z důvodu aktuálnosti jsme rozsah analyzovaných dat omezili na období 1995–2005, kdy v databázi NOR můžeme pracovat s validními záznamy podle novějších verzí klasifikace TNM. Data z tohoto období představují dostatečně velký vzorek pro populační analýzy (Obr. 1). Velmi podstatné je vyčlenění záznamů o pacientech s nedokončenou diagnostikou v důsledku odmítnutí léčby, komplikací nebo časného úmrtí, neboť tyto záznamy by zkreslovaly analýzy o nákladech na protinádorovou terapii. Ve shodě s literaturou byla použita hranice časného úmrtí do 1 měsíce od diagnózy.
Výsledkem auditu dostupných populačních dat je tedy referenční soubor kvalitních a věrohodných záznamů, které zachycují léčbu a výsledky léčby u pacientů s řádně dokončenou diagnostikou. Jak dokumentuje obr. 1, i následná separace protinádorově léčených a neléčených pacientů ještě stále poskytuje dostatečně velký vzorek pro populační analýzy.
Obrázek 1. Navržená cesta k referenčnímu souboru populačních dat pro hodnocení výsledků a nákladů péče (Národní onkologický registr ČR, 1995–2007)
1.3. Stručný metodický popis provedených výpočtů
Máme-li k dispozici referenční soubor dat, můžeme jej využít pro odhady dalších komponent nezbytných pro analýzy výsledků a nákladů léčebné péče. Smyslem těchto výpočtů je dospět ke spolehlivému odhadu počtu pacientů žijících v daném období a vyžadujících protinádorovou terapii. Podle podílu klinických stadií u žijících pacientů lze následně při znalosti možných scénářů léčby odhadnout i očekávané náklady. Jelikož u populačních registrů dostáváme data vždy s jistým zpožděním, jsou níže vyjmenované odhady prováděny prospektivně:
- Odhady incidence a mortality. Odhady byly provedeny jednak pro celková data a jednak odděleně pro klinická stadia. Metodika vychází z epidemiologických trendů za známé období a koriguje je s ohledem na pravděpodobné demografické změny populace. Byl použit Poissonův regresní model s odhady doplněnými intervaly spolehlivosti. Incidence je odhadována pouze pomocí dat o primárních nádorech jako prvním onkologickém onemocnění daného člověka. Nejsou uvažovány sekundární nádory a opakované nádory v téže lokalizaci.
- Odhad prevalence pacientů se zhoubnými nádory. Metodicky komplikovaný výpočet, neboť prospektivní odhad prevalence musí počítat s odhadem počtu nově diagnostikovaných pacientů v daném roce a s pravděpodobností x-letého přežití u pacientů diagnostikovaných v předchozích letech. Jde tedy o vícesložkový odhad, který kombinuje regresní odhady incidence a analýzy x-letého přežití. Pro účely predikce počtu léčených onkologických pacientů v roce 2009 byl proveden odhad prevalence pracující s definovaným referenčním souborem a pracující s korekcí na pravděpodobnost relapsu/progrese onemocnění a s korekcí na časná úmrtí ještě v roce diagnózy onemocnění.
- Odhad prevalence pacientů s protinádorovou terapií. Statistická metodika je stejná jako u odhadu celkové prevalence (bod 2 výše), hodnoty ale musí být korigovány na základě dalších klinických údajů (viz též obrázek 2):
- určité procento nově diagnostikovaných pacientů nebude v daném roce léčeno z důvodu pokročilosti onemocnění, komplikací, vysokého věku, odmítnutí léčby nebo časného úmrtí
- pouze určitá část pacientů diagnostikovaných (a léčených) v minulých letech přežije do hodnoceného roku (celková prevalence) a dále pouze určitá část z nich prodělá relaps nebo progresi onemocnění, a je tedy v daném roce opět protinádorově léčena. - Odhad x-letého přežitá onkologicky nemocných pacientů. Velmi podstatný údaj, nezbytný pro odhad počtu žijících pacientů, primárně diagnostikovaných a léčených v předchozím období. Rozsah dat NOR sbíraných od roku 1977 poskytuje dostatečný časový rámec pro věrohodné modelování přežití.
Vzhledem k výrazným časovým změnám v dosahovaném přežití onkologických pacientů od roku 1977 do roku 2005 byl pro výpočet x-letého přežití použit postup založený na principu tzv. pohyblivého časového okna (anglicky „moving window“). Jedná se o postupný odhad x-letého přežití analýzou kohort definovaných 5-letým časovým intervalem, který obsahuje rok diagnózy vzdálené x-1 a x let od roku 2005, tedy pacienti diagnostikovaní v letech 2001 – 2005 budou přispívat k odhadu 1letého až 5letého přežití, pacienti diagnostikovaní v letech 2000 – 2004 budou přispívat k odhadu 2letého až 6letého přežití, atd. Šířka intervalu definujícího jednu kohortu byla stanovena na 5 let, neboť se jedná o standardní šířku využívanou při populační analýze přežití (Berrino a kol., 2007). - Odhad četnosti (pravděpodobnosti) relapsu nebo progrese nádorového onemocnění v daném roce. Velmi podstatný parametr, nezbytný pro odhad počtu pacientů léčených pro relaps nebo progresi základního onemocnění. Při konstrukci těchto odhadů byla využita data o mortalitě na zhoubné nádory z NOR a z registru zemřelých. (přesné datum a příčina úmrtí). Ze záznamů o smrti pacienta z důvodu základního onkologického onemocnění lze odvodit četnost relapsů, a tedy i pravděpodobnost jejich nastání do 1., 2., .... x. roku od primární diagnózy. Jelikož právě tyto „poslední“ relapsy (u pokročilých klinických stadií se jedná o progrese) vedou k diseminovanému a léčebně velmi nákladnému onemocnění, jde o odhad relevantní právě pro hodnocení nákladů. Populační odhady byly nezávisle ověřeny pomocí odhadů provedených vybranou skupinou klinických expertů.
Opakované provádění těchto prediktivních odhadů odhalil u pravděpodobnosti nastání relapsu v x. roce od diagnózy silný časový trend. Odhad této pravděpodobnosti je počítán pouze z posledních pěti let, kdy jsou takové údaje dostupné.. Např. údaj o jednoleté pravděpodobnosti relapsu (tj. pravděpodobnost nastání diseminovaného relapsu v roce následujícím bezprostředně po diagnóze onemocnění) je počítán z údajů pacientů diagnostikovaných postupně v letech 2000-2004 (kteří relabují postupně v letech 2001-2005), nikoliv z údajů pacientů diagnostikovaných před rokem 2000. Tento početní přístup poskytuje relevantnější a časově aktuálnější údaje.
Obrázek 2. Vícesložkový populační odhad počtu pacientů s protinádorovou terapií v daném roce
1.4. Analýza rizik a pravděpodobnost zkreslení
Veškeré níže uvedené odhady jsou odvozené z populačních epidemiologických dat. Z této skutečnosti plyne i jistá neurčitost a bodové odhady byly tedy doplněny spíše širším intervalem spolehlivosti (90 %). Každý jednotlivý bodový odhad musí být interpretován neoddělitelně od těchto pravděpodobnostních limitů, které vyjadřují jeho statistickou spolehlivost a zabrání případným zkreslením. Přesnost predikcí na úrovni regionů může být u některých méně častých diagnóz a klinických stadií snížena v důsledku malé velikostí vzorku. I přes tento fakt byly predikce dělány na všech pod-souborech striktně stejnou metodikou a regionální odhady jsou tedy kalkulovány tak, že se v celkovém součtu shodují s populačními odhady.
2. Epidemiologické odhady: všechny zhoubné nádory včetně dalších primárních nádorů u stejného pacienta
2.1. Prediktivní odhady celkové incidence v roce 2011
Při predikcích jsou uvažovány veškeré zhoubné nádory hlášené do databáze NOR. Všechny odhady jsou doplněny 90% intervalem spolehlivosti (v závorkách).
Klinické stadium |
Incidence1 |
(90% interval spolehlivosti) |
---|---|---|
Stadium I |
1696 |
(1520; 1870) |
Stadium II |
2014 |
(1835; 2192) |
Stadium III |
2090 |
(1940; 2239) |
Stadium IV |
1971 |
(1826; 2114) |
Stadium neznámo z objekt. důvodů2 |
605 |
(474; 736) |
Stadium neznámo bez udání důvodu2 |
197 |
(153; 240) |
CELKEM |
8573 |
(7748; 9391) |
1 Údaj obsahuje úplnou incidenci nádorového onemocnění včetně nových nádorů diagnostikovaných u onkologických pacientů.
2 Objektivními důvody pro neuvedení stadia onemocnění jsou nálezy DCO nebo při pitvě, velmi časná úmrtí pacienta, nemocní neléčeni pro kontraindikace onkologické léčby, odmítnutí léčby pacientem. Není-li neuvedení stadia vysvětleno, je záznam považován za chybně neúplný. Záznamy bez uvedeného stadia nejsou dále započítávány do očekávaného počtu pacientů s protinádorovou léčbou.
2.2. Prediktivní odhady celkové prevalence v roce 2011 – výpočet s korekcí dle modelů přežití
Odhad celkové prevalence zahrnuje jednak počty nově diagnostikovaných zhoubných nádorů v roce 2011 a dále odhady žijících pacientů, kteří byli diagnostikováni a léčeni v minulých letech (kalkulováno pomocí populačních modelů přežití). U výsledných odhadů byla provedena korekce zohledující progresi onemocnění do diseminovaných stadií. Pacienti, kteří byli dříve diagnostikováni v I., II. nebo III. stadiu, ale kteří v roce pravděpodobně relabují nebo progredují do diseminovaného stadia, jsou již zahrnuti v predikované prevalenci IV. stadia. Model v této chvíli nesleduje pravděpodobnost relapsů do jiného než IV. stadia, neboť pro takto detailní sledování nejsou k dispozici dostatečně věrohodná populační data. Tento nedostatek zásadně neovlivňuje populační farmakoekonomické ukazatele, v této fázi modelování sledujeme většinu léčiv indikovaných právě pro diseminované stavy. Všechny odhady jsou doplněny 90% intervalem spolehlivosti (v závorkách).
Zde uvedené odhady jsou tedy korigovány dle pravděpodobnostních modelů přežití a modelů pro relaps/progresi základního onemocnění.
Klinické stadium |
Prevalence |
(90% interval spolehlivosti) |
---|---|---|
Stadium I |
16192 |
(15900; 16484) |
Stadium II |
15617 |
(15338; 15896) |
Stadium III |
10698 |
(10464; 10932) |
Stadium IV |
6824 |
(6637; 7011) |
Klinické stadium neznámo1 |
3297 |
(3166; 3428) |
CELKEM |
52628 |
(51505; 53751) |
1 Objektivními důvody pro neuvedení stadia onemocnění jsou nálezy DCO nebo při pitvě, velmi časná úmrtí pacienta, nemocní neléčeni pro kontraindikace onkologické léčby, odmítnutí léčby pacientem. Není-li neuvedení stadia vysvětleno, je záznam považován za chybně neúplný. Záznamy bez uvedeného stadia nejsou dále započítávány do očekávaného počtu pacientů s protinádorovou léčbou.
2.3. Souhrnný odhad počtu pacientů, kteří v roce 2011 pravděpodobně prodělají relaps do diseminovaného stádia nebo progresi onemocnění
Všechny odhady jsou doplněny 90% intervalem spolehlivosti (v závorkách). Kalkulováno na základě analýzy dat NOR a registru zemřelých ČR (viz popis metodiky výpočtů) s následným ověřením pomocí expertních odhadů.
Klinické stadium |
Diseminované relapsy nebo progrese |
(90% interval spolehlivosti) |
---|---|---|
Stadium I |
361 |
(317; 405) |
Stadium II |
629 |
(572; 686) |
Stadium III |
794 |
(729; 859) |
Stadium IV |
810 |
(746; 874) |
CELKEM |
2594 |
(2364; 2824) |
2.4. Souhrnný odhad počtu pacientů potenciálně léčených v roce 2011
Jednotlivé tabulky sumarizují predikované počty léčených pacientů odvozené z trendů incidence, prevalence a z populačních modelů přežití pro rok 2011. Odhady jsou prováděny výhradně z validních populačních dat, u kterých je jasná histologická verifikace nádoru a je dokončené určení klinického stadia onemocnění v době primární diagnózy. Tabulky obsahují počty všech osob potenciálně léčených protinádorovou terapií (informace o podstoupené léčbě dle záznamů NOR, 2002–2007), dle klinického stadia. Všechny odhady jsou doplněny 90% intervalem spolehlivosti (v závorkách).
Klinické stadium |
Nově diagnostikovaní léčení pacienti v roce 2011 (Klinické stadium I–III) |
Počty pacientů léčených v roce 2011 v klinickém stadiu IV |
||
---|---|---|---|---|
Nově diagn. léčení pacienti ve stadiu IV |
Léčená relabující a progredující onem. u pacientů diagn. v minulých letech |
|||
Stadium I |
1568 (1405; 1729) |
1359 (1259; 1457) |
1788 (1630; 1947) |
|
Stadium II |
1934 (1763; 2105) |
|||
Stadium III |
2005 (1860; 2147) |
|||
CELKEM |
5507 (5028; 5981) |
3147 (2889; 3404) |
||
8654 (7917; 9385) |
3. Literatura
- Agresti A. (2002): Categorical data analysis, Wiley-interscience
- Brenner H., Arndt V.: Long-term survival rates of patients with prostate cancer in the prostate-specific antigen screening era: population-based estimates for the year 2000 by period analysis. J. Clin. Oncol., 23(3), 441–447, 2005.
- Berrino F., DeAngelis R., Sant M. et al.: Survival for eight major cancers and all cancers combined for European adults diagnosed in 1995-99: results of the EUROCARE-4 study. Lancet Oncology, published online in August 21, 2007: http://oncology.thelancet.com.
- Cantor A.B. (2001): Projecting the standart error of the Kaplan-Meier estimator, Statistics in medicine, 20: 2091-2097
- Capocaccia R., De Angelis R. (1997): Estimating the completeness of prevalence based on cancer registry data, Statistics in medicine, 16: 425-440
- Capocaccia R. et al. (2002): Measuring prevalence in Europe: the EUROPREVAL project, Annals of Oncology, 13: 831-839
- Dickman P., Hakulinen T. (2003): Population-based cancer survival analysis, draft, http://www.pauldickman.com/teaching/tampere2004/book_draft.pdf
- dos Santos Silva I. Cancer Epidemiology: Principles and Methods. International Agency for Research on Cancer: Lyon, 1999.
- Dušek L., Žaloudík J. (Eds.): Hodnocení zdravotnických technologií v onkologii. Klinická onkologie 17 – Supplement 2004, 104 s. ISSN 0862 – 495 X.
- Dušek L., Žaloudík J., Indrák K. (Eds): Informační zázemí pro využití onkologických populačních dat v ČR. Zvláštní vydání časopisu Klinická onkologie, ISSN 0862-495X, 2007, v tisku
- Dyba T., Hakulinen T. (2000): Comparison of differenet approaches to incidence prediction based on simple interpolation techniques, Statistics in medicine, 19: 1741-1752
- Gail M.H., Kesser L., Midthune D., Scoppa S. (1999): Two approaches for estimation disease prevalence from Population-based registries of incidence and total mortality, Biometrics, 55: 1137-1144
- Hakulinen T., Dyba T. (1994): Precision of incidence predictions based on Poisson distributed observations, Statistics in medicine, 13: 1513-1523
- Chambers J.M. , Hastie T.J. (eds.) (1991): Statistical models in S, Chapman& Hall/CRC
- Lutz et al. (2003): Cancer prevalence in Central Europe: the EUROPREVAL study, Annals of Oncology, 14: 313-322.
- Mariotto A.B., Yabroff K.R., Feuer E., De Angelis R., Brown M. (2006): Projectiong the number of patients with colorectal carcinoma by phase of care in US: 2000-2020, Cancer causes control, 17: 1215-1226.
- Mariotto A. Waren J.L., Knopf K.B., Feuer E.J. (2003): The prevalence of patients with colorectal carcinoma under care in the U.S., Cancer, 98: 1253-1261
- Møller B., Weedon-Fekjæer H., Haldorsen T. (2005).: Empirical evaluation of prediction intervals for cancer incidence. BMC Medical Reasearch Methodology. 5:21 http://www.biomedcentral.com/1471-2288/5/21
- Pohar M., Stare J. (2006): Relative survival analysis in R, Computer mwthods and programs in biomedicine, 81: 272-278
- Verdecchia A., De Angelis Giovanni, Capocaccia R. (2002): Estimation and projection of cancer prevalence from cancer registry data. Statistics in medicine, 21: 3511-3526
Poslední aktualizace: 11.2.2011