Data Nádory kolorekta (C18-C21) Predikce počtu pacientů v ČR Predikce 2010

Predikce počtu léčených pacientů s kolorektálním karcinomem (C18-C21) v ČR v roce 2010

Obsah článku

1. Metodika predikce

2. Datová část

3. Literatura

L. Dušek, R. Vyzula, J. Abrahámová, J. Fínek, L. Petruželka, J. Vorlíček, O. Májek, J. Koptíková, T. Pavlík, J. Mužík

1. Metodika predikce

Cílem predikce počtu onkologických pacientů je poskytnout informační základ pro racionální diskuzi o nákladech protinádorové terapie a o počtech léčených pacientů. Tyto věrohodné odhady dosud v ČR chyběly, ačkoli jsou pro ně dostačující podklady v podobě onkologického registru a populačních dat.

1.1. Zdrojová data

K analýzám byla použita pouze validní populační data, oficiálně získaná od zákonem určených správců. Data byla analyzována v anonymizované podobě, tedy bez přímých i nepřímých identifikátorů konkrétní osoby, pacienta. Konkrétně jde o následující zdroje:

  • Národní onkologický registr ČR
  • Demografická data populace ČR a registr zemřelých
  • Expertní odhady zaměřené na hodnoty, které není možné z populačních dat věrohodně získat: pravděpodobnost diseminovaných relapsů u různých stadií onemocnění v různou dobu od ukončení primární terapie a pravděpodobnost absolvování různých linií léčby u metastatických onemocnění.

1.2. Definice referenčního souboru dat pro klinická hodnocení a analýzu nákladů

Korektní definice referenčních dat je základem věrohodnosti analýz, což je zvláště významné u prediktivních modelů. Chceme-li definovat populační rámec pro hodnocení výsledků a nákladů péče, musíme z populačních registrů čerpat údaje s jistým omezením:
- Data musí být aktuální a musí reflektovat současnou situaci českého zdravotnictví. Historické trendy mohou být velmi zavádějící. Zásadní jsou údaje od pacientů, kteří skutečně prošli zdravotnickým zařízením a byli léčeni. Počty pacientů diagnostikovaných např. při pitvě sice mají epidemiologický význam, ale hodnocení nákladů nijak neovlivňují.

Této analýze jsme podrobili Národní onkologický registr ČR. Z důvodu aktuálnosti jsme rozsah analyzovaných dat omezili na období 1995–2005, kdy v databázi NOR můžeme pracovat s validními záznamy podle novějších verzí klasifikace TNM. Data z tohoto období představují dostatečně velký vzorek pro populační analýzy (Obr. 1). Velmi podstatné je vyčlenění záznamů o pacientech s nedokončenou diagnostikou v důsledku odmítnutí léčby, komplikací nebo časného úmrtí, neboť tyto záznamy by zkreslovaly analýzy o nákladech na protinádorovou terapii. Ve shodě s literaturou byla použita hranice časného úmrtí do 1 měsíce od diagnózy.

Výsledkem auditu dostupných populačních dat je tedy referenční soubor kvalitních a věrohodných záznamů, které zachycují léčbu a výsledky léčby u pacientů s řádně dokončenou diagnostikou. Jak dokumentuje obr. 1, i následná separace protinádorově léčených a neléčených pacientů ještě stále poskytuje dostatečně velký vzorek pro populační analýzy.

Obrázek 1. Navržená cesta k referenčnímu souboru populačních dat pro hodnocení výsledků a nákladů péče (Národní onkologický registr ČR, 1995–2005)

1.3. Stručný metodický popis provedených výpočtů

Máme-li k dispozici referenční soubor dat, můžeme jej využít pro odhady dalších komponent nezbytných pro analýzy výsledků a nákladů léčebné péče. Smyslem těchto výpočtů je dospět ke spolehlivému odhadu počtu pacientů žijících v daném období a vyžadujících protinádorovou terapii. Podle podílu klinických stadií u žijících pacientů lze následně při znalosti možných scénářů léčby odhadnout i očekávané náklady. Jelikož u populačních registrů dostáváme data vždy s jistým zpožděním, jsou níže vyjmenované odhady prováděny prospektivně:

  1. Odhady incidence a mortality. Odhady byly provedeny jednak pro celková data a jednak odděleně pro klinická stadia. Metodika vychází z epidemiologických trendů za známé období a koriguje je s ohledem na pravděpodobné demografické změny populace. Byl použit Poissonův regresní model s odhady doplněnými intervaly spolehlivosti. Incidence je odhadována pouze pomocí dat o primárních nádorech jako prvním onkologickém onemocnění daného člověka. Nejsou uvažovány sekundární nádory a opakované nádory v téže lokalizaci.
  2. Odhad prevalence pacientů se zhoubnými nádory. Metodicky komplikovaný výpočet, neboť prospektivní odhad prevalence musí počítat s odhadem počtu nově diagnostikovaných pacientů v daném roce a s pravděpodobností x-letého přežití u pacientů diagnostikovaných v předchozích letech. Jde tedy o vícesložkový odhad, který kombinuje regresní odhady incidence a analýzy x-letého přežití. Pro účely predikce počtu léčených onkologických pacientů v roce 2009 byl proveden odhad prevalence pracující s definovaným referenčním souborem a pracující s korekcí na pravděpodobnost relapsu/progrese onemocnění a s korekcí na časná úmrtí ještě v roce diagnózy onemocnění.
  3. Odhad prevalence pacientů s protinádorovou terapií. Statistická metodika je stejná jako u odhadu celkové prevalence (bod 2 výše), hodnoty ale musí být korigovány na základě dalších klinických údajů (viz též obrázek 2):
    - určité procento nově diagnostikovaných pacientů nebude v daném roce léčeno z důvodu pokročilosti onemocnění, komplikací, vysokého věku, odmítnutí léčby nebo časného úmrtí
    - pouze určitá část pacientů diagnostikovaných (a léčených) v minulých letech přežije do hodnoceného roku (celková prevalence) a dále pouze určitá část z nich prodělá relaps nebo progresi onemocnění, a je tedy v daném roce opět protinádorově léčena.
  4. Odhad x-letého přežitá onkologicky nemocných pacientů. Velmi podstatný údaj, nezbytný pro odhad počtu žijících pacientů, primárně diagnostikovaných a léčených v předchozím období. Rozsah dat NOR sbíraných od roku 1977 poskytuje dostatečný časový rámec pro věrohodné modelování přežití.
    Vzhledem k výrazným časovým změnám v dosahovaném přežití onkologických pacientů od roku 1977 do roku 2005 byl pro výpočet x-letého přežití použit postup založený na principu tzv. pohyblivého časového okna (anglicky „moving window“). Jedná se o postupný odhad x-letého přežití analýzou kohort definovaných 5-letým časovým intervalem, který obsahuje rok diagnózy vzdálené x-1 a x let od roku 2005, tedy pacienti diagnostikovaní v letech 2001 – 2005 budou přispívat k odhadu 1letého až 5letého přežití, pacienti diagnostikovaní v letech 2000 – 2004 budou přispívat k odhadu 2letého až 6letého přežití, atd. Šířka intervalu definujícího jednu kohortu byla stanovena na 5 let, neboť se jedná o standardní šířku využívanou při populační analýze přežití (Berrino a kol., 2007).
  5. Odhad četnosti (pravděpodobnosti) relapsu nebo progrese nádorového onemocnění v daném roce. Velmi podstatný parametr, nezbytný pro odhad počtu pacientů léčených pro relaps nebo progresi základního onemocnění. Při konstrukci těchto odhadů byla využita data o mortalitě na zhoubné nádory z NOR a z registru zemřelých. (přesné datum a příčina úmrtí). Ze záznamů o smrti pacienta z důvodu základního onkologického onemocnění lze odvodit četnost relapsů, a tedy i pravděpodobnost jejich nastání do 1., 2., .... x. roku od primární diagnózy. Jelikož právě tyto „poslední“ relapsy (u pokročilých klinických stadií se jedná o progrese) vedou k diseminovanému a léčebně velmi nákladnému onemocnění, jde o odhad relevantní právě pro hodnocení nákladů. Populační odhady byly nezávisle ověřeny pomocí odhadů provedených vybranou skupinou klinických expertů.
    Opakované provádění těchto prediktivních odhadů odhalil u pravděpodobnosti nastání relapsu v x. roce od diagnózy silný časový trend. Odhad této pravděpodobnosti je počítán pouze z posledních pěti let, kdy jsou takové údaje dostupné.. Např. údaj o jednoleté pravděpodobnosti relapsu (tj. pravděpodobnost nastání diseminovaného relapsu v roce následujícím bezprostředně po diagnóze onemocnění) je počítán z údajů pacientů diagnostikovaných postupně v letech 2000-2004 (kteří relabují postupně v letech 2001-2005), nikoliv z údajů pacientů diagnostikovaných před rokem 2000. Tento početní přístup poskytuje relevantnější a časově aktuálnější údaje.

Obrázek 2. Vícesložkový populační odhad počtu pacientů s protinádorovou terapií v daném roce

1.4. Analýza rizik a pravděpodobnost zkreslení

Veškeré níže uvedené odhady jsou odvozené z populačních epidemiologických dat. Z této skutečnosti plyne i jistá neurčitost a bodové odhady byly tedy doplněny spíše širším intervalem spolehlivosti (90 %). Každý jednotlivý bodový odhad musí být interpretován neoddělitelně od těchto pravděpodobnostních limitů, které vyjadřují jeho statistickou spolehlivost a zabrání případným zkreslením. Přesnost predikcí na úrovni regionů může být u některých méně častých diagnóz a klinických stadií snížena v důsledku malé velikostí vzorku. I přes tento fakt byly predikce dělány na všech pod-souborech striktně stejnou metodikou a regionální odhady jsou tedy kalkulovány tak, že se v celkovém součtu shodují s populačními odhady.

2. Datová část

2.1. Prediktivní odhady celkové incidence v roce 2010

Klinické stadium

Incidence1

(90% interval spolehlivosti)

Stadium I

1645

(1480; 1807)

Stadium II

1987

(1821; 2156)

Stadium III

1989

(1849; 2130)

Stadium IV

1926

(1792; 2063)

Stadium neznámo z objekt. důvodů2

633

(505; 761)

Stadium neznámo bez udání důvodu2

207

(165; 250)

CELKEM

8387

(7612; 9167)

1 Údaj obsahuje úplnou incidenci nádorového onemocnění včetně nových nádorů diagnostikovaných u onkologických pacientů.
2 Objektivními důvody pro neuvedení stadia onemocnění jsou nálezy DCO nebo při pitvě, velmi časná úmrtí pacienta, nemocní neléčeni pro kontraindikace onkologické léčby, odmítnutí léčby pacientem. Není-li neuvedení stadia vysvětleno, je záznam považován za chybně neúplný. Záznamy bez uvedeného stadia nejsou dále započítávány do očekávaného počtu pacientů s protinádorovou léčbou. 

2.2. Prediktivní odhady celkové prevalence v roce 2010 – výpočet s korekcí dle modelů přežití

Při predikcích jsou uvažovány veškeré zhoubné nádory hlášené do databáze NOR. Všechny odhady jsou doplněny 90% intervalem spolehlivosti (v závorkách).

Klinické stadium

Prevalence

(90% interval spolehlivosti)

Stadium I

15881

(15592; 16170)

Stadium II

15359

(15083;15653)

Stadium III

10202

(9973; 10431)

Stadium IV

6661

(6476; 6846)

Klinické stadium neznámo1

3386

(3253; 3519)

CELKEM

51489

(50377; 52601)

1 Objektivními důvody pro neuvedení stadia onemocnění jsou nálezy DCO nebo při pitvě, velmi časná úmrtí pacienta, nemocní neléčeni pro kontraindikace onkologické léčby, odmítnutí léčby pacientem. Není-li neuvedení stadia vysvětleno, je záznam považován za chybně neúplný. Záznamy bez uvedeného stadia nejsou dále započítávány do očekávaného počtu pacientů s protinádorovou léčbou.

2.3. Souhrnný odhad počtu pacientů, kteří v roce 2010 pravděpodobně prodělají relaps do diseminovaného stádia nebo progresi onemocnění

Všechny odhady jsou doplněny 90% intervalem spolehlivosti (v závorkách). Kalkulováno na základě analýzy dat NOR a registru zemřelých ČR (viz popis metodiky výpočtů) s následným ověřením pomocí expertních odhadů.

Klinické stadium

Diseminované relapsy nebo progrese

(90% interval spolehlivosti)

Stadium I

354

(311; 397)

Stadium II

623

(566; 680)

Stadium III

751

(688; 814)

Stadium IV

791

(727; 855)

CELKEM

2519

(2292; 2746)

2.4. Souhrnný odhad počtu pacientů potenciálně léčených v roce 2010

Jednotlivé tabulky sumarizují predikované počty léčených pacientů odvozené z trendů incidence, prevalence a z populačních modelů přežití pro rok 2010. Odhady jsou prováděny výhradně z validních populačních dat, u kterých je jasná histologická verifikace nádoru a je dokončené určení klinického stadia onemocnění v době primární diagnózy. Tabulky obsahují počty všech osob potenciálně léčených protinádorovou terapií (informace o podstoupené léčbě dle záznamů NOR, 2002–2006), dle klinického stadia. Všechny odhady jsou doplněny 90% intervalem spolehlivosti (v závorkách)

Klinické
stadium

Nově diagnostikovaní léčení pacienti
v roce 2010

(Klinické stadium I–III)

Počty pacientů léčených v roce 2010 v klinickém stadiu IV

Nově diagnostikovaní léčení
pacienti ve stadiu IV

Léčená relabující a progredující
onemocnění u pacientů
diagnostikovaných v minulých letech

Stadium I

1475

(1327; 1620)

1310 (1218; 1403)

1738 (1581; 1894)

Stadium II

1872

(1715; 2030)

Stadium III

1878

(1746; 2012)

CELKEM

5225 (4788; 5662)

3048 (2799; 3297)

8273 (7587; 8959)

Poznámka: podíl pacientů léčených protinádorovou terapií v jednotlivých stadiích (dle dat NOR za období 2002-2006): stadium I 92,6%, stadium II 96,5%, stadium III 95,9%, stadium IV 69,0%.

3. Literatura

  • Agresti A. (2002): Categorical data analysis, Wiley-interscience
  • Brenner H., Arndt V.: Long-term survival rates of patients with prostate cancer in the prostate-specific antigen screening era: population-based estimates for the year 2000 by period analysis. J. Clin. Oncol., 23(3), 441–447, 2005.
  • Berrino F., DeAngelis R., Sant M. et al.: Survival for eight major cancers and all cancers combined for European adults diagnosed in 1995-99: results of the EUROCARE-4 study. Lancet Oncology, published online in August 21, 2007: http://oncology.thelancet.com.
  • Cantor A.B. (2001): Projecting the standart error of the Kaplan-Meier estimator, Statistics in medicine, 20: 2091-2097
  • Capocaccia R., De Angelis R. (1997): Estimating the completeness of prevalence based on cancer registry data, Statistics in medicine, 16: 425-440
  • Capocaccia R. et al. (2002): Measuring prevalence in Europe: the EUROPREVAL project, Annals of Oncology, 13: 831-839
  • Dickman P., Hakulinen T. (2003): Population-based cancer survival analysis, draft, http://www.pauldickman.com/teaching/tampere2004/book_draft.pdf
  • dos Santos Silva I. Cancer Epidemiology: Principles and Methods. International Agency for Research on Cancer: Lyon, 1999.
  • Dušek L., Žaloudík J. (Eds.): Hodnocení zdravotnických technologií v onkologii. Klinická onkologie 17 – Supplement 2004, 104 s. ISSN 0862 – 495 X.
  • Dušek L., Žaloudík J., Indrák K. (Eds): Informační zázemí pro využití onkologických populačních dat v ČR. Zvláštní vydání časopisu Klinická onkologie, ISSN 0862-495X, 2007, v tisku
  • Dyba T., Hakulinen T. (2000): Comparison of differenet approaches to incidence prediction based on simple interpolation techniques, Statistics in medicine, 19: 1741-1752
  • Gail M.H., Kesser L., Midthune D., Scoppa S. (1999): Two approaches for estimation disease prevalence from Population-based registries of incidence and total mortality, Biometrics, 55: 1137-1144
  • Hakulinen T., Dyba T. (1994): Precision of incidence predictions based on Poisson distributed observations, Statistics in medicine, 13: 1513-1523
  • Chambers J.M. , Hastie T.J. (eds.) (1991): Statistical models in S, Chapman& Hall/CRC
  • Lutz et al. (2003): Cancer prevalence in Central Europe: the EUROPREVAL study, Annals of Oncology, 14: 313-322.
  • Mariotto A.B., Yabroff K.R., Feuer E., De Angelis R., Brown M. (2006): Projectiong the number of patients with colorectal carcinoma by phase of care in US: 2000-2020, Cancer causes control, 17: 1215-1226.
  • Mariotto A. Waren J.L., Knopf K.B., Feuer E.J. (2003): The prevalence of patients with colorectal carcinoma under care in the U.S., Cancer, 98: 1253-1261
  • Møller B., Weedon-Fekjæer H., Haldorsen T. (2005).: Empirical evaluation of prediction intervals for cancer incidence. BMC Medical Reasearch Methodology. 5:21 http://www.biomedcentral.com/1471-2288/5/21
  • Pohar M., Stare J. (2006): Relative survival analysis in R, Computer mwthods and programs in biomedicine, 81: 272-278
  • Verdecchia A., De Angelis Giovanni, Capocaccia R. (2002): Estimation and projection of cancer prevalence from cancer registry data. Statistics in medicine, 21: 3511-3526

 

 

Slovo odborníka

Ladislav Dušek
Doc. RNDr. Ladislav Dušek, Ph.D.: V ČR každoročně přibude 8000 nových pacientů s kolorektálním karcinomem, z toho více než 2000 s karcinomem rekta (diagnóza C20). Více než polovina nádorů je diagnostikována v obtížně léčitelných pokročilých klinických stadiích.