To analyze changes in the incidence of thyroid cancer for Korean population using big data from the National Health Insurance Service.
Sample cohort database between January 2004 and December 2013 with 1,000,000 cases for each year was enrolled in this study. Thyroid cancer incidence was analyzed by sex, age and by region. Public health insurance payment was used to reflect socioeconomic status.
The incidence of thyroid cancer in Korea increased for 10 years annually. There are 3 times increasing in the incidence rate of thyroid cancer from 2004, 0.03% to 2013, 0.09%. The sex ratio in the incidence rate of thyroid cancer was male : female = 1:7.2 in 2004 and male : female = 1:3.6 in 2013 that suggest decreased gap between the sex ratio. Between 2004 and 2010, the incidence rates of those in their 40s were found to be the highest, whereas the incidence rates for those in their 50s were found to be highest from 2011 and thereafter. Every year the high socioeconomic status group showed a higher incidence of thyroid cancer than low socioeconomic status group. Some specific region showed continuous high incidence of thyroid cancer, not all city and state.
The incidence rate of thyroid cancer for 10 years had special feature by sex, age, socioeconomic status and especially by region. This results will be a barometer for further epidemiologic study about the incidence of thyroid cancer for Korean population
미국 국립 암 연구소에서 발표한 Surveillance, Epidemiology, and End Results Program (SEER)에 따르면 미국의 1975년에서 2016년까지의 갑상선암 발생률은 3배 정도 증가한 것으로 조사되었다.
이에 따른 연구가 활발히 진행 중이나, 대부분의 연구가 각 의료기간별 자체 자료를 이용한 임상연구에 집중되어 있는 것이 현재의 실정이다. 이에 본 연구는 국민건강보험공단의 빅데이터를 이용하여 한국인 갑상선암의 임상적 부분보다는 역학적 부분의 분석을 통하여 발생율의 차이를 알아보고자 하였다.
본 연구에 사용된 자료는 일산병원 연구소(2015-20-014)의 허가를 받은 표본코호트DB로 국민건강보험공단에서 2011년 발표한 국민건강정보 DB를 기반으로 완성하였으며, 표본코호트DB는 2002년 건강보험 가입자의 자격 DB로부터 약 2.2%(1,025,340명)의 표본을 추출하여 각 표본의 진료 DB, 요양기관 DB, 건강검진 DB, 통계청의 사망원인 DB를 연결하여 후향적으로 추적조사 하였다. 이에 사용된 표본 추출법은 연령대(18개 군), 성별(2개 군), 자격(지역가입자, 직장가입자, 의료급여 수급권자인 3개 군), 소득분위(21개 군)의 조합에 따른 1,476개 층(strata) 내에서 연간 총의료비를 이용한 계통추출(systematic sampling)을 사용하였다. 시간의 변화에 따른 코호트 자료의 자연감소(사망이나 이민 등)는 신생아의 표본을 추가하여 보완하였다. 상기 코호트 자료의 특성상 코호트 구성연도인 2002년을 제외한 이후 연도의 모집단에 대한 대표성 유지를 보장할 수 없지만, 대표본의 특성으로 보완 가능함을 이해하고 진행하였다.
2002년 1월 1일부터 2013년 12월 31일까지인 11년간의 갑상선암 환자의 정의는 진료 청구된 자료를 기준으로 주상병이 C73으로 시작하는 코드(KCD)로 지급된 이력이 있는 환자로 입원, 외래 구분, 자격구분 없는 모든 청구서를 고려하였다(
Number of samples of the sample cohort database by year
Year | Total | Male | Female | Nationally registered population |
---|---|---|---|---|
2002 | 1,025,340 | 513,258 | 512,082 | 48,229,948 |
2003 | 1,017,468 | 509,212 | 508,256 | 48,386,823 |
2004 | 1,016,580 | 508,223 | 508,357 | 48,583,805 |
2005 | 1,016,820 | 508,317 | 508,503 | 48,782,274 |
2006 | 1,002,005 | 500,808 | 501,197 | 48,991,779 |
2007 | 1,020,743 | 510,009 | 510,734 | 49,268,928 |
2008 | 1,000,785 | 501,019 | 499,766 | 49,540,367 |
2009 | 998,527 | 499,689 | 498,838 | 49,773,145 |
2010 | 1,002,031 | 501,338 | 500,693 | 50,515,666 |
2011 | 1,006,481 | 503,428 | 503,053 | 50,734,284 |
2012 | 1,011,123 | 505,614 | 505,509 | 50,948,272 |
2013 | 1,014,730 | 507,289 | 507,441 | 51,141,463 |
Nationally registered population : Ministry of the Interior and Safety, nationally registered population status
Estimated number of new thyroid cancer patients
Year | Total number of samples (A) | Number of new thyroid cancer patients (B) | =(B/A) 100,000 | Cancer registration statistics crude rates |
---|---|---|---|---|
2004 | 1,016,580 | 287 | 28.2 | 21.4 |
2005 | 1,016,820 | 319 | 31.4 | 26.2 |
2006 | 1,002,005 | 374 | 37.3 | 33.0 |
2007 | 1,020,743 | 497 | 48.7 | 43.2 |
2008 | 1,000,785 | 588 | 58.8 | 55.2 |
2009 | 998,527 | 771 | 77.2 | 65.2 |
2010 | 1,002,031 | 751 | 74.9 | 73.5 |
2011 | 1,006,481 | 904 | 89.8 | 82.0 |
2012 | 1,011,123 | 971 | 96.0 | 87.4 |
2013 | 1,014,730 | 907 | 89.4 | - |
Cancer registration statistics crude rate: excerpts from the National Cancer Registration Program Yearly Report (2012, Cancer Registration Statistics), Crude Rate = (Number of New Cancer Patients/Mid-Year Population)×100,000.
2004년부터 2013년까지 10년간 표본코호트 자료를 이용하여 갑상선암의 발생률을 각 연도별 성, 연령, 소득분위, 17개 시도지역별에 따라 분석하였으며 17개 시도지역은 또 다시 세분화하여 10년간 갑상선암의 발생률을 분석하였다.
17개 시도 지역별로 구분 기준은 하위지역은 서울특별시는 구 지역까지, 6대 광역시는 구 또는 군 지역까지, 그 외의 도는 시 또는 군 지역까지 분류하였다. 10년 사이에 경기도의 양주군과 포천군은 2003년에 시로 승격하였고 여주군은 2013년에 시로 승격하였으며, 충청남도 당진군은 2012년에 시로 승격하였다. 2012년에 새로 생성된 세종특별자치시는 이전의 충청남도 연기군 전체, 공주시 일부, 충청북도 청원구 일부를 편입하였고, 경상남도 마산시와 진해시는 2011년에 창원시 마산합포구와 마산회원구로 합병되었고, 제주도특별자치시의 북제주군과 남제주군은 2006년에 제주시로 합병되어 변경된 지역 정보를 고려하여 분석하였다.
모든 분석은 SAS v9.4 (SAS Institute, Cary, NC, USA)를 통해서 시행하였다.
2004년과 2005년은 신규 갑상선암 발생률이 0.03%로 증가소견을 보이지 않았으나 2006년부터 2009년까지 지속적으로 증가소견을 보여 0.08%까지 증가하였다. 2010년에 0.07%를 보였지만 다시 증가하기 시작하여 2012년에는 0.10%까지 증가하였으며 2013년에는 0.09%로 관찰되었다(
Yearly incidence rates of thyroid cancer
Year of new diagnostics | Number of new thyroid cancer patients | Total No. of samples (%) |
---|---|---|
2004 | 287 | 1,016,580 (0.03) |
2005 | 319 | 1,016,820 (0.03) |
2006 | 374 | 1,002,005 (0.04) |
2007 | 497 | 1,020,743 (0.05) |
2008 | 588 | 1,000,785 (0.06) |
2009 | 771 | 998,527 (0.08) |
2010 | 751 | 1,002,031 (0.07) |
2011 | 904 | 1,006,481 (0.09) |
2012 | 971 | 1,011,123 (0.10) |
2013 | 907 | 1,014,730 (0.09) |
2004년에 성별에 따른 갑상선암 발생률이 남:여=1:7.2로 가장 큰 차이를 보였고 2005년에는 1:6.3, 2006년에는 1:6.2, 2007년에는 1:6, 2008년에는 1:5.5로 점점 감소하는 추세를 보였다. 2009년에는 1:5.3, 2010년에는 1:4.6, 2011년에는 1:4.1, 2012년에는 1:4.3, 2013년에는 1:3.6으로 10년 전에 비해 성별에 따른 갑상선암의 발생률 차이가 많이 감소한 것을 볼 수 있었다(
Yearly incidence rates of thyroid cancer by sex
Year | Number of male | Number of female |
---|---|---|
2004 | 35 | 252 |
2005 | 44 | 275 |
2006 | 52 | 322 |
2007 | 71 | 426 |
2008 | 90 | 498 |
2009 | 121 | 650 |
2010 | 134 | 617 |
2011 | 176 | 728 |
2012 | 183 | 788 |
2013 | 194 | 713 |
갑상선암의 종류에 상관없이 계수되었으며 2004년부터 2010년까지는 40대에서 발병률이 가장 높았으나 2011년부터는 50대에서 발병률이 가장 높았다. 40대, 50대 다음으로는 30대에서 높은 발병률을 보였다(
Incidence rates of thyroid cancer by age
Age (yr) | Year of examination | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
2004 | 2005 | 2006 | 2007 | 2008 | 2009 | 2010 | 2011 | 2012 | 2013 | |
0-19 | 1 | 2 | 2 | 3 | 1 | 5 | 6 | 1 | 6 | 2 |
20-29 | 21 | 20 | 20 | 28 | 21 | 45 | 32 | 38 | 48 | 49 |
31-39 | 57 | 55 | 72 | 93 | 99 | 146 | 133 | 168 | 186 | 150 |
40-49 | 90 | 110 | 118 | 154 | 197 | 220 | 213 | 261 | 254 | 274 |
50-59 | 55 | 74 | 103 | 126 | 164 | 208 | 219 | 268 | 298 | 263 |
60-69 | 38 | 41 | 46 | 76 | 81 | 99 | 99 | 117 | 134 | 101 |
70-79 | 23 | 14 | 10 | 15 | 20 | 42 | 42 | 40 | 42 | 60 |
80-99 | 2 | 3 | 3 | 2 | 5 | 6 | 7 | 11 | 3 | 8 |
소득분위는 지역 및 직장 건강보험료 청구액을 기준으로 각 분위마다 10%씩 표본수가 들어가도록 나눈 상한선 및 하한선의 액수를 기준으로 분위를 지정하였다(
Income bracket classification by health insurance duty system
Income bracket | Occupation (won) | Region (won) | Other |
---|---|---|---|
Bracket 1 | 23,980 or less | 9,760 or less | 10% or less |
Bracket 2 | 23,980-28,590 | 91,760-16,080 | 11% or more and 30% or less |
Bracket 3 | 28,590-34,640 | 16,080-23,270 | 21% or more and 30% or less |
Bracket 4 | 34,640-41,730 | 23,270-34,980 | 31% or more and 40% or less |
Bracket 5 | 41,730-50,740 | 34,980-49,670 | 41% or more and 50% or less |
Bracket 6 | 50,740-62,290 | 49,670-68,250 | 51% or more and 60% or less |
Bracket 7 | 62,290-77,730 | 68,250-90,750 | 61% or more and 70% or less |
Bracket 8 | 77,730-99,870 | 90,750-121,360 | 71% or more and 80% or less |
Bracket 9 | 99,870-136,290 | 121,360-163,850 | 81% or more and 90% or less |
Bracket 10 | 136,290-1,753,300 | 163,850-1,718,200 | 91% or more and 100% or less |
Calculated number of examinations by income bracket
Income bracket | 2004 | 2005 | 2006 | 2007 | 2008 | 2009 | 2010 | 2011 | 2012 | 2013 |
---|---|---|---|---|---|---|---|---|---|---|
Bracket 0 | 2 | 5 | 1 | 5 | 15 | 19 | 3 | 60 | 18 | 20 |
Bracket 1 | 18 | 12 | 16 | 30 | 30 | 51 | 41 | 54 | 54 | 61 |
Bracket 2 | 9 | 17 | 20 | 24 | 27 | 34 | 40 | 54 | 61 | 50 |
Bracket 3 | 18 | 25 | 17 | 31 | 30 | 50 | 46 | 52 | 48 | 51 |
Bracket 4 | 22 | 11 | 24 | 30 | 28 | 57 | 45 | 64 | 59 | 65 |
Bracket 5 | 18 | 24 | 29 | 38 | 47 | 58 | 62 | 60 | 72 | 66 |
Bracket 6 | 31 | 30 | 33 | 46 | 57 | 57 | 62 | 76 | 75 | 94 |
Bracket 7 | 35 | 33 | 33 | 40 | 66 | 59 | 64 | 85 | 103 | 81 |
Bracket 8 | 30 | 37 | 46 | 62 | 60 | 104 | 116 | 102 | 125 | 86 |
Bracket 9 | 47 | 46 | 67 | 82 | 96 | 119 | 115 | 140 | 163 | 145 |
Bracket 10 | 57 | 79 | 88 | 109 | 132 | 163 | 157 | 157 | 193 | 188 |
2012년부터 세종시가 편입되어 서울, 부산, 대구, 인천, 광주, 대전, 울산, 세종, 경기, 강원, 충북, 충남, 전북, 전남, 경북, 경남, 제주 등 17개 시도지역을 대상으로 2004년부터 2013년까지 10년간 표본 코호트 자료를 이용하여 갑상선암 발생률을 분석하였다. 세종시가 처음 편입된 2012년에 발생률이 0.23%로 17개 시도지역 10년간 발병률 중 제일 높게 조사되었다. 매해마다 주로 대도시 위주로 갑상선암의 발생률이 높은 것을 알 수 있으며(
Incidence rates of thyroid cancer By 17 Cities or states in Korea
City or state | Year of examination (%) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
2004 | 2005 | 2006 | 2007 | 2008 | 2009 | 2010 | 2011 | 2012 | 2013 | |
Seoul | 0.03 | 0.04 | 0.04 | 0.05 | 0.06 | 0.10 | 0.08 | 0.09 | 0.11 | 0.10 |
Busan | 0.02 | 0.03 | 0.03 | 0.03 | 0.05 | 0.06 | 0.06 | 0.09 | 0.10 | 0.12 |
Daegu | 0.02 | 0.04 | 0.04 | 0.06 | 0.09 | 0.10 | 0.12 | 0.12 | 0.12 | 0.11 |
Incheon | 0.03 | 0.02 | 0.02 | 0.03 | 0.04 | 0.05 | 0.05 | 0.07 | 0.10 | 0.07 |
Gwangju | 0.05 | 0.06 | 0.08 | 0.09 | 0.09 | 0.10 | 0.11 | 0.10 | 0.10 | 0.10 |
Daejeon | 0.03 | 0.04 | 0.05 | 0.06 | 0.09 | 0.12 | 0.12 | 0.10 | 0.15 | 0.10 |
Ulsan | 0.05 | 0.03 | 0.03 | 0.04 | 0.05 | 0.09 | 0.10 | 0.13 | 0.12 | 0.13 |
Sejong | 0.23 | 0.08 | ||||||||
Gyeonggi | 0.03 | 0.03 | 0.04 | 0.05 | 0.06 | 0.07 | 0.07 | 0.09 | 0.08 | 0.08 |
Gangwon | 0.01 | 0.03 | 0.01 | 0.03 | 0.03 | 0.03 | 0.03 | 0.05 | 0.05 | 0.07 |
Chungbuk | 0.01 | 0.04 | 0.02 | 0.03 | 0.04 | 0.04 | 0.05 | 0.07 | 0.07 | 0.05 |
Chungnam | 0.01 | 0.01 | 0.03 | 0.05 | 0.05 | 0.06 | 0.08 | 0.08 | 0.07 | 0.10 |
Jeonbuk | 0.03 | 0.03 | 0.05 | 0.04 | 0.06 | 0.07 | 0.07 | 0.08 | 0.13 | 0.09 |
Jeonnam | 0.05 | 0.05 | 0.07 | 0.09 | 0.08 | 0.12 | 0.07 | 0.12 | 0.13 | 0.13 |
Kyeongbuk | 0.02 | 0.03 | 0.04 | 0.04 | 0.04 | 0.08 | 0.09 | 0.07 | 0.07 | 0.07 |
Kyeongnam | 0.04 | 0.02 | 0.04 | 0.04 | 0.06 | 0.07 | 0.05 | 0.08 | 0.09 | 0.07 |
Jeju | 0.04 | 0.03 | 0.05 | 0.03 | 0.13 | 0.05 | 0.06 | 0.05 | 0.04 | 0.10 |
이번 연구를 통하여 10년간 우리나라의 연도별, 성별, 연령별 갑상선암 발생률 및 소득분위별, 지역별 갑상선암 발생률의 변화 및 특징에 대해 알 수 있었다. 우리나라 전체 갑상선암 발생률의 경우 2004년 0.03%에서 2013년 0.09%로 10년 사이에 3배 증가한 것을 알 수 있다. 미국의 경우 2004년 0.01%에서 2013년 0.015%의 증가율을 보인 것을 보면 우리나라의 갑상선암 발생률 증가가 상당히 빠른 것을 알 수 있다.
일반적으로 갑상선암은 여성이 남성보다 3배 가까이 더 발생하는 것으로 알려져 있다.
여러 연구에 의하면 갑상선암 중 유두상암은 30-40대, 여포상암은 50대에 호발하는 것으로 알려져 있다.
사회경제적 요인과 갑상선암과의 상관관계에 대해서는 외국의 여러 문헌에서 찾아볼 수 있다.
본 연구에서는 우리나라를 17개 시도 지역으로 나누어 2004년부터 2013년까지 10년간 표본코호트 자료를 이용하여 갑상선암의 발병률을 분석하였고 모든 지역이 아닌 특정지역에서 갑상선암 발생률이 증가하는 것을 알 수 있었다. 특징적인 것으론 10년간 매 해마다 대도시 위주로 갑상선암 발생률이 높다는 점이다. 서울의 경우 2006년, 2008년을 제외한 8개년에서 모두 평균 이상의 발생률을 보였으며 그 외에도 대구, 광주, 부산 등 광역시 위주로 발생률이 높은 것을 볼 수 있었다. 대도시를 제외한 지역 중 갑성선암 발병률이 높은 지역으로는 강원도에 고성군, 양구군, 영월군, 철원군 / 경상북도의 영양군, 영덕군, 고령군, 예천군, 울릉군 / 겅상남도의 거제시, 거창군 / 전라남도의 곡성군, 구례군, 담양군, 완도군, 진도군으로 본 연구에서는 상기 지역의 높은 갑상선 발생률 원인에 대해 조사에 포함시키지 않아 알 수 없지만, 방사선이나 유전적, 환경적 요인에 근거를 두어 향후 역학조사를 통한 분석이 필요할 것으로 보인다.
본 연구는 기존 연구들에서 보고되지 않았던 지역별 갑상선암 발병률의 차이를 조사함으로써 향후 역학조사를 위한 지표가 될 수 있다는 점에서 의의를 가진다고 볼 수 있다. 하지만 주어진 자료로는 지역별 유동인구의 분석이 불가능하였고, 전수자료가 아닌 표본 코호트 자료를 이용하였기에 통계학적인 오류가 발생할 수도 있다는 한계점이 있다. 또한 앞에서 밝힌 것처럼 갑상선암 발생률이 높은 지역에 대한 원인 조사가 포함되지 않아 이에 대한 분석이 없었으며, 향후 역학조사를 통한 세밀한 분석이 필요할 것으로 사료된다.