이 글을 쓰고 있는 2020년 10월 현재, 많은 나라들이 코로나19의 감염 확산으로 큰 고통을 겪고 있다. 전 세계에서 3천4백만 명 이상의 확진자가 발생했고, 이 중 사망에 이른 사람도 이미 백만 명을 넘어섰다. OECD 발표에 따르면, 인도의 2020년 2분기 경제 성장률은 –25.2%에 달했고, 영국, 멕시코, 프랑스, 이탈리아의 경제 성장률도 각각 –20.4%, -17.1%, -13.8%, -12.8%였다. 코로나19의 확산이 경제에 상당히 심각한 영향을 끼쳤다는 것을 명확히 알 수 있다. 우리나라의 2분기 성장률은 –3.2%로서 마이너스 성장을 보여주었지만, 다른 여러 나라와 비교하면 경제적 피해의 규모가 상대적으로는 작은 편이다. 코로나19의 확산이 멈춘 미래에, 새로운 감염병-X는 우리를 다시 찾아올 것이 분명하다. 아래에서는 감염병 확산에 대한 이론적인 모형을 소개하고, 현실의 감염병 확산의 데이터와 비교해보고자 한다.
I. 감염병 확산의 구획 모형
감염병 확산을 설명하는 단순한 모형들이 가진 공통점이 있다. 한 사회를 구성하는 개인 한명이 언제, 어디서, 그리고 어떻게 다른 사람을 감염시키는지, 구체적인 감염의 과정을 기술하지 않는다. 대신, 구체적인 개인이 아닌 집단안의 사람의 숫자만을 이용해 확산의 패턴을 설명하려한다. 작은 마을을 하나 떠올려보자. 집집마다 가족 수와 연령 구성이 다르고 직업도 다르다. 마을 사람들을 상대로 작은 가게를 하고 있는 집도 있고, 마을 근처의 논에서 농사를 짓는 집도 있다. 며칠 전 읍내 시장에 들른 한 마을 사람이 질병에 감염되었고, 이 사람에 의해 이 상상의 마을에서 감염의 확산이 시작되었다고 생각해보자. 이 사람이 어떤 일을 하는지, 그리고 집이 어디에 있는지에 따라 감염병이 확산되는 경로와 확산 속도는 천차만별 다를 수 있다. 감염병 확산의 가장 단순한 유형의 모형들에서는 이런 구체적인 정보를 무시한다. 감염자 한 명이 다른 미감염자에게 병원균을 옮기는 확률이 모두에게 동일하다고 가정하고, 하루에 얼마나 많은 감염자가 발생하는지, 그 숫자만을 살피는 방식을 이용한다. 이처럼 집단을 구성하는 사람들을 감염자, 미감염자, 완치자 등으로 성격이 다른 소수의 구획(compartment)으로 나누어 감염 확산을 기술하는 모형을 구획모형이라고 한다. 어쩔 수 없는 한계로 말미암아 감염병 확산의 구획 모형을 이용해 실제의 감염 확산 경로를 예측하기는 어렵다. 하지만, 현실 데이터와 감염병 확산 모형의 결과를 비교하면, 감염확산의 현 단계에 대한 정성적인 이해를 할 수 있는 여지가 있다.
Ⅱ. SIR 구획 모형
감염병 확산을 설명하는 여러 구획모형이 있다. 이중 미감염자(Susceptible, S)가 병원균에 감염되면 감염자(Infected, I)가 되고, 감염자는 시간이 지나 치유되면 항체가 만들어진 회복자(Recovered, R)가 되는 변화를 고려하는 것이 SIR 모형이다. 집단의 구성원이 N명, 미감염, 감염, 그리고 회복 상태에 있는 사람의 수를 각각 S, I, R이라고 하면, 임의의 시간 t에 S(t)+I(t)+R(t)=N을 만족하게 된다. 사람들은 S, I, R 중 하나의 상태에 있을 수밖에 없기 때문이다. S상태에 있는 사람이 I상태의 사람을 만나면 단위시간당 일정한 확률 β로 감염이 일어난다고 가정하면, 이 과정을 통해서 S상태에 있는 사람의 수는 줄어들고, I상태에 있는 사람의 수는 늘어나게 된다. 먼저, 단위시간동안 S(t)가 얼마나 변하는 지를 생각해보자. 감염자 한 명이 집단을 구성하는 N명 중 한명을 임의로 만난다고 가정하면, 이 한명이 미감염자일 확률은 S/N이다. 따라서 단위시간동안 새롭게 감염되는 미감염자수의 기댓값은 beta S over N으로 적을 수 있는데, 현재 감염자는 모두 I명이 있으므로, 단위시간동안 줄어드는 미감염자의 수(이는 단위시간동안 늘어나는 감염자 수와 같다)는 다름 아닌 {beta I S} over N이고, 따라서, S(t)가 만족하는 미분방정식은 dS over dt = - {beta I S} over N로 적을 수 있다. 이렇게 줄어든 S가 I의 증가량에 해당하므로 dI overdt = {beta I S} over N라고 적을 수 있을 것 같지만, 주의할 점이 있다. 미감염자의 수는 오직 감염에 의해 숫자가 줄어들지만, 감염자의 수는 두 종류의 과정을 따라 변한다. 미감염자가 감염이 되면 감염자의 수가 늘어나지만, 감염자가 시간이 지나 면역이 있는 회복자로 바뀌는 과정을 통해서는 감염자의 수가 줄어들게 된다. 따라서, 감염자 한 명이 단위시간에 R상태로 회복되는 확률을 γ라고 하면, 감염자의 수가 만족하는 미분방정식은 dI overdt = {beta I S} over N - gamma I로 적을 수 있다. 한편, 감염자가 줄어드는 만큼 회복자가 늘어나므로 회복자수 R(t)이 만족하는 미분방정식은 dR over dt = gamma I로 적을 수 있다. 지금까지의 논의를 통해 SIR 모형의 세 미분방정식을 적으면 다음과 같다.
- (1) {dS} over {dt} `=`- {beta IS} over {N}
- (2) {dI} over {dt} `= {beta IS} over {N} -` gamma I
- (3) {dR} over {dt} = gamma I
식(1), (2), (3)에 등장한 세 식을 모두 더하면 {d (S + I + R)} overdt = 0이므로, 위에서 설명한 조건 S(t)+I(t)+R(t)=N이 임의의 시간 t에 항상 만족한다는 것도 확인할 수 있다.
III. SIR 구획 모형의 기초재생산지수
코로나19의 확산이 매일같이 언론에 보도되면서, 기초재생산지수라는 학술용어가 거의 상식이 된 듯하다. 보통 R0라고 부르는 이 지수는 감염자 한 명이 확진판정을 받아 격리될 때까지 평균 몇 명을 감염시키는지를 나타낸다. 현재 100명의 감염자가 있다고 가정해보자. 만약 R0의 값이 2라서 1보다 크면, 100명의 감염자를 모두 찾아내 격리하더라도, 이들은 격리 이전의 기간 동안 모두 200명의 사람을 감염시키므로, 감염자의 수는 시간이 지나면서 계속 늘어나게 된다. 만약 R0의 값이 0.5라서 1보다 작다면, 100명의 감염자를 찾아내어 격리하면, 사회에 남아있는 감염자는 절반인 50명으로 줄어들게 된다. 즉, R0가 1보다 크면 감염자는 늘어나고, 1보다 작으면 결국에는 감염 확산이 멈추게 된다는 뜻이다. 앞에서 설명한 SIR 모형에서도 기초재생산지수를 생각해 볼 수 있다. 감염자 한 명이 단위시간동안 미감염자를 감염시켜 감염자를 늘리는 확률은 β이고, 면역을 가지게 되어 회복될 확률은 γ이므로, 만약 β<γ라면, 감염자가 늘어나는 것이 감염자가 회복되는 속도보다 더 빠르다는 뜻이다. 거꾸로, 라면, 새로 감염되는 사람보다 회복되는 사람이 더 빨리 늘어난다는 뜻이 된다. 즉, SIR 모형의 beta over gamma가 바로 기초재생산지수 R0에 해당한다는 것을 알 수 있다. 다른 방법도 있다. 식(2)의 우변을 바꿔 적으면 dI over dt = left({beta S} over {gamma N} - 1 right) gamma I이다. 감염의 초기 단계에서는 S≈N이므로, 이 식을 통해서도 beta over gamma가 1보다 크면 감염자수가 늘고(즉, dI over dt>0), 1보다 작으면 감염자수가 줄게 된다(즉, dI over dt<0)는 것을 쉽게 알 수 있다.
IV. 코로나19 확산 데이터의 이해
<그림 1>은 위에서 소개한 SIR 모형의 미분방정식을 컴퓨터 프로그램을 이용해 적분해서 얻은 그래프이다. 회복자의 수 R(t)는 전형적인 S자의 꼴을 보여준다. 이번의 코로나19의 확산에서는 일단 확진판정을 받아 병원에 격리된 환자는 더 이상의 감염을 일으키지 못한다는 것을 생각하면, SIR 모형의 R상태를 코로나19의 확진자로 해석할 수 있다는 것이 필자의 의견이다. 이 경우, SIR모형의 회복률 γ는 감염자가 단위시간 동안 확진판정을 받아 격리될 확률을 뜻하게 된다. 우리나라의 방역 정책이 다른 나라와 비교해 강점이 있던 것이 바로 신속한 감염자 확진이라고 할 수 있다. 즉, 우리나라는 SIR모형의 γ를 크게 하는 데 성공했고, 이를 통해 기초재생산지수 R0 = β/γ를 줄일 수 있었다는 것이 필자의 해석이다.
SIR모형의 R(t)가 보여주는 S자 형태의 모습을 근사적으로 기술하는 함수가 수식으로 f(x)= {L} over {1+e ^{-k(t-t _{0} )}}의 꼴로 적을 수 있는 로지스틱함수다. 과거, 여러 번이 아닌 딱 한 번의 확산이 발생하고 결국 멈춘 우리나라 MERS의 경우 환자수의 시간에 따른 변화가 로지스틱 함수의 개략적인 모습을 따랐다. 이번의 코로나19의 경우에는 한 번이 아닌 시간차를 두고 발생한 여러 S자 곡선의 중첩의 형태로 확산이 일어나고 있는 것으로 보인다.
<그림 2> 는 우리나라 코로나19 확진자 데이터를 시간차를 두고 연이어 발생한 여러 S자의 중첩으로 나타내 본 것이다. 이런 방식으로 실제 현실의 데이터를 살펴보는 방법의 이점이 있다. 우리나라에서 대구, 경북을 기점으로 한 확산의 속도보다 이후 두 번의 소규모 감염은 초기 증가세가 완화된 모습이었다는 것을 알 수 있다. 금년 8월에 시작되어 현재도 진행 중인 다섯 번째 확산은 대구, 경북 지역의 감염보다 더 큰 규모일 뿐 아니라, 초기 확산의 속도도 다시 빨라진 형태를 보여준다. 다행인 점은 5번째의 S자를 따른 확산의 증가세가 최근 완화되고 있는 추세라는 점이다. 오늘 소개한 것과 같은 단순한 모형을 이용한 현실 감염병 확산의 이해는 여러 한계가 있다. 하지만, 감염 확산의 현황에 대한 정보를 일부 얻을 수 있다는 면에서는 가치가 있다는 것이 필자의 믿음이다. 더 개선된 이론 모형을 이용한 현실 감염병 확산의 이해를 위해 여러 연구자가 현재 다양한 노력을 하고 있다. 이런 성과가 모여, 미래의 감염병-X에 대한 대비가 더 충실해지기를 바란다.