診療データベースを用いた通院距離-患者数関係の解析による期間有病率の推定法
○桑田成規1 、松村泰志1 、武田裕1 、岡田武夫1 、井上通敏2
大阪大学医学部附属病院医療情報部1、国立大阪病院2
Estimation of period prevalence based on patient's address distribution
○Shigeki Kuwata1 , Yasushi Matsumura1, Hiroshi Takeda1, Takeo Okada1, Michitoshi Inoue2
Department of Medical Information Science, Osaka University Hospital (kuwata@hp-info.med.osaka-u.ac.jp)1
Osaka National Hospital2
Abstract: A new method to estimate period prevalence based on the analysis of the patients' address and their population was proposed. For 20 diseases, the number of patients over the population of the city was plotted to the distance from our hospital to the central hall of the city. The plot successfully fit to the exponential curve in the neighborhood of our hospital. The values extrapolated to zero distance(E) were compared with the values obtained from the investigation by Osaka prefecture(T). Median of E over T fell into 0.91 and its 95% confidence interval ranged from 0.58 to 1.54. This method enables us to estimate period prevalence from intrahospital patient data.
Keywords: database, estimation, exponential curve fitting, incidence rate, prevalence
1.はじめに
一病院における院内統計と全国統計を比較した場合、両者の一致度は低く、傾向も異なる場合がある。疾患の発生頻度が地域によらず一定であると仮定すると、このことは、病院の規模や機能、立地条件によって、患者の集中度が疾病ごとに異なることに起因すると考えられる。われわれは、患者集中度を考慮した患者分布モデルに基づき、院内統計から全国統計を推定する方法を考案した。今回、本院の診療データベースより得られた患者データを解析し、悪性新生物および特定疾患(難病)のうち代表的なものについて罹患率と期間有病率の推定を行った。
2. 方 法
1995年4月1日から1996年3月31日までに本院を受診した患者を解析対象とし、悪性新生物(以下、がん)の主要11部位のがん罹患率と、特定疾患のうち比較的頻度の高い9つの疾患の期間有病率の推定を行った。前者の推定に際しては、当該期間に新規登録された患者データを、後者では当該期間にその病名がアクティブであった患者データを採用した。ともに、病名に疑いのつくもの、および保険病名は確定診断でないとみなし、解析の対象外とした。比較対象には、大阪府による統計調査結果を採用した。大阪府は、府内におけるがん罹患者数および特定疾患有病者数を発表しており、これらの統計値とわれわれの求めた推定値との比較を行った。
2.1 患者分布モデル
ある疾病Aについて、地域iから本院を受診した疾病A患者数をni、地域i人口をNi、地域iの疾病A患者が本院を受診する確率をpiとし、有病率αが地域によらず一定とすると、次の式が成立する。
<式1>ni=αNipi、すなわち
αpi=ni/Ni</式1>
地域iから本院への平均通院距離をdiとすると、piはdiに伴って変化すると考えられる。今、pおよびdを連続変量とみなして、piをp(d)と表記する。
さて、実際に患者の居住地データから、市行政区分(大阪市は区行政区分)ごとに患者数ni、niと当該行政区人口Niの比(患者人口密度)を求め、本院と当該行政区中心地(市・区役所)の距離di(通院距離)を経緯度より算出した。これらの値より、通院距離-患者人口密度の片対数プロットを行うと、通院距離(d)-患者人口密度(n/N)の関係は、d=0〜10ないし15kmの付近で、次の形の減衰指数関数で近似するのが妥当と考えられた(図1)。
<式2>n/N = B exp(-βd) </式2>
式(1)(2)より、
<式3>αp(d) = B exp(-βd)</式3>
が成立する。p(d)→1(d→0)、すなわち本院のごく近傍では、疾病Aに罹患した患者がすべて本院を受診すると仮定すると、式(3)は、
<式4>α=B (d→0)</式4>
となり、有病率の推定は、減衰指数関数の定数を求めることに帰着する。
2.2 手順1(対象患者数が多い場合)
本院の所在都市(大阪府吹田市)を含む隣接5都市について、人口で重みをつけた ΣNi×(残差平方) を最小にする単回帰直線を求め、順次、距離の近い都市を1つずつ加え、距離15km以下の都市がすべて含まれるまで同様の手順を繰り返した。以上より得られた回帰直線の定数項のうち、決定係数R2が最大かつF値が1%有意となるものを推定値として採用した。
2.3 手順2(対象患者数が少ない場合)
データ数が十分でなく、有意なR2が得られない疾患については、次の方法によって推定値を得た。本院の所在都市を含む隣接5都市をA地帯、A地帯以外で距離15km以下の16都市をB地帯とし、本院から同一地帯の各都市までの距離の人口荷重平均値(ΣNi×di)/(ΣNi)を当該地帯の通院距離とみなして、当該地帯の患者人口密度に対して片対数プロットを行った。これを対象となるすべての疾患について行い、A、B地帯に対して得られた2点を通る直線式の定数項を求めた。次に、手順1により推定値が求められている疾患に対し、この定数項と手順1による推定値のプロットを行い、最小自乗法により予測式を確立した。この予測式を、手順1で推定不可能であった疾患に適用し、手順2による推定値とした。
3.結 果
1995年度がん罹患率の推定値、および特定疾患期間有病率の推定値を表1に示す。表より、推定値/大阪府統計値の中央値は0.91、その95%信頼区間は0.58-1.54であり、オーダレベルでの一致がみられた。
正確な罹患率、有病率を算定するには大規模な調査が必要となるが、今回の方法により、これらのパラメータは、ある程度の精度をもって一病院のデータから推定可能であることが示された。
図表
図1、本院受診胃がん患者の通院距離-患者人口密度プロット
表1、推定値と大阪府統計値の比較
参考文献
This document converted to HTML format on 1996年 11月 15日 金曜日 11:02:43 PMby SGML-HTML Converter version 0.96.