1-I-5-3 第17回医療情報学連合大会 17th JCMI(NOV,.1997)

診療データベースを用いた疾病相関の解析
共通背後因子の抽出

桑田 成規 , 松村 泰志 , 岡田 武夫 , 岡本 裕司 , 中村 考志 , 中野 裕彦 , 武田 裕
大阪大学医学部附属病院医療情報部

Analysis of correlation among diseases through the Clinical Database System

-- Detection of common factors --

Shigeki Kuwata , Yasushi Matsumura , Takeo Okada , Yuji Okamoto , Takashi Nakamura , Hirohiko Nakano , Hiroshi Takeda

Department of Medical Information Science, Osaka University Hospital(kuwata@hp-info.med.osaka-u.ac.jp )


Abstract:The correlation among one hundred diseases having relatively high frequency in our hospital were studied in order to detect common factors that underlie the diseases closely related one another. Patient data used in this analysis were obtained from our Clinical Database System. First, "distance" between diseases was defined with the phi correlation coefficient that represents the degree of frequency of simultaneous onset of the diseases. Then, multidimensional scaling was applied to obtain a comprehensive three-dimensional chart that shows the relationship of the diseases. As a result, an interesting clustering of diseases was found and several common factors could be inferred from the chart. This method may yield the clue to find common factors that have been unknown so far.

Keywords: database, correlation studies, clustering, multidimensional scaling



1.はじめに

 
 1人の患者に複数の疾患が併発することは、しばしば認められる現象であり、これらの併発疾患には、併発しやすい傾向のある疾病群が存在する。併発の頻度が高い疾患群には、共通する何らかの因子が働いていることが予想される。
 従来より、疾病間の関連性およびその共通背後因子を特定する研究は、いくつかの限られた疾病について行われてきた。多数の疾患にわたる調査を行うためには、相当量のデータを蓄積および処理する必要があり、その実行が困難であったため思われる。一方、本院では、1995年より病院情報システムと連携した診療データベースが稼働しており、大標本に基づく統計解析が必要な研究のために利用することが可能である。そこで、本研究では、本データベースに登録された病名データをもとに、頻度の高い100の疾患の群別分類を行うことにより併発疾患群を特定し、これらに共通する背後因子を抽出する試みを行った。

2.方 法

 1996年4月1日から末日までに本院を外来受診した患者19,190人について、当該期間中にアクティブであった登録病名(疑い病名、保険病名を除く)142,809件のうち、頻度順上位100位までの疾病について解析を行った。なお、病名分類はICD-10の中分類(上位より2番目の分類)に従った。
 ある疾病A患者群(A+群)と、性・年齢のマッチングを行い抽出された同数の非疾病A患者群(A-群)について、他の疾患Bを併発しているか否かで患者を分類した。A+B+群、A+B-群、A-B+群、A-B-群の患者数をそれぞれN++、N+-、N-+、N--とするとき、次式

(1)

で定義されるφ相関係数(-1<φ<1)が、疾病相互の併発しやすさ(親近性)を表すを考えられるので、疾病相互間の距離(非親近性)δ(0<δ<4)を

δ=2(1-φ)  (2)

と定義した。対象とした100の疾病すべてについてδを算出した後、多次元尺度構成法(Kruskalの方法1)を適用し、1疾病を1点とみなして、疾病相互の距離関係を3次元空間上にプロットした。得られた3次元布置から、疾病の群別分類を行い、併発疾病群に共通する背後因子について考察を行った。

3.結果および考察

 MDSによる、疾病の空間布置を図1〜4に示す。臓器ごとに群を作る疾病もみられたが、共通する因子に起因すると考えられる、いくつかの疾病群が見出された。(1)糖尿病、高血圧、虚血性心疾患、高脂血症、痛風などの疾病が、「成人病」群を形成した。これらは、栄養過剰や加齢に一因をもつ疾病と考えられる。(2)疼痛、背部痛、関節障害、脊髄疾患などの疾病が「骨・痛み」群を形成した。これもまた加齢に一因をもつ疾病と考えれられ、「成人病」群の近くに位置することは合理的である。(3)喘息、蕁麻疹、掻痒、鼻炎などの疾病が「アレルギー」群を形成した。これらが「皮膚」群とは離れた場所に位置することは興味深い。
 疾病群同士の位置関係だけでなく、疾病と群の位置関係においても興味深い結果が得られた。(1)糖尿病は「成人病」群と「眼」群の中間に位置した。(2)脳梗塞は「成人病」群と「脳・神経群」の中間に位置した。(3)骨粗鬆症は、「骨・痛み」群の中で、「女性」群寄りに位置した。これらは、当該疾病の性質を考えれば、合理的な結果である。

4.おわりに

 比較的頻度の高い100の疾病について、疾病間距離に基づき分類を行うことにより、共通の因子をもつ、いくつかの疾患群を特定することができた。本研究は、従来は見過ごされていた、新たな背後因子の発見への手がかりを与えるものである。


図表

図1、多次元尺度構成法による疾病の3次元プロット

 説明:3次元空間(X-Y-Z)を、一定範囲のZで区切ったときのX-Y断面として表示した。病名は略語表記がなされている。考えうる疾病群を線で囲み、命名した。元データの距離関係は、3次元空間に必ずしも正しく反映されておらず、その「ひずみ」の程度(ストレス)S1(0≦S1≦1)は0.27であった。なお、座標は標準化されている


参考文献

1 Kruskal JB:Nonmetric multidimensional scaling: a numerical method:Psychometrika 29(2), 115-129, 1964



Microsoft Access TO HTML Converter.Medical Informatics,Shimane medical UNIV.