※この記事は私の勤めるクリニックのホームページに3月2日に投稿したものです。
前回の記事のまとめです。
検査は万能でないため、検査の陽性・陰性と疾患の有無については以下の4つの可能性があります。
① 検査は陽性で、実際に疾患がある。
② 検査は陽性だが、実際に疾患がない。
③ 検査は陰性だが、実際に疾患がある。
④ 検査は陰性で、実際に疾患ではない。
このうち、本当に知りたいのは①と④の確率です。
しかし、検査の特性だけではこれらは分かりません。
今回の記事では具体的な例を挙げながら、本当に知りたいことを求めるために必要なこと、そこから分かることについて説明していきます。
考え方は慣れないと難しいかもしれませんが、必要な計算は加減乗除だけで複雑な計算をしているわけではありません。
まず、検査の陽性・陰性と疾患の有無について次のような表をつくります。
疾患あり | 疾患なし | 合計 | |
検査陽性 | |||
検査陰性 | |||
合計 |
この表に先ほどの①から④を当てはめると
疾患あり | 疾患なし | 合計 | |
検査陽性 | ① | ② | ①+② |
検査陰性 | ③ | ④ | ③+④ |
合計 | ①+③ | ②+④ |
このようになります(分かりにくければ、①から④の配置だけ着目して下さい)。
本当に知りたいのは①÷(①+②)や④÷(③+④)です
(以下、話を分かりやすくするため、前者のみを計算します)。
ところが、この情報だけではそれらは求められません。
なぜならば、全体において疾患のある人が何%いるかが分からないからです。
感度や特異度といった検査の特性に加えて、必要な情報なのは全体において疾患のある人が何%いるか?です。
集団を調べる場合も個人を調べる場合も考え方は同じです。個人を調べる場合は「検査をする前の見積もりとして、何%くらいの確率で疾患があると想定するか?」です。これを「検査前確率」といいます。検査前確率は集団内での流行状況や病歴や他の検査所見を総合的に判断して何%くらいの可能性があるかを見積もります。
ここで仮に1000人の集団がいたとして、集団全体において本当に疾患があるのは500人だとします。もしくは個人において検査前確率が50%だとしましょう。
先ほどの表を使うと、このような状況になります。
疾患あり | 疾患なし | 合計 | |
検査陽性 | ① | ② | |
検査陰性 | ③ | ④ | |
合計 | 500 | 500 | 1000 |
この仮定のもとに検査をします。ここで前回の記事の感度・特異度が出てきます。
おさらいですが、感度とは疾患がある人の中で検査が陽性と出る割合、特異度とは疾患がない人の中で検査が陰性と出る割合のことでした。
仮に感度90%、特異度90%の検査をしたとしましょう。
すると、感度と特異度の定義から、こうなります。
疾患あり | 疾患なし | 合計 | |
検査陽性 | 450 (①) | ||
検査陰性 | 450(④) | ||
合計 | 500 | 500 | 1000 |
残りの欄を埋めると、次のようになります。
疾患あり | 疾患なし | 合計 | |
検査陽性 | 450 | 50 | 500 |
検査陰性 | 50 | 450 | 500 |
合計 | 500 | 500 | 1000 |
上の段を横読みすると、次のようになります。
疾患あり | 疾患なし | 合計 | |
検査陽性 | 450 | 50 | 500 |
検査が陽性と出た500人のうち、450人が本当に疾患があります。陽性の適中率は450÷500 = 90%となります。
検査をする前の確率は50%でしたが、検査をして陽性と出た後の確率は90%になります。
これは「40%増えた」と考えることもできますし「1.8倍になった」と考えることもできます。
見方を変えると、疾患のある確率と疾患のない確率が検査前は50%対50%(1 : 1)だったものが、検査後は90%対10%(9 : 1)になったとも考えることができます。このような考え方をオッズ(今回は1⇒9)、オッズ比(今回は9÷1=9)といいます。これは検査の特性で決まります。
いかがでしょうか?人それぞれ感じ方は違うと思いますが、50%だったものが90%になるのであれば、かなり有益ではないでしょうか?
確率論的な観点から検査をするべき状況というのは、このように検査前後で疾患のある確率が大きく変わる状況です。それを決めるのは検査前確率と感度・特異度という検査の特性です。
それでは前提条件を変えて、疾患がある人の割合が1000人中50人(5%)だったとしましょう。
ここで、検査の設定は変えず、感度90%、特異度90%のままとします。
まず、疾患あり50人、疾患なし950人なので、次のようになります。
疾患あり | 疾患なし | 合計 | |
検査陽性 | |||
検査陰性 | |||
合計 | 50 | 950 | 1000 |
次に感度90%ということは、疾患あり50人の中で検査が陽性に出る割合は90%ですから左上の欄は50×0.9= 45人となります。同じ要領で特異度90%であるため、疾患なし・検査陰性である左下の欄は950×0.9=855人になります
疾患あり | 疾患なし | 合計 | |
検査陽性 | 45 | ||
検査陰性 | 855 | ||
合計 | 50 | 950 | 1000 |
空欄を完成させると、こうなります。
疾患あり | 疾患なし | 合計 | |
検査陽性 | 45 | 95 | 140 |
検査陰性 | 5 | 855 | 860 |
合計 | 50 | 950 | 1000 |
検査陽性の段を横に読むと検査陽性と出た140人のうち、本当に疾患があるのは45人、つまり陽性の適中率は32%だけです。残りの68%の人は検査が陽性に出ても、疾患がない(偽陽性)ということになります。反対に、左下の欄をみると855÷860=99.4%と非常に高い確率で真の陰性を判定できています。
なぜ、このようになるかというと、検査前確率が低いからです。検査前確率が低いというのは疑われない状況であることを意味しています。このような状況では優れた検査をして結果が陽性に出たとしても偽陽性の方が多くなるのです。
偽陽性になることで不必要な検査・治療を受けることになり、個人にとって本来不要の負担が大きくなります。これが、優れた検査であったとしても万人に勧められない理由です。
それでは今度は1000人中疾患がある人が800人いたとしましょう。
感度・特異度は同じ90%ずつとします。要領は同じなので計算途中は省きます。
疾患あり | 疾患なし | 合計 | |
検査陽性 | 720 | 20 | 740 |
検査陰性 | 80 | 180 | 260 |
合計 | 800 | 200 | 1000 |
検査陽性の段を横に読むと、検査陽性740人中720人が疾患があることになります。陽性の適中率は720÷740=97.3%です。反対に、検査が陰性と出ても80÷260=30.7%の人は偽陰性であることになります。このような状況では検査が陰性と出ても安心はできないことになります。
これらの例から分かることは、たとえ感度・特異度に優れた検査でも、検査前の確率によって検査の陽性・陰性の意味合いは大きく異なるということです。従って、検査をする前から「どれくらい疑わしいのか?」ということを判断していないといけません。「まず検査をしてから考える」という姿勢が誤りであることが分かります。
これまでは検査の感度・特異度を90%というバランスの良い前提で計算してきましたので、次は感度と特異度を変えてみます。
一番イメージのわきやすいインフルエンザの迅速検査を例にとると、感度は約70%、特異度は95-98%とされています。特異度95%と特異度98%では全く違うのですが、ここでは感度70%、特異度98%で計算をします。
①流行期にやってきた発熱患者さん②流行期にやってきた患者さんで症状から更に疑わしい患者さん③非流行期という3つのシナリオを想定してみます。
まず①のケースです。検査前確率を40%とします(世の中には沢山の疾患があるので、40%というのは相当高い数字です)。
疾患あり | 疾患なし | 合計 | |
検査陽性 | 280 | 12 | 292 |
検査陰性 | 120 | 588 | 708 |
合計 | 400 | 600 | 1000 |
検査が陽性と出た場合に本当に疾患がある確率は280÷292=95.8%と非常に高い一方で、検査が陰性と出た場合でも120÷708=16.9%と約20%の確率で偽陰性になります。これが検査が陰性でもインフルエンザは否定できない理由です。
次に②のケースです。流行期に発熱や関節痛、くしゃみ、咽頭痛などの典型的な症状があり、周りにインフルエンザの人がいて濃厚接触しているようなケースです。検査前確率を80%とします。
疾患あり | 疾患なし | 合計 | |
検査陽性 | 560 | 4 | 564 |
検査陰性 | 240 | 196 | 436 |
合計 | 800 | 200 | 1000 |
検査が陽性の場合、本当にインフルエンザである確率は99.2%ですが、反対に検査が陰性でも55%の確率でインフルエンザであることになります。このような場合には敢えて検査を行わないということも選択肢になるでしょう(後で述べますが、検査をするかしないかは確率だけで判断しません)。
最後に③の非流行期です。たとえば夏場に発熱で受診した場合を想定します。検査前確率は5%だとしましょう。
疾患あり | 疾患なし | 合計 | |
検査陽性 | 42 | 19 | 61 |
検査陰性 | 8 | 931 | 939 |
合計 | 50 | 950 | 1000 |
検査が陽性で本当にインフルエンザの確率は69%、インフルエンザではない確率が31%です。
ちなみに先ほどの同じ検査前確率が5%で感度・特異度90%のときの表です。
疾患あり | 疾患なし | 合計 | |
検査陽性 | 45 | 95 | 140 |
検査陰性 | 5 | 855 | 860 |
合計 | 50 | 950 | 1000 |
検査が陽性で疾患がある確率は32%、疾患がない確率は68%です。
先ほどと比べて、まだ良いのは「特異度が高いから」です。前の記事で述べたように「特異度が高い」というのは「偽陽性が少ない」ことを意味するので、検査で陽性と出たら本当に疾患が存在する可能性が高いのです。
そうはいっても偽陽性である確率(分かりやすくいうと誤診をする確率)が31%というのは、かなり心許ない数字です。しかも、これは特異度98%という設定の下での数字であり、特異度が下がれば、更に誤診をしてしまう確率が高くなります。繰り返しになりますが、検査前に疑わしくない状況で検査をして陽性という結果が出たとしても、本当に疾患があるかどうかは疑問であるということです。
前回の記事で「インフルエンザの検査が陽性でもインフルエンザではない可能性が2つの意味である」と述べました。1つはここまで述べてきたように偽陽性の可能性です。
もう1つは「インフルエンザもあるがインフルエンザだけではない」という可能性です。他の疾患も同時に存在していて、そちらの方が中心である可能性もあります。
一般論でいうとAだということはBではないということの証明にはなりません。推理小説とは異なり、真実は1つとは限りません。もっとも医療の世界は数学と違うので、必要十分条件を証明するのは難しく、現実的には「Aならば状況を説明できるから、まずAとして治療する」という思考法をすることが多くあります。この場合でも論理的にはBもある可能性もあることを忘れてはなりません。治療が上手くいっているように見えるときこそ他の可能性について注意が必要です。
最後に偽陽性と偽陰性について、もう少し述べます。
患者さんの立場からすると、偽陰性であるというのは「本当は疾患があるのに、疾患がないと思われてしまう」ということを意味します。要するに「見逃し」です。「見逃し」は後から分かりやすいので目立ちます。世の中には見逃しのニュースであふれていて、医療に見逃しは絶対にあってはいけないという風潮があります。
見逃しを避ける最も効果的な方法は、検査を沢山することも含めて異常の基準を下げて感度を上げることです。しかし、感度を上げると結果的に特異度は下がるので、偽陽性が増えます。
偽陽性であるというのは「本当は疾患がないのに、疾患があると思われてしまう」ということを意味します。従って、本来は不要である追加の検査や治療を受けることによる不利益が生じることになります。偽陽性というのは通常、我々にも本人にも中々分かりません。特に自然に治るような疾患では偽陽性であったかどうかの判断は難しいでしょう。誰にも分からないところで目に見えない損失が生じている可能性についても考慮する必要があります(念のためですが、見逃しをして良いと言っているわけではありません。見逃しを避けるための最大限の努力は必要です)。
大切なのはバランスをどう考え、どこに現実的なラインを置くかです。
これまで、長々と検査について確率論的な話をしてきました。やや難しい内容だとは思いますが、優れた検査であっても万人に検査をすれば良いわけではないということを確率論的な観点から述べました。
確率論はあくまで検査の側面の1つであり、検査の意義は確率論的なことだけでは決まりません。
具体的に以下のようなことを考慮します。
・疾患の重症度・緊急度
・疾患の自然経過(無治療だとどうなるか)
・治療方法があるかどうか(疾患の自然経過を変えられるかどうか)
・検査が簡便に行えるかどうか
・検査の侵襲性
・公衆衛生に与える影響
これらに関してはまた別の記事で述べたいと思います。
コメント