薬剤副作用の自発報告データを利用した解析について(自分の理解を)まとめておく。



JADERデータベースとは
Japanese Adverse Drug Event Report (JADER)という、PMDAから公開されているデータである。主に、薬の発売後の副作用調査として利用されている。リアルワールドデータの1種である。
主に日本全国の医師や薬剤師や弁護士や患者やその他から、自発的に報告された副作用レポートを取りまとめているのでself-reporting databaseとも言われる。csvファイルで配布されていて、容量的にもそんなに大きくないので比較的解析しやすい。報告レコードは数十万単位。
USAだとFDAから、FAERSデータベースをより大規模に公開されている。FAERSはUSAに限らず全世界から集められている。FAERSはXML形式でファイルサイズも大きく、扱いづらい感は否めない(*ASCII形式もある)。


スクリーンショット 2020-01-26 0.29.48
PMDAより



自発報告データの特徴
このタイプのデータに特有のreporting biasという特徴というか問題点があり、解析とその解釈に十分な注意を要する

本データは、ある薬を使った人全員を観察して、「ある副作用が出た人」vs「出なかった人」で観察するようなよくある普通の観察データではなく、最初の「副作用が出た人」群を集めただけである。注目されている薬はそうでない薬(昔からある効果が微妙だけど外来とかで結構出されてたりするやつ等)よりは報告されやすいなどの理由で薬ごとにデータ量は異なるし、全体の分母がわからないから各薬について各副作用頻度はわからない。また各レポートに含まれる臨床情報はかなりざっくりしている:というのは、記載されている各副作用の診断の確実度はわからないし、そう記載されている医学的根拠もわからない(報告者はDrに限らず、薬剤師や弁護士、消費者などもありうる)。患者情報はかなり匿名化処理がされていて、年齢は20代とか10年単位くらいでしかわからない。過去の服薬は、現在使用されていないものは記載されないし、既往歴についても現在の副作用に関係ないものは記載されない。このため、交絡因子を統制してよりバイアスの少ない解析をしたくても、抜けている臨床情報が多いのでバイアスはやはり大きいままとならざるを得ない。エビデンスレベル的な位置付けでは、「症例ごとのデータクオリティにばらつきがある、大きなcase series」とみなすこともできなくはないかもしれない。。?

内服なしコントロール群がないデータとはいえ、後述するdisproportionality analysis「2×2分割表からOdds比を算出し、95%信頼区間 > 1を有意とする」などの解析を行うと、ある薬剤Aを使用されている中である副作用Eは(他の薬剤における報告頻度と比べて)有意に報告が多いか、などはわかる。つまり他の薬と比べてある副作用が多いか、という統計的な結論は導くことが可能である。ここから、ある新薬の発売後間もない時点で、特定の副作用が多そうかどうかをより迅速に検出し、その安全性への注意を喚起することが可能になる。またある薬剤と他の薬剤の間の、これまで知られていない相互作用や、ある薬剤の隠れた副作用の可能性などを探ることができる。意義づけとしては、あくまでも副作用と薬剤の関係についての仮説構築のための早期探索、という意味合いが大きい(Ref)。このデータからの結論として、ある薬剤によってこの副作用が確かに起こる、とは結論できない。「起こるかもしれない、のでさらに検証が必要だ」とするならば許容される。このような「(〜〜)かもね」というような曖昧な結論が多くなるのは悩ましいが、これはデータの性質上致し方ないことと考えられる。

一方で、この自発的報告データの利点としては、普通のコホートデータと比べて、「十分なサンプル数を持ったデータの入手」が格段にしやすいという点がある。新薬の承認段階でのN数の限られたRCTではわからなかったような副作用の可能性を見出すことが、その膨大なサンプルサイズによって可能である(*JADER単独よりはFAERSも参照した方が結論としてはRobustではあると考えられるが)。FAERSはさておき、JADERはすでに解析しやすい形で提供されているため、解析もしやすい。データの性質からくる結論の制約上、基本的にあまりIFの大きな論文にはならない傾向であるが、日常臨床の中で気づいた副作用の可能性について、すぐに解析で確かめることができるのも良い点である。また解析の流れは「薬剤〜副作用」の組み合わせによらず大体一緒なので、銅鉄研究的な論文量産も可能かもしれない。。。?