大規模ヘルスケアDBにおけるデータ品質管理の取り組み

09.29 THU13:30 - 14:00
  • #Python
  • #Pandas
  • #データ品質

ヘルスケア事業におけるリアルワールドデータ(RWD)の疫学研究・薬剤の臨床開発への利活用は世界的に見てもより加速しており、これらのデータ分析において、データの完全性、正確性が必須条件となります。

一方で、一言で「データ品質を担保する」といっても、データ品質を損なうようなトラブルは多岐に渡ります。シンプルなデータの欠損に限らず、特定層のデータ欠損や、データクレンジング・加工後に発生する意図しない不整合など、想定とは外れたケースも多く発生し得ます。

ヘルスケア業界におけるRWDから正確なデータ分析を行うために必要なデータ品質管理における自社の取り組みをご紹介します。