記事ポイント
- 186万人・1,869万件データでAUROC 0.898のSAS予測AIモデルを開発
- 既存健診データとライフログのみでハイリスク者を抽出
- 潜在患者940万人の「隠れSAS」対策研究として国際学術誌に掲載
「SAS予測AIモデル」

- 研究発表日:2026年6月24日
- 対象データ:約186万人のPep Upユーザー、延べ約1,869万レコード(2022年1月〜2024年7月)
- 予測手法:機械学習(LightGBM)、合計279データ項目
- 掲載誌:国際学術誌「Sleep and Breathing」
- 共同研究機関:JMDC・オムロン・筑波大学
JMDC、オムロン、筑波大学の共同研究グループは、レセプトデータ・健康診断データ・PHRサービス「Pep Up」のライフログデータを組み合わせ、治療が必要なレベルの睡眠時無呼吸症候群(SAS)のリスクを高精度に予測するAIモデルを開発しました。
JMDCは2002年創業の医療データ企業で、健康保険組合から二次利用許諾を得たレセプト・健診データをもとに国内最大規模の医療ビッグデータ基盤「JMDC Claims Database」を構築・運営しています。
オムロンは血圧計等デバイスのデータ連携と臨床的助言を担い、筑波大学は臨床疫学・睡眠医学の観点から研究全体を監修しました。
SASは睡眠中に呼吸が止まったり浅くなったりを繰り返す病気で、高血圧・脳卒中・心疾患の重大なリスク要因となります。
国内の潜在患者は約940万人にのぼる一方、持続陽圧呼吸療法(CPAP)を受けている患者は約64万人程度にとどまり、多くの患者が治療のチャンスを失っている可能性があります。
なぜ今この研究が必要だったのか
SASの患者の多くは自覚症状が乏しく、確定診断には専門施設での精密検査(PSG:ポリソムノグラフィー等)が必要です。
従来のリスク把握は、自覚症状のある人が主体的に手間とコストをかけて医療機関を受診するか、専用ウェアラブルデバイスを用いるかに限られていました。
そのため社会には未診断・未治療の「隠れSAS」が数多く存在するとされています。
本研究は「無自覚な人も含め、ほとんど手間や追加のコストをかけずにSASリスクの高い人を見つけ出し、適切な検査・治療につなげる」という課題に取り組んだものです。
AIモデルの概要

- 使用データ種別:レセプト(診療報酬明細書)・健康診断・PHRライフログ(家庭血圧、体重、睡眠時間、歩数等)
- データ収集期間:2022年1月〜2024年7月(3か月毎の11時点)
- 予測アルゴリズム:LightGBM(機械学習)
- 使用データ項目数:合計279項目
本モデルは、JMDCが保有する仮名加工済みのレセプトデータおよび健康診断データに加え、「Pep Up」に記録された日々のライフログデータ(家庭血圧、体重、睡眠時間、歩数など)を組み合わせて構築されました。
PHR情報がある場合とない場合で予測精度を比較した点が、従来研究との大きな違いです。
PHR(パーソナルヘルスレコード)とは、健康診断の結果や服薬の履歴、家庭で測った血圧・体重・歩数・睡眠といった日々の健康データを、本人がスマートフォンアプリなどでまとめて記録・管理できる仕組みです。
ライフログは、家庭血圧計・体組成計・ウェアラブルデバイスなどによって日々記録される生活・健康の記録データを指します。
3機関の役割はそれぞれ明確で、JMDCが臨床データ整備と予測モデルの構築・解析を担い、オムロンが血圧計等デバイスのデータ連携と臨床的助言を提供し、筑波大学が研究全体の監修と臨床疫学・睡眠医学の観点からの指導を行いました。
SAS予測モデルの精度

- AUROC:0.898(95%信頼区間:0.895〜0.901)
- 予測スコア上位1%のうちCPAP治療者に該当:約28.3%
- 予測スコア上位10%のうちCPAP治療者に該当:約10.3%
- 本研究対象集団における有病率:1.6%
開発したAIモデルのAUROC(ROC曲線下の面積)は0.898で、0.5(ランダム予測)から1(完璧な予測)の範囲で非常に高い予測性能を示しました。
無作為に検査する場合の有病率1.6%と比べると、予測スコア上位1%からは約28.3%のCPAP治療者を抽出でき、はるかに効率的なハイリスク者の特定が可能です。
主要な予測因子として、男性であること・年齢・BMI・腹囲が上位にあがり、過去の研究と矛盾しない結果でした。
さらに健康診断の採血結果や日々のライフログ(睡眠時間など)も予測に寄与しています。
「Pep Up」を通じて血圧・睡眠時間・体重などを日常的に記録しているユーザーほど、PHRが予測に貢献する度合いが高いことも分かりました。
日々の記録習慣がそのままリスク検出の精度向上につながります。
予測因子の上位15位(SHAP値)

SHAP値(各特徴量がモデルの予測結果に与える貢献度を示す指標)による上位15の予測因子が可視化されています。
男性・年齢・BMI・腹囲といった身体特性が上位を占める一方で、健康診断の採血結果や睡眠時間などのライフログデータも因子に含まれます。
レセプトや健康診断のデータだけでなく、日常的なバイタル測定データを組み込んだ点がこのモデルの特徴。
PHR情報の有無による予測精度の差を定量的に検証した研究として、新規性の高い取り組みといえます。
この因子リストは、どのような日常データがSASリスクと関連するかを示しており、今後の予防医療サービス設計の根拠としても活用できます。
日常生活の中でのスクリーニングへの展開
このAIモデルを活用することで、特別な検査機器を使わなくても、すでにある健診データや個人のライフログから「SASリスクが高いグループに該当するため、精密検査をお勧めします」とアラートを出すことが可能になります。
リスクが高いと判定された場合に精密検査を推奨し、治療適応があれば早期治療につなげることで、健康寿命の延伸に寄与します。
未治療のSASによる日中の強い眠気や集中力の低下は、「プレゼンティズム(疾病就業)」や「アブセンティズム(疾病休業)」を招き、労働生産性の低下につながることが知られています。
ハイリスク者の早期発見によって、従業員の健康度向上と企業の生産性損失抑制にも寄与することが期待されます。
本研究を通じて、日々の健康記録がSASのような病気の予兆発見に役立つことが科学的に示されました。
オムロンは、家庭血圧計・体組成計・ウェアラブルデバイス等のデータが病気の予兆予測に活用される健康管理と予防の時代の実現を目指しています。
本取組みはSASを皮切りとして、脳心血管イベントやその他の生活習慣病・メンタル疾患等への発展も可能で、JMDCは今後も多様なAIモデルを構築するプラットフォーマーとして予測サービスを社会に還元していく方針です。
約186万人の健康データと日々のライフログが、自覚症状のない「隠れSAS」を早期に見つける仕組みを生み出しています。
健診を受けるたびに積み上がるデータが、高血圧や脳卒中につながる睡眠の問題を未然に発見する手がかりになります。
JMDC・オムロン・筑波大学「SAS予測AIモデル」の紹介でした。
よくある質問
Q. このAIモデルはどのようなデータを使って予測するのですか?
A. JMDCが保有する仮名加工済みのレセプト(診療報酬明細書)データと健康診断データに加え、PHRサービス「Pep Up」に記録された家庭血圧・体重・睡眠時間・歩数などの日々のライフログデータを組み合わせています。
合計279のデータ項目を機械学習(LightGBM)で処理し、治療が必要なレベルのSASを予測します。
Q. 予測精度はどのくらいですか?
A. 予測性能を示すAUROCは0.898(95%信頼区間:0.895〜0.901)です。
予測スコア上位1%に入った人のうち約28.3%が実際にCPAP治療を受けているSAS患者に該当しており、有病率1.6%の集団を無作為に検査する場合と比べて効率的にハイリスク者を見つけられます。
Q. 研究の対象者はどのくらいの規模ですか?
A. 約186万人のPep Upユーザーから収集された大規模データが対象です。
2022年1月から2024年7月にかけて3か月毎の11時点で集計された延べ約1,869万レコードを使用しています。
Q. この研究はどこで発表されましたか?
A. 国際学術誌「Sleep and Breathing」に学術論文として掲載されています。
研究発表は2026年6月24日です。