調査・エビデンス

5,000人RCTで分かった：職場ウェルネスは医療費を下げない｜健康経営の効果測定に使える教訓

Q: なぜ参加者と非参加者の比較ではいけないのですか。

もともと健康で医療費の低い人が自発的に参加しやすい傾向があるからです。イリノイ研究では、RCTを用いて横断比較で見えた「効果」の多くが、この選択バイアスによるものだと特定しました（Jones, Molitor & Reif 2019）。参加者だけを見た報告は、因果関係の証拠にはなりません。

著者: localgovs.net 編集部公開日: 2026年6月7日最終更新: 2026年6月7日

職場ウェルネスプログラムは本当に効くのか。約5,000人の大学職員をランダム化したイリノイ大学の研究（Jones, Molitor & Reif 2019）は、検診の受診率こそ上がったものの、医療費・健康行動・雇用成果には有意な因果効果を確認できませんでした。横断比較で見える「効果」の多くは、もともと健康な人ほど参加する選択バイアスだったのです。

健康経営が経営テーマとして定着し、福利厚生やウェルネス施策に予算を投じる企業が増えています。しかし「導入したら医療費が下がった」「離職が減った」といった社内報告の多くは、参加者と非参加者を単純に比べた観察データに基づいています。この記事では、効果測定の方法論として最も信頼性の高いランダム化比較試験（RCT）であるイリノイ研究を単独で深掘りし、日本企業の人事・総務・経営企画・CSR担当者が自社施策の効果測定をどう設計すべきかを整理します。

この記事のポイント

イリノイ研究は約5,000人をランダムに「プログラム提供群」と「対照群」に分けた本格的なRCT。観察研究では避けられないバイアスを設計で排除した。
主要結果：健康診断・スクリーニングの受診率は上がったが、医療費・健康行動・体重などの臨床指標・在職や生産性といった雇用成果には、1年時点で統計的に有意な因果効果が確認されなかった。
横断比較（参加者 vs 非参加者）では好成績が見えたが、その差の正体は「もともと健康・低医療費の人ほど参加する」選択バイアスだった。
日本の健康経営でも、効果はRCTや準実験で測るべき。参加者だけを見た「成功報告」は因果関係の証拠にならない。

研究デザイン：なぜRCTだと信頼できるのか

イリノイ大学の職場ウェルネス研究（Illinois Workplace Wellness Study）は、同大学の従業員約5,000人を対象に、参加の機会をランダムに割り当てた点が決定的な特徴です（Jones, Molitor & Reif 2019）。約3分の2を「プログラムを提供する処置群」、残りを「提供しない対照群」に無作為に振り分け、両群のその後を比較しました。

なぜランダム化が重要なのでしょうか。職場ウェルネスを「参加した人」と「参加しなかった人」で比べると、一見プログラムの効果に見えるものの大半は、両者がそもそも違う人だったことに起因します。健康意識が高い人、時間に余裕がある人、もともと健康な人ほど自発的に参加するため、結果が良いのは当然です。これが選択バイアスです。RCTは割り当てを偶然に委ねることで両群の背景を平均的に揃え、「プログラムを提供したこと」そのものの因果効果を切り出せます。

この研究はさらに、同じデータで「RCTによる因果推定」と「参加者と非参加者を比べる横断的な観察分析」の両方を実施し、両者がどれだけ食い違うかを正面から示しました。効果測定の方法論を考えるうえで、この対比そのものが大きな学びになります。

主要結果：上がったもの、変わらなかったもの

RCTで因果効果が確認されたのは限定的でした。要点を整理します（Jones, Molitor & Reif 2019）。

アウトカム	RCTで見られた因果効果
健康診断・スクリーニングの受診	受診率は上昇（プログラムが促進した）
医療費（支出）	有意な低下は確認されず
健康行動・臨床指標	明確で有意な改善は確認されず
雇用成果（在職・生産性など）	有意な効果は確認されず

つまり、プログラムは従業員を「検診を受けに行かせる」ことには成功しましたが、その先にある医療費の削減や健康状態の改善、定着・生産性の向上といった、経営層が本当に期待する成果には結びつかなかったということです。これは「プログラムに意味がない」という意味ではなく、少なくとも1年程度の短期では、投資に見合う測定可能な経済効果を立証できなかった、と読むのが正確です。エビデンスの強さで言えば、これは大規模RCTという最も頑健な部類の証拠です。

横断比較が見せた「幻の効果」＝選択バイアス

この研究の白眉は、同じ集団を観察データ的に分析すると話がまるで変わる点です。参加者と非参加者を単純比較すると、参加者のほうが医療費が低く健康的に見えました。しかしRCTの設計上、プログラムを提供しただけでは健康状態に差が出ていないことが分かっているため、この差はプログラムの効果ではなく、もともと健康で医療費の低い人が参加していたことの反映だと特定できます。

これは健康経営の現場に直結する警告です。社内で「ウェルネス参加者は欠勤が少ない」「研修受講者は離職率が低い」というデータが出ても、それは施策が効いた証拠とは限りません。健康で前向きな従業員ほど施策に参加しやすいという、ごく自然な傾向を測っているだけかもしれないのです。

他の大規模RCT・調査との整合性

イリノイ研究の結論は孤立した発見ではありません。約33,000人を対象にした別の大規模RCT（Song & Baicker 2019）でも、自己申告ベースの健康行動（運動や体重管理への取り組み）は改善した一方、18か月時点で臨床指標・医療費・欠勤・在職に有意差は確認されませんでした。米国の職場ウェルネスを広く調べたRAND報告（Mattke et al. 2013）も、参加や一部の行動変容は見られるものの、費用対効果の証拠は限定的だと結論づけています。

一方で、ウェルビーイングそのものに価値がないわけではありません。Gallupの大規模データを用いた観察研究・メタ分析（Krekel, Ward & De Neve 2019）は、従業員ウェルビーイングが生産性・顧客ロイヤルティ・離職率・企業業績と正の関連を持つことを示しています。ただしこれは観察的な関連（相関）であり、特定のウェルネス「プログラム」を導入すれば因果的にこれらが改善する、という主張とは区別が必要です。重要なのは、関連（相関）と因果効果を混同しないことです。

日本の健康経営への教訓

日本では「健康経営」が政策的にも後押しされ、施策の導入自体は進んでいます。RIETIの実証分析（RIETI 2021）は、健康を経営理念に掲げて組織に浸透させる施策が利益率にプラスに働くことを示しており、「何をやるか」だけでなく「経営にどう統合し浸透させるか」が成果を分ける可能性を示唆します。ただしこちらも観察的な分析であり、因果を確定したものではありません。海外RCTと合わせて読むと、示唆は次のように整理できます。

効果はRCTか準実験で測る。全社一斉導入は対照群が取れず効果測定が難しい。部署や事業所単位で段階的に導入し、未導入群と比較する設計を最初から組み込む。
参加者だけの「成功報告」を因果の証拠にしない。参加者と非参加者の比較は選択バイアスを含む。稟議や統合報告で効果を語るなら、その限界を明記する。
アウトカムを区別する。受診率のような「行動」は動かしやすいが、医療費・臨床指標・離職のような「結果」は短期では動きにくい。KPIの時間軸を現実的に設定する。
経営理念への統合を重視する。単発のイベント型施策より、健康を経営に組み込み浸透させるアプローチのほうが、日本のデータでは業績との関連が見えている（観察的知見）。

これらの判断材料を社内で共有するための土台として、関連エビデンスを横断的にまとめた健康経営・ウェルビーイングハブも併せてご確認ください。

医療費ROIの査読エビデンスを全体像として整理した健康経営ROIの実態と稟議で使えるエビデンス整理もあわせてお読みください。

健康・ウェルビーイングと地域貢献を両立させる選択肢

従業員のウェルビーイングを高める取り組みは、社内施策に限りません。地域の健康づくり・医療・福祉・子育て支援といった社会課題に企業として関わること自体が、従業員の誇りやエンゲージメントを支える要素になり得ます。その手段の一つが企業版ふるさと納税で、自治体の健康・福祉プロジェクトへの寄附を通じて地域に貢献しながら、寄附額に応じた税制優遇（損金算入に加えた税額控除）を受けられます。仕組みの全体像は企業版ふるさと納税とは（基礎ガイド）で整理しています。自社に合う寄附先を探したい場合はAI診断を、控除額の規模感をつかみたい場合は寄附シミュレーターを活用してください。健康経営の効果測定とは別軸ですが、CSRと従業員のウェルビーイングを地続きで設計するうえで検討に値する選択肢です。

まとめ

イリノイRCTが伝えたいのは、「ウェルネスは無駄だ」という断定ではなく、効果は思い込みではなく、適切な方法で測れるという点です。検診受診率のような指標は動くものもあれば、医療費や離職といった結果は短期間では変化しにくい。参加者だけに注目した成功報告は、選択バイアスによって効果を過大評価しがちです。健康経営の投資を役員稟議で通すには、対照群を設け、エビデンスの強弱を正直に示す姿勢が、長期的に信頼される報告につながります。

Q. イリノイ研究は「職場ウェルネスは効果がない」と結論づけたのですか。

A. そうではありません。正確には「少なくとも1年程度の短期間では、医療費や健康行動、雇用成果に統計的に有意な因果効果を確認できなかった」という結論です（Jones, Molitor & Reif 2019）。検診受診率は上昇しており、効果がゼロだとは言っていません。長期的な効果や、設計次第での可能性はまだ残っています。

Q. なぜ参加者と非参加者の比較ではいけないのですか。

A. 健康で医療費の低い人が自発的に参加しやすい傾向があるからです。イリノイ研究では、RCTを用いて横断比較で見えた「効果」の多くが、この選択バイアスによるものだと特定しました（Jones, Molitor & Reif 2019）。参加者だけを見た報告は、因果関係の証拠にはなりません。

Q. 他の研究でも同じ結果が出ているのですか。

A. はい。約33,000人のRCT（Song & Baicker 2019）でも、自己申告の健康行動は改善しましたが、18か月後の臨床指標・医療費・欠勤・在職に有意差は見られませんでした。RANDの報告（Mattke et al. 2013）も、費用対効果の証拠は限定的だと指摘しています。

Q. 日本の健康経営でも同じことが言えますか。

A. 効果測定の方法論——RCTや準実験で測り、選択バイアスに注意する——は日本でも通用します。ただ、RIETIの観察的分析（RIETI 2021）は、健康を経営理念に掲げ浸透させる施策が利益率にプラスの影響を与えると示しており、施策の「経営への統合」が成果を左右する可能性を示唆しています（因果関係は未確定）。

Q. 自社で効果測定するにはどう設計すればよいですか。

A. 全社一斉導入では対照群が確保できず、効果を正確に測れません。部署や事業所単位で段階的に導入し、未導入群と比較する準実験的な設計を最初から組み込むのが現実的です。受診率のような行動指標と、医療費・離職といった結果指標を明確に分け、時間軸も現実的に設定しましょう。

📊 自社に合う寄附先をAIが診断

会社のメールアドレスを入力するだけで、本社・事業所の所在地、業種、サステナビリティ重点テーマから、貴社にマッチしやすい企業版ふるさと納税の寄附先を提案します。会員登録不要・無料・所要30〜60秒。

無料AI診断を受ける →