職場ウェルネスプログラムは本当に効くのか。約5,000人の大学職員をランダム化したイリノイ大学の研究(Jones, Molitor & Reif 2019)は、検診の受診率こそ上がったものの、医療費・健康行動・雇用成果には有意な因果効果を確認できませんでした。横断比較で見える「効果」の多くは、もともと健康な人ほど参加する選択バイアスだったのです。
健康経営が経営テーマとして定着し、福利厚生やウェルネス施策に予算を投じる企業が増えています。しかし「導入したら医療費が下がった」「離職が減った」といった社内報告の多くは、参加者と非参加者を単純に比べた観察データに基づいています。この記事では、効果測定の方法論として最も信頼性の高いランダム化比較試験(RCT)であるイリノイ研究を単独で深掘りし、日本企業の人事・総務・経営企画・CSR担当者が自社施策の効果測定をどう設計すべきかを整理します。
この記事のポイント
- イリノイ研究は約5,000人をランダムに「プログラム提供群」と「対照群」に分けた本格的なRCT。観察研究では避けられないバイアスを設計で排除した。
- 主要結果:健康診断・スクリーニングの受診率は上がったが、医療費・健康行動・体重などの臨床指標・在職や生産性といった雇用成果には、1年時点で統計的に有意な因果効果が確認されなかった。
- 横断比較(参加者 vs 非参加者)では好成績が見えたが、その差の正体は「もともと健康・低医療費の人ほど参加する」選択バイアスだった。
- 日本の健康経営でも、効果はRCTや準実験で測るべき。参加者だけを見た「成功報告」は因果関係の証拠にならない。
研究デザイン:なぜRCTだと信頼できるのか
イリノイ大学の職場ウェルネス研究(Illinois Workplace Wellness Study)は、同大学の従業員約5,000人を対象に、参加の機会をランダムに割り当てた点が決定的な特徴です(Jones, Molitor & Reif 2019)。約3分の2を「プログラムを提供する処置群」、残りを「提供しない対照群」に無作為に振り分け、両群のその後を比較しました。
なぜランダム化が重要なのでしょうか。職場ウェルネスを「参加した人」と「参加しなかった人」で比べると、一見プログラムの効果に見えるものの大半は、両者がそもそも違う人だったことに起因します。健康意識が高い人、時間に余裕がある人、もともと健康な人ほど自発的に参加するため、結果が良いのは当然です。これが選択バイアスです。RCTは割り当てを偶然に委ねることで両群の背景を平均的に揃え、「プログラムを提供したこと」そのものの因果効果を切り出せます。
この研究はさらに、同じデータで「RCTによる因果推定」と「参加者と非参加者を比べる横断的な観察分析」の両方を実施し、両者がどれだけ食い違うかを正面から示しました。効果測定の方法論を考えるうえで、この対比そのものが大きな学びになります。
主要結果:上がったもの、変わらなかったもの
RCTで因果効果が確認されたのは限定的でした。要点を整理します(Jones, Molitor & Reif 2019)。
| アウトカム | RCTで見られた因果効果 |
|---|---|
| 健康診断・スクリーニングの受診 | 受診率は上昇(プログラムが促進した) |
| 医療費(支出) | 有意な低下は確認されず |
| 健康行動・臨床指標 | 明確で有意な改善は確認されず |
| 雇用成果(在職・生産性など) | 有意な効果は確認されず |
つまり、プログラムは従業員を「検診を受けに行かせる」ことには成功しましたが、その先にある医療費の削減や健康状態の改善、定着・生産性の向上といった、経営層が本当に期待する成果には結びつかなかったということです。これは「プログラムに意味がない」という意味ではなく、少なくとも1年程度の短期では、投資に見合う測定可能な経済効果を立証できなかった、と読むのが正確です。エビデンスの強さで言えば、これは大規模RCTという最も頑健な部類の証拠です。
横断比較が見せた「幻の効果」=選択バイアス
この研究の白眉は、同じ集団を観察データ的に分析すると話がまるで変わる点です。参加者と非参加者を単純比較すると、参加者のほうが医療費が低く健康的に見えました。しかしRCTの設計上、プログラムを提供しただけでは健康状態に差が出ていないことが分かっているため、この差はプログラムの効果ではなく、もともと健康で医療費の低い人が参加していたことの反映だと特定できます。
これは健康経営の現場に直結する警告です。社内で「ウェルネス参加者は欠勤が少ない」「研修受講者は離職率が低い」というデータが出ても、それは施策が効いた証拠とは限りません。健康で前向きな従業員ほど施策に参加しやすいという、ごく自然な傾向を測っているだけかもしれないのです。
他の大規模RCT・調査との整合性
イリノイ研究の結論は孤立した発見ではありません。約33,000人を対象にした別の大規模RCT(Song & Baicker 2019)でも、自己申告ベースの健康行動(運動や体重管理への取り組み)は改善した一方、18か月時点で臨床指標・医療費・欠勤・在職に有意差は確認されませんでした。米国の職場ウェルネスを広く調べたRAND報告(Mattke et al. 2013)も、参加や一部の行動変容は見られるものの、費用対効果の証拠は限定的だと結論づけています。
一方で、ウェルビーイングそのものに価値がないわけではありません。Gallupの大規模データを用いた観察研究・メタ分析(Krekel, Ward & De Neve 2019)は、従業員ウェルビーイングが生産性・顧客ロイヤルティ・離職率・企業業績と正の関連を持つことを示しています。ただしこれは観察的な関連(相関)であり、特定のウェルネス「プログラム」を導入すれば因果的にこれらが改善する、という主張とは区別が必要です。重要なのは、関連(相関)と因果効果を混同しないことです。
日本の健康経営への教訓
日本では「健康経営」が政策的にも後押しされ、施策の導入自体は進んでいます。RIETIの実証分析(RIETI 2021)は、健康を経営理念に掲げて組織に浸透させる施策が利益率にプラスに働くことを示しており、「何をやるか」だけでなく「経営にどう統合し浸透させるか」が成果を分ける可能性を示唆します。ただしこちらも観察的な分析であり、因果を確定したものではありません。海外RCTと合わせて読むと、示唆は次のように整理できます。
- 効果はRCTか準実験で測る。全社一斉導入は対照群が取れず効果測定が難しい。部署や事業所単位で段階的に導入し、未導入群と比較する設計を最初から組み込む。
- 参加者だけの「成功報告」を因果の証拠にしない。参加者と非参加者の比較は選択バイアスを含む。稟議や統合報告で効果を語るなら、その限界を明記する。
- アウトカムを区別する。受診率のような「行動」は動かしやすいが、医療費・臨床指標・離職のような「結果」は短期では動きにくい。KPIの時間軸を現実的に設定する。
- 経営理念への統合を重視する。単発のイベント型施策より、健康を経営に組み込み浸透させるアプローチのほうが、日本のデータでは業績との関連が見えている(観察的知見)。
これらの判断材料を社内で共有するための土台として、関連エビデンスを横断的にまとめた健康経営・ウェルビーイングハブも併せてご確認ください。
医療費ROIの査読エビデンスを全体像として整理した健康経営ROIの実態と稟議で使えるエビデンス整理もあわせてお読みください。
健康・ウェルビーイングと地域貢献を両立させる選択肢
従業員のウェルビーイングを高める取り組みは、社内施策に限りません。地域の健康づくり・医療・福祉・子育て支援といった社会課題に企業として関わること自体が、従業員の誇りやエンゲージメントを支える要素になり得ます。その手段の一つが企業版ふるさと納税で、自治体の健康・福祉プロジェクトへの寄附を通じて地域に貢献しながら、寄附額に応じた税制優遇(損金算入に加えた税額控除)を受けられます。仕組みの全体像は企業版ふるさと納税とは(基礎ガイド)で整理しています。自社に合う寄附先を探したい場合はAI診断を、控除額の規模感をつかみたい場合は寄附シミュレーターを活用してください。健康経営の効果測定とは別軸ですが、CSRと従業員のウェルビーイングを地続きで設計するうえで検討に値する選択肢です。
まとめ
イリノイRCTが伝えるのは「ウェルネスは無駄」ということではなく、効果は思い込みではなく適切な方法で測れという方法論上の警告です。検診受診率のように動く指標もあれば、医療費や離職のように短期では動かない指標もあります。そして参加者だけを見た成功報告は、選択バイアスによって効果を過大評価しがちです。健康経営の投資判断を役員稟議で通すなら、対照群を持つ設計と、エビデンスの強弱を正直に示す姿勢こそが、長期的に信頼される報告につながります。
Q. イリノイ研究は「職場ウェルネスは効果がない」と結論づけたのですか。
A. 正確には「少なくとも1年程度の短期では、医療費・健康行動・雇用成果に統計的に有意な因果効果を確認できなかった」という結論です(Jones, Molitor & Reif 2019)。検診受診率は上がっており、効果がゼロと断定したわけではありません。長期効果や設計次第の可能性は残ります。
Q. なぜ参加者と非参加者の比較ではいけないのですか。
A. もともと健康で医療費の低い人ほど自発的に参加する傾向があるためです。イリノイ研究では、横断比較で見えた「効果」の大半がこの選択バイアスによるものだとRCTを使って特定しました(Jones, Molitor & Reif 2019)。参加者だけを見た成功報告は因果関係の証拠になりません。
Q. 他の研究でも同じ結果が出ているのですか。
A. はい。約33,000人のRCT(Song & Baicker 2019)でも、自己申告の健康行動は改善したものの18か月時点で臨床指標・医療費・欠勤・在職に有意差はありませんでした。RAND報告(Mattke et al. 2013)も費用対効果の証拠は限定的としています。
Q. 日本の健康経営でも同じことが言えますか。
A. 効果測定の方法論(RCT・準実験で測る、選択バイアスに注意する)は日本でも共通です。一方でRIETIの観察的分析(RIETI 2021)は、健康を経営理念に掲げ浸透させる施策が利益率にプラスとの結果を示しており、施策の「経営への統合」が成果を左右する可能性を示唆します(因果は未確定)。
Q. 自社で効果測定するにはどう設計すればよいですか。
A. 全社一斉導入は対照群が取れず効果が測れません。部署や事業所単位で段階的に導入し、未導入群と比較する準実験的な設計を最初から組み込むのが現実的です。受診率のような行動指標と、医療費・離職のような結果指標を分け、時間軸を現実的に設定してください。