ココシルデータ解析2

ココシルスコアと職業性ストレスチェックとの関係の特定

著者

司馬博文

日付

2/26/2025

はじめに

ココシルの位置付けをわかりやすく説明するために, バイオピリンと職業性ストレスチェックとの相関を詳細に検討し, ココシルスコアがどのような意味で職業性ストレスチェックの要約になっているかを解明する. これは結局変数選択をした後の,右辺の式の形を見る問題になる.

1 まとめ

ToDo
  • ココシルスコアは「どういう意味で職業ストレスチェック項目の要約になっているか?」のストーリーを特定する.
報告点
報告するまでは行かない発見

2 解析(途中)

2.1 事前処理

2回繰り返しココシル測定データを R に読み込んで整理する.

id 心理的な仕事の負担(質) 心理的な仕事の負担(量) 自覚的な身体的負担度 職場の対人関係でのストレス 職場環境によるストレス 仕事のコントロール度 技能の活用度 仕事の適性度 働きがい 活気 イライラ感 疲労感 不安感 抑うつ感 身体愁訴 上司からのサポート 同僚からのサポート 家族・友人からのサポート 仕事や生活の満足度 測定時点 スコア 性別 年齢
330 1 2 2 2 2 1 3 1 3 2 3 4 2 4 3 2 4 1 2 2 43 male 28
334 1 3 2 1 2 1 2 1 1 3 1 1 1 1 5 1 1 1 2 2 38 male 25
333 3 3 2 2 3 3 3 4 5 5 3 4 3 4 4 3 3 4 4 2 55 male 32
335 4 3 2 4 3 4 3 3 1 4 2 4 5 5 4 2 3 2 3 2 42 male 27
328 4 3 4 3 4 5 5 4 5 5 4 5 4 5 4 5 4 2 5 2 34 male 39
332 3 4 3 3 5 3 3 3 3 4 3 4 4 4 3 4 5 4 4 2 10 female 25

2.2 一旦線型回帰をかけてみる(ベイズ)

library(brms)
df_short <- df_long[,c(2:20,22)]
colnames(df_short)[c(1,2,18)] <- c("心理的な仕事の負担_質", "心理的な仕事の負担_量", "家族と友人からのサポート")
# 線型回帰モデルの定義
fit <- brm(
  formula = スコア ~ .,
  data = df_short,
  family = gaussian(),
  chains = 4,
  cores = 4
)
summary(fit)
 Family: gaussian 
  Links: mu = identity; sigma = identity 
Formula: スコア ~ 心理的な仕事の負担_質 + 心理的な仕事の負担_量 + 自覚的な身体的負担度 + 職場の対人関係でのストレス + 職場環境によるストレス + 仕事のコントロール度 + 技能の活用度 + 仕事の適性度 + 働きがい + 活気 + イライラ感 + 疲労感 + 不安感 + 抑うつ感 + 身体愁訴 + 上司からのサポート + 同僚からのサポート + 家族と友人からのサポート + 仕事や生活の満足度 
   Data: df_short (Number of observations: 52) 
  Draws: 4 chains, each with iter = 2000; warmup = 1000; thin = 1;
         total post-warmup draws = 4000

Regression Coefficients:
                           Estimate Est.Error l-95% CI u-95% CI Rhat Bulk_ESS
Intercept                     28.77     35.23   -39.44    98.80 1.00     3044
心理的な仕事の負担_質         -0.97      4.21    -9.20     7.20 1.00     3144
心理的な仕事の負担_量         10.54      6.58    -1.77    23.73 1.00     2546
自覚的な身体的負担度          -4.14      8.07   -20.17    11.60 1.00     2603
職場の対人関係でのストレス    -1.78      4.41   -10.49     6.87 1.00     2675
職場環境によるストレス        -5.52      4.30   -13.95     3.17 1.00     2922
仕事のコントロール度          -2.38      4.90   -11.61     7.44 1.00     2675
技能の活用度                   1.19      5.12    -9.17    11.03 1.00     2667
仕事の適性度                   0.09      3.98    -7.75     8.04 1.00     2953
働きがい                       3.08      5.62    -7.83    14.14 1.00     2495
活気                          -1.59      3.76    -9.16     5.85 1.00     3706
イライラ感                     2.45      4.08    -5.46    10.51 1.00     3026
疲労感                        -2.56      5.42   -13.43     8.43 1.00     2741
不安感                        -5.70      5.58   -16.51     5.35 1.00     2544
抑うつ感                       9.31      4.47     0.37    17.92 1.00     2951
身体愁訴                       0.49      4.48    -8.59     9.26 1.00     3747
上司からのサポート             1.15      6.53   -11.67    13.90 1.00     2270
同僚からのサポート            -4.15      5.37   -14.66     6.56 1.00     2699
家族と友人からのサポート      -1.30      3.48    -8.34     5.59 1.00     2468
仕事や生活の満足度             2.00      5.97    -9.92    14.23 1.00     2686
                           Tail_ESS
Intercept                      3320
心理的な仕事の負担_質          2453
心理的な仕事の負担_量          2744
自覚的な身体的負担度           2658
職場の対人関係でのストレス     2870
職場環境によるストレス         2699
仕事のコントロール度           2602
技能の活用度                   2840
仕事の適性度                   3010
働きがい                       2581
活気                           2810
イライラ感                     2667
疲労感                         2831
不安感                         2563
抑うつ感                       2828
身体愁訴                       2864
上司からのサポート             2799
同僚からのサポート             2848
家族と友人からのサポート       2574
仕事や生活の満足度             2673

Further Distributional Parameters:
      Estimate Est.Error l-95% CI u-95% CI Rhat Bulk_ESS Tail_ESS
sigma    20.89      2.67    16.50    26.95 1.00     2237     2976

Draws were sampled using sampling(NUTS). For each parameter, Bulk_ESS
and Tail_ESS are effective sample size measures, and Rhat is the potential
scale reduction factor on split chains (at convergence, Rhat = 1).
plot(fit)

2.3 これ LASSO で良いかもしれない

全ての変数を入れても3割しか説明できないが,2割(うち半分以上)はこれで説明できる:

\[ 25+10\times\text{心理的な仕事の負担\_量}+7\times\text{抑うつ感}-5\times\text{職場環境によるストレス} \] \[ -4\times\text{仕事のコントロール度}-4\times\text{同僚からのサポート} \]

library(glmnet)
y <- df_short$スコア
x <- df_short[, !names(df_short) %in% "スコア"]
fit <- glmnet(x, y)
plot(fit)

print(fit)

Call:  glmnet(x = x, y = y) 

   Df  %Dev Lambda
1   0  0.00 4.7150
2   1  0.98 4.2970
3   2  2.83 3.9150
4   2  4.44 3.5670
5   2  5.78 3.2500
6   3  7.18 2.9610
7   4  8.94 2.6980
8   5 11.18 2.4590
9   6 14.07 2.2400
10  7 16.76 2.0410
11  7 19.22 1.8600
12  7 21.25 1.6950
13  7 22.94 1.5440
14  7 24.34 1.4070
15  7 25.51 1.2820
16  7 26.48 1.1680
17  9 27.28 1.0640
18  9 27.99 0.9697
19 10 28.58 0.8836
20 10 29.13 0.8051
21 11 29.69 0.7336
22 12 30.20 0.6684
23 12 30.65 0.6090
24 12 31.02 0.5549
25 13 31.35 0.5056
26 13 31.63 0.4607
27 13 31.86 0.4198
28 13 32.06 0.3825
29 13 32.21 0.3485
30 14 32.37 0.3175
31 14 32.49 0.2893
32 15 32.60 0.2636
33 15 32.69 0.2402
34 17 32.79 0.2189
35 17 32.89 0.1994
36 17 32.97 0.1817
37 17 33.03 0.1656
38 17 33.09 0.1509
39 17 33.13 0.1375
40 17 33.17 0.1252
41 18 33.20 0.1141
42 18 33.24 0.1040
43 19 33.26 0.0947
44 19 33.29 0.0863
45 19 33.32 0.0787
46 19 33.34 0.0717
47 19 33.36 0.0653
48 19 33.38 0.0595
49 19 33.39 0.0542
50 19 33.40 0.0494
51 19 33.41 0.0450
52 19 33.42 0.0410
53 19 33.42 0.0374
54 19 33.43 0.0340
55 19 33.43 0.0310
56 19 33.43 0.0283
57 19 33.44 0.0258
58 19 33.44 0.0235
59 19 33.44 0.0214
60 19 33.44 0.0195
61 19 33.44 0.0177
62 19 33.45 0.0162
63 19 33.45 0.0147
64 19 33.45 0.0134
65 19 33.45 0.0122
66 19 33.45 0.0112
67 19 33.45 0.0102
68 19 33.45 0.0093
69 19 33.45 0.0084
70 19 33.45 0.0077
71 19 33.45 0.0070
  1. 職場環境によるストレス(ー)
  2. 心理的な仕事の負担_量(+)
  3. 抑うつ感(+)
  4. 仕事のコントロール度(ー)
  5. 同僚からのサポート(ー)
  6. 働きがい(+)
  7. 不安感(ー)
coef(fit, s = 4.3)
20 x 1 sparse Matrix of class "dgCMatrix"
                                   s1
(Intercept)                40.0697796
心理的な仕事の負担_質       .        
心理的な仕事の負担_量       .        
自覚的な身体的負担度        .        
職場の対人関係でのストレス  .        
職場環境によるストレス     -0.4040551
仕事のコントロール度        .        
技能の活用度                .        
仕事の適性度                .        
働きがい                    .        
活気                        .        
イライラ感                  .        
疲労感                      .        
不安感                      .        
抑うつ感                    .        
身体愁訴                    .        
上司からのサポート          .        
同僚からのサポート          .        
家族と友人からのサポート    .        
仕事や生活の満足度          .        
coef(fit, s = 3.5)
20 x 1 sparse Matrix of class "dgCMatrix"
                                  s1
(Intercept)                38.621965
心理的な仕事の負担_質       .       
心理的な仕事の負担_量       1.254752
自覚的な身体的負担度        .       
職場の対人関係でのストレス  .       
職場環境によるストレス     -1.326897
仕事のコントロール度        .       
技能の活用度                .       
仕事の適性度                .       
働きがい                    .       
活気                        .       
イライラ感                  .       
疲労感                      .       
不安感                      .       
抑うつ感                    .       
身体愁訴                    .       
上司からのサポート          .       
同僚からのサポート          .       
家族と友人からのサポート    .       
仕事や生活の満足度          .       
coef(fit, s = 3.2)
20 x 1 sparse Matrix of class "dgCMatrix"
                                    s1
(Intercept)                37.95481457
心理的な仕事の負担_質       .         
心理的な仕事の負担_量       1.74713025
自覚的な身体的負担度        .         
職場の対人関係でのストレス  .         
職場環境によるストレス     -1.68159031
仕事のコントロール度        .         
技能の活用度                .         
仕事の適性度                .         
働きがい                    .         
活気                        .         
イライラ感                  .         
疲労感                      .         
不安感                      .         
抑うつ感                    0.02159717
身体愁訴                    .         
上司からのサポート          .         
同僚からのサポート          .         
家族と友人からのサポート    .         
仕事や生活の満足度          .         
coef(fit, s = 2.9)
20 x 1 sparse Matrix of class "dgCMatrix"
                                    s1
(Intercept)                36.79685743
心理的な仕事の負担_質       .         
心理的な仕事の負担_量       2.26025109
自覚的な身体的負担度        .         
職場の対人関係でのストレス  .         
職場環境によるストレス     -2.08265631
仕事のコントロール度       -0.01088252
技能の活用度                .         
仕事の適性度                .         
働きがい                    .         
活気                        .         
イライラ感                  .         
疲労感                      .         
不安感                      .         
抑うつ感                    0.20825916
身体愁訴                    .         
上司からのサポート          .         
同僚からのサポート          .         
家族と友人からのサポート    .         
仕事や生活の満足度          .         
coef(fit, s = 2.5)
20 x 1 sparse Matrix of class "dgCMatrix"
                                    s1
(Intercept)                34.44886721
心理的な仕事の負担_質       .         
心理的な仕事の負担_量       3.11100519
自覚的な身体的負担度        .         
職場の対人関係でのストレス  .         
職場環境によるストレス     -2.64732213
仕事のコントロール度       -0.39913592
技能の活用度                .         
仕事の適性度                .         
働きがい                    .         
活気                        .         
イライラ感                  .         
疲労感                      .         
不安感                      .         
抑うつ感                    0.84612453
身体愁訴                    .         
上司からのサポート          .         
同僚からのサポート         -0.02970209
家族と友人からのサポート    .         
仕事や生活の満足度          .         
coef(fit, s = 2.2)
20 x 1 sparse Matrix of class "dgCMatrix"
                                   s1
(Intercept)                32.8651263
心理的な仕事の負担_質       .        
心理的な仕事の負担_量       3.9201708
自覚的な身体的負担度        .        
職場の対人関係でのストレス  .        
職場環境によるストレス     -2.8850679
仕事のコントロール度       -0.6681094
技能の活用度                .        
仕事の適性度                .        
働きがい                    0.0294705
活気                        .        
イライラ感                  .        
疲労感                      .        
不安感                     -0.5223057
抑うつ感                    1.7934085
身体愁訴                    .        
上司からのサポート          .        
同僚からのサポート         -0.4738716
家族と友人からのサポート    .        
仕事や生活の満足度          .        
coef(fit, s = 2.0)
20 x 1 sparse Matrix of class "dgCMatrix"
                                   s1
(Intercept)                31.6329342
心理的な仕事の負担_質       .        
心理的な仕事の負担_量       4.4923163
自覚的な身体的負担度        .        
職場の対人関係でのストレス  .        
職場環境によるストレス     -3.0292994
仕事のコントロール度       -0.8153373
技能の活用度                .        
仕事の適性度                .        
働きがい                    0.2173602
活気                        .        
イライラ感                  .        
疲労感                      .        
不安感                     -1.0030051
抑うつ感                    2.4498852
身体愁訴                    .        
上司からのサポート          .        
同僚からのサポート         -0.8397849
家族と友人からのサポート    .        
仕事や生活の満足度          .        
coef(fit, s = 1.1)
20 x 1 sparse Matrix of class "dgCMatrix"
                                     s1
(Intercept)                25.402439698
心理的な仕事の負担_質       .          
心理的な仕事の負担_量       7.163348270
自覚的な身体的負担度        .          
職場の対人関係でのストレス  .          
職場環境によるストレス     -3.762904968
仕事のコントロール度       -1.586354739
技能の活用度                .          
仕事の適性度                .          
働きがい                    1.760512480
活気                        .          
イライラ感                  .          
疲労感                     -0.010687147
不安感                     -3.111804027
抑うつ感                    5.165054724
身体愁訴                   -0.003504387
上司からのサポート          .          
同僚からのサポート         -2.649852101
家族と友人からのサポート    .          
仕事や生活の満足度          .          
coef(fit, s = 1.0)
20 x 1 sparse Matrix of class "dgCMatrix"
                                    s1
(Intercept)                24.93745208
心理的な仕事の負担_質       .         
心理的な仕事の負担_量       7.43116938
自覚的な身体的負担度        .         
職場の対人関係でのストレス  .         
職場環境によるストレス     -3.84159566
仕事のコントロール度       -1.66675472
技能の活用度                .         
仕事の適性度                .         
働きがい                    1.94335455
活気                        .         
イライラ感                  .         
疲労感                     -0.10239212
不安感                     -3.32394496
抑うつ感                    5.48228332
身体愁訴                   -0.01193691
上司からのサポート          .         
同僚からのサポート         -2.84150386
家族と友人からのサポート    .         
仕事や生活の満足度          .         
coef(fit, s = 0.85)
20 x 1 sparse Matrix of class "dgCMatrix"
                                    s1
(Intercept)                24.38593274
心理的な仕事の負担_質       .         
心理的な仕事の負担_量       7.79823396
自覚的な身体的負担度        .         
職場の対人関係でのストレス  .         
職場環境によるストレス     -3.96992626
仕事のコントロール度       -1.76983997
技能の活用度                .         
仕事の適性度                .         
働きがい                    2.21242933
活気                        .         
イライラ感                  0.07565762
疲労感                     -0.32262016
不安感                     -3.64836717
抑うつ感                    5.96520047
身体愁訴                   -0.01876479
上司からのサポート          .         
同僚からのサポート         -3.12310203
家族と友人からのサポート    .         
仕事や生活の満足度          .         

2.3.1 5つの変数だけを入れて回帰してみる

fit <- brm(
  formula = スコア ~ 職場環境によるストレス + 心理的な仕事の負担_量 + 抑うつ感 + 仕事のコントロール度 + 同僚からのサポート,
  data = df_short,
  family = gaussian(),
  chains = 4,
  cores = 4
)
library(showtext)
# Googleフォントを使用する場合
font_add_google("Noto Sans JP", "notosans")
showtext_auto()  # 自動的にフォントを適用
plot(fit)

summary(fit)
 Family: gaussian 
  Links: mu = identity; sigma = identity 
Formula: スコア ~ 職場環境によるストレス + 心理的な仕事の負担_量 + 抑うつ感 + 仕事のコントロール度 + 同僚からのサポート 
   Data: df_short (Number of observations: 52) 
  Draws: 4 chains, each with iter = 2000; warmup = 1000; thin = 1;
         total post-warmup draws = 4000

Regression Coefficients:
                       Estimate Est.Error l-95% CI u-95% CI Rhat Bulk_ESS
Intercept                 24.09     15.55    -6.11    54.37 1.00     5172
職場環境によるストレス    -5.53      2.68   -10.73    -0.21 1.00     5250
心理的な仕事の負担_量      9.68      3.80     2.12    17.39 1.00     4733
抑うつ感                   6.90      2.84     1.26    12.32 1.00     3852
仕事のコントロール度      -4.04      2.99   -10.02     1.91 1.00     4249
同僚からのサポート        -4.60      3.30   -11.13     1.78 1.00     4272
                       Tail_ESS
Intercept                  3221
職場環境によるストレス     2936
心理的な仕事の負担_量      2848
抑うつ感                   2923
仕事のコントロール度       2998
同僚からのサポート         3054

Further Distributional Parameters:
      Estimate Est.Error l-95% CI u-95% CI Rhat Bulk_ESS Tail_ESS
sigma    18.36      1.95    15.12    22.81 1.00     4556     2800

Draws were sampled using sampling(NUTS). For each parameter, Bulk_ESS
and Tail_ESS are effective sample size measures, and Rhat is the potential
scale reduction factor on split chains (at convergence, Rhat = 1).