줄기-잎 그림

정의

  • stem-leaf diagram
  • 데이터 분포의 대략적 형태를 알기 위해 작성하는 그래프

해석

  • 줄기(stem) : 그림의 중간 부분. 통계의 기준이 되는 값의 구간이 기재된다.
  • 빈도 : 그림의 왼쪽 부분. 해당 값의 구간이 나타난 빈도를 누적하여 표기
  • 주의 : 빈도는 누적이다.
  • 잎(leaf) : 그림의 오른쪽 부분. 줄기 구간 가장 마지막 자리를 의미하며, 줄기와 잎을 합치면 실제적인 값이 된다.

예시

야구 타자의 타율 분포

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
  1    18 |   9             // 타율이 1할 8푼 9리인 선수 1명
       19 |
       20 |
  3    21 |   44            // 타율 214인 선수 2명, 총 빈도 = 3
  8    22 |   06789
 11    23 |   468
 16    24 |   01257
 25    25 |   111223388
 38    26 |   012223444779
 44    27 |   013478
(12)   28 |   014456677888
 54    29 |   22234457810
 44    30 |   235666688999
 32    31 |   02345556678
 21    32 |   1235699
 14    33 |   179
 11    34 |   13356
  6    35 |   66
  4    36 |   258
  1    37 |   0
  • 줄기(stem) : 그림의 중간 부분. 여기서는 타율의 앞 두자리(구간)를 의미한다.
  • 빈도 : 그림의 왼쪽 부분. 해당 타율 구간의 데이터 수(선수 수)를 의미한다.
  • 주의 : 빈도는 누적이다. 위 그래프에서 보면 21까지 3명의 선수(189, 214, 214)가 있기 때문에 3
  • 잎(leaf) : 그림의 오른쪽 부분. 타율의 가장 마지막 자리를 의미한다.

야구 투수의 이닝당 주자허용률 분포

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
n = 100

 1   10. | 9
 2   11* | 1
 4   11. | 68
 6   12* | 34
11   12. | 67889
22   13* | 01122334444
32   13. | 5566678899
41   14* | 011233444
(13) 14. | 5666778888899
46   15* | 02333
41   15. | 56667778899
30   16* | 002
27   16. | 5788
23   17* | 0111
19   17. | 57789
14   18* | 004
11   18. | 678
 8   19* | 1
 7   19. | 79
 5   20* | 2
 4   20. | 556

Reference

통계로 세상 읽기 - 이긍희, 이기재, 장영재, 박서영, 한종대 공저
방송통신대 - 통계로 세상 읽기 강의

Comments