줄기-잎 그림
정의
- stem-leaf diagram
- 데이터 분포의 대략적 형태를 알기 위해 작성하는 그래프
해석
- 줄기(stem) : 그림의 중간 부분. 통계의 기준이 되는 값의 구간이 기재된다.
- 빈도 : 그림의 왼쪽 부분. 해당 값의 구간이 나타난 빈도를 누적하여 표기
- 주의 : 빈도는 누적이다.
- 잎(leaf) : 그림의 오른쪽 부분. 줄기 구간 가장 마지막 자리를 의미하며, 줄기와 잎을 합치면 실제적인 값이 된다.
예시
야구 타자의 타율 분포
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
| 1 18 | 9 // 타율이 1할 8푼 9리인 선수 1명
19 |
20 |
3 21 | 44 // 타율 214인 선수 2명, 총 빈도 = 3
8 22 | 06789
11 23 | 468
16 24 | 01257
25 25 | 111223388
38 26 | 012223444779
44 27 | 013478
(12) 28 | 014456677888
54 29 | 22234457810
44 30 | 235666688999
32 31 | 02345556678
21 32 | 1235699
14 33 | 179
11 34 | 13356
6 35 | 66
4 36 | 258
1 37 | 0
|
- 줄기(stem) : 그림의 중간 부분. 여기서는 타율의 앞 두자리(구간)를 의미한다.
- 빈도 : 그림의 왼쪽 부분. 해당 타율 구간의 데이터 수(선수 수)를 의미한다.
- 주의 : 빈도는 누적이다. 위 그래프에서 보면 21까지 3명의 선수(189, 214, 214)가 있기 때문에 3
- 잎(leaf) : 그림의 오른쪽 부분. 타율의 가장 마지막 자리를 의미한다.
야구 투수의 이닝당 주자허용률 분포
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
| n = 100
1 10. | 9
2 11* | 1
4 11. | 68
6 12* | 34
11 12. | 67889
22 13* | 01122334444
32 13. | 5566678899
41 14* | 011233444
(13) 14. | 5666778888899
46 15* | 02333
41 15. | 56667778899
30 16* | 002
27 16. | 5788
23 17* | 0111
19 17. | 57789
14 18* | 004
11 18. | 678
8 19* | 1
7 19. | 79
5 20* | 2
4 20. | 556
|
Reference
통계로 세상 읽기 - 이긍희, 이기재, 장영재, 박서영, 한종대 공저
방송통신대 - 통계로 세상 읽기 강의
Comments