타자의 경기력 지표 그래프
한국프로야구 정규시즌의 타율 분포
줄기-잎 그림
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
1 18 | 9 // 타율이 1할 8푼 9리인 선수 1명
19 |
20 |
3 21 | 44 // 타율 214인 선수 2명, 총 빈도 = 3
8 22 | 06789
11 23 | 468
16 24 | 01257
25 25 | 111223388
38 26 | 012223444779
44 27 | 013478
(12) 28 | 014456677888
54 29 | 22234457810
44 30 | 235666688999
32 31 | 02345556678
21 32 | 1235699
14 33 | 179
11 34 | 13356
6 35 | 66
4 36 | 258
1 37 | 0
- 줄기-잎 그림 : 데이터 분포의 대략적 형태를 알기 위해 작성하는 그래프
- 줄기(stem) : 그림의 중간 부분. 여기서는 타율의 앞 두자리(구간)를 의미한다.
- 빈도 : 그림의 왼쪽 부분. 해당 타율 구간의 데이터 수(선수 수)를 의미한다.
- 주의 : 빈도는 누적이다. 위 그래프에서 보면 21까지 3명의 선수(189, 214, 214)가 있기 때문에 3
- 잎(leaf) : 그림의 오른쪽 부분. 타율의 가장 마지막 자리를 의미한다.
상자그림

- 상자그림 : 다섯숫자요약이라고도 부른다.
- 다섯숫자 : 최소값, 최대값, 중앙값, 제1사분위수, 제3사분위수
- 이를 통해 연속형 데이터 분포를 그래프로 표현한다.
- 중앙선 : 중앙값(median, 50% 지점)
- 상자(box) : Q1 ~ Q3 범위 (중앙 50% 데이터)
- 상자의 길이 : IQR (Q3 - Q1) = 퍼짐 정도
- 위/아래의 막대(whisker) : 1.5 IQR 버위 내 최대, 최소값
- 밖으로 튀어나온 점 : 이상치(outlier)
공격형 선수와 수비형 선수의 타율 비교

- 공격형 선수 : 1루수, 3루수, 좌익수, 우익수, 지명타자
- 수비형 선수 : 포수, 2루수, 유격수, 중견수
- 공격형 선수의 타율의 중앙값과 상자의 범위가 더 높은 것을 볼 수 있다.
출루율과 장타력의 관계

- 산점도 : 두 변수의 관련성의 방향과 정도를 파악할 수 있다.
- 방향 : 두 변수 간 상관성이 양의 상관성인지 음의 상관성인지
- 정도 : 얼마나 많이 집중되어있는지. 가장 집중되면 하나의 선으로 보이게 된다.
- 전체적으로 출루율이 높아짐에 따라 장타력도 높아지는 경향이 있음을 볼 수 있다.
투수의 경기력 지표 그래프
WHIP 분포
줄기-잎 그림
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
n = 100
1 10. | 9
2 11* | 1
4 11. | 68
6 12* | 34
11 12. | 67889
22 13* | 01122334444
32 13. | 5566678899
41 14* | 011233444
(13) 14. | 5666778888899
46 15* | 02333
41 15. | 56667778899
30 16* | 002
27 16. | 5788
23 17* | 0111
19 17. | 57789
14 18* | 004
11 18. | 678
8 19* | 1
7 19. | 79
5 20* | 2
4 20. | 556
박스플롯

투수의 역할별 이닝당 주자허용률 분포

- 마무리투수는 편차가 적으면서, 주자허용율이 낮은 것을 볼 수 있다.
- 이는 이기는 경기를 지키기 위해 확실하게 주자허용을 막아야 하기 때문에, 경기력이 좋은 선수를 등용하기 때문이다.
Reference
통계로 세상 읽기 - 이긍희, 이기재, 장영재, 박서영, 한종대 공저
방송통신대 - 통계로 세상 읽기 강의
Comments