타자의 경기력 지표 그래프

한국프로야구 정규시즌의 타율 분포

줄기-잎 그림

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
  1    18 |   9             // 타율이 1할 8푼 9리인 선수 1명
       19 |
       20 |
  3    21 |   44            // 타율 214인 선수 2명, 총 빈도 = 3
  8    22 |   06789
 11    23 |   468
 16    24 |   01257
 25    25 |   111223388
 38    26 |   012223444779
 44    27 |   013478
(12)   28 |   014456677888
 54    29 |   22234457810
 44    30 |   235666688999
 32    31 |   02345556678
 21    32 |   1235699
 14    33 |   179
 11    34 |   13356
  6    35 |   66
  4    36 |   258
  1    37 |   0
  • 줄기-잎 그림 : 데이터 분포의 대략적 형태를 알기 위해 작성하는 그래프
  • 줄기(stem) : 그림의 중간 부분. 여기서는 타율의 앞 두자리(구간)를 의미한다.
  • 빈도 : 그림의 왼쪽 부분. 해당 타율 구간의 데이터 수(선수 수)를 의미한다.
  • 주의 : 빈도는 누적이다. 위 그래프에서 보면 21까지 3명의 선수(189, 214, 214)가 있기 때문에 3
  • 잎(leaf) : 그림의 오른쪽 부분. 타율의 가장 마지막 자리를 의미한다.

상자그림

  • 상자그림 : 다섯숫자요약이라고도 부른다.
  • 다섯숫자 : 최소값, 최대값, 중앙값, 제1사분위수, 제3사분위수
  • 이를 통해 연속형 데이터 분포를 그래프로 표현한다.
  • 중앙선 : 중앙값(median, 50% 지점)
  • 상자(box) : Q1 ~ Q3 범위 (중앙 50% 데이터)
  • 상자의 길이 : IQR (Q3 - Q1) = 퍼짐 정도
  • 위/아래의 막대(whisker) : 1.5 IQR 버위 내 최대, 최소값
  • 밖으로 튀어나온 점 : 이상치(outlier)

공격형 선수와 수비형 선수의 타율 비교

  • 공격형 선수 : 1루수, 3루수, 좌익수, 우익수, 지명타자
  • 수비형 선수 : 포수, 2루수, 유격수, 중견수
  • 공격형 선수의 타율의 중앙값과 상자의 범위가 더 높은 것을 볼 수 있다.

출루율과 장타력의 관계

  • 산점도 : 두 변수의 관련성의 방향과 정도를 파악할 수 있다.
  • 방향 : 두 변수 간 상관성이 양의 상관성인지 음의 상관성인지
  • 정도 : 얼마나 많이 집중되어있는지. 가장 집중되면 하나의 선으로 보이게 된다.
  • 전체적으로 출루율이 높아짐에 따라 장타력도 높아지는 경향이 있음을 볼 수 있다.

투수의 경기력 지표 그래프

WHIP 분포

줄기-잎 그림

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
n = 100

 1   10. | 9
 2   11* | 1
 4   11. | 68
 6   12* | 34
11   12. | 67889
22   13* | 01122334444
32   13. | 5566678899
41   14* | 011233444
(13) 14. | 5666778888899
46   15* | 02333
41   15. | 56667778899
30   16* | 002
27   16. | 5788
23   17* | 0111
19   17. | 57789
14   18* | 004
11   18. | 678
 8   19* | 1
 7   19. | 79
 5   20* | 2
 4   20. | 556

박스플롯

투수의 역할별 이닝당 주자허용률 분포

  • 마무리투수는 편차가 적으면서, 주자허용율이 낮은 것을 볼 수 있다.
  • 이는 이기는 경기를 지키기 위해 확실하게 주자허용을 막아야 하기 때문에, 경기력이 좋은 선수를 등용하기 때문이다.

Reference

통계로 세상 읽기 - 이긍희, 이기재, 장영재, 박서영, 한종대 공저
방송통신대 - 통계로 세상 읽기 강의

Comments