Fundamental Notes/EDA

[EDA] 첫번째 과제

콩콩댕 2009. 3. 18. 13:04
반응형

[탐색적 자료분석 HW1]
1. (연습문제 2장 1번)
1958년 Heckman과 Lubeck는 알파 퍼세이(Alpha Persei)라는 별 근처에 있는 작은 별들의
주행속도를 관측하였다. 데이터는 다음과 같다(단위: km/sec).
50.0 -2.4 1.0 -0.5 2.2 -11.8 -11.9
-36.1 10.0 3.7 -15.9 -4.1 -19.1 -16.2
-7.0 7.0 -9.5 2.0 -3.0 -22.1 -10.8
2.2 0.0 -8.4 5.0 3.2 -9.1 -6.0
-2.8 -1.0 0.5 4.4 -4.4 -17.2 -23.9
3.0 -0.7 2.2 1.6 -0.3 12.8 -8.2
24.7 15.9 18.0 6.0 14.5 -10.5 -13.6
4.8 9.0 -17.5 5.9 -18.4 -17.2 -4.4
15.9 -25.7 (n=58)
1) 줄기 잎 그림
2) 자료가 어떤 모양의 분포인지 간략히 설명하시오(5줄 내외).
3) 다섯 수치 요약
(사분위수 계산은 depth를 계산하여 역 추적하는 방법으로)
4) 상자그림
5) 문자값전시를 통하여 왜도, 첨도를 구하시오.
6) mid, spr의 추이와 5)에서 구한 왜도, 첨도를 이용하여 자료의 분포를 개략적으로 설명
하시오.
2. 다음 t-분포표를 이용하여 문자값 전시를 하고 분포의 특징(왜도, 첨도, mid와 spr의 추이
를 이용)을 각각 설명하시오. 또한 가 증가함에 따라 정규분포에 근사하는 것을 보이시
오.
예)   의 문자값 전시
문자값 mid spr
M 0 0 -
H -0.727 0.727 0 1.454
E -1.1015 1.1015 0 2.203
D -1.7455 1.7455 0 3.491
(정확한 값을 구할 수 없는 경우, 인접값의 평균을 사용하세요)
예, E(8분위수)를 구하기 위하여 꼬리면적이 0.125(=1/8)인 값을 구하고 싶으나, 표
에 제시되어있지 않으므로 인접값이 0.1과 0.25에 해당하는 값인 1.476과 0.727의
평균(1.1015)을 사용.
1)   
2)   
3)   
4)   
5)   ∞
6)  의 증가에 따라 정규분포에 근사하는가? 근거를 제시하시오.
(Hint! : 정규분포 경우의 왜도, 첨도를 비교하시오.)
자 유 도

꼬리확률 
0.4 0.25 0.1 0.05 0.025 0.01 0.005 0.0025 0.001 0.0005
1 0.325 1.000 3.078 6.314 12.706 31.821 63.657 127.32 318.31 636.62
5 0.267 0.727 1.476 2.015 2.571 3.365 4.032 4.773 5.893 6.869
10 0.260 0.700 1.372 1.812 2.228 2.764 3.169 3.581 4.144 4.587
20 0.257 0.687 1.325 1.725 2.086 2.528 2.845 3.153 3.552 3.850
40 0.255 0.681 1.303 1.684 2.021 2.423 2.704 2.971 3.307 3.551
∞ 0.253 0.674 1.282 1.645 1.960 2.326 2.576 2.807 3.090 3.291
3. (연습문제 3장 2번)
다음은 1992년 12월 1일 상장 금융업 48사의 주가이다 (단위: 100원).
110 175 113 111 156 139 104
210 160 114 163 144 165 158
161 173 147 133 111 277 145
138 101 168 102 148 165 146
140 212 103 161 110 147 159
102 165 235 102 128 106 157
135 189 110 129 149 109 (n=48)
1) 줄기 잎 그림
2) 자료가 어떤 모양의 분포인지 간략히 설명하시오(5줄 내외).
3) 다섯 수치 요약
(사분위수 계산은 depth를 계산하여 역 추적하는 방법으로)
4) 상자그림
5) 문자값전시를 통하여 왜도, 첨도를 구하시오.
6) mid, spr의 추이와 5)에서 구한 왜도, 첨도를 이용하여 자료의 분포를 개략적으로 설명
하시오.

'Fundamental Notes > EDA' 카테고리의 다른 글

[EDA] 09. 03.31  (0) 2009.04.01
탐색적자료구조  (0) 2009.03.24
[EDA] 탐색적자료분석 - 과제  (0) 2009.03.17
[EDA] 09. 03. 10 - CH2 Stem-and leaf plot  (0) 2009.03.11
[EDA] 09. 03. 10 - CH1-3 그래프의 유용성  (0) 2009.03.11