◇ 경제 통계 디자인이란?경제통계디자인 개요추론과정가정경제 통계학계량 경제학시계열 분석경제통계디자인경제 통계 디자인은 정보의 종류에 따라 정보를 수치화 하거나 요약을 한다.1차 수치화는 기호화수량화를 통한 수치화를 하고 2차 수치화는 그 정보를 재가공 한다.정보를 요약할 때 : 수치적인 요약시각적인 요약( 수치적 요약은 평균과 표 등을 이용,시각적 요약은 그래프 등을 이용하여 데이터를 요약하고 설명)경제 통계학 : 단변량분석, 계량경제학 : 다변량분석경제통계디자인이 기술이라면 경제 통계학은 추론이다.계량경제학은 인과 관계를 설명한다.Cf) 단변량분석과 다변량분석단 변량 분석 : 변수가 하나라는 의미로 하나의 속성에 대해 분석하는 것.Ex) 평균, 비율, 분산다 변량 분석 : 여러 변수에 대해 여러 개의 종속 변수를 동시에 분석하는 것.Ex) 상관관계, 인과관계경제통계디자인 추론 과정속성 정보는 주관적인 사실이기 때문에 수치화 규칙을 통해 수치 정보를 객관적으로 정리한 후, 산술평균과 같은 요약 방식/공식을 이용해 요약 정보를 도출해낸다.요약정보가 실질적으로 모든 수치들을 반영할 수도 있고 반영하지 못 할 수 도 있다.이러한 사실을 도출해 낸 후 가정과 가능성을 수치화 하여 확률적 정보를 얻는다.그 후 관심 대상의 관심 특성에 대한 구간 추정 가설 검정을 통해 통계적 의사결정을 내리는데 이의 경우에 틀릴 가능성을 염두에 두고 진행해야 한다.◇ 정보의 종류명칭속성/수치 정보(사칙)연산 대상(주장)명제: 핵심메세지추정량공통중심경향이질 산포 정도명목변수범주형구분/분류∈, , =, ≠-(절대)빈도수(fi)-상대빈도수(pi)구분/분류 명제최(다 발생)빈값확률분포서수적대소/서열, ≤, ≥-(정렬)순위(i)-누적(합계)빈도수(Fi)대소/서열 명제(순위상) 중앙값범위 (사)분위수 간 범위실질변수기수적-절대적 수준 차이-절대적 수준 비율-상대적 차이 비율-비교치-기준치△-비교치/기준치 r-(비교치-기준치)/기준치r△횡단면 자료: 차이시계열 자료: 변동-(산술)평균값-(조화)평균포로 나타낸다. 서수적 정보는 사분위수 간 범위로 나타내고, 기수적 정보는 사칙연산을 이용해서 분산, 편차 등을 이용해 이질 산포 정도를 나타낸다.범주형 정보수치 정보의 숫자는 속성 정보를 단순히 기호화 한 것이기 때문에 기수적, 서수적 정보로 착각해선 안 된다.범주형 정보를 산술평균 공식으로 나타낸 값은 무의미하다.부분 된 정보만 알 수 있고 정보의 나열 순서에 어떠한 영향도 주지 않는다.추정량 : 정보를 단순히 분류하기 때문에 최빈값(가장 큰 빈도수를 가진 관측치)을 이용하고 이질 산포 정도도 역시 대상을 단순히 분류만 하기 때문에 확률분포로 나타낸다.Ex)나의 중간고사까지 평가점수는 A+로 분류된다.우리 회사의 신용등급은 가장 낮은 단계인 D등급에 해당한다.1월 휘발류 가격은 유가관리 5단계 중 위험단계에 진입하였다.나의 혈액형은 A형이다.서수적 정보각 속성 비율에 대해 자세히 알 수는 없지만 대소/서열에 대한 파악이 가능하다.서수적 정보 역시 산술평균을 이용하여 나타낸 값은 무의미하고 범주형 정보와의 차이점으로 서수적 정보의 경우 순서를 파악할 수 있다.추정량 : 속성정보에 순서의 의미도 담겨져 있기에 최빈값으로 추정량을 나타내는 것은문제가 있다. 따라서 서수적 정보는 공통중심경향을 파악할 때는 중앙값을 이용하고 이질 산포 정도를 파악할 때는 사분위수 간 범위(중간에 위치한 50%의 관측치들이 흩어져 있는 정도를 측정)로 나타낸다.+ ) 사분위수간 범위가 크다는 것은 변동성이 크다는 것을 의미함.Ex)우리 회사의 판매 수익율은 5위를 기록했다.6개 백화점의 이직률(순위)는 거의 같다.올해 A상품의 판매가 B와 C 상품의 판매보다 많았다.우리 나라 FIFA 랭킹은 60위이다.기수적 정보관측값 자체에 의미가 존재한다.또 ‘A는 B보다 몇 배 크다.’와 같은 정보를 파악 할 수 있다.추정량 : 공통 중심 경향을 파악하고자 할 때는 (산술,조화,기하) 평균값을 이용하여 추정량을 나타내고 이질 산포 정도를 구하고자 할 때에는 분산과 표준편차로 나타낸다.Ex)지역한 것이기 때문에명목 변수이고 기수형은 실질적인 변수이다.정보종류의 벤다이어그램기수형서수적범주형원 정보가 범주형 정보인 경우 그 정보를 서수적, 기수적으로 수치정보를 나타낼 수는 없다.서수적 정보는 범주형 정보를 포함하고 있기 때문에 범주형 정보로 수치정보를 구할 수 있지만 기수적 정보는 구할 수 없다.기수적 정보의 경우 가장 상위의 정보이기 때문에 범주형 정보나 서수적 정보 그리고 기수적 정보로 모두 수치 정보를 구할 수 있다.∴ 범주형 ⊂ 서수적 ⊂ 기수적□ 시계열 자료와 횡단면 자료시계열 자료 : 속성과 관계없이 대상 자체가 서수적, 기수적 성격을 가지고 있으며‘t=1,2,3 …t’라고 표현한다.횡단면 자료 : 대상이 범주형 성격만 지니고 있으며 순서는 무의미 하다. ‘i=1,2,3 …N’이라고 표현한다.속성/수치정보(사칙)연산대상핵심 메세지횡단면 자료차이(Difference)시계열 자료변동(Change)절대적 수준비교치-기준치△차이폭 (-))변화폭 (-) )상대적 차이비교치/기준치 r(수준간)배율 ()(전후)배율 ()상대적 비율(비교치-기준치)/기준치r△차이율 ()변화율 ()횡단면 자료와 시계열 자료는 ‘보여주는 메시지가 다르다.’는 차이점 존재한다.절대적 수준을 비교하기 위해서는 ‘비교치-기준치’를 파악하면 된다.이는 기호로 △(delta)라고 나타내고 횡단면 자료에서는 ‘차이폭’, 시계열 자료에서는 ‘변화폭’이라고 부른다다.상대적 차이를 나타낼 때는 절대적인 숫자가 아니라 ‘ ‘를 통해 파악한다.기호로는 r(ratio)라고 한다.상대적 비율을 나타낼 때 에는 ‘ ‘를 통해 파악한다.기호로는 r△인데 여기서 r이 의미하는 것은 ratio가 아니라 relative이다.Ex 1) 범주형 자료< 횡단면 자료 >대상속성(성별)수치 정보(남=1,여=0)철수남1명희여0칠수남1우리가 궁금한 속성 정보는 성별으로 속성정보 자체가 대상으로 분류, 구분되어 있다.남자는 1, 여자는 0이라는 규칙을 통한 수치화를 한다. 따라서 수치 정보의 0과 1의 차이는 단순히 성별의 궁금한 속성 정보는 통계학에 대한 선호도이다. 선호도에서 혐오를 선택하면 -1, 보통을 선택하면 0 그리고 선호를 선택하면 +1이라는 동일한 규칙을 적용하여 수치화를 했다. 서수적 정보의 수치화 결과를 보면 선호도의 순서를 알 수 있다. 그러므로 수치화를 하고 나서 순서를 정렬해야 한다.< 시계열 자료 >대상속성(체감 물가)수치 정보2000비쌈352005그저 그렇다36~742010쌈75체감 물가에 따라 정보를 분류하고 수치화 규칙을 통해 수치 정보를 얻는다.Ex 3.) 기수적 자료< 횡단면 자료 >대상속성(키)수치 정보철수155cm15.5명희160cm16.0칠수165cm16.5키는 양적으로 존재하는 값이다. 수치화 방법으로 관측값을 그대로 사용하거나 단위를 바꾸는 방법이 있다. 위 정보를 통해 세 명의 키가 다르다는 정보와 키 순위에 대한 정보를 알 수 있다. 그리고 각각의 차이에 대해 알 수 있다.< 시계열 자료 >대상속성(물가)수치 정보1월100012월15001.53월20002.0◇(표/차트) 자료 해석 순서□ 주제 파악명제의 유형(정보의 유형)을 파악하기 위해서 주제를 파악해야 한다.표와 차트의 제목을 먼저 보고 X축과 Y축의 내용이 무엇인지 파악한 후 단위와 주석을 참고한다.그 후 정보의 대소서열이나 방향과 경향을 파악한다.가장 먼저 비교기준이 무엇인지 파악해야 하는데, 대상의 비교기준을 파악할 때는 속성치의 비율로 구성비중()을, 시점과 관련하여 파악할 때에는 변화의 추세를 강조하기 위해 전기()와 대비하여 비교한다. 그리고 범위와 대표 값을 통해 주장하는 내용을 파악한다.□ 전체(적) 경향 파악횡단면 자료()시계열 자료()①비교 기준 확인(기준치)== ()(전기대비)②대소 서열 확인항목간 순위/차이시점간 증감/변화③Data 범위 (최대/최소)확인특이점, 비 대칭성먼저 비교기준을 확인한다. 기준치와 비교치를 확인해야 대소 서열(항목간 순위/차이나 시점간 증감/변화)을 파악 할 수 있다.횡단면 자료의 경우 대상이 범주형 성격만 지니고 있기 때문에 항목*************990시계열 자료 전기 대비년분기월주일전기전 년전 분기전 월전 주전 월전년동기X전년 동 분기전년 동 월전년 전 주전년 전 월: 전년동기와 비교하려고 할 때 해의 경우에는 시간이 지나면 돌아오지 않기 때문에 전년 동기에 전 년 전 해는 불가능하다.□ 세부 정량 정보 계산대소/증감을 먼저 파악한 후 대상을 비교한다. 그리고 계산을 통해 원하는 값을 얻는다.방향/서열폭(차이) : 수준 간 차이 -비율 : 수준 간 비율대소 방향을 파악하기 위해 어림산을 사용한다. 어림산을 통해 더 빠른 결과를 도출 할 수 있다.Ex 1 ) 45 + 62 + 53 + 34 vs. 34 + 50 + 63 + 5045+ 62+53+34 vs. 50+ 63 + 50 + 343 vs. 5+13 < 5+1∴ 45 + 62 + 53 + 34 < 34 + 50 + 63 + 50Ex 2 ) 72 + 85 + 42 + 23 vs. 27 + 77 + 80 + 4142 + 72 + 85 vs. 27 + 41 + 77 + 801 + 5 vs. 4 + 56 vs. 9∴ 72 + 85 + 42 + 23 < 27 + 77 + 80 + 41대소 서열이 핵심 메시지 이기 때문에 연산이 아니라 속산을 하는 것이 더 효율적이다. 속산을 하기 위해 비슷한 수끼리 재정렬을 하고 한 숫자씩 비교하여 속산하면 빠른 시간 안에 대소 구분이 가능하다.◇ 대소 서열의 방향 (차이- 횡단면자료 /변화 - 시계열자료)a+b vs. c+d / a-b vs. c-da+b vs. c+d(결과)a-b vs. c-d(결과)a+b-x vs. c+d-x (조건)a-b-x vs. c-d-x (조건)Ex) if, x = b,a+b b < c+d-ba < c+d-bb을 이항하면a+b < c+d∴ a+b < c+dEx) if, x = - b,a-b (-b) < c-d-(-b)a-b + b < c-d+ba < c-d+bb을 이항하면a-b < c-d∴ a-b < c-da > b△ (+/-)r()If, a-b > 0b를 오른쪽으로 이항 G
목 차□ 경제통계디자인 개요□ 정보의 종류○ 기수적 자료○ 서수적 자료○ 범주형 자료○정보종류의 벤 다이어그램□ 모집단과 표본집단□ 시계열 자료와 횡단면 자료◇ (표/차트) 자료 해석 순서□ 주제 파악□ 전체(적) 경향 파악□ 세부 정량 정보 계산◇ 수 읽기□ 양수 읽기□ 분수 읽기□ 단위 읽기◇ 수치 연산□ 수의 사칙연산□ 공(통) 약수/배수□ 지수의 사칙연산□ 함수의 사칙연산□ 분수 법칙◇ 대소/서열의 방향□ 덧셈 비교□ 뺄셈 비교□ 곱셈 비교□ 분수 비교□ 증감 최대/최소Question or Commentary□ 경제통계디자인 개요추론과정가정경제 통계학계량 경제학시계열 분석경제통계디자인경제 통계 디자인은 정보의 종류에 따라 정보를 수치화 하거나 요약을 한다. 정보를 수치화 할 때에는 1차적으로는 기호화 수량화를 통한 수치화를 하고 2차적으로 그 정보를 가공하는 과정을 거친다. 정보를 요약할 때에는 수치적인 요약과 시각적인 요약으로 나뉘는데 수치적 요약은 평균과 표 등을 이용하고 시각적인 요약은 그래프 등을 이용하여 데이터를 요약하고 설명한다.경제 통계학은 단변량분석을, 계량경제학은 다변량분석을 한다.경제통계디자인이 기술이라면 경제 통계학은 추론이다. 계량경제학은 인과 관계를 말해준다.Cf) 단변량분석과 다변량분석- 단 변량 분석 : 변수가 하나라는 의미로 하나의 속성에 대해 분석하는 것이다.예를 들면, 평균, 비율, 분산이 있다.- 다 변량 분석 : 여러 변수에 대해 여러 개의 종속 변수를 동시에 분석하는 것이다.예를 들면, 상관관계, 인과관계를 나타낸다.○ 경제통계디자인 추론 과정- 속성 정보는 주관적인 사실이기 때문에 수치화 규칙을 통해 수치 정보를 객관적으로 정리한 후,산술평균과 같은 요약 방식/공식을 이용해 요약 정보를 도출해낸다. 요약정보가 실질적으로 모든 수치들을 반영할 수도 있고 반영하지 못 할 수 도 있다. 이러한 사실을 도출해 낸 후 가정과 가능성을 수치화 하여 확률적 정보를 얻는다. 그 후 관심 대상의 관심 특성에 대한 구간 추정 가설 은 무의미하다. 범주형 정보의 경우 부분 된 정보만 알 수 있고 정보의 나열 순서에 어떠한 영향도 주지 않는다.추정량 : 정보를 단순히 분류하기 때문에 최빈값을 이용하는데 최빈값은 가장 큰 빈도수를 가진 관측치이다. 이질 산포 정도 역시 마찬가지다. 대상을 단순히 분류만 하기 때문에 확률분포로 나타낸다.Ex)- 나의 중간고사까지 평가점수는 A+로 분류된다.- 우리 회사의 신용등급은 가장 낮은 단계인 D등급에 해당한다.- 1월 휘발류 가격은 유가관리 5단계 중 위험단계에 진입하였다.- 나의 혈액형은 A형이다.○ 서수적 정보각 속성 비율에 대해 자세히 알 수는 없지만 대소/서열에 대한 파악이 가능하다. 서수적 정보 역시 산술평균을 이용하여 나타낸 값은 무의미하다. 범주형 정보와의 차이점으로 서수적 정보의 경우 순서를 파악할 수 있다.추정량 : 속성정보가 순서도 나타내기 때문에 최빈값으로 추정량을 나타내는 것은 문제가 있다. 따라서 서수적 정보는 공통중심경향을 파악할 때는 중앙값을 이용하고 이질 산포 정도를 파악할 때에는 사분위수 간 범위로 나타낸다. 사분위수간 범위는 중간에 위치한 50%의 관측치들이 흩어져 있는 정도를 측정한다. 사분위수간 범위가 크다는 것은 변동성이 크다는 것을 의미한다.Ex)- 우리 회사의 판매 수익율은 5위를 기록했다.- 6개 백화점의 이직률(순위)는 거의 같다.- 올해 A상품의 판매가 B와 C 상품의 판매보다 많았다.- 우리 나라 FIFA 랭킹은 60위이다.기수적 정보관측값 자체에 의미가 존재한다. 또 ‘A는 B보다 몇 배 크다.’와 같은 정보를 파악 할 수 있다.추정량 : 공통 중심 경향을 파악하고자 할 때는 (산술,조화,기하) 평균값을 이용하여 추정량을 나타내고 이질 산포 정도를 구하고자 할 때에는 분산과 표준편차로 나타난다.Ex)- 지역 평균에 비해, C지역의 실업률이 5% 높다.- 평년에 비해, 올해 수출액이 10% 낮다.- 국내 강물 오염도와 비교하여 ‘A강’의 오염도가 7% 높다.- 매출액은 1월 이후 꾸준히 증가했다.∴ 서수적차(Ui)잔차)상대적 빈도수실제 (발생) (==Pi )관측 fi (= )모집단은 N, 표본집단은 n으로 나타낸다. 모집단의 경우는 모든 수를 대상으로 하고 있지만 표본집단은 일정 부분을 떼어내서 파악한다고 생각하면 된다. 따라서 모집단의 수는 실제치를 나타내지만 표본집단은 관측한 부분의 관측값을 나타낸다.□ 시계열 자료와 횡단면 자료○ 시계열 자료 : 속성과 관계없이 대상 자체가 서수적, 기수적 성격을 가지고 있으며‘t=1,2,3 …t’라고 표현한다.○ 횡단면 자료 : 대상이 범주형 성격만 지니고 있으며 순서는 무의미 하다. ‘i=1,2,3 …N’이라고표현한다.Ex 1.) 범주형 자료< 횡단면 자료 >대상속성(성별)수치 정보(남=1,여=0)철수남1명희여0칠수남1우리가 궁금한 속성 정보는 성별으로 속성정보 자체가 대상으로 분류, 구분되어 있다. 남자는 1, 여자는 0이라는 규칙을 통한 수치화를 한다. 따라서 수치 정보의 0과 1의 차이는 단순히 성별의 차이일 뿐이다.< 시계열 자료>대상속성(경제상황)수치 정보2000불황0.72005호황1.52010불황0.7경제상황에 대해 시간의 순서에 따라 조사를 했다.조사를 한 후 불황일 경우 0.7, 호황일 경우 1.5라고 수치화 규칙을 통한 수치정보를 구한다.Ex 2.) 서수적 자료< 횡단면 자료 >대상속성(선호도)수치 정보철수혐오-1명희보통0칠수선호+1우리가 궁금한 속성 정보는 통계학에 대한 선호도이다. 선호도에서 혐오를 선택하면 -1, 보통을 선택하면 0 그리고 선호를 선택하면 +1이라는 동일한 규칙을 적용하여 수치화를 했다. 서수적 정보의 수치화 결과를 보면 선호도의 순서를 알 수 있다. 그러므로 수치화를 하고 나서 순서를 정렬해야 한다.< 시계열 자료 >대상속성(체감 물가)수치 정보2000비쌈352005그저 그렇다36~742010쌈75체감 물가에 따라 정보를 분류하고 수치화 규칙을 통해 수치 정보를 얻는다.Ex 3.) 기수적 자료< 횡단면 자료 >대상속성(키)수치 정보철수155cm15.5명희160cm16.0칠수165횡단면 자료는 ‘차이폭’이라고 하고 시계열 자료에서는 ‘변화폭’이라고 한다.상대적 차이를 나타낼 때는 절대적인 숫자가 아니라 ‘ ‘를 통해 파악한다. 기호로는 r(ratio)라고 한다.상대적 비율을 나타낼 때 에는 ‘ ‘를 통해 파악한다. 기호로는 r△인데 여기서 r이 의미하는 것은 ratio가 아니라 relative이다.◇(표/차트) 자료 해석 순서□ 주제 파악- 명제의 유형(정보의 유형)을 파악하기 위해서 주제를 파악해야 한다. 표와 차트의 제목을 먼저 보고 X축과 Y축의 내용이 무엇인지 파악한 후 단위와 주석을 참고한다. 그 후 정보의 대소서열이나 방향과 경향을 파악한다. 가장 먼저 비교기준이 무엇인지 파악해야 한다. 대상의 비교기준을 파악할 때는 속성치의 비율로 구성비중()을, 시점과 관련하여 파악할 때에는 변화의 추세를 강조하기 위해 전기()와 대비하여 비교한다. 그리고 범위와 대표 값을 통해 주장하는 내용을 파악한다.□ 전체(적) 경향 파악횡단면 자료()시계열 자료()①비교 기준 확인(기준치)== ()(전기대비)②대소 서열 확인항목간 순위/차이시점간 증감/변화③Data 범위 (최대/최소)확인특이점, 비 대칭성먼저 비교기준을 확인한다. 기준치와 비교치를 확인해야 대소 서열(항목간 순위/차이나 시점간 증감/변화)을 파악 할 수 있다. 횡단면 자료의 경우 대상이 범주형 성격만 지니고 있기 때문에 항목간 순위/차이의 정보만 파악이 가능하지만 시계열 자료의 경우 속성과 관계없이 대상 자체가 서수적, 기수적 성격을 가지고 있기 때문에 시점간 증감/변화의 파악이 가능하다.횡단면 자료는 기준 대상에 대비하여 차이를 파악하고 시계열 자료는 기준 시점에 대비하여 변동을 파악한다.를 기준치로 두는 이유는 변화율을 더 명확히 파악하기 위해서이다.Ex)관심치기준치*************990시계열 자료 전기 대비년분기월주일전기전 년전 분기전 월전 주전 월전년동기X전년 동 분기전년 동 월전년 전 주전년 전 월: 전년동기와 비교하려고 할 때 해의 경우에는 시간이 지나면 돌아오3 + 34 < 34 + 50 + 63 + 50Ex 2 ) 72 + 85 + 42 + 23 vs. 27 + 77 + 80 + 4142 + 72 + 85 vs. 27 + 41 + 77 + 801 + 5 vs. 4 + 56 vs. 9∴ 72 + 85 + 42 + 23 < 27 + 77 + 80 + 41대소 서열이 핵심 메시지 이기 때문에 연산이 아니라 속산을 하는 것이 더 효율적이다. 속산을 하기 위해 비슷한 수끼리 재정렬을 하고 한 숫자씩 비교하여 속산하면 빠른 시간 안에 대소 구분이 가능하다.◇ 수 읽기□ 양수 읽기천 단위()십 단위()표시법(1.00E+n)미국식(Short scale)한국어읽기11E+0One일101E+1Ten십1001E+2Hundred백1E+3Thousand천1E+6Million백만1E+9Billion십억1E+12Trillion조1E+15Quadrillion천조1E+18Quintillion백경1E+21Sextillion십해1E+24Septillion자□ 분수 읽기천 단위()십 단위()표시법(1.00E-n)미국식(Short scale)한국어읽기1E-0One일 분의1E-1Tenth십 분의1E-2Hundredth백 분의1E-3Thousandth천 분의1E-6Millionth백만 분의1E-9Billionth십억 분의1E-12Trillionth조 분의1E-15Quadrillionth천조 분의1E-18Quintillionth백경 분의1E-21Sextillionth십해 분의1E-24Septillionth자 분의□ 단위 읽기무게mg(Milli)g(Gram)kg(Kilo)mg = 1g1g= 1g1mgg = 1mgkg = 1mgkg1kg: 1g은 1000mg, kg과 같다.: 1mg은 g,kg과 같다.: 1kg은 1000000g, 1000g과 같다.부피mL(Milli Liter)L (Liter)KL(Kilo Liter)= 1L1L= 1L1mLL=1 mL= 1mLmL = 1KLL = 1KL1KL: 1L는 1000mL, kL과 같다.: 1ml는 L,KL와 같다.:셈이다.