세계 500대 부자 자산에도 파레토법칙이 적용될까??
20:80 법칙이라도고 하는 파레토법칙은 전체의 20%의 원인에 의해 전체의 80%결과가 나타나는 법칙을 말합니다. 상당히 많은 분야에 적용이 가능한 흥미로운 법칙입니다. 예를들면 "20%의 운전자가 80%의 교통위반을 한다" "20%의 범죄자가 80%의 범죄를 저지른다" "운동선수 20%가 상금80%를 받는다" 등이 있습니다.
이 법칙이 500대 부자의 재산에도 적용이 가능한지 궁금해졌습니다. 만약 적용이 가능하다면 500명 중 상위 20%가 전체 재산의 합의 80%를 가지고 있을 것입니다. 세계 500대 부자의 데이터는 블룸버그에서 제공하는 사이트에서 구할 수 있습니다.
블룸버그는 경제전문 뉴스를 제공하는 언론인데요. 세계에서 돈이 가장 많은 500명의 이름,재산,나라,사업분야를 보여주는 블룸버그 억만장자지수를 제공합니다. 매일 업데이트가 됩니다. 링크는 아래와 같습니다.
https://www.bloomberg.com/billionaires/
20200516일의 데이터를 다운받았습니다. 실제로는 499명입니다. 464명이 없더라구요.
R에서 그래프를 그렸습니다. (코드는 글 마지막 부분에 적어놓겠습니다.)
선형은 아니고 확실히 초반에 급감하는 구간이 있습니다. 감소 속도는 점점 느려집니다.
파레토법칙이 성립하는지 알아봅시다. 500명의 상위 20%는 100명입니다. 파레토 법칙(20:80법칙)이 성립한다면 상위 20%의 자산이 전체 자산의 80%를 차지해야 합니다. 전체자산의 합과, 상위 20% 자산의 합을 그래프로 그려보겠습니다.
상위 20%는 전체 부의 51.9% 를 갖고 있습니다. 파레토 법칙이 성립하지는 않네요.
데이터를 분석하다 보니 상위 1%는 전체 재산의 몇 퍼센트를 갖고 있는지, 상위 5%는 전체 재산의 몇 퍼센트를 갖고 있는지 등의 궁금증이 생겼습니다. 여기서 전체 재산은 500명의 재산입니다.
x축을 "상위 부터의 누적 인원(%)", "y축을 "전체 재산에서 차지하는 비율(%)"로 하는 그래프를 그려보았습니다. 예를들어 x축 1에 해당되는 값은 상위 1%가 전체 재산의 몇 %를 차지하고 있는지를 보여줍니다.
위 표의 몇개의 점을 뽑으면 아래와 같습니다.
1% -> 8.7%
5% -> 27.2%
10% -> 38.2%
20% -> 52.0%
50% -> 76.8%
상위 5%가 500명 재산의 30%를, 상위 50%가 500명 재산의 80%정도를 갖고 있다고 볼 수 있습니다. 초고소득자들 구간에서는 부의 집중정도가 파레토 법칙의 기준보다 낮았기 떄문에 파레토 법칙이 성립하지 않았습니다.
사용한 코드와 데이터는 아래와 같습니다.
#데이터 불러오기
library(readxl)
data <- read_excel("경로",col_names = FALSE)
data=data.frame(data)
#결측치 제거
data=na.omit(data)
rownames(data)=NULL
#Number of row
nor=nrow(data)
#
for (i in 1:7)
{
assign(paste0("C",i),c(data[i+7,1]))
}
for (i in 1:(((nor-7)/7)-1) ){
C1=c(C1,data[8+7*i,1])
C2=c(C2,data[9+7*i,1])
C3=c(C3,data[10+7*i,1])
C4=c(C4,data[11+7*i,1])
C5=c(C5,data[12+7*i,1])
C6=c(C6,data[13+7*i,1])
C7=c(C7,data[14+7*i,1])
}
#소득 항 숫자로 만들기
C3_2=gsub("[\\$,]", "", C3)
C3_2=gsub("B", "", C3_2)
C3_2=as.numeric(C3_2)*(10^9)*1230/(10^12)
myd=data.frame(C1,C2,C3,C3_2,C4,C5,C6,C7)
View(myd)
#500명 자산 막대그래프
barplot(myd$C3_2,ylim=c(0,200),names=1:499)
title(main="세계 500대 부자 자산",cex.main=1.7
,xlab="순위",ylab="조",cex.lab=1.5)
#테두리 설정
box("figure", col="gray")
#전체 자산, 상위 20% 자산
all=round(sum(myd$C3_2[1:499]),0)
top20=round(sum(myd$C3_2[1:100]),0)
mybp=barplot(c(all,top20),ylim=c(0,8000),
names=c("전체 자산","상위 20% 자산"),cex.names=1.3)
title(main="전체 자산, 상위 20% 자산"
,cex.main=1.7,ylab="조",cex.lab=1.5)
text(x=mybp,y=c(all,top20),labels=c(all,top20),pos=3,col="black")
#테두리 설정
box("figure", col="gray")
C3_3=c()
for (i in 1:499)
{
C3_3[i]=sum(C3_2[1:i])/sum(C3_2)*100
}
#누적인원에 대한 누적자산비율 그래프
plot(round((1:499)/499*100,0),C3_3,'h',ann=FALSE)
title(main="누적 자산 비율 그래프",cex.main=1.7
,xlab="누적 인원%",ylab="누적 자산 비율%",cex.lab=1.5)
#테두리 설정
box("figure", col="gray")
View(data.frame(X=round((1:499)/499*100,1),Y=C3_3))
'@ 통계 교양 > 통계로 세상보기' 카테고리의 다른 글
병 진단과 조건부확률 (양성이 나왔을 때 병에 걸려있을 확률) (0) | 2021.08.25 |
---|---|
물가상승률은 어떻게 계산되는걸까? (물가상승률과 물가지수) (0) | 2021.03.01 |
나라별 국가채무 확인하는 방법(IMF 홈페이지) (0) | 2021.02.28 |
대학 학과 별 입학자 수 확인하는 방법 (0) | 2020.07.04 |
우리나라는 어느 연령의 인구 수가 가장 많을까? (2) | 2020.05.12 |
세계 인구가 '현재' 몇명인시 실시간으로 알려주는 사이트 (0) | 2020.05.11 |
한국인 6000명의 키와 몸무게는 정규분포 모양일까?? (0) | 2020.05.09 |
유소년층 인구는 얼마나 줄어들고 있을까 (주민등록 인구통계) (0) | 2020.01.23 |
댓글