본문 바로가기
@ 통계 교양/통계로 세상보기

세계 500대 부자 자산에도 파레토법칙이 적용될까??

by bigpicture 2020. 5. 14.
반응형

세계 500대 부자 자산에도 파레토법칙이 적용될까??


20:80 법칙이라도고 하는 파레토법칙은 전체의 20%의 원인에 의해 전체의 80%결과가 나타나는 법칙을 말합니다. 상당히 많은 분야에 적용이 가능한 흥미로운 법칙입니다. 예를들면 "20%의 운전자가 80%의 교통위반을 한다" "20%의 범죄자가 80%의 범죄를 저지른다" "운동선수 20%가 상금80%를 받는다" 등이 있습니다. 


이 법칙이 500대 부자의 재산에도 적용이 가능한지 궁금해졌습니다. 만약 적용이 가능하다면 500명 중 상위 20%가 전체 재산의 합의 80%를 가지고 있을 것입니다. 세계 500대 부자의 데이터는 블룸버그에서 제공하는 사이트에서 구할 수 있습니다. 


블룸버그는 경제전문 뉴스를 제공하는 언론인데요. 세계에서 돈이 가장 많은 500명의 이름,재산,나라,사업분야를 보여주는 블룸버그 억만장자지수를 제공합니다. 매일 업데이트가 됩니다. 링크는 아래와 같습니다. 


https://www.bloomberg.com/billionaires/


20200516일의 데이터를 다운받았습니다. 실제로는 499명입니다. 464명이 없더라구요. 


R에서 그래프를 그렸습니다. (코드는 글 마지막 부분에 적어놓겠습니다.)


선형은 아니고 확실히 초반에 급감하는 구간이 있습니다. 감소 속도는 점점 느려집니다. 


파레토법칙이 성립하는지 알아봅시다. 500명의 상위 20%는 100명입니다. 파레토 법칙(20:80법칙)이 성립한다면 상위 20%의 자산이 전체 자산의 80%를 차지해야 합니다. 전체자산의 합과, 상위 20% 자산의 합을 그래프로 그려보겠습니다. 




상위 20%는 전체 부의 51.9% 를 갖고 있습니다. 파레토 법칙이 성립하지는 않네요. 


데이터를 분석하다 보니 상위 1%는 전체 재산의 몇 퍼센트를 갖고 있는지, 상위 5%는 전체 재산의 몇 퍼센트를 갖고 있는지 등의 궁금증이 생겼습니다. 여기서 전체 재산은 500명의 재산입니다. 


x축을 "상위 부터의 누적 인원(%)", "y축을 "전체 재산에서 차지하는 비율(%)"로 하는 그래프를 그려보았습니다. 예를들어 x축 1에 해당되는 값은 상위 1%가 전체 재산의 몇 %를 차지하고 있는지를 보여줍니다. 



위 표의 몇개의 점을 뽑으면 아래와 같습니다. 


1% -> 8.7%

5% -> 27.2%

10% -> 38.2%

20% -> 52.0%

50% -> 76.8% 


상위 5%가 500명 재산의 30%를, 상위 50%가 500명 재산의 80%정도를 갖고 있다고 볼 수 있습니다. 초고소득자들 구간에서는 부의 집중정도가 파레토 법칙의 기준보다 낮았기 떄문에 파레토 법칙이 성립하지 않았습니다. 


사용한 코드와 데이터는 아래와 같습니다.


data.xlsx


#데이터 불러오기

library(readxl)

data <- read_excel("경로",col_names = FALSE)


data=data.frame(data)


#결측치 제거

data=na.omit(data)

rownames(data)=NULL


#Number of row

nor=nrow(data)


#

for (i in 1:7)

{

  assign(paste0("C",i),c(data[i+7,1]))

}


for (i in 1:(((nor-7)/7)-1) ){

 

  C1=c(C1,data[8+7*i,1])

  C2=c(C2,data[9+7*i,1])

  C3=c(C3,data[10+7*i,1])

  C4=c(C4,data[11+7*i,1])

  C5=c(C5,data[12+7*i,1])

  C6=c(C6,data[13+7*i,1])

  C7=c(C7,data[14+7*i,1])

}


#소득 항 숫자로 만들기

C3_2=gsub("[\\$,]", "", C3)

C3_2=gsub("B", "", C3_2)

C3_2=as.numeric(C3_2)*(10^9)*1230/(10^12)


myd=data.frame(C1,C2,C3,C3_2,C4,C5,C6,C7)


View(myd)


#500명 자산 막대그래프

barplot(myd$C3_2,ylim=c(0,200),names=1:499)

title(main="세계 500대 부자 자산",cex.main=1.7

      ,xlab="순위",ylab="조",cex.lab=1.5)

#테두리 설정

box("figure", col="gray")


#전체 자산, 상위 20% 자산

all=round(sum(myd$C3_2[1:499]),0)

top20=round(sum(myd$C3_2[1:100]),0)

mybp=barplot(c(all,top20),ylim=c(0,8000),

        names=c("전체 자산","상위 20% 자산"),cex.names=1.3)

title(main="전체 자산, 상위 20% 자산"

      ,cex.main=1.7,ylab="조",cex.lab=1.5)

text(x=mybp,y=c(all,top20),labels=c(all,top20),pos=3,col="black")


#테두리 설정

box("figure", col="gray")


C3_3=c()


for (i in 1:499)

  {

  C3_3[i]=sum(C3_2[1:i])/sum(C3_2)*100

}


#누적인원에 대한 누적자산비율 그래프

plot(round((1:499)/499*100,0),C3_3,'h',ann=FALSE)

title(main="누적 자산 비율 그래프",cex.main=1.7

      ,xlab="누적 인원%",ylab="누적 자산 비율%",cex.lab=1.5)


#테두리 설정

box("figure", col="gray")


View(data.frame(X=round((1:499)/499*100,1),Y=C3_3))




반응형

댓글