국가 권역별 수출 수입에 대한 데이터를 시각화해보고자 한다.
world = ['아시아', '중동', '유럽', '북미', '중남미', '아프리카',
'오세아니아', '기타지역', 'EU(27)', 'OECD', 'ASEAN',
'LAIA', '선진국', 'OPEC', '개발도상국']
df_word = df[df["국가권역"].isin(world)]
df_country = df[~df["국가권역"].isin(world)]
px.histogram(df_country, x="달러", y="국가권역", histfunc="sum")
# color, barmode
px.histogram(df_country, x="달러", y="국가권역", histfunc="sum", color = "항목", barmode = "group")
#height
px.histogram(df_country, x="달러", y="국가권역", histfunc="sum", color = "항목", barmode = "group", height=600)
#서브플롯: facet_col
#color 값 = facet_col 값
px.histogram(df_country, x="달러", y="국가권역",
histfunc="sum", color = "항목", facet_col="항목")
#color != facet_col
px.histogram(df_country, x="달러", y="국가권역",
histfunc="sum", color = "항목", barmode = "group", facet_col="산업")
#그래프 함께 그리기: marginal
px.histogram(df_country, x="달러", histfunc="sum", color = "산업",
marginal="violin")
국가권역 달러 합계 상위 20개국은 아래와 같으 추출한다 sum().nlargest(20)
top20 = df.groupby("국가권역")["달러"].sum().nlargest(20)
#seaborn을 사용한 상위 20개항목에 대한 시각화
df_top20 = df[df["국가권역"].isin(top20)
sns.catplot(data = df_top20, x="연", y="달러", kind="point",
hue="항목", col="국가권역", estimator="sum", col_wrap=4)
[머신러닝] INTRO. 머신러닝프로젝트 주요단계(전처리, EDA, Feature Engineering, 교차검증, 하이퍼파라미터튜닝) (0) | 2022.11.17 |
---|---|
[머신러닝] INTRO. Definition, Tool, 알고리즘 유형 (0) | 2022.11.17 |
시각화 총정리: seaborn (0) | 2022.10.28 |
Boolean Indexing (0) | 2022.10.28 |
[데이터 집계] pd.crosstab, pivot table, group by (0) | 2022.10.28 |