| DataFrame | Series | |
| 수학적 표현 | 행렬 | 백터 |
| 리스트 구조 | 2차원 | 1차원 |
| 예시 | [[1, 2, 3], [4, 5, 6]] | [1, 2, 3] |
df라는 데이터프레임이 있다고 가정하면, type(df)와 type(df["column1"])의 출력값은 다르다.
- type(df) --> pandas.core.frame.DataFrame
- typr(df["column1"]) --> pandas.core.series.Series
1. 라이브러리 로드하기
import pandas as pd
import numpy as np
2. 비어있는 데이터프레임 만들기
df = pd.DataFrame()
3. 컬럼추가하기
df["약품명"] = ["소화제", "감기약", "비타민", "digestive", "Omega3", "오메가3", "vitamin", "Vitamin"]
df["가격"] = 3500
4. Series를 list로 변환
df["가격"].tolist() # = list(df["가격"])
5. 컬럼값 삭제하기: drop()
df["종류2"] = "전문의약품"
df = df.drop("종류2", axis=1)
6. 데이터프레임 인덱싱
df.loc[ : ], df.loc[ [index1, index2] ], df.iloc[ : ], df.iloc[ [index1, index2] ]
df.set_index("약품명") --> 약품명 컬럼이 인덱스로 설정됨
df.set_index("약품명").loc["소화제"] --> 약품명 == 소화제 인 행만 추출함


*bool indexing: 조건에 따라 원하는 자료만 찾기
예시): 약품의 가격이 특정 값 이상 혹은 이하인 데이터만 불러오기

7. string accessor
예시1) 특정 컬럼값 모두 대문자로 만들기
df["약품명"].str.upper()
df[df["약품명"].str.contains("vita")]
8. 정렬하기
df.sort_values(by = ["가격", "약품명"], ascending = [False, True])
9. 저장하기
df.to_확장자('저장할 파일명')
df.to_csv('drug.csv', index=False, encoding = 'cp949')
10. 불러오기
pd.read_확장자('파일명', encoding = )
pd.read_csv('drug.csv', encoding = 'cp949')
11. 데이터 요약하기
| 1주차 과제 뒷풀이: 인덱싱은 리스트나 문자열만! (0) | 2022.09.22 |
|---|---|
| 앤스컴 콰르텟 (0) | 2022.09.22 |
| [시각화] Seaborn (0) | 2022.09.22 |
| [파이썬기초]조건문, 반복문, 함수 (1) | 2022.09.22 |
| [파이썬기초]변수, 문자열, 리스트, 딕셔너리 (1) | 2022.09.22 |