Python, R 분석과 프로그래밍/파이썬 프로그래밍
[파이썬] 결측치가 있는 행, 열 제거
마르띤
2023. 8. 15. 14:47
반응형
1. 결측치 확인
import pandas as pd
# 데이터프레임 생성 (예시)
data = {'A': [1, 2, None, 4],
'B': [None, 5, 6, 7],
'C': [10, 20, 30, 40]}
df = pd.DataFrame(data)
# 결측값 확인
print(df.isnull())
print(df.isnull().sum())
2. 결측치 제거
1) 행 삭제
# 결측값이 있는 행 삭제
df = df.dropna()
df
2) 열 삭제
# 결측값이 있는 열 삭제
df = df.dropna(axis=1)
df
3. 결측치 대체
1) 평균값
# 평균값으로 대체
mean_value = df['A'].mean()
df_filled = df.fillna(mean_value)
df_filled
2) 중앙값 또는 최빈값
# 중간값(median)이나 최빈값(mode)으로 대체 가능
median_value = df['B'].median()
df_filled = df.fillna(median_value)
df_filled
3) 사전에 정의한 값
# 사전에 정의된 값으로 대체
df_filled = df.fillna({'A': 0, 'B': 1, 'C': 2})
df_filled
반응형