반응형
1. 결측치 확인
import pandas as pd
# 데이터프레임 생성 (예시)
data = {'A': [1, 2, None, 4],
'B': [None, 5, 6, 7],
'C': [10, 20, 30, 40]}
df = pd.DataFrame(data)
# 결측값 확인
print(df.isnull())
print(df.isnull().sum())
2. 결측치 제거
1) 행 삭제
# 결측값이 있는 행 삭제
df = df.dropna()
df
2) 열 삭제
# 결측값이 있는 열 삭제
df = df.dropna(axis=1)
df
3. 결측치 대체
1) 평균값
# 평균값으로 대체
mean_value = df['A'].mean()
df_filled = df.fillna(mean_value)
df_filled
2) 중앙값 또는 최빈값
# 중간값(median)이나 최빈값(mode)으로 대체 가능
median_value = df['B'].median()
df_filled = df.fillna(median_value)
df_filled
3) 사전에 정의한 값
# 사전에 정의된 값으로 대체
df_filled = df.fillna({'A': 0, 'B': 1, 'C': 2})
df_filled
반응형
'Python, R 분석과 프로그래밍 > 파이썬 프로그래밍' 카테고리의 다른 글
[Python] if - else문 (2) | 2024.01.08 |
---|---|
[python] 파이썬 기초 문법과 예외 처리: 리스트, 딕셔너리, 제곱근, 그리고 예외 상황 다루기 (0) | 2024.01.03 |
[Python] 퀴즈 - 짝수만 출력하기, range, def 활용 (0) | 2024.01.01 |
for문 (0) | 2023.08.01 |