데이터 프레임을 사용할 때 index는 은근 골칫거리.. 맞죠?
그래서 맨날 쓸 때마다 헷갈리길래 정리해 놓으려고 합니다..
1. ignore_index
- 말 그대로 인덱스 무시할건지 안 할건지 명시
: ignore_index = True 이면, index 0부터 새로 생김 (0,1,2,3,0,1,2 가 아니라 0,1,2,3,4,5,6)
: ignore_index = False 이면, 기존 index를 유지하면서 (0,1,2,3,0,1,2)
: 보통 append 나 concat에서 데이터를 추가할 때 유용..
2. 데이터프레임 파일로 저장할 때 쓰는 index = False
: 데이터프레임.to_csv(파일명,encoding='utf-8-sig', index=False)
: 인덱스 없이 csv 파일로 저장됨
: 비작성 시 csv 파일 open시 index 열 자동 추가
3. drop 후에 사용하는 reset_index(drop=True)
: 기존 인덱스를 킵하는 성질을 버리기 위해 사용
: drop 된 데이터의 인덱스가 비어버리는데 drop = True를 안 해주면
: 기존 index를 index라는 새로운 열로 자동 생성 후, 기본 index를 reset함
: (df.coumns -> index, column1, column2, column3 ... 이렇게 되어버림)
4. 파일 불러올 때 Unnamed: 0 없이 불러오는 방법 (index_col = 0)
: csv 파일 데이터프레임으로 불러올 때 앞에 이상한 인덱스가 생기는 경우 추가
나만 알아볼 수 있게 쓴 글인것 같지만..
또 생기면 또 추가할 예정..
'Python' 카테고리의 다른 글
[Python] 데이터 프레임 첫번째 인덱스에 값 추가하기, 특정 행을 열로(columns) 교체하기 (0) | 2022.12.02 |
---|