카테고리 없음
2024. 12. 10.
[TIL]최소/최대 인덱스(행 번호)를 반환하는 idxmin, idxmax
목차1. 개요2. idxmin(), idxmax() 정의3. 파이썬 활용 코드4. SQL과 비교5. 주의할 점1. 개요로그 데이터 EDA 과정 중 각 세션 별로 가장 빠르게 시간대가 기록된 행만 남기고 싶었다. 즉, SQL로 따지자면 세션 별 파티션을 생성하고 RANK함수를 적용하고 1인 경우만 추출하고 싶었던 것.Python에는 파티션과 동일한 기능은 없기 때문에 다음과 같은 로직으로 추출하기로 했다.step1. 세션 id 별로 groupby & datetime만 남겨두기step2. idxmin 메소드 활용해 가장 빠른 시간대의 인덱스 적용step3. .loc[]를 활용해 데이터프레임에서 행 선택2. idxmin(), idxmax() 정의idxmin() : 최소값을 가지는 인덱스 출력idxmax() :..