데이터프레임 다중 열 정렬(1)
- .sort_values(by = ['열1', '열2'...] )
three_columns = df[['time', 'num_staff', 'num_actor']].copy()
sorted_df = three_columns.sort_values(by = ['time', 'num_staff'])
sorted_df.head(3)
데이터프레임 다중 열 정렬(2)
four_columns = df[['time', 'num_staff', 'num_actor', 'box_off_num']].copy()
sorted_dataframe = four_columns.sort_values(by = ['box_off_num', 'time'], ascending = True)
sorted_dataframe.head()
groupby를 이용한 평균 값 계산
- df.groupby('그룹화 기준 열').mean( )
- numeric_only = True : 숫자형 열의 평균을 얻을 수 있음
- numeric_only = False : 모든 열의 평균을 얻을 수 있음
df.groupby('screening_rat').mean(numeric_only = True)
두 개 이상의 열로 groupby하기
- df.groupby(['열1', '열2'...])
pd.DataFrame(df.groupby(['screening_rat', 'num_actor']).count()['title'])
groupby에 agg 메서드 사용하기
- 예시 코드 참고
df.groupby('screening_rat')[['num_staff']].agg('mean')
728x90
'Python > Pandas' 카테고리의 다른 글
[pandas] 조건에 맞는 데이터 필터링 : where( ), query( ) (0) | 2023.09.07 |
---|---|
[Pandas] cut(), qcut()을 이용한 데이터 구간화 (0) | 2023.09.07 |
describe() : 범주형 변수에 적용하여 기술 통계량 확인 (0) | 2023.08.17 |
display() 함수 : 여러 개 데이터프레임 동시에 확인 (0) | 2023.08.14 |
[pandas] pd.qcut() 과 pd.crosstab() (0) | 2023.08.09 |