본문 바로가기

Python/Pandas15

[pandas] 날짜 데이터 다루기 to_datetime 사용법 : pd.to_datetime(df) 문자열에 적용하면 timestamp 유형이 됨 리스트에 적용하면 datetime64 유형이 됨 #문자열에 to_datetime => timestamp date_string = "2023-03-02" print(type(date_string)) datetime_obj = pd.to_datetime(date_string) print(datetime_obj) print(type(datetime_obj)) #리스트에 to_datetime => datetime64 date_list = ["2023-03-02"] print(type(date_list)) datetime_obj = pd.to_datetime(date_list) print(datetim.. 2023. 8. 9.
[API 다루기] XML 파일을 pandas 데이터프레임으로 XML 파일을 pandas 데이터프레임으로 만들기 🧑🏻‍💻 코드 해석 url 변수에 주어진 URL로 HTTP 요청을 보내고, 그에 대한 응답을 response 변수에 저장 ET.fromstring(response.content)를 사용하여 response 변수에 저장된 XML 데이터를 ElementTree 객체로 파싱 data_list라는 빈 리스트를 만들기 >> 이 리스트는 나중에 데이터프레임을 만들기 위해 각 행을 딕셔너리 형태로 담을 것 root.findall('.//item')를 사용하여 XML 데이터에서 'item'라는 태그의 모든 요소들을 찾기 각 item 태그에서 필요한 정보를 추출하여, data 딕셔너리에 저장 data_list에 모든 행에 해당하는 딕셔너리들이 저장됨 pd.DataFram.. 2023. 8. 7.
[API 다루기] XML 데이터를 pandas 데이터프레임으로 앞 포스팅에서 다룬 동일한 데이터를 xml 파일로 불러왔다. xml 파일을 pandas 데이터프레임으로 변환하는 법을 알아보자. 🧑🏻‍💻 코드 해석 1. requests.get(xml_url)를 사용하여 주어진 URL로 HTTP 요청을 보내고, 그에 대한 응답을 req 변수에 저장 2. BeautifulSoup(req.text, "lxml")를 사용하여 req 변수에 저장된 XML 데이터를 BeautifulSoup 객체로 파싱 3. find_all 메서드를 사용하여 'stddate' 태그와 'timeavg' 태그를 모두 찾기 4. zip 함수를 사용하여 'stddate_list'와 'timeAvg_list'를 동시에 순회하면서 해당 태그들의 텍스트 값을 가져와 'stddate'와 'avgTime' 리스트.. 2023. 8. 7.
[API 다루기] JSON 데이터를 pandas 데이터프레임으로 API 데이터 찾기 본 예제에서는 한국도로공사 고속도로 공공데이터 포털을 이용해본다. http://data.ex.co.kr/dataset/datasetList/list?pn=1&CATEGORY=TR&GROUP_TR=TIME_TCS 2023. 8. 7.
[Django] 엑셀 데이터 출력 페이지 만들기(부록) - 결과값을 표로 깔끔하게 보여주기(pandas dataframe > django) 웹페이지에 엑셀 데이터의 값들을 요약해서 보여주는 것까지 완성했다. 그런데 좀 더 가독성있게 표로 제시하는 방법도 찾아보았다.👀 여기서는 pandas 데이터프레임을 django에서 html에 표시되게 하는 방법을 살펴본다. 1. result 함수 수정 calculate > views.py > calculate 함수 수정 기본적으로 result 함수에 출력되는 결과값을 데이터프레임으로 변환하고, 세션에 저장해야한다. 이를 위해 calculate 함수를 먼저 수정한다. grade 별 value 통계량 요약 groupby 함수를 사용 : grade 컬럼을 기준으로, value 값에 min, max, mean 함수를 적용 index를 새로고침하고, 컬럼 값을 재지정 깔끔한 출력을 위해 min, max, mean.. 2023. 8. 3.
[pandas 시계열자료] pd.to_datetime() 함수 datetime (datetime64) 자료형 pandas.to_datetime() 함수 : 날짜와 시간을 나타내는 문자열을 datetime (datetime64) 자료형으로 변경 pandas.to_datetime() 함수 사용법 Series 변수 = to_datetime(Series 변수) return 된 Series 변수 데이터는 datetime64 형으로 변형되어 저장 Series 변수 = to_datetime(Series 변수, format='~') Series 에 변환될 문자열에 특별한 포맷을 지정하여, 명시적으로 format 지정 (옵션) Series 변수 = to_datetime(Series 변수, errors='raise') 디폴트 raise errors 가능한 값: ignore(무시), .. 2023. 3. 13.
728x90