데이터분석

· Project
Flask를 사용하여 Python 으로 작성한 구문을 통해 전처리한 데이터를 api로 전송하여 react에서 chart.js로 시각화하는 부분까지 구현해봤습니다. ○ 라이브러리 설치 사용하는 python 가상환경에 pip install Flask pip install flask-cors 를 통해 라이브러리를 설치합니다 flask-cors는 CORS 관련 문제를 방지하고 클라이언트 측에서 서버로의 요청을 허용하도록 도와주는 역할을합니다. ○ Flask 파일 만들기 파일 구성은 nomore(전체파일) > app >__init__.py 와 routes.py nomore > function_module.py 와 run.py nomore >src > predict(예측) > Predict.jsx nomore > ..
· Project
이전내용과 이어집니다 이전 내용을 보고싶으시다면 클릭 제가 거주하고 있는 광주 지역의 최근 여행지 관심도가 성별 , 나이, 소득기준에 따라서 어떻게 변화하고 있는 추세인지에 대해 궁금해졌습니다. 광주광역시 성별 여행 관심도 변화 분석 ① 기존 데이터 불러들이기 import pandas as pd df = pd.read_csv('01_data/travel_data_total.csv') df.columns Index(['응답자ID', '조사시작일자', '성별구분코드', '연령대구분명', '답변자거주지역명', '가구소득정도명', '서울특별시여행관심값', '경기도인천광역시여행관심값', '부산광역시여행관심값', '충청남도대전광역시여행관심값', '충청북도여행관심값', '경상남도울산광역시여행관심값', '경상북도대구광..
이전 내용과 이어집니다. 이전 내용을 보고싶으시다면 클릭 [해당 년도의 국내 여행지별 관심도 평균 분석] 2021 ,2022 , 2023 년의 여행지별 관심도를 -2~2의 숫자로 넣은 데이터를 전처리를 통해 일정 년도의 관심도만 추출해낸 뒤 각 여행지별로 관심도 평균의 차이를 비교해보려고합니다. 우선 2023년을 기준으로하여 샘플링하였습니다. ① 컬럼값을 리스트형태로 만들기 key가 컬럼값(서울특별시여행관심값 , 경기도인천광역시여행관심값 ,...) 이며 value가 해당년도의 관심값의 평균인 딕셔너리 형태를 만들기 위해 컬럼값을 리스트형태로 만들었습니다. df.columns[6:-3] Index(['서울특별시여행관심값', '경기도인천광역시여행관심값', '부산광역시여행관심값', '충청남도대전광역시여행관심값..
· Project
이전 내용과 이어집니다. 이전 내용을 보고싶으시다면 클릭 데이터 통합 문화 빅데이터 플랫폼에서 총 106개의 데이터를 다운로드해서 파일명을 travel_interest(숫자) 형태로 바꿔놓았습니다. 단순히 코드 작성시 편리하기 위함이므로 굳이 파일명을 변경할 필요는 없습니다. 저번에 샘플링했던 코드를 하나로 모아 제대로 작동되는지 travel_interest(1).csv 파일을 넣어 확인해보겠습니다. file_path = './01_data/travel_interest(1).csv' df = pd.read_csv(file_path) file_path2 = "./01_data/travel_columns.xlsx" df_col = pd.read_excel(file_path2,header = 0 , useco..
· Project
데이터 수집 국내 여행지역에 대한 관심도를 분석해봤습니다. 데이터는 문화 빅데이터 플랫폼에서 무료로 제공해주는 국내 여행지역 관심도 분석 데이터를 가져왔습니다. https://www.bigdata-culture.kr/bigdata/user/main.do 문화빅데이터 플랫폼 한국문화정보원이 운영하는 문화빅데이터 플랫폼은 공공기관 및 민간기업으로 구성된 데이터센터와 함께 도서, 체육, 예술, 숙박, 레저, 음식 등 고품질의 문화 분야 데이터를 개방하고 데이터 www.bigdata-culture.kr csv 파일로 다운로드 받은 데이터의 컬럼 정의서입니다. 우선 csv 파일 한 건을 데이터 프레임에 담아봤습니다. 판다스 라이브러리를 사용하였습니다. import pandas as pd file_path = '...
· DB
이제까지 배운 내용을 토대로 데이터를 받아와서 처리하는 실습을 진행하였다. 데이터는 국가 교통 데이터 오픈마켓에서 데이터를 사용하였다. 80개의 파일을 받아서 이를 하나의 데이터 파일로 합친 후에 진행해야한다. 따라서 한 건의 데이터 샘플링을 실행하고 이를 80개의 파일에 적용하는 순서로 수행하였다. 한 건의 데이터 샘플링 ⓛ 라이브러리 정의 및 데이터 읽어들이기 # 라이브러리 정의 import pandas as pd # 0번 파일의 csv 데이터 읽어들이기 # 데이터 프레임 이름 : df_bus_card_org # 파일 경로 지정 file_path = "./01_data/org/trfcard(0)/trfcard.csv" df_bus_card_org = pd.read_csv(file_path) df_bu..
s2h15
'데이터분석' 태그의 글 목록