분류 전체보기 33

H&M 데이터 분석(VS Code)

데이터에 대한 설명들 ○컬럼들에 대한 설명*article id: 특정 상품에 하나하나에 부여한 id   결측치 처리하는 것 https://velog.io/@cndbstlr7/%ED%8C%8C%EC%9D%B4%EC%8D%AC-%EA%B8%B0%EC%B4%88-4.-%EA%B2%B0%EC%B8%A1%EC%B9%98-%EC%B2%98%EB%A6%AC 파이썬 기초 4. 결측치 처리목차 1. isna 2. isna 3. isnull 4. notnull 5. fillna 6. dropnavelog.iohttps://rfriend.tistory.com/262 [Python pandas] 결측값 채우기, 결측값 대체하기, 결측값 처리 (filling missing value, imputation of missing v..

카테고리 없음 2025.03.06

개인 프로젝트

-2022년 기준 나이 구하기  -2022년 기주 나이 평균  -성별별 비율 구하기 일단 남자별 여자별 수 구하기  납자가 1, 여자가 0 남자 여자  -전체 성별 수  여자, 남자 비율 여자 비율남자비율 -전체 customer 수 -연도별 first join date한 사람 수색=평균 2022년 기준 나이tetxt=customer id가 평균적으로 몇개인지 -city별 고객수각 city별 booking한 사람들의 수 -양방향 대시보드 성별이 숫자로만 나와서 계산된 필드 만들기 양방향 그래프 만들기 위해서 계산된 필드 만들기 결과물 -first join date별 gender   (대시보드 만들때 주위해야하는거)*** 가로 컨테이너 대시보드에 드래그-마우스 오른쪽 클릭후 균등 분배 맞춤  - 전체보기 하..

카테고리 없음 2025.02.10

종속,독립변수 넣고 머신러닝

import pandas as pdfrom sklearn.model_selection import train_test_split# 예시 데이터프레임 로드# transaction 데이터 로드transaction_data = pd.read_csv("transaction.csv")# 독립변수(X)와 종속변수(Y) 설정X = transaction_data[['shippment_fee']]  # 독립변수y = transaction_data['total_fee']       # 종속변수# 학습 데이터와 테스트 데이터 분리X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42) 2. 트리 기반 모델 학습 (예: R..

카테고리 없음 2025.01.14

히트맵에 대해

# 히트맵 데이터 생성heatmap_data = click_stream_df.pivot_table(index='event_name', columns='event_time_month', aggfunc='size', fill_value=0)# 히트맵 그리기#label: 젤 오른쪽 막대기#plt.figure(figsize=(12, 8)) # 전체 그림 크기 조정sns.heatmap(heatmap_data, annot=True, fmt='d', cmap='coolwarm', cbar_kws={'label': 'Frequency'}, annot_kws={"size": 10}) # 글자 크기 조정plt.title("Event Frequency by Month and Event Name", fontsize=16)..

카테고리 없음 2025.01.12

x,y 둘다 value를 넣고 싶을때

질문 'product_raw 데이터가 있고 x축은 cloth y축은 season으로 그래프 만들고 싶으면 어떻게 해?' 1. 막대 그래프import seaborn as snsimport matplotlib.pyplot as plt# cloth별 season의 빈도수를 계산season_counts = product_raw.groupby(['cloth', 'season']).size().reset_index(name='counts')# 막대 그래프 그리기sns.barplot(data=season_counts, x='cloth', y='counts', hue='season')plt.xticks(rotation=45)plt.show()  2. 히트맵# cloth와 season 빈도수를 교차 테이블로 변환heat..

조별과제 2025.01.10

조별과제(game) Dashboard

주어진 데이터들에 대한 설명:https://www.kaggle.com/datasets/sohyunjun0401/game-rawdata-240705account_idlzp4q7rw-z30g-8jpz-v50m-12poovfh29b5ip_addr70.30.233.132countryCNlatitude35.86166longitude104.1954age34genderMALEosiOSfirst_login_date2020-12-16last_login_date2024-12-16level88exp(획득 경험치 총량(레벨과비례아님))999972serverno16job전사action_type(주요 활동)PVEmarketing_info_yn(마케팅 정보제공 활용동의 여부)Ypay_amont(누적 결제금액)99997151refu..

조별과제 2024.12.30