본문 바로가기

분류 전체보기140

9. 랜덤 포레스트 1. hotel 데이터셋import numpy as npimport pandas as pdimport seaborn as snsimport matplotlib.pyplot as plthotel_df = pd.read_csv('/content/drive/MyDrive/KDT/6.머신러닝과 딥러닝/Data/hotel.csv')hotel_dfhotel_df.info()hotel: 호텔 종류is_canceled: 취소 여부lead_time: 예약 시점으로부터 체크인 될 때까지의 기간(얼마나 미리 예약했는지)arrival_date_year: 예약 연도arrival_date_month: 예약 월arrival_date_week_number: 예약 주arrival_date_day_of_month:.. 2024. 6. 12.
8. 서포트 벡터 머신 1. 손글씨 데이터셋from sklearn.datasets import load_digitsdigits = load_digits()digits.keys()data = digits['data']data.shapetarget = digits['target']target.shapetargetimport matplotlib.pyplot as plt_, axes = plt.subplots(2, 5, figsize=(14, 8))# flatten: 다차원을 1차원으로 바꿔주는 메소드for i, ax in enumerate(axes.flatten()): ax.imshow(data[i].reshape((8, 8)), cmap='gray') ax.set_title(target[i]) 2. 스케일링(Scalin.. 2024. 6. 12.
7. 로지스틱 회귀 1. hr 데이터셋 살펴보기# 라이브러리 불러오기:import numpy as npimport pandas as pdimport seaborn as snsimport matplotlib.pyplot as plt 데이터 불러오기:hr_df = pd.read_csv('/content/drive/MyDrive/KDT/6.머신러닝과 딥러닝/Data/hr.csv')hr_df.head() hr_df.info()# 변수 설명:employee_id: 임의의 직원 아이디department: 부서region: 지역education: 학력gender: 성별recruitment_channel: 채용 방법no_of_trainings: 트레이닝 받은 횟수age: 나이previous_year_rating: 이.. 2024. 6. 12.
6. 의사 결정 나무 1. bike 데이터셋import numpy as npimport pandas as pdimport seaborn as snsimport matplotlib.pyplot as pltbike_df = pd.read_csv('/content/drive/MyDrive/KDT/6.머신러닝과 딥러닝/Data/bike.csv')bike_dfbike_df.info()datetime: 날짜count: 대여 개수holiday: 휴일workingday: 근무일temp: 기온feels_like: 체감온도temp_min: 최저온도temp_max: 최고온도pressure: 기압humidity: 습도wind_speed: 풍속wind_deg: 풍향rain_1h: 1시간당 내리는 비의 양snow_1h: 1시간당.. 2024. 6. 11.