본문 바로가기

분류 전체보기162

7. 로지스틱 회귀 1. hr 데이터셋 살펴보기# 라이브러리 불러오기:import numpy as npimport pandas as pdimport seaborn as snsimport matplotlib.pyplot as plt 데이터 불러오기:hr_df = pd.read_csv('/content/drive/MyDrive/KDT/6.머신러닝과 딥러닝/Data/hr.csv')hr_df.head() hr_df.info()# 변수 설명:employee_id: 임의의 직원 아이디department: 부서region: 지역education: 학력gender: 성별recruitment_channel: 채용 방법no_of_trainings: 트레이닝 받은 횟수age: 나이previous_year_rating: 이.. 2024. 6. 12.
6. 의사 결정 나무 1. bike 데이터셋import numpy as npimport pandas as pdimport seaborn as snsimport matplotlib.pyplot as pltbike_df = pd.read_csv('/content/drive/MyDrive/KDT/6.머신러닝과 딥러닝/Data/bike.csv')bike_dfbike_df.info()datetime: 날짜count: 대여 개수holiday: 휴일workingday: 근무일temp: 기온feels_like: 체감온도temp_min: 최저온도temp_max: 최고온도pressure: 기압humidity: 습도wind_speed: 풍속wind_deg: 풍향rain_1h: 1시간당 내리는 비의 양snow_1h: 1시간당.. 2024. 6. 11.
5. 선형 회귀 1. Rent 데이터셋import numpy as npimport pandas as pdimport seaborn as snsrent_df = pd.read_csv('/content/drive/MyDrive/KDT/6.머신러닝과 딥러닝/Data/rent.csv')rent_dfrent_df.info()Posted On: 매물 등록 날짜BHK: 베드, 홀, 키친의 개수Rent: 렌트비Size: 집 크기Floor: 총 층수 중 몇층Area Type: 공용공간을 포함하는지, 집의 면적만 포함하는지Area Locality: 지역City: 도시Furnishing Status: 풀옵션 여부Tenant Preferred: 선호하는 가족형태Bathroom: 화장실 개수Point of Contact:.. 2024. 6. 11.
4. 타이타닉 데이터셋 1. 캐글(Kaggle)소개: 구글에서 운영하는 전 세계 AI 개발자 및 데이터 사이언티스트들이 데이터를 분석하고 토론할 수 있는 플랫폼입니다. 데이터 분석, 머신러닝, 딥러닝 대회를 개최하며 다양한 데이터셋, 파이썬 자료, R 자료 등을 제공합니다.주요 기능:데이터 분석 및 머신러닝, 딥러닝 대회 개최다양한 데이터셋 제공 (공개, 비공개)파이썬, R 프로그래밍 언어 학습 자료 제공데이터 과학 커뮤니티 운영활용 방법:대회 참여: 머신러닝 실력 향상, 새로운 데이터셋 발굴데이터셋 활용: 개인 연구, 프로젝트 진행커뮤니티 참여: 다른 데이터 과학자들과 교류, 정보 공유링크: https://www.kaggle.com/  sklearn.datasetsUtilities to load popular datasets.. 2024. 6. 10.