본문 바로가기

머신러닝 & 딥러닝22

6. 의사 결정 나무 1. bike 데이터셋import numpy as npimport pandas as pdimport seaborn as snsimport matplotlib.pyplot as pltbike_df = pd.read_csv('/content/drive/MyDrive/KDT/6.머신러닝과 딥러닝/Data/bike.csv')bike_dfbike_df.info()datetime: 날짜count: 대여 개수holiday: 휴일workingday: 근무일temp: 기온feels_like: 체감온도temp_min: 최저온도temp_max: 최고온도pressure: 기압humidity: 습도wind_speed: 풍속wind_deg: 풍향rain_1h: 1시간당 내리는 비의 양snow_1h: 1시간당.. 2024. 6. 11.
5. 선형 회귀 1. Rent 데이터셋import numpy as npimport pandas as pdimport seaborn as snsrent_df = pd.read_csv('/content/drive/MyDrive/KDT/6.머신러닝과 딥러닝/Data/rent.csv')rent_dfrent_df.info()Posted On: 매물 등록 날짜BHK: 베드, 홀, 키친의 개수Rent: 렌트비Size: 집 크기Floor: 총 층수 중 몇층Area Type: 공용공간을 포함하는지, 집의 면적만 포함하는지Area Locality: 지역City: 도시Furnishing Status: 풀옵션 여부Tenant Preferred: 선호하는 가족형태Bathroom: 화장실 개수Point of Contact:.. 2024. 6. 11.
4. 타이타닉 데이터셋 1. 캐글(Kaggle)소개: 구글에서 운영하는 전 세계 AI 개발자 및 데이터 사이언티스트들이 데이터를 분석하고 토론할 수 있는 플랫폼입니다. 데이터 분석, 머신러닝, 딥러닝 대회를 개최하며 다양한 데이터셋, 파이썬 자료, R 자료 등을 제공합니다.주요 기능:데이터 분석 및 머신러닝, 딥러닝 대회 개최다양한 데이터셋 제공 (공개, 비공개)파이썬, R 프로그래밍 언어 학습 자료 제공데이터 과학 커뮤니티 운영활용 방법:대회 참여: 머신러닝 실력 향상, 새로운 데이터셋 발굴데이터셋 활용: 개인 연구, 프로젝트 진행커뮤니티 참여: 다른 데이터 과학자들과 교류, 정보 공유링크: https://www.kaggle.com/  sklearn.datasetsUtilities to load popular datasets.. 2024. 6. 10.
3. 아이리스 데이터셋 1. Iris DatasetIris Dataset은 머신러닝 분야에서 널리 사용되는 데이터 세트입니다. 붓꽃(Iris)의 세 가지 종류(Iris setosa, Iris virginica, Iris versicolor) 각각 50개씩 총 150개의 샘플로 구성되어 있습니다. 각 샘플은 꽃받침 길이, 꽃받침 너비, 꽃잎 길이, 꽃잎 너비 4가지 특징과 꽃 종류를 나타내는 종속 변수로 구성됩니다.데이터셋: 특정한 작업을 위해 테이터를 관련성 있게 모아놓은 것링크: https://scikit-learn.org/stable/api/sklearn.datasets.html#module-sklearn.datasets sklearn.datasetsUtilities to load popular datasets and ar.. 2024. 6. 10.