ML4 [03] Wine Dataset for Clustering 03. Wine Dataset for Clustering 출처: https://www.kaggle.com/datasets/harrywang/wine-dataset-for-clustering Wine Dataset for Clustering Cluster wines based on their chemical constituents www.kaggle.com 1. 데이터 불러오기 이번 실습은 클러스터링을 위한 실습으로, 자료가 사전에 정제되어 있었다. 기초통계, 결측치를 살펴보았을 때, 이상이 없었기 때문에 바로 군집분석을 진행했다. 2. K-Means 군집분석을 위해 이번 실습에서는 K-Means와 HDBSCAN을 모델을 선정하였다. 중심기반(Centroid)의 K-Means와 밀도기반(Density)의 .. 2024. 1. 20. [02] Real Estate Dataset 02. Real Estate Dataset 출처: https://www.kaggle.com/datasets/arnoldkakas/real-estate-dataset/data Real Estate Dataset Explore Spatial dynamics, Price, and Quality of Apartments in Slovakia (11/23) www.kaggle.com 1. 데이터 불러오기 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns df = pd.read_csv('/kaggle/input/real-estate-dataset/Real Estate Dataset.csv',sep='.. 2024. 1. 18. [01] Apple Quality 01. Apple Quality 출처: https://www.kaggle.com/datasets/nelgiriyewithana/apple-quality Apple Quality Explore the World of Fruits www.kaggle.com 1. 데이터 불러오기 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn as sns df = pd.read_csv('/kaggle/input/apple-quality/apple_quality.csv') df.head() 판다스를 활용해서 데이터를 불러오면 먼저 데이터의 헤드를 보며 어떤 데이터인지 대략적으로 파악한다. 캐글에서 제공되는 데이터는 Feat.. 2024. 1. 18. [ML-01] 문제 개요 및 정의 축구결과 예측모델은 정말 단순한 호기심에서 출발했다. 먼저 나는 축구광이고, 한때 축구 스타트업에서 근무를 했었던 적이 있었다. 그 당시 여러 미팅을 하면서 들었던 체육****의 이야기를 듣고 들었던 생각이 '아, 절대로 망할 수 없는 구조다' 였다. 이윽고 시간이 흘러, 내가 AI를 공부하고, 여러 모델을 학습하면서 스포츠분야에서 내가 직접 AI 모델을 만들고 싶다는 생각을 하게 되었다. '오즈들의 선택은 항상 경제적일까?' '배당을 변동하는 이유는 환급에 있어서 손해를 보지 않으려고?' '과연 오즈들은 절대로 손해를 보지 않는 구조를 만들어 내는가?' 이러한 개인적 호기심에서 출발해서 내가 이 아이디어를 뿌시는(?) 축구결과 예측모델을 만들어보자고 다짐했다. 사실 이 프로젝트를 만들어보면서 정말 비약.. 2023. 11. 19. 이전 1 다음