DAY 2022.04.14
나중에 참고할 기록용
일단 과제테스트(시험)통과용 이므로 기본 베이스라인만 정리한 글
이산형 데이터는 basic인 타이타닉~
데이터 출처
https://www.kaggle.com/competitions/titanic/data
1.데이터 불러오기
2.데이터 확인
3.데이터 시각화
-범주형 변수 ->여기서는 주로 countplot(data, x=범주형값, hue=생존여부(y값))
-연속형 변수 -> 이상치 파악 boxplot(data, x=연속형변수값)
4.데이터 전처리
5.데이터분석(데이터분할, 모델링, 적합모델)
6.데이터 최적화(예측) &저장/값비교