본문 바로가기

머신러닝6

55일차 머신러닝 - 캐글 참가 / JSP - Interface 실습 21.05.28 Machine Learning @Kaggle( 캐글 ) 팀등록 및 참여 => 내가 수업듣고있는 "스마트인재개발원" 자체적으로 캐글 대회를 진행하였다. 총 3개반 참여. % 캐글 신청 및 데이터 다운 => 빨간색 동그라미 친 부분이 현재는 참여 신청을 해버려서 저래 뜨지만 원래는 "Join Competition"라고있다. => 해당 문구를 클릭하면 참여할 수 있으며, 사진과 같이 "Data"탭을 통해 파일들을 다운, 설명을 볼 수 있다. => 아래로 스크롤을 내리면 다운로드 받을 수 있으며, 뭐... 별동의 동의를 해야하는데 그냥 누르고 다시 다운버튼 % 팀 등록 및 초대 => "Team"태그에서 내가 팀을 만들 수 있으며( 좌측 ), 팀 멤버를 초대할 수 있다.( 우측 ) => 단, 한명.. 2021. 5. 28.
54일차 머신러닝 랜덤 포레스트 실습 / JSP 게시판페이지 21.05.27 Machine Learning @Ensemble % Bagging 53일차에 했던 내용 이어서 진행한다. Bagging 방법 중 하나 의 예로 랜덤 포레스트라는 방법이 있다. %Random Forest - 랜덤 포레스트 => 결국 요약하자면 랜덤 포레스트( Random Forest )는 결정 트리( Decision Tree )를 기반으로, 여러개의 결정트리 "Classifier"를 생성 한다. 그리고 각 트리별 다른 Sample 데이터를 학습하여 최종적 Voting을 통해 모델을 생성한다. % 주요 매개변수 ( Hyperparameter ) "n_estimators" 옵션은 Default 값이 100개로, 위와 같이 결정 트리 분류 모델의 수를 결정한다. "random_state"는 내가.. 2021. 5. 27.
53일차 머신러닝 - Importance, 시각화 / JSP - DAO 활용 페이지 실습 21.05.26 Machine Learning @ Series - info / 칼럼 및 인덱스 확인 위와 같이 Series의 경우 는 Column을 확인하는 colums 나 index( ) , info( ) 와 같은 함수를 사용할 수 없다 . 하지만 아래와 같이 정의할 때 값을 칼럼으로 주면 결과를 확인할 수 있다. 좌측과 같이 data안의 값을 칼럼이 아닌 List 형태로 주게 되면 DF와 같이 정의 된다. 해당 값을 담고 칼럼, 인덱스, 정보를 확인한다. @중요도 ( Importance ) Model이름.feature_importances_ 는 해당 모델의 각 칼럼별 데이터들이 갖는 중요도 를 표기한다. 출력된 결과는 몇개인지 보이진 않지만 총 117개이다. 이는 Data를 One-hot Encodi.. 2021. 5. 26.
52일차 머신러닝 - 교차검증, GridSearchCV / JSP - 로그인페이지 21.05.25 Machine Learning @과대or과소 적합 과대 적합 : 훈련 데이터에 너무 잘맞아버려서 일반성이 떨어지는 것 ( = 복잡도가 높은 모델 을 만든 것. ) -> Train Data에 너무 적응 해버려서 Test Data에서 높은 성능을 보여줄 수 없다. -> Train Data 이외의 다양한 변수에 대응하기 힘들다. ( = 새로운 데이터에 대응할 수 없다 . ) 예로 주어진 학습(Train) 데이터에서 만든 모델에 대한 성능을 올리기 위해 여러 규칙을 만들었다. ( 복잡도 증가 ) "A는 1보다 높고..", "B는 모두 Yes이며..", "C는 no인 경우.." 이런식으로 규칙을 늘린다면 성능은 높아질 것이다. 단, Train Data 한정 해서. 때문에, 새로운 데이터( Test.. 2021. 5. 25.
51일차_머신러닝_인코딩 실습_Decsion Tree / JSP_Scope 21.05.24 Machine Learning @함수 - value_count( ) => 데이터의 종류 및 갯수 확인 - 위 사진 처럼 "cap_shape"라는 데이터의 각 종류 및 갯수 를 반환한다. @데이터 전처리 - Encoding ( 인코딩 ) => 2가지 종류 인 Label Encoding 과 One-hot Encoding 이 있다. % Label Encoding - 실습 보는것과 같이 Dictionary 등을 활용하여, 각 Label들을 숫자로 변환한다 . 보는것과 같이 기존의 데이터인 "X" 는 그대로 보존하고 "X1"이라는 새로운 변수에 데이터를 복사한다. - map( ) 함수를 사용하여 기존의 "cap-shape" 칼럼의 값을 문자에서 숫자로 변경한다 . - result3 변수에 "cap.. 2021. 5. 24.
50일차_머신러닝 / JSP_Session_Cookie_실습 21.05.22 Machine Learning @특성공학 => 인공지능 알고리즘에 적용, 빅데이터 분석 등을 위해 데이터에 대한 도메인 지식을 활용하여 특성(Feature)를 만들어내는 과정 % 'Sibsp' & 'Parch' 로 새로운 열 생성 위의 2가지 열을 합쳐 새로운 열 "Family_Size"를 만든다. - "SibSp"는 형제 자매의 수 , "Parch"는 부모자식 수 를 의미한다. - 새로 만든 열은 가족 구성원 수를 의미하므로 합치는 2개의 열에 자기자신을 포함 +1을 더한다. 확인해보면 "Family_Size" 열이 정상적으로 생성됨을 볼 수 있다. %새로만든 열 등급 매기는 열 생성 - "Family_Size" 열의 값이 1이면 "Alone" , 2~4명은 "Small" , 5명 이상.. 2021. 5. 22.