kaggle (2) 썸네일형 리스트형 XGBoost 파라미터 XGBoost의 Hyperparameter 1. nthreadgeneral parameter (general parameter) : 거의 변경하지 않음, 어떤 booster를 사용할 것인지 - booster: gbtree(tree based model) 또는 gblinear(linear model) // gbtree가 디폴트값 // test 결과 gbtree가 더 성능이 좋다고함 - silent : 출력 메시지 조절 // 메시지를 나타내지 않는 것이 디폴트값 - nthread : 병렬 조절, CPU의 실행 스레드 개수를 조정 // 전체 CPU를 다 사용하는 것이 디폴트값 2. booster parameter : 앞으로 우리가 변경할 값, 대부분 이 값들만 조정함 - eta : learning rate /.. [Kaggle] AMP-Parkinson's Disease Progression Prediction (1) 자료조사 Goal of the Competition -환자들의 파킨슨병 진전도를 측정하는 MDS-UPDR score을 예측하는 것이 대회의 목표이다. -protein과 peptide data를 활용하여 예측을 진행하면 된다. -이 대회의 work는 파킨슨병이 진전됨에 따라 어떤 molecules들이 변화하는지 돌파구를 제시할 수 있을 것이다. Dataset 관련 배경 지식 자료조사 -생명과학, 의학쪽 단어들이 등장해서, 이들에 대한 사전 이해가 필요하다고 생각되어 아주 간단한 자료조사를 진행하였다. kaggle에서 링크를 올려준 사이트와 추가적인 구글링을 활용하였다. 1. UniProt (Universal Protein Resource) - protein sequence(단백질 서열)과 추가적인 기능 정보 등을 .. 이전 1 다음