일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
31 |
- 엔트로피
- 선형회귀
- 로지스틱
- 데이터사이언스
- 가지치기
- confusion_matrix
- 부스팅
- AutoML
- 평가지표
- BDA학회
- DT
- 논문리뷰
- distillm
- OLS
- 빅데이터분석학회
- ML
- 한국산업경영시스템학회
- 지니계수
- 머신러닝
- 에이다부스트
- BDA
- Machine Learning
- 규제
- 의사결정트리
- skld
- 랜덤포레스트
- dl
- AAAI
- adaboost
- 로짓
- Today
- Total
목록분류 전체보기 (23)
데이터 사이언스 공부할래

단백질 구조는 생명 현상 이해에 필수적실험적으로 규명된 구조(약 10만 개)는 알려진 서열(수십억 개)의 극히 일부에 불과함단백질 접힘 문제(protein folding problem)는 50년 이상 해결되지 않은 과제였으며, 기존 방법들은 상동 구조가 없을 때 정확도가 낮음AlphaFold는 유사 구조가 없는 경우에도 원자 수준의 정확도로 단백질 구조를 예측할 수 있는 최초의 계산 방법으로, CASP14에서 다른 방법들을 크게 능가이 모델은 물리·생물학적 지식을 딥러닝에 통합하고 다중 서열 정렬(MSA)을 활용하는 혁신적 접근법을 기반으로 한다. 단백질 3차원(3D) 구조를 단백질 서열로부터 예측하는 계산적 방법의 발전은 물리적 상호작용과 진화적 이력 가운데 어느 쪽을 중점적으로 다루느냐에 따라 두 갈..

본 논문 리뷰는 개인적인 학습 내용을 바탕으로 작성된 것으로, 일부 내용에 오류가 있을 수 있습니다. 논문 정보 Kim, T., Heo, J., Kim, H., Shin, K., & Kim, S. W. (2024, March). VITA:‘Carefully Chosen and Weighted Less’ Is Better in Medication Recommendation. In Proceedings of the AAAI Conference on Artificial Intelligence (Vol. 38, No. 8, pp. 8600-8607). VITA: 'Carefully Chosen and Weighted Less' Is Better in Medication RecommendationWe addre..

본 논문 리뷰는 개인적인 학습 내용을 바탕으로 작성된 것으로, 일부 내용에 오류가 있을 수 있습니다. 논문 정보 Ko, J., Kim, S., Chen, T., & Yun, S. Y. (2024). Distillm: Towards streamlined distillation for large language models. arXiv preprint arXiv:2402.03898. DistiLLM: Towards Streamlined Distillation for Large Language ModelsKnowledge distillation (KD) is widely used for compressing a teacher model to a smaller student model, reducing it..

논문 정보 로드밸런싱을 위한 전기차 충전소 입지선정 문제In South Korea, Jeju Island has a role as a test bed for electric vehicles (EVs). All conventional cars on the island are supposed to be replaced with EVs by 2030. Accordingly, how to effectively set up EV charging stations (EVCSs) that can charge EVs is awww.kci.go.kr1. Introduction본 논문은 부하 평준화 기법(load balancing method)을 활용한 최적 입지선정 모델을 제시하였다.해당 모형은 전체 수요를 충족시킬 수 ..

본 연구는 3D BPP를 해결하기 위해 Actor-critic 구조를 가진 DRL을 활용하여 3D BPP 문제를 해결하는 연구이다.논문 정보 Online 3D Bin Packing with Constrained Deep Reinforcement LearningWe solve a challenging yet practically useful variant of 3D Bin Packing Problem (3D-BPP). In our problem, the agent has limited information about the items to be packed into the bin, and an item must be packed immediately after its arrival without buffe..
AdaBoost를 만들기 위한 구조화를 실습과 패키지를 활용하여 AdaBoost를 실습해본다. AdaBoost 메서드fit(X, y): 설명 주어진 입력 데이터 X와 타겟 레이블 y를 사용하여 AdaBoost 모델을 학습 입력X: 학습 데이터(특성 행렬). 크기: (n_samples, n_features). y: 타겟 레이블. 크기: (n_samples,). 역할지정된 약한 학습자(예: 결정 스텀프)를 반복적으로 학습시키고, 각 학습자의 가중치를 계산하여 최종 모델을 구성 predict(X): 설명 학습된 AdaBoost 모델을 사용하여 새로운 데이터 X에 대한 예측을 수행 입력X: 예측할 데이터(특성 행렬). 크기: (n_samples, n_features). 출력각 샘플에 대한 예측된 클래스 ..

에이다 부스트(AdaBoost) 알고리즘에 대해 알아본다. 에이다 부스트오류 데이터에 가중치를 부여하면서 부스팅을 수행하는 알고리즘으로, AdaBoost 학습 단계에서 모델이 잘못 예측한 샘플에 더 큰 가중치를 부여하여 더 잘 학습하도록 유도한다. 초기에는 모두 동일한 가중치를 가지며, 단계가 진행될수록 잘못 예측한 샘플의 가중치를 점진적으로 증가시켜 이전 학습기들이 잘못 예측한 부분을 보완하도록 유도한다. Input : Dataset D={(x1,y1),⋯,(xN,yN)}, y(i)∈{−1,1} for i=1,⋯,N Step0 : 모든 $i = 1, \cdo..
랜덤 포레스트와 보팅 패키지의 하이퍼파라미터를 확인해보고, 실습해본다.RandomForest 하이퍼파라미터n_estimators: 결정 트리의 개수를 의미. 기본값은 100. 트리 수를 늘리면 성능이 향상되지만 계산 비용도 증가 criterion: 분할의 품질을 측정하는 기준. 분류에 사용되는 기준은 "gini"(지니 불순도) 또는 "entropy"(정보 이득). 기본값은 "gini" max_depth: 트리의 최대 깊이. 너무 깊은 트리는 과적합을 일으킬 수 있음. 기본값은 None, 리프 노드가 순수하거나 min_samples_split보다 적은 샘플을 가질 때까지 확장 min_samples_split: 노드를 분할하기 위해 필요한 최소 샘플 수. 기본값은 2 min_samples_leaf: 리프 ..