훈련 데이터 성능은 높지만 테스트 데이터 성능이 낮은 상태는?
과적합
Overfitting이라고 부른다
Card
emy
← 탐색으로 돌아가기
마지막 단계에서는 실제 시험 스타일에 적응하는 실전 훈련을 진행한다. 과목별 핵심 개념을 연결해서 문제를 푸는 연습을 하고, 자주 출제되는 함정 패턴과 오답 유도 유형을 반복 학습한다. 특히 “비슷한 개념 비교”, “모델 특징 연결”, “통계 해석”, “전처리 판단” 유형을 집중적으로 정리한다. 시험 직전 빠르게 회독할 수 있는 형태로 정리하며, 제한 시간 안에서 정답을 선택하는 감각까지 완성하는 단계다.
무료 체험 퀴즈
훈련 데이터 성능은 높지만 테스트 데이터 성능이 낮은 상태는?
과적합
Overfitting이라고 부른다
KNN 알고리즘에서 가장 중요한 전처리 작업은?
스케일링
거리 계산 기반 알고리즘이기 때문이다
의사결정나무의 장점으로 가장 적절한 것은?
해석이 쉽다
시각화가 가능하다
랜덤포레스트가 과적합을 줄일 수 있는 이유는?
여러 트리를 결합하기 때문
앙상블 효과를 활용한다
PCA의 주요 목적은?
차원 축소
정보 손실을 최소화하며 변수 수를 줄인다
아래 문항들은 이 학습지에 수록된 카드입니다. 로그인하면 이 학습지를 내 계정으로 복사해 카드를 한 장씩 넘기며 반복 학습할 수 있고, 숙달한 카드는 완료 표시하여 다음 세션에서 제외할 수 있습니다.
훈련 데이터 성능은 높지만 테스트 데이터 성능이 낮은 상태는?
KNN 알고리즘에서 가장 중요한 전처리 작업은?
의사결정나무의 장점으로 가장 적절한 것은?
랜덤포레스트가 과적합을 줄일 수 있는 이유는?
PCA의 주요 목적은?
군집분석에 해당하는 알고리즘은?
로지스틱회귀가 주로 사용되는 문제 유형은?
분류 모델 평가 시 불균형 데이터에 적절한 지표는?
결측치 처리 방법으로 가장 적절하지 않은 것은?
상관관계가 높다고 반드시 의미하지 않는 것은?
회귀분석에서 종속변수 의미는?
데이터 분산 정도를 가장 잘 나타내는 값은?
정규분포에서 평균과 중앙값 관계는?
정확도만으로 모델 평가가 어려운 이유는?
ROC Curve 아래 면적을 의미하는 것은?
지도학습에 해당하지 않는 것은?
K-Means에서 K 의미는?
의사결정나무 분기 기준으로 사용되는 값은?
Spark가 Hadoop MapReduce보다 빠른 이유는?
비정형 데이터 예시로 가장 적절한 것은?
데이터 웨어하우스 주요 목적은?
하둡의 분산 파일 시스템은?
나이브베이즈 핵심 가정은?
과소적합 상태 특징은?
회귀 문제 평가에 적절한 지표는?
데이터 전처리 목적과 가장 거리가 먼 것은?
표준화 결과 특징은?
정규화 목적은?
앙상블 학습의 공통 목적은?
랜덤포레스트 학습 방식은?
부스팅 특징은?
XGBoost 특징으로 적절한 것은?
CNN이 주로 사용되는 분야는?
RNN이 적합한 데이터 유형은?
LSTM 목적은?
데이터를 학습용과 테스트용으로 나누는 이유는?
교차검증 목적은?
K-Fold 교차검증 특징은?
Confusion Matrix에서 FP 의미는?
정밀도 중요 상황 예시는?
재현율 중요 상황 예시는?
데이터 레이크 특징은?
OLTP 목적은?
OLAP 목적은?
NoSQL 특징은?
CAP 이론 요소가 아닌 것은?
ETL 과정 순서는?
결측치가 많은 경우 가장 먼저 해야 할 것은?
EDA 목적은?
박스플롯으로 확인하기 좋은 것은?
히스토그램 주요 목적은?
상관계수 범위는?
베이즈정리 기반 알고리즘은?
SVM 핵심 개념은?
KNN에서 K가 너무 작을 때 문제는?
의사결정나무 단점은?
딥러닝 학습 속도 향상에 많이 사용하는 하드웨어는?
Dropout 목적은?
데이터 품질 요소가 아닌 것은?
데이터 거버넌스 목적은?
비식별화 목적은?
로그 데이터 특징은?
시계열 데이터 핵심 특징은?
Bias가 큰 모델 특징은?
Variance가 큰 모델 특징은?
Bias-Variance Tradeoff 의미는?
모델 일반화 의미는?
Feature Importance 의미는?
AutoML 목적은?