반응형
통계에서 문자 'K'는
1. 왜 하필 K 인가?
> K는 ‘개수(number)’를 일반적으로 나타내는 수학적 기호입니다.
즉,
K-겹 교차검증(K-Fold Cross Validation)에서
K는
> 데이터를 몇 개의 부분(폴드)으로 나누는가를 나타내는 변수
입니다.
2. 수학·통계에서 K의 관례적 의미
수학·통계·알고리즘 분야에서:
n : 전체 데이터 개수
k : 부분의 개수, 묶음의 개수, 선택 개수
로 쓰는 것이 오랜 관례입니다.
예시
K-means → 군집의 개수 K
K-NN → 이웃의 개수 K
K-Fold → 분할 개수 K
📌 공통점
> “몇 개로 나누는가”를 나타내는 기호
3. 왜 다른 문자(L, M 등)가 아니라 K인가?
특정 의미가 고정된 약자가 아님
가변적인 정수(parameter)를 나타내기에 적합
n과 혼동되지 않음
수학·컴퓨터과학에서 널리 합의된 표기
👉 그래서 논문·교재·시험에서 모두 K 사용
4. 시험 답안용 한 줄 문장
> K는 교차검증에서 데이터를 분할하는 폴드의 개수를 나타내는 변수로, 수학·통계 분야에서 부분의 개수를 관례적으로 표현하는 기호이다.
5. 기억을 돕는 암기 문장
> K = 몇 개로 나누느냐
6. 시험장에서 말이 막히면
> K는 임의로 정한 분할 개수를 의미하는 기호이며, K-겹 교차검증은 데이터를 K개 부분으로 나누어 검증을 반복하는 방법이다.
'통계데이터과학과' 카테고리의 다른 글
| 비즈니스 운영 시나리오 명세화 (0) | 2026.02.27 |
|---|---|
| 분석 모형의 전면 리모델링 (0) | 2026.02.26 |
| [캐글] Titanic: Machine Learning from Disaster (2) | 2025.11.09 |
| 캐글(Kaggle)에서 컴페티션(Competition) (0) | 2025.11.08 |
| SQLD 자격증 준비 로드맵 (1) | 2025.10.25 |
댓글