KOAI 1과목(기초 역량 및 고전 ML) 전 범위를 이론과 실전 코드로 숙달합니다. NumPy·Pandas·scikit-learn으로 회귀·분류·군집화 파이프라인을 처음부터 끝까지 구현하고, 모델 평가와 피처 엔지니어링까지 다룹니다. 모든 KOAI 응시자의 출발점이 되는 필수 코스입니다.
게시일: 2026년 5월 16일 | 최종 수정: 2026년 5월 16일 · KOAI 2026 요강 기준
트랙
기초 (Foundation)
모든 KOAI 응시자 필수
대상 학년
중3 ~ 고2
Python 사전 학습 필수
권장 수업 시간
약 10시간
1:1 기준 · 6~14시간 변동
KOAI 매핑
1과목 전 범위
실라버스 1-1 ~ 1-4
F1을 마치면 학생은 NumPy·Pandas·scikit-learn으로 회귀·분류·군집화 파이프라인을 처음부터 끝까지 직접 구현할 수 있습니다. 단순히 라이브러리 호출법을 익히는 것이 아니라, 모델이 왜 그렇게 동작하는지 이론적으로 이해하고, 모델 평가 지표를 해석하며, 피처 엔지니어링으로 성능을 개선하는 수준까지 도달하는 것이 목표입니다.
F1은 Python 자체를 가르치지 않습니다. Python 기본 문법은 사전 학습된 것으로 전제하고, 첫 시간부터 곧바로 데이터 사이언스와 머신러닝의 핵심으로 진입합니다. 이 코스는 KOAI 1과목 전 범위(실라버스 1-1 ~ 1-4)를 빠짐없이 다루는 모든 KOAI 응시자의 공통 출발점입니다.
Python 기본 문법 사전 학습이 필수입니다. F1은 Python을 가르치지 않고 곧바로 NumPy/Pandas/scikit-learn으로 진입합니다. Python이 미숙한 경우 CIT 코딩반 Python 기초를 선이수하거나, 초등 트랙의 E2·E3로 토대를 먼저 다집니다.
아래는 1:1 기준 표준 진행안입니다. 학생의 사전 지식과 흡수 속도에 따라 일부 주차를 가속·압축하거나 더 깊게 다룹니다. 핵심 도구: NumPy, Pandas, Matplotlib/Seaborn, scikit-learn, XGBoost/LightGBM, Optuna, Kaggle.
| 주차 | 주제 | 핵심 산출물 |
|---|---|---|
| 1 | NumPy 벡터·행렬, Pandas DataFrame | EDA 노트북 (Kaggle Titanic) |
| 2 | Matplotlib/Seaborn, 데이터 전처리 | EDA 노트북 (Kaggle House Prices) |
| 3 | 선형회귀 (이론·구현) | 회귀 baseline + 잔차 분석 |
| 4 | 로지스틱 회귀, L1/L2 정규화 | 분류 baseline |
| 5 | K-NN, 의사결정 트리 | 모델 비교 노트북 |
| 6 | 앙상블 (Random Forest, Gradient Boosting) | XGBoost/LightGBM 적용 |
| 7 | SVM | SVM 커널 비교 실험 |
| 8 | K-평균, PCA | 차원축소 + 군집 시각화 |
| 9 | t-SNE, UMAP, DBSCAN | 임베딩 시각화 노트북 |
| 10 | 모델 평가 지표, 혼동행렬, ROC | 지표 해석 리포트 |
| 11 | 과소·과대적합, 교차검증 | learning curve 분석 |
| 12 | 하이퍼파라미터 튜닝 (Grid, Random, Optuna) | 튜닝 실험 노트북 |
| 13 | 피처 엔지니어링 (sliding window, encoding, 통계 모멘트) | 피처 추가로 성능 개선 비교 |
| 14 | 미니 Kaggle 컴페티션 (캡스톤) | 리더보드 제출 + 회고 |
※ 주차는 콘텐츠 단위이며 실제 소요 시간은 학생별로 다릅니다. 권장 약 10시간, 변동 범위 6~14시간.
매주 Jupyter 노트북을 작성합니다. 영문 노트북에 한국어 핵심 용어 주석을 병기 — 국제학교 학생의 영어 강점을 살리면서 KOAI 2차 한국어 서술형 시험도 동시에 대비합니다.
공개 Kaggle 컴페티션 1개에 직접 제출하고, 5쪽 분량의 분석·회고 리포트를 작성합니다. 리더보드 점수와 개선 과정이 그대로 포트폴리오 자산이 됩니다.
KOAI 1차 서류에서 가장 큰 비중인 포트폴리오 40%는 시험 직전 몇 주에 만들 수 없습니다. F1의 모든 산출물은 누적 자산으로 적층되도록 설계됩니다.
GitHub
정리된 repo 1개 koai-classical-ml
Kaggle
프로필 활성화 + 컴페티션 제출 이력
Notion
학습 일지 4~6편 (자기소개서 소재)
이 이력은 KOAI 1차 서류의 포트폴리오 40% · AI 역량 30% 항목에 일자가 찍힌 증빙으로 작용합니다. 일찍 시작할수록 응시 시점의 깊이가 깊어집니다.
F1은 KOAI 커리큘럼 기초 트랙의 첫 코스입니다. 전체 트랙 구조는 KOAI 대비 커리큘럼 허브에서 확인하세요.
네. F1은 Python 기본 문법(변수·반복문·함수·리스트·딕셔너리)을 사전 학습한 상태를 전제로 합니다. Python 자체를 가르치지 않고 곧바로 NumPy·Pandas·scikit-learn으로 진입하기 때문입니다. Python이 미숙한 경우 CIT 코딩반 Python 기초를 선이수하거나, 초등 트랙의 E2·E3로 토대를 먼저 다집니다.
F1은 KOAI 실라버스 1과목(기초 역량 및 고전 ML)의 1-1부터 1-4까지 전 범위에 매핑됩니다. 데이터 전처리·EDA부터 선형/로지스틱 회귀, 트리·앙상블, SVM, 차원축소·군집화, 모델 평가, 하이퍼파라미터 튜닝, 피처 엔지니어링까지 다룹니다.
아닙니다. 약 10시간은 1:1 기준 권장치이며 학생의 사전 지식과 이해 속도에 따라 ±30~50% 변동합니다(대략 6~14시간). 사전 ML 경험이 있으면 권장 시간보다 적게, 처음이면 더 많이 필요할 수 있습니다. 첫 진단 세션에서 학생별 개별 시간 계획을 산정합니다.
F1 다음은 F2(기초 II — 신경망 & 딥러닝)입니다. 고등부 응시자는 이후 A1(Computer Vision)·A2(NLP & Audio)로 심화하고, 중등부 응시자는 M1 중등부 종합반에서 F1·F2를 압축적으로 다룹니다. 포트폴리오는 C1, 시험 운영은 C2, 면접은 C3에서 대비합니다.
F1은 정리된 GitHub repo(koai-classical-ml), 활성화된 Kaggle 프로필, Notion 학습 일지 4~6편을 누적 자산으로 남깁니다. 이 이력은 KOAI 1차 서류의 포트폴리오 40%·AI 역량 30% 항목에 일자가 찍힌 증빙으로 작용합니다. 포트폴리오는 시간의 함수이므로 일찍 시작할수록 깊이가 깊어집니다.