기초 트랙 · KOAI 1과목

F1. KOAI 기초 I — Python + 고전 머신러닝

KOAI 1과목(기초 역량 및 고전 ML) 전 범위를 이론과 실전 코드로 숙달합니다. NumPy·Pandas·scikit-learn으로 회귀·분류·군집화 파이프라인을 처음부터 끝까지 구현하고, 모델 평가와 피처 엔지니어링까지 다룹니다. 모든 KOAI 응시자의 출발점이 되는 필수 코스입니다.

🎯 대상: 중3 ~ 고2 ⏱ 권장 약 10시간 (1:1) 📘 실라버스 1-1 ~ 1-4 🧩 전제: Python 기본 문법

게시일: 2026년 5월 16일 | 최종 수정: 2026년 5월 16일 · KOAI 2026 요강 기준

한눈에 보기

트랙

기초 (Foundation)

모든 KOAI 응시자 필수

대상 학년

중3 ~ 고2

Python 사전 학습 필수

권장 수업 시간

약 10시간

1:1 기준 · 6~14시간 변동

KOAI 매핑

1과목 전 범위

실라버스 1-1 ~ 1-4

학습 목표

F1을 마치면 학생은 NumPy·Pandas·scikit-learn으로 회귀·분류·군집화 파이프라인을 처음부터 끝까지 직접 구현할 수 있습니다. 단순히 라이브러리 호출법을 익히는 것이 아니라, 모델이 왜 그렇게 동작하는지 이론적으로 이해하고, 모델 평가 지표를 해석하며, 피처 엔지니어링으로 성능을 개선하는 수준까지 도달하는 것이 목표입니다.

F1은 Python 자체를 가르치지 않습니다. Python 기본 문법은 사전 학습된 것으로 전제하고, 첫 시간부터 곧바로 데이터 사이언스와 머신러닝의 핵심으로 진입합니다. 이 코스는 KOAI 1과목 전 범위(실라버스 1-1 ~ 1-4)를 빠짐없이 다루는 모든 KOAI 응시자의 공통 출발점입니다.

대상 & 전제

이런 학생에게 권장

  • 중3 ~ 고2 학생
  • KOAI 고등부·중등부 응시를 준비하는 학생
  • Python 기본 문법(변수·반복문·함수·리스트·딕셔너리)에 익숙한 학생
  • 머신러닝을 체계적으로 처음 배우려는 학생

선행 조건

Python 기본 문법 사전 학습이 필수입니다. F1은 Python을 가르치지 않고 곧바로 NumPy/Pandas/scikit-learn으로 진입합니다. Python이 미숙한 경우 CIT 코딩반 Python 기초를 선이수하거나, 초등 트랙의 E2·E3로 토대를 먼저 다집니다.

주차별 커리큘럼

아래는 1:1 기준 표준 진행안입니다. 학생의 사전 지식과 흡수 속도에 따라 일부 주차를 가속·압축하거나 더 깊게 다룹니다. 핵심 도구: NumPy, Pandas, Matplotlib/Seaborn, scikit-learn, XGBoost/LightGBM, Optuna, Kaggle.

주차 주제 핵심 산출물
1NumPy 벡터·행렬, Pandas DataFrameEDA 노트북 (Kaggle Titanic)
2Matplotlib/Seaborn, 데이터 전처리EDA 노트북 (Kaggle House Prices)
3선형회귀 (이론·구현)회귀 baseline + 잔차 분석
4로지스틱 회귀, L1/L2 정규화분류 baseline
5K-NN, 의사결정 트리모델 비교 노트북
6앙상블 (Random Forest, Gradient Boosting)XGBoost/LightGBM 적용
7SVMSVM 커널 비교 실험
8K-평균, PCA차원축소 + 군집 시각화
9t-SNE, UMAP, DBSCAN임베딩 시각화 노트북
10모델 평가 지표, 혼동행렬, ROC지표 해석 리포트
11과소·과대적합, 교차검증learning curve 분석
12하이퍼파라미터 튜닝 (Grid, Random, Optuna)튜닝 실험 노트북
13피처 엔지니어링 (sliding window, encoding, 통계 모멘트)피처 추가로 성능 개선 비교
14미니 Kaggle 컴페티션 (캡스톤)리더보드 제출 + 회고

※ 주차는 콘텐츠 단위이며 실제 소요 시간은 학생별로 다릅니다. 권장 약 10시간, 변동 범위 6~14시간.

평가 & 산출물

주간 산출물

매주 Jupyter 노트북을 작성합니다. 영문 노트북에 한국어 핵심 용어 주석을 병기 — 국제학교 학생의 영어 강점을 살리면서 KOAI 2차 한국어 서술형 시험도 동시에 대비합니다.

캡스톤

공개 Kaggle 컴페티션 1개에 직접 제출하고, 5쪽 분량의 분석·회고 리포트를 작성합니다. 리더보드 점수와 개선 과정이 그대로 포트폴리오 자산이 됩니다.

포트폴리오 기여 — 시간이 만드는 깊이

KOAI 1차 서류에서 가장 큰 비중인 포트폴리오 40%는 시험 직전 몇 주에 만들 수 없습니다. F1의 모든 산출물은 누적 자산으로 적층되도록 설계됩니다.

GitHub

정리된 repo 1개 koai-classical-ml

Kaggle

프로필 활성화 + 컴페티션 제출 이력

Notion

학습 일지 4~6편 (자기소개서 소재)

이 이력은 KOAI 1차 서류의 포트폴리오 40% · AI 역량 30% 항목에 일자가 찍힌 증빙으로 작용합니다. 일찍 시작할수록 응시 시점의 깊이가 깊어집니다.

이 코스의 위치

F1은 KOAI 커리큘럼 기초 트랙의 첫 코스입니다. 전체 트랙 구조는 KOAI 대비 커리큘럼 허브에서 확인하세요.

이전 단계 (선행)

E3. 초등 첫 ML

초등 파이프라인 (해당자)

현재 코스

F1. 기초 I

Python + 고전 ML

다음 단계

F2. 기초 II

신경망 & 딥러닝

자주 묻는 질문

F1을 듣기 전에 Python을 알아야 하나요?

네. F1은 Python 기본 문법(변수·반복문·함수·리스트·딕셔너리)을 사전 학습한 상태를 전제로 합니다. Python 자체를 가르치지 않고 곧바로 NumPy·Pandas·scikit-learn으로 진입하기 때문입니다. Python이 미숙한 경우 CIT 코딩반 Python 기초를 선이수하거나, 초등 트랙의 E2·E3로 토대를 먼저 다집니다.

F1은 KOAI의 어떤 과목에 대응하나요?

F1은 KOAI 실라버스 1과목(기초 역량 및 고전 ML)의 1-1부터 1-4까지 전 범위에 매핑됩니다. 데이터 전처리·EDA부터 선형/로지스틱 회귀, 트리·앙상블, SVM, 차원축소·군집화, 모델 평가, 하이퍼파라미터 튜닝, 피처 엔지니어링까지 다룹니다.

수업 시간 약 10시간은 고정인가요?

아닙니다. 약 10시간은 1:1 기준 권장치이며 학생의 사전 지식과 이해 속도에 따라 ±30~50% 변동합니다(대략 6~14시간). 사전 ML 경험이 있으면 권장 시간보다 적게, 처음이면 더 많이 필요할 수 있습니다. 첫 진단 세션에서 학생별 개별 시간 계획을 산정합니다.

F1을 마치면 다음에 무엇을 듣나요?

F1 다음은 F2(기초 II — 신경망 & 딥러닝)입니다. 고등부 응시자는 이후 A1(Computer Vision)·A2(NLP & Audio)로 심화하고, 중등부 응시자는 M1 중등부 종합반에서 F1·F2를 압축적으로 다룹니다. 포트폴리오는 C1, 시험 운영은 C2, 면접은 C3에서 대비합니다.

F1에서 만든 산출물은 KOAI 평가에 어떻게 쓰이나요?

F1은 정리된 GitHub repo(koai-classical-ml), 활성화된 Kaggle 프로필, Notion 학습 일지 4~6편을 누적 자산으로 남깁니다. 이 이력은 KOAI 1차 서류의 포트폴리오 40%·AI 역량 30% 항목에 일자가 찍힌 증빙으로 작용합니다. 포트폴리오는 시간의 함수이므로 일찍 시작할수록 깊이가 깊어집니다.

F1 상담 안내

우리 아이의 사전 지식과 목표에 맞춰 F1의 시작 시점과 시간 계획을 진단 세션에서 개별 설계해 드립니다.

관련 페이지

상담하기 (02) 540-2922