심화 트랙 · KOAI 4과목

A2. KOAI 심화 II — NLP & Audio

KOAI 4과목(자연어 처리 및 오디오) 전 범위를 실전으로 숙달합니다. BERT·인코더-디코더·LLM API·Whisper까지 다루며, 텍스트와 오디오 데이터에 대한 end-to-end 파이프라인을 직접 구성할 수 있는 수준에 도달합니다. 고등부 응시자를 위한 자연어·오디오 심화 코스입니다.

🎯 대상: F1·F2 이수 고등부 ⏱ 권장 약 10시간 (1:1) 📘 실라버스 4-1 ~ 4-2 🧩 전제: F1·F2 이수

게시일: 2026년 5월 16일 | 최종 수정: 2026년 5월 16일 · KOAI 2026 요강 기준

한눈에 보기

트랙

심화 (Advanced)

고등부 응시자

대상 학년

고등부

F1·F2 이수

권장 수업 시간

약 10시간

1:1 기준 · 6~14시간 변동

KOAI 매핑

4과목 전 범위

실라버스 4-1 ~ 4-2

학습 목표

A2를 마치면 학생은 KOAI 4과목(자연어 처리 및 오디오) 전 범위를 실전 수준으로 숙달합니다. 토큰화와 어휘 구축에서 출발해 BERT·인코더-디코더 모델, 언어 모델링, LLM API 활용, Whisper 기반 음성 인식까지 다루며, 텍스트와 오디오 데이터에 대한 end-to-end 파이프라인을 처음부터 끝까지 직접 구성할 수 있는 수준에 도달하는 것이 목표입니다.

A2는 F1·F2에서 다진 머신러닝·딥러닝 토대 위에 자연어 처리와 오디오 처리를 쌓는 고등부 응시자 전용 심화 코스입니다. 특히 한국어 NLP의 특수성을 별도로 다뤄, 한국어 데이터로 진행한 캡스톤은 자기소개서의 차별화 소재로 직접 연결됩니다.

대상 & 전제

이런 학생에게 권장

  • KOAI 고등부 응시를 준비하는 학생
  • F1·F2를 이수해 ML·딥러닝 토대가 잡힌 학생
  • 자연어 처리·오디오 처리를 실전으로 다루려는 학생
  • 한국어 NLP로 차별화된 포트폴리오를 만들려는 학생

선행 조건

F1·F2 이수가 필수입니다. A2는 A1(Computer Vision)과 병행 가능하며, KOAI 고등부 응시 예정자에게만 권장합니다. 자연어·오디오 심화 내용을 다루므로 신경망과 딥러닝 기초가 갖춰진 상태를 전제로 합니다.

주차별 커리큘럼

아래는 1:1 기준 표준 진행안입니다. 학생의 사전 지식과 흡수 속도에 따라 일부 주차를 가속·압축하거나 더 깊게 다룹니다. 핵심 도구: Hugging Face Transformers, PyTorch, BERT, mT5/MarianMT, KoBERT/KLUE, Llama/Qwen, Anthropic/OpenAI API, Whisper, HuBERT.

주차 주제 핵심 산출물
1텍스트 분류 + 토큰화·어휘 구축TF-IDF + 신경망 baseline
2사전학습 텍스트 인코더 BERT (이론+실전)BERT 파인튜닝 (감정 분석)
3언어 모델링 (이론+실전), causal vs masked토큰 단위 LM 학습
4인코더-디코더 모델 (기계번역, 요약)mT5·MarianMT 파인튜닝
5한국어 NLP 특수성 (형태소, 한국어 토크나이저)KoBERT·KLUE 활용
6오픈소스 LLM 사용 (Llama, Qwen)로컬 추론 + LoRA
7LLM API 활용 (Anthropic, OpenAI) — 프롬프트 엔지니어링RAG mini system
8오디오 데이터 처리 + HuBERT오디오 분류
9Whisper, Qwen-Audio, Voxtral음성 인식 + 다국어
10캡스톤: NLP 또는 오디오 응용 프로젝트repo + 데모

※ 주차는 콘텐츠 단위이며 실제 소요 시간은 학생별로 다릅니다. 권장 약 10시간, 변동 범위 6~14시간.

평가 & 산출물

주간 산출물

매주 Jupyter 노트북을 작성합니다. 토큰화·BERT 파인튜닝·LLM API·음성 인식까지 각 주제를 코드로 구현해 누적 자산으로 남깁니다. 영문 노트북에 한국어 핵심 용어 주석을 병기 — KOAI 2차 한국어 서술형도 동시에 대비합니다.

캡스톤

한국어 또는 영어 텍스트/오디오 응용 프로젝트 1편을 완성합니다. NLP 또는 오디오 중 하나를 선택해 end-to-end로 구현하고, repo와 데모로 정리해 포트폴리오 자산으로 남깁니다.

포트폴리오 기여 — 시간이 만드는 깊이

A2는 GitHub repo 1개 koai-nlp-audio를 누적 자산으로 남깁니다. 한국어 데이터로 진행한 캡스톤은 자기소개서 문항 2의 "현지화된 AI 경험" 소재로 직접 활용됩니다.

GitHub

정리된 repo 1개 koai-nlp-audio

한국어 NLP

KoBERT/KLUE 산출물

자기소개서

문항 2 "현지화된 AI 경험"

이 이력은 KOAI 1차 서류의 포트폴리오 40% · AI 역량 30% 항목에 누적 증빙으로 작용합니다. 일찍 시작할수록 응시 시점의 깊이가 깊어집니다.

이 코스의 위치

A2는 KOAI 커리큘럼 심화 트랙의 코스입니다. 전체 트랙 구조는 KOAI 대비 커리큘럼 허브에서 확인하세요.

이전 단계 (선행)

A1. 심화 I — Computer Vision

컴퓨터 비전 심화

현재 코스

A2. 심화 II — NLP & Audio

자연어 처리 & 오디오

다음 단계

C1. Portfolio Studio

포트폴리오 정리

자주 묻는 질문

A2를 들으려면 무엇이 필요한가요?

F1·F2 이수가 필요합니다. A1과 병행 가능하며 고등부 응시 예정자에게 권장합니다.

A2는 KOAI 어떤 과목인가요?

KOAI 실라버스 4과목(자연어 처리 및 오디오) 전 범위(4-1~4-2)에 매핑됩니다. 토큰화·BERT·LLM API·RAG·Whisper까지 다룹니다.

한국어 NLP도 다루나요?

네. 5주차에 형태소·한국어 토크나이저·KoBERT·KLUE를 다룹니다. 한국어 데이터 캡스톤은 자기소개서 "현지화된 AI 경험" 소재로 활용됩니다.

LLM API는 실제로 써보나요?

7주차에 Anthropic·OpenAI API와 프롬프트 엔지니어링으로 RAG mini system을 직접 구성합니다.

A2 다음은요?

C1 Portfolio Studio → C2 Mock Bootcamp → C3 Selection Camp로 이어집니다. 정확한 일정은 KOAI 대회 안내(https://citcoding.com/competitions/koai.html)를 확인하세요.

A2 상담 안내

텍스트·오디오 심화 경로와 한국어 NLP 강점 전략을 진단 세션에서 개별 설계해 드립니다.

관련 페이지

상담하기 (02) 540-2922