알면 신나는 AI용어: 제로샷 러닝

금융 머신러닝 개요

by 주빌리20 2025. 12. 22. 21:47

제로샷 러닝(Zero-Shot Learning, ZSL)은 인공지능이 학습 과정에서 한 번도 본 적 없는 데이터나 클래스에 대해 추론하고 정답을 맞히는 능력을 말합니다.

일반적인 딥러닝은 사과 사진을 인식하려면 수천 장의 사과 사진을 미리 학습해야 하지만, 제로샷 러닝은 그 과정 없이도 "이것은 사과다"라고 판단하는 것이 목표입니다.

제로샷 러닝의 핵심은 '개념 간의 관계'나 '설명(Attribute)'을 활용하는 것입니다. 사람이 새로운 동물을 처음 보더라도 설명을 통해 무엇인지 유추하는 과정과 비슷합니다.

예시: 여러분이 '얼룩말'을 한 번도 본 적 없다고 가정해 봅시다. 하지만 누군가 다음과 같이 설명해 줍니다.
"얼룩말은 말처럼 생겼는데, 몸 전체에 검은색과 흰색 줄무늬가 있어."
추론: 나중에 처음으로 초원에서 얼룩말을 마주치면, 여러분은 학습한 적은 없지만 **'말의 형태'**와 **'줄무늬'**라는 정보를 조합해 "저게 바로 얼룩말이구나!"라고 알아챕니다.

AI 역시 텍스트 설명이나 특징 벡터를 통해 이미 알고 있는 정보와 새로운 정보를 연결하는 방식으로 작동합니다.

특징	설명
데이터 효율성	모든 클래스에 대해 방대한 학습 데이터를 수집할 필요가 없습니다.
확장성	새로운 카테고리가 추가될 때마다 모델을 처음부터 다시 학습시키지 않아도 됩니다.
지식 전이	언어 모델(LLM)처럼 이미 세상의 방대한 지식을 배운 모델일수록 제로샷 능력이 뛰어납니다.

최근 우리가 사용하는 ChatGPT 같은 대규모 언어 모델이 제로샷 러닝의 대표적인 예입니다.

명령: "다음 문장을 프랑스어로 번역해줘: '오늘 날씨가 좋네요.'"
상황: 만약 모델이 이 특정 문장에 대한 번역 데이터를 명시적으로 학습한 적이 없더라도, 언어의 구조와 관계를 이미 이해하고 있기 때문에 바로 답을 내놓을 수 있습니다. 이것이 바로 제로샷 성능입니다.

파이낸셜 노마드의 재테크