파인튜닝은 CPU 및 저사양 환경에서는 시간이 너무 오래 걸리므로 RUN POD 플랫폼 활용
실습 환경세팅
RunPod 회원 가입 및 결제
Pod 스펙 지정(권장)
인스턴스를 띄워 Jupyter로 접속한 뒤, 터미널을 열어 아래 작업을 실행
Hugging Face 토큰(HF_TOKEN) 세팅
# 1) 현재 셸에만 적용(세션 종료 시 사라짐)
export HF_TOKEN="xxxxx"
# 2) 매번 자동 적용(~/.bashrc에 추가)
echo 'export HF_TOKEN="xxxxx"' >> ~/.bashrc
source ~/.bashrc
github 소스코드 클론(ai_agent_chatbot)
LoRA 학습/병합 실행 전 필수 패키지 설치
python -m venv .venv
cd .venv/bin
chmod 777 activate
source ./activate
pip install -r requirements.txt
학습진행
base모델 vs 튜닝모델 비교 테스트
base 모델 실행
apt-get update
apt-get install -y zstd
curl -fsSL <https://ollama.com/install.sh> | sh
ollama serve > ollama.log 2>&1 &
ollama run llama3.2:3b
병합모델 실행 및 테스트