Sign in Subscribe

Fine-tuning

[AI Agent] AI Engineering Review (12주차)

[AI Agent] AI Engineering Review (12주차)

AI Agent 과정을 정리합니다. LLM 기초와 프롬프트 엔지니어링에서 시작해 RAG, Evaluation, Agent 설계, Observability, Cost, Security, Fine-tuning까지 운영 가능한 AI 시스템을 만들기 위해 필요한 흐름을 되짚습니다.

[AI Agent] LLM Training Preview (11주차)

[AI Agent] LLM Training Preview (11주차)

LLM의 Pre-training과 Post-training 차이를 정리하고 Fine-tuning의 목적, 데이터 구조와 설계 방법을 정리했습니다.

[AI/ML] Qwen3-VL-4B 강화 학습(RL) 기반 파인튜닝(Unsloth) 가이드

[AI/ML] Qwen3-VL-4B 강화 학습(RL) 기반 파인튜닝(Unsloth) 가이드

GRPO를 활용해 Qwen3-VL을 강화학습으로 파인튜닝하는 실전 가이드. Unsloth와 TRL로 수학 문제 해결 능력을 향상시키는 방법과 보상함수 설계법을 제시합니다.

[AI/ML] Qwen3 VL 8B SFT LoRA Fine Tuning 가이드

[AI/ML] Qwen3 VL 8B SFT LoRA Fine Tuning 가이드

LoRA를 활용하여 Qwen3-VL-8B을 건설현장 균열 이미지 데이터셋(2,057개)으로 효율적으로 파인튜닝하고 SageMaker vLLM으로 배포하는 전체 파이프라인을 확인합니다

[SageMaker] SageMaker Jumpstart를 사용한 LLM Fine Tuning - DAFT(Domain-Agnostic Fine-Tuning)

[SageMaker] SageMaker Jumpstart를 사용한 LLM Fine Tuning - DAFT(Domain-Agnostic Fine-Tuning)

Sagemaker를 통해 LLM 모델을 파인튜닝하고 테스트합니다.