Fine-tuning [AI/ML] Qwen3-VL-4B 강화 학습(RL) 기반 파인튜닝(Unsloth) 가이드 GRPO를 활용해 Qwen3-VL을 강화학습으로 파인튜닝하는 실전 가이드. Unsloth와 TRL로 수학 문제 해결 능력을 향상시키는 방법과 보상함수 설계법을 제시합니다.
Fine-tuning [AI/ML] Qwen3 VL 8B SFT LoRA Fine Tuning 가이드 LoRA를 활용하여 Qwen3-VL-8B을 건설현장 균열 이미지 데이터셋(2,057개)으로 효율적으로 파인튜닝하고 SageMaker vLLM으로 배포하는 전체 파이프라인을 확인합니다
DAFT [SageMaker] SageMaker Jumpstart를 사용한 LLM Fine Tuning - DAFT(Domain-Agnostic Fine-Tuning) Sagemaker를 통해 LLM 모델을 파인튜닝하고 테스트합니다.