📚מודולModule 4 - פרודקשן ותחזוקה
🎓שיעור13 (14 מתוך 14)
⏲משך~8 דקות
🏆רמהפינלה
TAKEAWAY 1
Full Pipeline
שמונה שלבים: Define → Data → Model → SFT → DPO → Eval → Deploy → Monitor
TAKEAWAY 2
איכות הדאטה
1,000-5,000 דוגמאות איכותיות עדיפות על מיליונים גרועות
TAKEAWAY 3
Unsloth + LoRA
אימון יעיל עם r=16, alpha=32, lr=2e-4 ב2-4 שעות
TAKEAWAY 4
Deploy + Monitor
GGUF Q4_K_M → Ollama / vLLM + ניטור ושיפור מתמיד
1
מה השלב הראשון ב-Pipeline לפני שכותבים קוד?
לאמן מודל בסיס
להגדיר use case ו-success metrics
להתחיל אימון SFT
להעלות ל-Hugging Face
2
כמה דוגמאות איכותיות מומלץ ל-Fine-Tuning יעיל?
100 דוגמאות
1,000-5,000 דוגמאות
מיליון דוגמאות
אין מספר מינימלי
3
מה הפורמט המומלץ ל-quantization לפני deployment?
SafeTensors
ONNX
GGUF Q4_K_M
PyTorch .bin
4
מה ההבדל בין Ollama ל-vLLM?
Ollama תומך ב-GPU יותר חזק
Ollama ל-local, vLLM ל-production עם batch processing
אין הבדל, שניהם זהים
vLLM רץ רק על Windows
🏆 COURSE COMPLETE
סיימתם את הקורס!
התחלתם כ-consumers של AI ועכשיו אתם יוצרי AI.
הכוח שלכם הוא ביכולת ליצור AI מותאם — ואתם עכשיו יודעים איך.