Lior Testa
LIOR TESTA
TESTAMIND
AI Educator & Developer
MODULE 2 — ADVANCED FEATURES
עיבוד המוני וניהול הקשר
שיעור 5 מתוך 5
חומרים נוספים
1 / 10
📚מודול2 — פיצ'רים מתקדמים
🎓שיעור7 (5 מתוך 5)
משך~7 דקות
📈רמהמתקדם
🎯
נקודות מפתח מהשיעור
1
Message Batches API
עד 100,000 בקשות בבת אחת עם 50% הנחה. אידיאלי ל-evaluations, content moderation, ועיבוד נתונים בכמויות.
2
חלון הקשר ו-Compaction
200K סטנדרט, עד 1M tokens בטייר 4+. Compaction מסכם אוטומטית שיחות ארוכות.
3
בחירת מודל חכמה
Haiku לפשוט, Sonnet למאוזן, Opus למורכב. תתחילו מ-Haiku ותעלו רק אם צריך.
4
ייעול עלויות משולב
Caching + Batching + Model Routing = חיסכון של 70-80% מהעלויות. מ-$1,000 ל-$200 על אותו נפח.
🧠
בדקו את עצמכם
1כמה הנחה נותן Message Batches API?
25% הנחה
50% הנחה
75% הנחה
2מה עושה Compaction?
מוחק את כל ההיסטוריה ומתחיל מחדש
מסכם אוטומטית הודעות ישנות ושומר מידע חשוב
מכפיל את חלון ההקשר
3איזה מודל כדאי להתחיל איתו לרוב המשימות?
Opus — תמיד הכי חזק
Haiku — תתחילו זול ותעלו רק אם צריך
זה לא משנה — כולם אותו דבר
4איזה שלוש טכניקות משלבים לייעול עלויות?
Streaming + Caching + Batching
Tool Use + Vision + Streaming
Caching + Batching + Model Routing
תשובות נכונות מתוך 4
✍️
תרגול — קוד לנסות
יצירת Batch עם Python SDK
import anthropic client = anthropic.Anthropic() batch = client.messages.batches.create( requests=[ { "custom_id": "item-001", "params": { "model": "claude-sonnet-4-20250514", "max_tokens": 1024, "messages": [ {"role": "user", "content": "Summarize this text..."} ] } }, # ... up to 100,000 requests ] ) print(f"Batch ID: {batch.id}")
Token Counting API
result = client.messages.count_tokens( model="claude-sonnet-4-20250514", messages=[ {"role": "user", "content": "Your long text here..."} ] ) print(f"Input tokens: {result.input_tokens}")
Model Routing — בחירת מודל לפי מורכבות
def choose_model(task_complexity): if task_complexity == "simple": return "claude-haiku-3-5-20241022" elif task_complexity == "balanced": return "claude-sonnet-4-20250514" else: return "claude-opus-4-20250514" model = choose_model("simple") response = client.messages.create( model=model, max_tokens=512, messages=[{"role": "user", "content": "Classify: positive"}] )
🚀 UP NEXT
שיעור 8: Claude Agent SDK — סוכנים אוטונומיים
בשיעור הבא נעבור למודול 3 — אדריכלות פרודקשן. נלמד לבנות סוכנים אוטונומיים עם Agent SDK — Web Search, Web Fetch, Code Execution ועוד.
Agent Loop
Built-in Tools
Web Search
Code Execution