📚מודול2 — פיצ'רים מתקדמים
🎓שיעור7 (5 מתוך 5)
⏲משך~7 דקות
📈רמהמתקדם
1
Message Batches API
עד 100,000 בקשות בבת אחת עם 50% הנחה. אידיאלי ל-evaluations, content moderation, ועיבוד נתונים בכמויות.
2
חלון הקשר ו-Compaction
200K סטנדרט, עד 1M tokens בטייר 4+. Compaction מסכם אוטומטית שיחות ארוכות.
3
בחירת מודל חכמה
Haiku לפשוט, Sonnet למאוזן, Opus למורכב. תתחילו מ-Haiku ותעלו רק אם צריך.
4
ייעול עלויות משולב
Caching + Batching + Model Routing = חיסכון של 70-80% מהעלויות. מ-$1,000 ל-$200 על אותו נפח.
1כמה הנחה נותן Message Batches API?
25% הנחה
50% הנחה
75% הנחה
2מה עושה Compaction?
מוחק את כל ההיסטוריה ומתחיל מחדש
מסכם אוטומטית הודעות ישנות ושומר מידע חשוב
מכפיל את חלון ההקשר
3איזה מודל כדאי להתחיל איתו לרוב המשימות?
Opus — תמיד הכי חזק
Haiku — תתחילו זול ותעלו רק אם צריך
זה לא משנה — כולם אותו דבר
4איזה שלוש טכניקות משלבים לייעול עלויות?
Streaming + Caching + Batching
Tool Use + Vision + Streaming
Caching + Batching + Model Routing
יצירת Batch עם Python SDK
import anthropic
client = anthropic.Anthropic()
batch = client.messages.batches.create(
requests=[
{
"custom_id": "item-001",
"params": {
"model": "claude-sonnet-4-20250514",
"max_tokens": 1024,
"messages": [
{"role": "user",
"content": "Summarize this text..."}
]
}
},
# ... up to 100,000 requests
]
)
print(f"Batch ID: {batch.id}")
Token Counting API
result = client.messages.count_tokens(
model="claude-sonnet-4-20250514",
messages=[
{"role": "user",
"content": "Your long text here..."}
]
)
print(f"Input tokens: {result.input_tokens}")
Model Routing — בחירת מודל לפי מורכבות
def choose_model(task_complexity):
if task_complexity == "simple":
return "claude-haiku-3-5-20241022"
elif task_complexity == "balanced":
return "claude-sonnet-4-20250514"
else:
return "claude-opus-4-20250514"
model = choose_model("simple")
response = client.messages.create(
model=model,
max_tokens=512,
messages=[{"role": "user",
"content": "Classify: positive"}]
)
🚀 UP NEXT
שיעור 8: Claude Agent SDK — סוכנים אוטונומיים
בשיעור הבא נעבור למודול 3 — אדריכלות פרודקשן. נלמד לבנות סוכנים אוטונומיים עם Agent SDK — Web Search, Web Fetch, Code Execution ועוד.
Agent Loop
Built-in Tools
Web Search
Code Execution