\uD83D\uDCDA\u05DE\u05D5\u05D3\u05D5\u05DCModule 2 - \u05E4\u05D9\u05E6'\u05E8\u05D9\u05DD \u05DE\u05EA\u05E7\u05D3\u05DE\u05D9\u05DD
\uD83C\uDF93\u05E9\u05D9\u05E2\u05D5\u05E86 \u05DE\u05EA\u05D5\u05DA 10
\u23F2\u05DE\u05E9\u05DA~7 \u05D3\u05E7\u05D5\u05EA
\uD83D\uDCC8\u05E8\u05DE\u05D4\u05D1\u05D9\u05E0\u05D5\u05E0\u05D9-\u05DE\u05EA\u05E7\u05D3\u05DD
TAKEAWAY 1
Prompt Caching - \u05D7\u05D9\u05E1\u05DB\u05D5\u05DF \u05E9\u05DC 90%
cache_control \u05E9\u05D5\u05DE\u05E8 \u05EA\u05D5\u05DB\u05DF \u05D7\u05D5\u05D6\u05E8 \u05D1\u05D6\u05D9\u05DB\u05E8\u05D5\u05DF \u05D5\u05DE\u05D0\u05D9\u05E5 \u05EA\u05D2\u05D5\u05D1\u05D5\u05EA \u05D1-85%
TAKEAWAY 2
Extended Thinking - \u05D7\u05E9\u05D9\u05D1\u05D4 \u05E2\u05DE\u05D5\u05E7\u05D4
budget_tokens \u05E0\u05D5\u05EA\u05DF \u05DC\u05E7\u05DC\u05D5\u05D3 \u05DC\u05D7\u05E9\u05D5\u05D1 \u05DC\u05E4\u05E0\u05D9 \u05E9\u05D4\u05D5\u05D0 \u05E2\u05D5\u05E0\u05D4, \u05DC\u05D5\u05D2\u05D9\u05E7\u05D4 \u05D5\u05E7\u05D5\u05D3 \u05D1\u05E8\u05DE\u05D4 \u05D0\u05D7\u05E8\u05EA
TAKEAWAY 3
\u05E9\u05D9\u05DC\u05D5\u05D1 \u05E9\u05E0\u05D9\u05D4\u05DD - \u05D4\u05D8\u05D5\u05D1 \u05DE\u05E9\u05E0\u05D9 \u05E2\u05D5\u05DC\u05DE\u05D5\u05EA
Thinking + Caching = \u05E7\u05D0\u05E9 \u05E9\u05DC \u05E9\u05E2\u05D4 \u05D5\u05E9\u05DE\u05D9\u05E8\u05EA \u05D1\u05DC\u05D5\u05E7\u05D9 \u05D7\u05E9\u05D9\u05D1\u05D4 \u05D0\u05D5\u05D8\u05D5\u05DE\u05D8\u05D9\u05EA
TAKEAWAY 4
\u05DE\u05E2\u05E7\u05D1 \u05D5\u05D0\u05D5\u05E4\u05D8\u05D9\u05DE\u05D9\u05D6\u05E6\u05D9\u05D4
\u05DE\u05E2\u05E7\u05D1 cache hits \u05D3\u05E8\u05DA usage \u05D1-API \u05D5\u05D3\u05E9\u05D1\u05D5\u05E8\u05D3 \u05E9\u05DC Anthropic Console
1
\u05DB\u05DE\u05D4 \u05D0\u05D7\u05D5\u05D6 \u05D7\u05D9\u05E1\u05DB\u05D5\u05DF \u05E0\u05D9\u05EA\u05DF \u05DC\u05D4\u05E9\u05D9\u05D2 \u05E2\u05DD Prompt Caching?
\u05E2\u05D3 50% \u05D7\u05D9\u05E1\u05DB\u05D5\u05DF \u05D1\u05E2\u05DC\u05D5\u05D9\u05D5\u05EA
\u05E2\u05D3 90% \u05D7\u05D9\u05E1\u05DB\u05D5\u05DF \u05D1\u05E2\u05DC\u05D5\u05D9\u05D5\u05EA
\u05E2\u05D3 30% \u05D7\u05D9\u05E1\u05DB\u05D5\u05DF \u05D1\u05E2\u05DC\u05D5\u05D9\u05D5\u05EA
\u05D0\u05D9\u05DF \u05D7\u05D9\u05E1\u05DB\u05D5\u05DF, \u05E8\u05E7 \u05DE\u05D4\u05D9\u05E8\u05D5\u05EA
2
\u05DE\u05D4 \u05D4\u05DE\u05D9\u05E0\u05D9\u05DE\u05D5\u05DD \u05E9\u05DC budget_tokens \u05D1-Extended Thinking?
256 \u05D8\u05D5\u05E7\u05E0\u05D9\u05DD
512 \u05D8\u05D5\u05E7\u05E0\u05D9\u05DD
1,024 \u05D8\u05D5\u05E7\u05E0\u05D9\u05DD
4,096 \u05D8\u05D5\u05E7\u05E0\u05D9\u05DD
3
\u05DE\u05D4 \u05E7\u05D5\u05E8\u05D4 \u05DC-TTL \u05E9\u05DC \u05D4\u05E7\u05D0\u05E9 \u05DB\u05E9-Extended Thinking \u05DE\u05D5\u05E4\u05E2\u05DC?
\u05E0\u05E9\u05D0\u05E8 5 \u05D3\u05E7\u05D5\u05EA \u05DB\u05DE\u05D5 \u05D1\u05E8\u05D9\u05E8\u05EA \u05D4\u05DE\u05D7\u05D3\u05DC
\u05E2\u05D5\u05DC\u05D4 \u05DC\u05E9\u05E2\u05D4 \u05D0\u05D7\u05EA
\u05E2\u05D5\u05DC\u05D4 \u05DC-24 \u05E9\u05E2\u05D5\u05EA
\u05D4\u05E7\u05D0\u05E9 \u05DC\u05D0 \u05E2\u05D5\u05D1\u05D3 \u05E2\u05DD Extended Thinking
4
\u05D0\u05D9\u05D6\u05D4 \u05E9\u05D3\u05D4 \u05D1-API response \u05DE\u05E8\u05D0\u05D4 \u05D8\u05D5\u05E7\u05E0\u05D9\u05DD \u05E9\u05E0\u05E7\u05E8\u05D0\u05D5 \u05DE\u05D4\u05E7\u05D0\u05E9?
input_tokens
cache_read_input_tokens
output_tokens
cached_output_tokens
\uD83D\uDE80 UP NEXT
\u05E9\u05D9\u05E2\u05D5\u05E8 7: \u05E2\u05D9\u05D1\u05D5\u05D3 \u05D4\u05DE\u05D5\u05E0\u05D9 \u05D5\u05E0\u05D9\u05D4\u05D5\u05DC \u05D4\u05E7\u05E9\u05E8
\u05D1\u05E9\u05D9\u05E2\u05D5\u05E8 \u05D4\u05D1\u05D0 \u05E0\u05DC\u05DE\u05D3 \u05E2\u05DC Batches API \u05E2\u05DD 50% \u05D4\u05E0\u05D7\u05D4, \u05E0\u05D9\u05D4\u05D5\u05DC \u05D7\u05DC\u05D5\u05DF \u05D4\u05E7\u05E9\u05E8, Compaction, \u05D5\u05D0\u05E1\u05D8\u05E8\u05D8\u05D2\u05D9\u05D5\u05EA \u05DC\u05D9\u05D9\u05E2\u05D5\u05DC \u05E2\u05DC\u05D5\u05D9\u05D5\u05EA.
Batches API
Context Windows
Compaction
Cost Optimization