להפעיל כעסק — capstone | צוות של איש אחד

חוט הפרויקט — איפה אנחנו על הציר

פרק 7 (קודם): הרכבת צי חי מתבנית OSS מאומתת (gru-ai / Orloj / Hermes) או stack מינימלי, חיברת עליו observability והגדרת governance ב-runtime — הבסיס הטכני.

פרק 8 (כאן, אחרון): מחברים את ארבעת התפקידים למערכת עסקית אחת חיה — loop + autonomy + observability + payroll — ומקבלים את ההחלטות העסקיות הסופיות: build-vs-buy, הצעת תפקיד-כשירות לשוק הישראלי, ו-portability plan. זה ה-capstone שסוגר את הקורס.

אחרי הפרק: אין פרק נוסף — יש לך 'חברה של אחד' רצה ב-git, וצ'קליסט production שמכין אותה לעולם האמיתי. אתה מסיים את הקורס כ-operator, לא כפרילנסר.

מטרות למידה

לחבר ולהפעיל צי 4-תפקידים חי (מכירות / תוכן / תמיכה / כספים) עם cron+eval+reflexion, סולם autonomy ו-approval gates — מהפרקים הקודמים, בפועל ולא בתיאוריה.
לתפעל agent payroll dashboard בש"ח לצי החי, ולקבל החלטת build-vs-buy מנומקת לכל תפקיד.
לתמחר הצעת 'תפקיד-כשירות' (productized-role) ל-SMB ישראלי מול הצעת מחיר של סוכנות 5 אנשים (~₪45,000), ולנמק את היתרון של אפס תקורה.
לבצע audit סיכונים סופי (hype / freshness / lock-in) ולכתוב portability plan + production checklist לפני הפעלה אמיתית.
להפעיל שגרת operator שבועית מצטברת — יומי/שבועי/חודשי — שמנהלת את הצי כחברה ולא כרשימת מטלות.

דרישות קדם

זה פרק אינטגרציה — הוא נשען על כל שבעת הפרקים הקודמים. אם דילגת על אחד מהם, ה-capstone לא יחבר את החלקים שאין לך:

פרק 1 — operator, לא founder: ה-execution-vs-judgment split וששת התפקידים הסטנדרטיים. כאן נבחר 4 מהם להפעלה חיה.
פרק 2 — תפקיד, לא הוראה: ה-org chart עם role+goal+scope+escalation. כאן הוא נטען לתוך הצי החי.
פרק 3 — SOPs לסוכנים: ה-SOPs ב-RFC 2119 וה-.context/ ב-git. כאן הם הופכים ל-Skills שכל סוכן טוען.
פרק 4 — Cron + Eval + Reflexion: ה-loop שמריץ ומשפר בלילה. כאן הוא מחבר את ארבעת התפקידים.
פרק 5 — Owner-as-Operator: סולם ה-autonomy וה-approval gates. כאן הם מגדרים את הצי החי.
פרק 6 — P&L של הסוכנים: ה-agent payroll וה-model-routing policy. כאן הם מתומחרים על הצי האמיתי בש"ח.
פרק 7 — להרכיב צי אמיתי: ה-template (gru-ai/Orloj/minimal) וה-observability. כאן הם הבסיס שעליו הכל יושב.

מה תפיק בסוף הפרק (5 תוצרים)

צי 4-תפקידים חי — SDR (מסנן לידים מול ICP SOP), Writer+Editor (eval-gate על golden set של brand-voice), Support triage (reflexion אחרי כל פנייה), Finance renewal (approval gate על כל פעולת כסף) — מחובר ב-loop, מגודר ב-autonomy+approvals, נצפה ב-observability, הכל ב-git.
Weekly Agent All-Hands report — cron שמרכז פלטים/כשלים/לקחים של כל סוכן ל-report אחד שאתה סוקר ביום ראשון.
Agent Payroll dashboard בש"ח לצי החי + מסמך החלטות: org chart סופי, build-vs-buy לכל תפקיד, model-routing policy, portability plan.
הצעת 'תפקיד-כשירות' מתומחרת ל-SMB ישראלי מול ~₪45,000 של סוכנות 5 אנשים — עם בדיקת מרווח מול עלות הטוקנים האמיתית.
Production checklist + final risk audit (hype/freshness/lock-in) — המסמך שמכריע אם הצי מוכן לעסק אמיתי.

אינטגרציהמערכת אחתחיווט

משבעה חלקים לחברה אחת

עד עכשיו בנית שבעה חלקים נפרדים, פרק אחרי פרק. כל אחד מהם עמד בפני עצמו: org chart בפרק 2, SOP בפרק 3, loop בפרק 4. אבל חלקים נפרדים הם בדיוק מה שהקורס הזה בא לרפא — בעיית נקודת-האינטגרציה שראינו בפרק 1: כלים מנותקים שאף אחד מהם לא יודע מה השני עושה, ואתה ה-glue היחיד ביניהם. כפי שניסחה זאת Nestr, "לרוב המייסדים הסולו שבונים עם סוכני-AI אין מבנה... המייסד הוא נקודת-האינטגרציה היחידה". ה-capstone הזה הוא הרגע שבו אתה מפסיק להיות ה-glue.

המעבר מ"שבעה חלקים" ל"חברה אחת" הוא מעבר בחיווט (wiring), לא בכמות. אתה לא בונה שום דבר חדש — אתה מחבר את מה שכבר קיים כך שכל חלק מזין את השני. ה-wiring עצמו הוא ה-competitive moat שלך: כל אחד יכול לפתוח Notion ולשים שם GPT. אבל operator שמחזיק org chart ב-git, SOPs שסוכנים טוענים, loop שמשפר בלילה, ו-P&L חודשי — זה מה שמפריד בין "שימוש ב-AI" לבין "הפעלת חברה":

השכבה	מאיזה פרק	מה היא תורמת לצי החי
Org chart (4 תפקידים)	פרק 2	מי הסוכנים, מה ה-scope של כל אחד, ולמי הוא מסלים
SOPs כ-Skills	פרק 3	איך כל תפקיד מבצע את העבודה שלו בעקביות (RFC 2119)
Loop: cron+eval+reflexion	פרק 4	המנוע שמריץ בתזמון, מנקד מול golden set, ומשפר בלילה
Autonomy + approval gates	פרק 5	מה רץ לבד מול מה דורש חתימה שלך — המשמעת
Agent payroll + routing	פרק 6	כמה כל תפקיד עולה בש"ח, ואיזה מודל מריץ אותו
Template + observability	פרק 7	הבסיס הטכני וה'מצלמת אבטחה' על כל הצי

הצי החי הוא ארבעה תפקידים — בדיוק אלה שה-capstone של הקורס (מה-syllabus) דורש: מכירות, תוכן, תמיכה, כספים. למה דווקא ארבעה ולא שישה? כי ה-capstone מודד אם אתה יודע לחבר מערכת, לא אם אתה יודע למלא org chart. ארבעה תפקידים מכסים את כל ארבעת דפוסי החיווט שצריך לשלוט בהם: eval-gate (תוכן), reflexion (תמיכה), approval-gate על כסף (כספים), ו-human-in-the-loop על outreach (מכירות). מי שמרכיב את הארבעה האלה נכון — מרכיב גם שישה. וכפי שמציין Nestr בניסוח חד: "סוכן עם תפקיד מחזיק פונקציה מקצה לקצה; סוכן עם הוראה מחכה להוראה הבאה". ארבעת התפקידים שלמטה הם ארבעה "בעלי-תפקיד", לא ארבעה מבצעי-הוראות.

מקרה ממחיש: דניאל, מנהל שיווק עצמאי בתל אביב, ניסה לנהל שלושה כלים נפרדים — Notion לניהול לידים, Make להפצת תוכן, ו-ChatGPT לפניות תמיכה. הוא עצמו היה הגשר: כל שישי בבוקר הוא העביר נתונים ידנית בין הכלים. ב-capstone הוא עצר את זה. כתב org chart, חיבר SOP, והפעיל loop. כעת כל הנתונים זורמים אוטומטית בין ארבעת התפקידים, ויום שישי שלו פנוי לאסטרטגיה. זה בדיוק מה שה-capstone הזה מלמד — לא לבנות כלי חדש, אלא לחבר את מה שיש.

עשה עכשיו (2 דקות)

פתח את ה-repo של החברה (תיקיית .context/ מפרק 3). ודא שיש בה את שלושת אלה: org-chart.md, תיקיית sops/ עם לפחות SOP אחד, ותיקיית lessons/ ריקה או מאוכלסת. אם חסר אחד מהם — חזור לפרק הרלוונטי לפני שתמשיך. אי-אפשר לחבר חלק שלא קיים.

ארכיטקטורה4 תפקידיםדפוסי חיווט

ארכיטקטורת הצי החי: ארבעה תפקידים, ארבעה דפוסים

כל אחד מארבעת התפקידים מדגים דפוס חיווט אחר. זה לא מקרי — אם תשלוט בארבעת הדפוסים האלה, תוכל לחבר כל תפקיד עתידי. נעבור אחד-אחד, ונקשור כל תפקיד לפרק שבו בנית את החלק שלו.

תפקיד 1 — SDR (מכירות): דפוס ה-human-in-the-loop על outreach

סוכן ה-SDR (Sales Development Representative — נציג פיתוח מכירות, התפקיד שמסנן ומכשיר לידים לפני שמגיעים אליך) צופה ב-form/inbox, מכשיר כל ליד מול ICP SOP (Ideal Customer Profile — פרופיל הלקוח האידיאלי), מעשיר אותו, ומנסח outreach. החיווט הקריטי: approval gate אנושי לפני כל הודעה יוצאת. מקור המחקר (Knowlee 4Sales) מתאר את התפקיד הזה כ"autonomous prospecting + multi-channel outreach + meeting booking" — אבל הכלל מפרק 5 חד: כל פעולה שיוצאת ללקוח חיצוני מתחילה ב-human-in-the-loop.

בפועל זה נראה כך: ליד נכנס ל-Google Form בשעה 02:14. הסוכן מתעורר (event-driven), בודק מול ה-ICP SOP — גודל חברה, ענף, תפקיד פונה — ומחשב ציון כשירות. אם הציון עובר 70%, הסוכן מעשיר מ-LinkedIn ומנסח הודעת outreach. ב-07:00 אתה מקבל Telegram עם שלושה לידים ממתינים: "✓ אשר שליחה / ✗ דחה / ✏ ערוך". ליד שלא מקבל אישור עד 09:00 נכנס לתור "cold" אוטומטית. שום הודעה לא יצאה בלי עיניים שלך.

תפקיד 2 — Writer+Editor (תוכן): דפוס ה-eval-gate על golden set

זה לא סוכן אחד אלא שניים בשרשרת: Writer מנסח טיוטה, Editor מנקד אותה מול golden set של brand-voice (קול-המותג). רק טיוטות שעוברות את ה-rubric (מחוון הניקוד) מגיעות לתור הסקירה שלך. זה ה-eval-gate מפרק 4 בפעולה: scorer אוטומטי שחוסם פלט שלא עומד בסטנדרט לפני שאתה מבזבזת עליו תשומת-לב. ה-golden set כאן נבנה מתוצרי ה-dry-run של פרק 3.

הדיוק שמשנה: ה-golden set חייב להכיל דוגמאות של כשל, לא רק הצלחה. Editor שמאומן רק על פוסטים טובים לא יידע לחסום פוסט שטחי שנשמע טוב — הוא רואה את הסגנון אבל לא את העומק. הכנס למינימום 3 דוגמאות "נדחה + הסבר למה" לכל קריטריון ב-rubric. זה מה שמבדיל eval שעובד מ-eval שמאשר הכל.

תפקיד 3 — Support triage (תמיכה): דפוס ה-reflexion שמשתפר

סוכן התמיכה מסווג פנייה (classify), מנפק first response מ-SOP, ומסלים פניות קשות/מסוכנות אליך. החיווט הייחודי: אחרי כל פנייה הוא מריץ צעד reflexion — כותב "מה הייתי צריך לעשות אחרת" ל-.context/lessons/. זה ה-loop מפרק 4 ברמת התפקיד: לפי המאמר המכונן (Shinn et al., arXiv 2303.11366), שלושת המודולים Actor→Evaluator→Self-Reflection מאפשרים שיפור בלי אימון מחדש, כך ש"הפנייה ה-10 מטופלת טוב יותר מהראשונה" (gru-ai מכנה זאת "lessons learned").

דוגמה קונקרטית מה-paper: במבחן HotPotQA (שאלות מורכבות עם מרובה-מקורות), מודל GPT-4 עם Reflexion השיג +20% על ביצוע בלי reflexion — בלי אף עדכון משקל. על פי gru-ai, "ה-directive ה-10 רץ טוב יותר מהראשון" בגלל שהלקחים שנצברים ב-.context/lessons/ הופכים לחלק מה-context של כל ריצה עתידית. בסוכן תמיכה זה אומר: פנייה שגרמה לסלמה בשבוע שעבר → lesson נכתב → השבוע אותו סוג פנייה טופלה מיד בלי סלמה.

תפקיד 4 — Finance renewal (כספים): דפוס ה-approval-gate על כסף

סוכן הכספים מנקד חוזים/מנויים לסיכון חידוש (renewal/churn-risk), ומנסח את פניית החידוש. החיווט הקריטי, מפרק 5: כל פעולה שנוגעת בכסף מגודרת ב-approval gate עם סף ₪ + named approver. הסוכן מנסח, אבל אף שקל לא זז בלי one-click approval שלך. זה היישום הישיר של כלל money/permissions/records/state — הפעולה הכי בלתי-הפיכה בצי מקבלת את הגדר הכי מחמירה.

למה דווקא finance נשאר הכי נמוך בסולם ה-autonomy? כי טעות בתוכן אפשר לתקן — מחיקת פוסט, שליחת פוסט מתקן. טעות ב-outreach אפשר לתקן — התנצלות, הסבר. אבל פנייה שגויה לחידוש לקוח (מחיר שגוי, תנאים שגויים, לחצן "שלח חשבונית" שנלחץ לא נכון) — זה נזק שיכול לעלות ביחסי לקוח, במשפטי, ובפנים. reversibility הוא מה שמכתיב את רמת ה-gate, לא רמת ה-eval.

Framework: לאיזה דפוס חיווט שייך תפקיד חדש?

כשתרצה להוסיף תפקיד חמישי או שישי, אל תמציא חיווט — מַפֵּה אותו לאחד מארבעת הדפוסים:

אם התפקיד מפיק תוכן שצריך לעמוד בסטנדרט איכות → אז דפוס eval-gate על golden set (כמו Writer+Editor).
אם התפקיד שולח משהו ללקוח חיצוני → אז דפוס human-in-the-loop על outreach (כמו SDR).
אם התפקיד נוגע בכסף/הרשאות/רשומות → אז דפוס approval-gate עם סף ₪ + approver (כמו Finance).
אם התפקיד חוזר על אותו סוג משימה ויכול ללמוד מטעויות → אז דפוס reflexion שכותב לקח (כמו Support).

רוב התפקידים הם שילוב של שניים מהדפוסים. סוכן מכירות, למשל, הוא human-in-the-loop וגם reflexion.

Framework: איך לזהות שהחיווט מהיר מדי — "הסוכן בלי רשת"

אם תפקיד חדש עולה ל-autonomy מלאה בשבוע הראשון שלו → אז אתה ממהר. אפילו Pieter Levels, שמריץ ~$3M ARR בלי עובדים, מתחיל כל אוטומציה חדשה ב-supervised mode.
אם יש לך פחות מ-10 מקרי golden set לתפקיד → אז ה-eval שלו לא בשל. eval gate עם 3 דוגמאות הוא בעצם רעש, לא בקרת איכות.
אם טעות של תפקיד יכולה לגרום נזק שאי-אפשר לבטל → אז ה-gate נשאר אנושי, גם אחרי 100% pass-rate. חוקי irreversibility חזקים מחוקי eval.

טעות נפוצה: לחווט את ארבעת התפקידים באותו דפוס

המפתה ביותר הוא לתת לכל ארבעת הסוכנים אותה רמת autonomy ("כולם human-in-the-loop, ליתר ביטחון" או — גרוע יותר — "כולם אוטונומיים, כי בניתי eval"). זו טעות. תפקיד הכספים חייב approval-gate על כסף גם אחרי שה-eval pass-rate שלו מצוין; תפקיד התוכן לא צריך approval-gate אנושי על כל טיוטה — ה-eval-gate מספיק. דפוס שגוי = או צוואר בקבוק (אתה מאשר הכל) או סיכון (כסף זז לבד).

עשה עכשיו (3 דקות) — הכן את `.context/` לפני תרגיל 1

תרגיל 1 (וגם 2) תלויים בקבצים שיוצרים בפרקים 2+3. אם הם לא קיימים ב-.context/ שלך — צור אותם עכשיו, אחרת fleet-wiring.md יצביע על קבצים חסרים ותרגילים 1+2 ייתקעו:

mkdir -p .context/{org,sops,lessons,decisions,schedules} — צור את 5 תתי-התיקיות.
העתק מפרק 2: .context/org/chart.md (4 התפקידים + owned function לכל אחד).
העתק מפרק 3: .context/sops/sdr-qualify.md, .context/sops/writer-edit.md, .context/sops/support-triage.md, .context/sops/finance-renewal.md — 4 קבצי ה-SOP שעליהם fleet-wiring.md יצביע.

בלי 5 הקבצים האלה, "מלא שורה לכל תפקיד" הופך ל-תרגיל תיאורטי. השלם את 3 הצעדים לפני שאתה פותח את fleet-wiring.md.

תרגיל 1 (capstone — משלב פרקים 2+3+5): מטריצת חיווט הצי

מטרה: תוצר נראה לעין — טבלה אחת שמחווטת את כל ארבעת התפקידים שלך, מוכנה להפוך לקוד.

שלבים:

פתח גיליון/קובץ fleet-wiring.md ב-.context/.
צור טבלה עם עמודות: תפקיד · owned function (מפרק 2) · SOP file (מפרק 3) · דפוס חיווט (מ-4 הדפוסים למעלה) · autonomy level (in-the-loop / on-the-loop, מפרק 5) · escalation אליך מתי.
מלא שורה לכל אחד מארבעת התפקידים: SDR, Writer+Editor, Support, Finance.
בעמודת ה-autonomy — סמן את התפקיד שמתחיל הכי "נמוך" (כספים, כמעט תמיד) ואת זה שיכול לטפס הכי מהר (תמיכה, בזכות ה-reflexion).
הוסף עמודה חמישית: reversibility — סמן H (High, אפשר לבטל) / L (Low, קשה לבטל) לכל תפקיד. כל L מחייב gate אנושי ללא תלות ב-eval score.

תוצר נראה: טבלת חיווט בת 4 שורות ו-6 עמודות שאפשר להראות למישהו והוא יבין מיד איך החברה שלך עובדת. זה ה-blueprint שתחבר לפיו בתרגילים הבאים. פלט צפוי — דוגמה מלאה ל-4 שורות: שורת SDR תראה: "SDR | סינון לידים + הכנה לפגישה | sops/sdr-qualify.md | human-in-the-loop על outreach | in-the-loop | כל outreach ממתין לאישור | L (הודעה שנשלחה לא חוזרת)".

תפקיד	owned function	SOP file	דפוס חיווט	autonomy	reversibility
SDR	סינון לידים + הכנה לפגישה	sops/sdr-qualify.md	human-in-the-loop על outreach	in-the-loop (כל outreach ממתין לאישור)	L (הודעה יצאה — לא חוזרת)
Writer+Editor	טיוטה + ניקוד מול brand-voice rubric	sops/writer-edit.md	eval-gate על golden set	on-the-loop (אחרי 90% pass-rate)	H (מחיקה/תיקון תמיד אפשרי)
Support	triage + first-response + reflexion	sops/support-triage.md	reflexion שכותב לקח	on-the-loop (טיפוס מהיר)	H (תגובה ניתנת לתיקון מיידי)
Finance	renewal/churn-risk + ניסוח פנייה	sops/finance-renewal.md	approval-gate עם סף ₪ + approver	in-the-loop (תמיד)	L (פעולת כסף — לא הפיכה)

loopcronחיבור-בפועל

לחבר את הכל ל-loop אחד שרץ בלילה

עכשיו לוקחים את ארבעת התפקידים המחווטים ומחברים אותם ל-loop אחד שרץ בתזמון. בפרק 4 בנית את ה-loop לתפקיד בודד (ה-morning brief); כאן אתה מרכיב את אותו דפוס על ארבעה תפקידים שרצים זה לצד זה. שלושת מרכיבי ה-loop — cron, eval, reflexion — חוזרים, אבל עכשיו ברמת הצי:

מרכיב	ברמת הצי	מימוש (self-host / managed)
Cron	כל תפקיד רץ בתזמון משלו (SDR כל שעה, Finance פעם ביום, Support על trigger)	Hermes Agent (daemon, $0 infra) או Claude Code Routines (תשתית Anthropic, בלי תהליך לוקלי)
Eval	ה-golden set של כל תפקיד מנקד את הפלט שלו לפני שהוא יוצא	Braintrust (free tier: 1M spans/חודש, 10K eval runs) או Langfuse (OSS, חינמי ל-self-host)
Reflexion	כל תפקיד כותב לקח ל-`.context/lessons/` אחרי ריצה	קבצי Markdown ב-git — ה-.context/ pattern של gru-ai

הקריטי כאן: חמשת דפוסי התזמון מפרק 4 לא חלים על כל התפקידים באותה צורה. תזמן כל תפקיד לפי הטבע שלו —

שמור על ה-loop-debt ב-0: בכל פעם שמשהו מצטבר ב-queue בלי שהסוכן מטפל בו, קרא לזה "loop-debt". Loop-debt גדל בשקט — ואתה לא מבחין בו עד שלקוח מתלונן על תגובה שלא הגיעה, על תוכן שלא פורסם, או על חידוש שנשכח. ה-heartbeat (בדיקה שהסוכן בחיים וה-queue מתרוקן) הוא מה שמונע צבירת debt בלתי-נראה. כלל פשוט: כל תפקיד שרץ event-driven צריך heartbeat כל 4 שעות שבודק שה-queue לא עלה מעל 10 פריטים.

תרגיל 2 (capstone — משלב פרקים 3+4): לחבר את ה-loop על שני תפקידים

מטרה: תוצר נראה — שני תפקידים שרצים אוטומטית בתזמון, עם eval ו-reflexion מחוברים.

שלבים:

בחר שני תפקידים מהארבעה (המלצה: Support ו-Finance — אחד event-driven, אחד cron יומי).
חבר לכל אחד את ה-SOP שלו (כ-Skill מפרק 3), את ה-golden set שלו (כ-eval, מפרק 4), ואת קובץ ה-lessons/ שלו (ל-reflexion).
הגדר את התזמון: Support על event/trigger, Finance על cron יומי. ודא שלשניהם יש already-done marker.
הרץ אותם פעם אחת ובדוק ב-observability (מפרק 7) שה-trace מראה: schedule → run → eval score → reflection written.
פתח את קובץ ה-lessons שנוצר וקרא אותו. האם הלקח הגיוני? אם לא — מחק אותו ידנית לפני שהוא מרעיל ריצה עתידית. זו ה-"review of reflections" מהשגרה השבועית.

תוצר נראה: שני traces ב-Langfuse/Braintrust שמראים את ה-loop המלא רץ end-to-end על שני תפקידים — צילום מסך של ה-trace הוא ההוכחה. פלט צפוי לTrace של Support: span עם שם "support-triage", תת-spans "classify → sop-lookup → draft-response → eval-score:0.87 → reflection-written", וזמן ריצה כולל תחת 45 שניות.

ניהולall-handsתמונה-כוללת

ה-Weekly Agent All-Hands: ישיבת צוות עם צוות שלא קיים

ארבעה תפקידים שרצים בלילה יוצרים בעיה חדשה: איך אתה רואה את התמונה הכוללת בלי לצפות בכל ריצה? התשובה היא דפוס מתוך מחקר הקורס — ה-weekly agent all-hands: cron job שמרכז את הפלטים, הכשלים והלקחים של כל סוכן ל-report אחד שאתה סוקר ביום ראשון בבוקר. כפי שמנסח זאת המחקר: "הישיבה הקבועה שלך עם צוות שלא קיים".

ה-all-hands הוא מה שהופך אותך מ"מי שמגיב לתקלות" ל"operator שמנהל מגמות". הוא צריך לכלול, לכל תפקיד:

החיבור ל-tripwires מפרק 5 קריטי כאן. ה-all-hands הוא הסקירה היזומה השבועית; ה-tripwires הם ההתראות הסלקטיביות בזמן אמת. שניהם יחד הם איך operator סולו "מגדיל את עצמו": ה-tripwire מפנג אותך רק כשסוכן ניסה שוב ושוב, נתקל במקורות סותרים, או הפיק diff/פעולה מסוכנת — אחרת אתה לא מתערב עד יום ראשון. זו selective attention בפעולה.

שאלת ה-operator הנכונה ל-all-hands: לא "מה הסוכן עשה?" אלא "האם הוא עשה זאת בצורה שמשרתת את העסק?". ל-SDR עם 40 לידים שהוכשרו אבל רק פגישה אחת שהפכה ללקוח — ייתכן שה-ICP SOP שלו צר מדי, או שה-outreach טמפלייט גרוע. ה-output count הוא מה שה-all-hands מדווח; הפרשנות היא מה שה-operator עושה ביום ראשון בבוקר.

הבחנה חשובה: all-hands ≠ observability dashboard. ה-observability (פרק 7) מראה לך כל span, כל tool-call, כל retry — ברמת המיקרו. ה-all-hands מדווח ברמת המאקרו: מגמות שבועיות, eval pass-rate, לקחים. אם תנסה לנהל את הצי מ-observability בלבד, תאבד את עצמך בפרטים. אם תנהל רק מ-all-hands, תחמיץ תקלות חדות. שניהם יחד — מיקרו ומאקרו — זה הזוג שמאפשר לך לראות ולהגיב. Langfuse או Braintrust לפרטי הריצות; ה-all-hands לקצב הניהול השבועי.

Framework: all-hands שבועי מול tripwire בזמן אמת

אם זו מגמה (eval pass-rate יורד, עלות תפקיד עולה, אותו סוג כשל חוזר) → אז זה שייך ל-weekly all-hands, סוקרים ביום ראשון.
אם זה אירוע חד שמסוכן עכשיו (פעולת כסף תקועה ב-approval, סוכן ב-runaway loop, מקורות סותרים על ליד גדול) → אז זה tripwire, מפנג אותך מיד.
אם אתה לא בטוח לאן זה שייך → אז ברירת המחדל היא all-hands. ריבוי tripwires הופך אותם לרעש, ואתה מתחיל להתעלם מהם.
אם ה-eval pass-rate של תפקיד ירד מתחת לסף שקבעת (למשל 75%) שלושה שבועות ברצף → אז זו לא מגמה — זה משבר. הורד את ה-autonomy level שלו בחזרה לרמה קודמת ופתח חקירה.

תרגיל 3 (capstone — משלב פרקים 4+5+7): להפעיל את ה-All-Hands + tripwire אחד

מטרה: תוצר נראה — report שבועי שנוצר אוטומטית + tripwire אחד חי שמפנג אותך.

שלבים:

הגדר cron שבועי (יום ראשון 07:00) שאוסף מה-observability (פרק 7) את ה-output/failures/lessons/pass-rate של כל תפקיד וממלא את תבנית ה-all-hands.
הגדר tripwire אחד (המלצה: על תפקיד הכספים) — "פנג אותי אם פעולת כסף ממתינה ב-approval מעל 24 שעות, או אם הסוכן ניסה לנסח את אותה פנייה 3+ פעמים".
הפעל ידנית (dry-run) את ה-cron של ה-all-hands על נתוני השבוע האחרון כדי לראות report אמיתי.
צור בכוונה תנאי שמפעיל את ה-tripwire (למשל השאר פעולת-כסף בלי אישור) וודא שקיבלת התראה.
אחרי שה-tripwire פנג אותך — כבה אותו ידנית, טפל בסיבה, ואז הפעל מחדש. תרגול זה מוכיח שאתה מסוגל לנתק ולחבר מחדש חלקים בצי בלי לשבור את הכל.

תוצר נראה: קובץ all-hands report מלא בנתונים אמיתיים + צילום מסך של התראת ה-tripwire שהגיעה אליך (Telegram/email). פלט צפוי ל-report: "SDR: 18 לידים שוכשרו | 2 כשלים (tool-call timeout) | 1 lesson חדש: 'לא לפנות לחברות מתחת ל-10 עובדים' | pass-rate: 83%".

P&Lpayrollהחלטות-ROI

Agent Payroll על הצי החי: לנהל סוכנים כמו משכורות

בפרק 6 בנית את ה-agent payroll dashboard כתבנית. כאן אתה מפעיל אותו על הצי החי — עם נתוני עלות אמיתיים מה-observability. ההבדל קריטי: בפרק 6 חישבת אומדנים; כאן אתה קורא את החשבון האמיתי. ה-payroll הוא מה שהופך את "אני מפעיל סוכנים" ל"אני מנהל עסק עם מרווח".

מספרי-העוגן מהמחקר (להציג כ-ranges עם הנחות, לא כהבטחות — זה COST-CLAIM RISK מפורש בקורס):

ה-payroll dashboard לצי החי, בש"ח (כולל FX מ-USD — ספקי ה-LLM מחייבים בדולרים, וזה חייב להיכנס ל-P&L שלך). הטבלה למטה היא דוגמה מייצגת — המספרים הם המחשה, לא נתוני אמת; אתה ממלא את שלך מה-observability:

* דוגמה מייצגת. הנחות: שער USD→ILS ו-נפחים הם להמחשה בלבד; מלא את שלך מנתוני ה-observability האמיתיים.

תפקיד	מודל ראשי	עלות/חודש (₪)*	ROI (הכנסה/חיסכון שמייצר)	החלטה
SDR (מכירות)	frontier ל-qualify, זול ל-enrich	~₪650	מכשיר 40 לידים/חודש → 3 פגישות	Promote (העלה ב-autonomy)
Writer+Editor (תוכן)	זול ל-draft, frontier ל-edit	~₪420	12 פוסטים/חודש שעוברים eval	Right-size (הורד את ה-Editor למודל זול יותר)
Support (תמיכה)	זול ל-triage, frontier ל-10% הקשים	~₪300	חוסך ~15 שעות/חודש שלך	Keep
Finance (כספים)	frontier (סיכון גבוה, נפח נמוך)	~₪180	תופס 2 חידושים בסיכון/חודש	Keep

ההחלטה לכל תפקיד היא תמיד אחת משלוש — fire / promote / right-size — ותמיד לפי מספרים, לא vibes. שים לב למלכודת ה-loop הריבועי שחוזרת כאן מפרק 6: session בן 10 turns עולה ~50x קריאה בודדת, לא 10x, כי כל turn שולח שוב את כל ההיסטוריה. תפקיד שנראה זול פר-קריאה יכול להיות יקר מאוד פר-session. תקצב loops, לא קריאות.

כיצד "right-size" נראה בפועל: תפקיד ה-Writer+Editor בדוגמה למעלה עולה ₪420/חודש. ה-tiered routing שלמדת בפרק 6 אומר: שלח את 90% ה-drafts הפשוטים למודל זול (עלות: ~$0.001/draft), ואת ה-10% שה-Editor דחה לבדיקה מחודשת על מודל frontier. בהנחת 12 פוסטים/חודש, מעבר למודל זול ל-draft חוסך ~₪280/חודש — כמעט 67%. הכלל מהמחקר: tiered routing יכול לחתוך עלות פר-conversation עד ~80%.

טעות נפוצה: לשפוט תפקיד לפי "הרגשה שהוא עובד"

הסוכן הכי "מרשים" שלך הוא לא בהכרח הכי רווחי. תפקיד שמפיק תוכן יפה אבל רץ על מודל frontier יקר על כל טיוטה יכול לשרוף יותר ממה שהוא מייצר. בלי ה-payroll dashboard לא תראה את זה — תראה רק פלט יפה. ה-ROI פר-תפקיד הוא מה שמבחין בין "סוכן מרשים" ל"סוכן רווחי". 'free OSS' לא פותר את זה: gru-ai/Orloj/Hermes חינמיים ברישיון בלבד — צי always-on עדיין צובר חשבון טוקנים שיכול להשתוות למשכורת.

תרגיל 4 (capstone — משלב פרקים 6+7): Agent Payroll על נתונים אמיתיים

מטרה: תוצר נראה — dashboard payroll בש"ח עם נתוני עלות אמיתיים מה-observability + החלטה לכל תפקיד.

שלבים:

שלוף מה-observability (Langfuse/Braintrust, פרק 7) את עלות הטוקנים בפועל של כל תפקיד מהשבוע/חודש האחרון.
המר USD→ILS בשער עדכני והכנס לטבלת payroll: תפקיד · מודל · ₪/חודש · ROI · החלטה.
לכל תפקיד קבע fire / promote / right-size — ונמק במספר אחד (עלות/חיסכון).
בדוק לפחות תפקיד אחד אם אפשר ל-right-size אותו ב-tiered routing (מודל זול ל-90% הקלים) — והערך כמה זה חוסך (היעד מהמחקר: עד ~80% פר-conversation).
חשב את סך עלות הצי בש"ח ובדוק: האם היא מתחת ל-20% מהכנסה חודשית ממוצעת שלך? אם לא — יש לך "מס טוקנים" שצריך לטפל בו לפני שתמחר שירותים ללקוחות.

תוצר נראה: טבלת payroll מלאה בש"ח + שורת החלטה לכל תפקיד + חישוב חיסכון אחד מ-routing + אחוז עלות מול הכנסה. פלט צפוי — 4 שורות בטבלת payroll (מתואם לדוגמה למעלה; המספרים הם אותם ערכי-דוגמה שתרגיל 5 ייקח מהם): "SDR: ₪650/חודש | מכשיר 40 לידים → 3 פגישות → ~₪24,000 ARR | ROI: ~37x | Promote · Writer+Editor: ₪420/חודש | 12 פוסטים/חודש שעוברים eval | Right-size (להוריד editor למודל זול) · Support: ₪300/חודש | חוסך 14 שעות × ₪150/שעה = ₪2,100 | ROI: ~7x | Keep · Finance: ₪180/חודש | תופס 2 חידושים בסיכון/חודש | Keep · סך עלות צי: ₪1,550/חודש (~4% מהכנסה ₪40,000/חודש — מתחת לסף ה-20% המסומן)".

החלטהbuild-vs-buyportability

ההחלטה הסופית: Build-vs-Buy ו-Portability

עכשיו שיש לך צי חי עם payroll, אתה יכול לקבל את ההחלטה העסקית הסופית לכל תפקיד: לבנות על OSS (אתה הבעלים, אתה משלם טוקנים) או לקנות commercial OS (מהיר יותר, אבל lock-in). זו לא החלטה אחת לכל הצי — היא יכולה להיות שונה פר-תפקיד.

אופציה	דוגמאות מאומתות	מתי לבחור	הסיכון
Build (OSS)	gru-ai (MIT), Orloj (Apache-2.0), Hermes	אתה רוצה בעלות מלאה, control, ו-portability; נוח לך עם git ו-YAML	חשבון טוקנים שלך; Orloj pre-1.0 — APIs עשויים להשתנות, חובה ל-pin גרסה
Buy (commercial OS)	Knowlee OS (5 verticals על backbone אחד)	אתה רוצה מהירות time-to-value ולא אכפת לך לשלם על פלטפורמה	vendor lock-in: ה-'Brain'/knowledge-graph וה-audit trail חיים ב-OS שלהם
Minimal	plain API + cron + git	צי קטן, אתה רוצה אפס תלות framework	אתה בונה יותר בעצמך; פחות observability/governance מובנים

בלי קשר לבחירה, ה-portability plan הוא חובה — זה ה-VENDOR-LOCK RISK המפורש בקורס. הכלל הפשוט: כל config + memory של הצי חי ב-git כ-Markdown+JSON (ה-.context/ pattern). זה אומר שני דברים: (1) ה'חברה' שלך forkable, diff-able ו-recoverable — עריכת SOP גרועה היא git revert אחד; (2) אם תלך לפלטפורמה מסחרית, ודא שיש לה נתיב export לפני שאתה תלוי ב-'Brain' שלה. תכנן את היציאה לפני הכניסה.

דוגמה מוחשית לחשיבות ה-portability: Langfuse, אחד מכלי ה-observability המובילים בקורס, נרכש על ידי ClickHouse בינואר 2026. הוא נשאר OSS ועצמאי — אבל אם לא היה נשאר, ואת כל ה-traces שלך היו נעולים ב-cloud שלו? מי שהריץ self-hosted היה עצמאי לחלוטין. הכלי הנכון הוא הכלי שאפשר לעזוב.

עשה עכשיו (2 דקות)

פתח את .context/decisions/build-vs-buy.md וכתוב שורה אחת לכל תפקיד: build / buy / minimal + סיבה אחת. אם בחרת buy לאיזשהו תפקיד — הוסף שורה שנייה: "נתיב export: ___". אם אין לך תשובה לנתיב ה-export, זה דגל אדום. הוסף בתחתית שורה אחת נוספת: "snapshot date: ___ | בפרויקט הבא אאמת: ___" — כי ה-freshness של ה-tech stack זז מהר, וההחלטה הזו צריכה re-check כל רבעון.

שוק-ישראליproductized-roleתמחור

ההצעה הישראלית: תפקיד-כשירות מול סוכנות של 5 אנשים

זה החלק שהופך את הקורס מ"איך לנהל את הצי שלך" ל"איך להרוויח מהצי שלך בשוק הישראלי". ישראל היא קרקע פורייה למודל הזה: ~550,000 עצמאים (~12% מכוח העבודה, נתוני למ"ס 2024) ותרבות פרילנס/indie עמוקה. אבל היתרון המבני האמיתי הוא תמחור.

הנקודה החדה (מקור: Times of Israel): סוכנות של 5 אנשים חייבת לתמחר משהו כמו בוט-WhatsApp בסביבות ~₪45,000 — לא כי העבודה שווה כך, אלא כדי לכסות משכורות, משרד, project manager ומרווח. operator סולו עם צי סוכנים, באפס תקורה, יכול לספק את אותה עבודה בחלק קטן מהמחיר — וזה לא דמפינג, זה יתרון מבני. אין לך 5 משכורות לכסות; יש לך חשבון טוקנים בש"ח (שבנית בדיוק עכשיו ב-payroll).

איך פועלים על זה? productize-a-role — אורזים תפקיד מואצל אחד כשירות:

מקרה מספרי מוחשי: נניח שתפקיד ה-SDR עולה לך ₪650/חודש (מה-payroll, תרגיל 4). ×4 מרווח = ₪2,600/חודש ללקוח. ₪2,600 × 12 = ₪31,200/שנה — 69% מהצעת ה-₪45,000 של הסוכנות, אבל הלקוח מקבל שירות 24/7 בלי שאלות על "מי הPM", בלי ישיבות, ובלי חשבונית על שינוי. ואתה מריץ 5 לקוחות כאלה במקביל — עם אותו צי. זו אסימטריה שסוכנות של 5 אנשים לא יכולה לשחק.

Framework: לתמחר תפקיד-כשירות עם מרווח

אל תתמחר לפי מחיר הסוכנות — תמחר לפי עלות + מרווח, ואז וודא שאתה עדיין מתחת לסוכנות:

אם חישבת את עלות הטוקנים החודשית של התפקיד (מה-payroll, פרק 6) → אז הוסף עליה מרווח (×3 עד ×5 הוא נקודת פתיחה סבירה לשירות מנוהל).
אם המחיר שיצא עדיין נמוך משמעותית מהצעת הסוכנות (~₪45,000 לפרויקט דומה) → אז יש לך הצעה זוכה עם מרווח בריא.
אם המרווח יוצא דק כי הצי שלך יקר → אז חזור ל-tiered routing (פרק 6) וקצץ עלות לפני שתתמחר, לא אחרי.
אם לקוח שואל "כמה לידים תכשיר בחודש?" → אז תן range מוכח (מה-payroll שלך, לא מ-vendor deck) ועגן אותו בנתוני הצי שלך, לא בהבטחות כלליות.

טעות נפוצה: לתמחר לפי הסוכנות בלי לבדוק מרווח מול עלות אמיתית

מפתה לחשוב "הסוכנות לוקחת ₪45,000, אקח ₪8,000 וארוויח מלא". אבל אם לא בדקת את עלות הטוקנים האמיתית של התפקיד (כולל ה-loop הריבועי!), אתה עלול למכור בהפסד בלי לדעת — במיוחד אם הלקוח שולח נפח גדול. תמיד תמחר מ-עלות כלפי מעלה, לא מ-מחיר-הסוכנות כלפי מטה. ה-payroll dashboard הוא מה שמונע את זה. ואל תשכח: לקוח שמשתמש ב-SDR שלך ב-3× הנפח הצפוי = 3× העלות שלך, אבל אותו מחיר חוזי.

תרגיל 5 (capstone — משלב פרקים 1+6+8): הצעת תפקיד-כשירות מתומחרת

מטרה: תוצר נראה — מסמך הצעה בן עמוד אחד ל-SMB ישראלי, עם מרווח מוכח.

שלבים:

בחר תפקיד אחד מהצי שלך לארוז כשירות (המלצה: SDR או Content — הכי קל למכור ל-SMB).
קח את עלותו החודשית מה-payroll (תרגיל 4), הוסף מרווח ×3–×5, וקבע נקודת מחיר בש"ח.
בנה טבלת השוואה: ההצעה שלך מול ~₪45,000 של סוכנות 5 אנשים — מה הלקוח מקבל, באיזה מחיר, ומה ה-differentiator (עברית, 24/7, אפס תקורה).
הוסף שורה אחת שמוכיחה את המרווח שלך (מחיר − עלות טוקנים = רווח) — זה מה שמבדיל הצעה רווחית מהצעה בהפסד.
הוסף סעיף "מה לא כלול": legal/tax/חשבוניות (→ קורסי freelancer/creator-economy), בניית ה-runtime (→ agent-harness) — גבולות ברורים מונעים ציפיות לא נכונות ומגנים על המרווח.

תוצר נראה: מסמך הצעה בן עמוד אחד עם טבלת השוואה לסוכנות + שורת מרווח מוכחת + גבולות שירות. זה מסמך שאפשר לשלוח ללקוח אמיתי מחר. פלט צפוי לשורת מרווח: "₪2,600 (מחיר) − ₪650 (עלות טוקנים) = ₪1,950 רווח/חודש | מרווח: 75%".

scaleSOP-not-headcountגיוס-סוכן

לגדול בלי לגייס: scale by SOP, not headcount

הצי החי מעלה שאלה: מה קורה כשאתה צריך יותר קיבולת? בעסק רגיל, אתה מגייס אדם. כאן, אתה כותב SOP. זה ההבדל המבני שמאפשר ל"חברה של אחד" לגדול בלי להפוך לחברה של חמישה. כדי "לגייס" פונקציה חדשה (נניח, סוכן מחקר-מתחרים):

זה "hire by SOP" — אונבורדינג של סוכן כמו עובד חדש, אבל בלי משכורת, בלי גיוס, ובלי תקרה של 24 שעות ביממה. ההבדל מגיוס אנושי: עובד חדש לוקח 90 יום להיות productive. סוכן חדש לוקח 90 דקות — כולל כתיבת ה-SOP, ה-dry-run, והחיבור ל-loop. ה-bottleneck היחידה הוא כמה מהר אתה יכול לכתוב SOP טוב, לא כמה מהר אתה יכול לגייס ולאנבורד.

וזה גם מחזיר אותנו לדבר שלא משתנה גם ב-scale: ה-execution-vs-judgment split מפרק 1. ככל שתוסיף תפקידים, מה שנשאר אנושי תמיד זהה — אסטרטגיה, טעם, יחסי לקוח, והחלטות בלתי-הפיכות. הצי גדל; אתה נשאר ה-operator.

על מה שומרים כשהצי גדל: הנחת היסוד שמאפשרת scale היא שהצי לא מחליף אותך — הוא מגדיל אותך. Pieter Levels, שמריץ ~$3M ARR ללא עובדים (נכון ל-2026), לא "ישב על הגדה" — הוא עבד אינטנסיבית על בחירת פרויקטים, תמחור, ואיכות מוצר. מה שה-AI עשה הוא להסיר ממנו 80% מה-execution הרוטיני. Medvi, שדיווחה על $401M מכירות בשנה ראשונה עם מייסד בודד + AI tools, ניהלה ממשקי רגולציה, ספקים, ויחסי לקוח ישירות. ה-scale של "חברה של אחד" בנוי על כך שהסוכנים לוקחים את ה-execution הרוטיני — ואתה ממקד את הזמן האנושי שנחסך על ההחלטות שרק אדם יכול לקבל.

עשה עכשיו (4 דקות)

תאר בשתי שורות: מה יהיה התפקיד החמישי שתוסיף לצי שלך — ולאיזה מארבעת דפוסי החיווט הוא ישתייך? (Research? Competitor-watch? Renewal-finance שני? אפשרות חמישית שלא ב-syllabus — מה שמתאים לעסק שלך.) כתוב את זה ב-.context/decisions/next-hire.md. זה לא משימה — זה תרגיל בחשיבה כ-operator: אתה לא מחכה לתקלה שתגרום לגיוס, אתה מתכנן scale מראש.

שגרת העבודה המצטברת — operator של חברה שלמה

זו שגרת העבודה הסופית של הקורס. היא מצטברת: כל מה שבנית לאורך 8 הפרקים מתכנס לקצב הפעלה אחד. זו לא רשימת מטלות — זו הדרך שבה אתה מנהל חברה של אחד כ-operator, לא כמכבה-אש.

יומי (10–15 דק' בבוקר):

סקור את ה-morning brief (פרק 4) — הכנסות, תור תמיכה, מהלכי מתחרים, inbox, בש"ח.
טפל ב-approval queue (פרק 5) — אשר/דחה פעולות כסף ו-outreach שממתינות. one-click.
הגב ל-tripwires שפינגו אותך בלילה (אם היו) — רק לאירועים חדים. אם אין — טוב, המערכת עובדת.

שבועי (45–60 דק', יום ראשון):

סקור את ה-Weekly Agent All-Hands (פרק 8) — output/failures/lessons/pass-rate לכל תפקיד.
Review של reflections (פרק 4) — אשר לקחים טובים, מחק לקחים מורעלים לפני שהם מרעילים ריצות. זה לא אופציונלי — לקח שגוי שנשאר ב-.context/lessons/ עולה יותר מה-10 דקות שלקח לאשר אותו.
בדוק את ה-eval pass-rate — האם תפקיד מוכן לטפס בסולם ה-autonomy (פרק 5)? האם תפקיד ירד מתחת לסף ומצריך הורדה?
שלח לעצמך שאלה אחת אסטרטגית לשבוע הבא: "האם יש לי לקוח אחד שהצי עזר לו מספיק שיהפוך ל-case study?"

חודשי (60–90 דק'):

הפעל את ה-Agent Payroll dashboard בש"ח (פרק 6) — ROI פר-תפקיד, החלטות fire/promote/right-size.
בדוק model-routing — האם אפשר לקצץ עוד עלות ב-tiered routing? מחירי מודלים זזים כל חודש.
הרץ final risk audit מקוצר — האם משהו ב-freshness זז (star counts, סטטוס framework, מחירי טוקנים)?
אמת מחדש ה-golden sets: האם הם עדיין מייצגים את מה שאתה רוצה? golden set שלא עודכן בשלושה חודשים הוא golden set שמנחה את ה-eval בכיוון לא עדכני.

לפי הצורך: "גַיֵּס" תפקיד חדש דרך hire-by-SOP. snapshot ל-git לפני כל שינוי מסוכן. pin גרסת OSS לפני שה-upstream משנה API.

risk-audithype-vs-factproduction

Final Risk Audit: להפריד hype מעובדה לפני שאתה תלוי בזה

לפני שאתה מסתמך על הצי בעסק אמיתי — עם לקוחות אמיתיים וכסף אמיתי — עליך לעבור audit סיכונים סופי. זה לא פסימיות; זו האחריות של operator. שלושה סוגי סיכון, ישירות ממחקר הקורס:

סוג סיכון	מה לבדוק	הפעולה
HYPE	האם אתה בונה ציפיות על "one-person unicorn"?	הפרד proof-points מאומתים (Pieter Levels ~$3M ARR/0 עובדים; Medvi $401M שנה ראשונה) מ-forecast (תחזית Amodei ל-$1B היא ~70–80% confidence — לא עובדה)
FRESHNESS	star counts של OSS, סטטוס frameworks, מגבלות free-tier, מחירי טוקנים	אמת מחדש: gru-ai (~142 stars, MIT), Orloj (~102 stars, Apache-2.0, pre-1.0); AutoGen ב-maintenance (פיתוח → Microsoft Agent Framework); Langfuse נרכש ע"י ClickHouse ינואר 2026 אך נשאר חינמי ל-self-host
LOCK-IN	האם config/memory נעולים ב-vendor?	ודא portability plan: הכל ב-git, נתיב export קיים, מודלים GA בלבד (לא preview)

כיצד ה-audit מתנהל בפועל: שב 30 דקות, פתח דפדפן, ועבור על הרשימה הזו שורה-שורה. לכל שורה — אמת את הנתון ממקור ראשוני (GitHub repo, אתר מוצר, Carta). אם הנתון השתנה — עדכן את ה-.context/ שלך. אם שינוי מתקרב (API breaking change, framework שעובר למצב maintenance) — הוסף לכל-טבלת-ה-all-hands כ-"freshness flag" שתסקור בחודש הבא.

מחזור ה-audit: עשה audit מלא לפני כל הפעלה ראשונית, ו-audit מקוצר (15 דקות, FRESHNESS בלבד) כל חודש. השאלה המרכזית בכל audit: "האם משהו השתנה שמסוכן ל-runtime שלי?" — לא "האם הכל בסדר?" (כי לרוב הכל בסדר). מה שחיפוש ב-GitHub issues של Orloj, CHANGELOG של framework שאתה תלוי בו, ובדיקת מחירי API אחת לחודש קונה לך הוא שקט נפשי: אתה יודע שהקרקע שתחתיך יציבה — ואם היא זזה, תדע את זה לפני שהלקוח שלך יגלה.

Cross-links סופיים — מה לא לשכפל (וזה מכוון, כדי שהקורס יישאר על שכבת ה-business/org-design):

productionchecklistמוכנות

Production Checklist: האם הצי מוכן לעולם האמיתי?

זו רשימת ה-go/no-go הסופית. אל תפעיל את הצי על לקוחות אמיתיים לפני שכל סעיף מסומן. כל סעיף נשען על פרק שלם — אם משהו לא מסומן, חזור לשם. הרשימה הזו היא לא תיבת סימונים — היא חוזה שאתה כותב לעצמך: מתחת לרמה זו לא תלך לייצור.

שים לב שהרשימה מכוונת לא רק ל-"האם כל הכלים מחוברים?" אלא ל-"האם המערכת בטוחה לפעול ב-production?" — הבדל מהותי. כלים יכולים להיות מחוברים ועדיין לא בטוחים אם חסרים approval gates על כסף, חסרה idempotency, או שה-observability עיוור לרוב הכשלים. production readiness הוא מעגל safety, לא מעגל completeness.

Production Readiness — צ'קליסט סופי (15 סעיפים)

✅ org chart מלא ב-git (פרק 2): 4 תפקידים, כל אחד עם role+goal+scope+escalation.
✅ SOPs לכל תפקיד ב-RFC 2119, מאוחסנים כ-Skills ב-.context/ (פרק 3).
✅ Golden sets מתוחזקים לכל תפקיד שיש לו eval-gate (פרק 4) — 10+ מקרים כל אחד, כולל דוגמאות "נדחה + הסבר".
✅ Loop פעיל: cron+eval+reflexion רץ על כל תפקיד, מנוטר ב-observability (פרקים 4+7).
✅ Idempotency: לכל תפקיד יש already-done marker — אין עיבוד כפול / שליחה כפולה (פרק 4).
✅ Approval gates על כסף: כל פעולה שנוגעת בכסף/הרשאות/רשומות מגודרת בסף ₪ + named approver (פרק 5).
✅ סולם autonomy מתועד: כל תפקיד יודע איפה הוא יושב והסף לטיפוס (eval pass-rate) (פרק 5).
✅ Tripwires מוגדרים: התראה על retries רבים / מקורות סותרים / פעולה מסוכנת (פרק 5).
✅ Dead-agent alerting: heartbeat monitoring — סוכן שמת בלילה לא נשאר בלתי-נראה (פרק 4).
✅ Observability חי: traces, tool-call breakdowns, runaway-loop detection (Langfuse/Braintrust) (פרק 7).
✅ Agent payroll בש"ח מעודכן: ROI פר-תפקיד, החלטות fire/promote/right-size (פרק 6).
✅ Model-routing policy: tiered routing — מודל זול ל-90% הקלים, frontier ל-10% הקשים (פרק 6).
✅ מודלים GA בלבד: שום preview/beta בנתיב production; גרסאות OSS pinned (פרק 7).
✅ Portability plan: config+memory ב-git, נתיב export מ-כל vendor מסחרי (פרקים 7+8).
✅ Final risk audit עבר: hype מופרד מעובדה, freshness אומת, lock-in מגודר (פרק 8).

מילון מונחים — הפרק

Live 4-role fleet (צי 4-תפקידים חי): ארבעת התפקידים — מכירות (SDR), תוכן (Writer+Editor), תמיכה (Support), כספים (Finance) — מחוברים למערכת אחת חיה עם loop, autonomy, observability ו-payroll. ה-capstone של הקורס.
Fleet integration (אינטגרציית הצי): החיווט של החלקים הנפרדים (org chart, SOPs, loop, autonomy, observability, payroll) למערכת אחת — הפתרון ל'בעיית נקודת-האינטגרציה' מפרק 1.
Fleet wiring pattern (דפוס חיווט): אחד מארבעת הדפוסים שמגדיר איך תפקיד מחובר: eval-gate על golden set / human-in-the-loop על outreach / approval-gate עם סף ₪ / reflexion שכותב לקח. כל תפקיד חדש ממופה לדפוס לפני כתיבת קוד.
Weekly Agent All-Hands: cron job שמרכז את ה-output/failures/lessons/eval-pass-rate של כל סוכן ל-report שבועי אחד שאתה סוקר ביום ראשון — "ישיבת צוות עם צוות שלא קיים".
Loop-debt: צבירה בלתי-נראית של פריטים ב-queue שהסוכן לא טיפל בהם — גדל בשקט עד שלקוח מתלונן. נמנע ע"י heartbeat שמוודא שה-queue מתרוקן בקצב הנדרש.
Hire by SOP (גיוס-ב-SOP): תהליך הוספת תפקיד חדש לצי: כתוב role+SOP, dry-run על מקרי עבר (שיהפכו ל-golden set), חבר ל-loop, התחל ב-human-in-the-loop, טפס בסולם לפי eval pass-rate. 90 דקות במקום 90 יום.
Productized-role-as-a-service (תפקיד-כשירות): אריזת תפקיד מואצל אחד (SDR-agent / content-agent) כשירות מסחרי ל-SMB, בנקודת מחיר בש"ח — מנוף ההכנסה של ה-operator הסולו.
The Israeli zero-overhead offer (ההצעה הישראלית של אפס תקורה): היתרון המבני: סוכנות 5 אנשים מתמחרת ~₪45,000 כדי לכסות תקורה; operator סולו עם צי, באפס תקורה, מספק את אותה עבודה בחלק קטן — עם מרווח. תמחור מעלות-כלפי-מעלה, לא ממחיר-סוכנות-כלפי-מטה.
Reversibility gate (גדר הפיכות): עיקרון ממשמעת ה-approval: גובה ה-gate של תפקיד נקבע לפי מידת ההפיכות של פעולותיו, לא רק לפי eval score. פעולה בלתי-הפיכה (כסף, הרשאות, חוזה) תמיד דורשת human-in-the-loop, גם אם pass-rate = 100%.
Scaling by SOP, not headcount (לגדול ב-SOP, לא בגיוס): הוספת קיבולת ע"י כתיבת role+SOP חדש ("hire by SOP") במקום גיוס אדם — מה שמאפשר ל"חברה של אחד" לגדול בלי להפוך לחברה של חמישה.
Final risk audit (audit סיכונים סופי): בדיקה סופית (ועיתית חודשית) של שלושה סיכונים — hype (להפריד proof-points מ-forecast), freshness (לאמת star counts/framework status/מחירים), lock-in (portability plan) — לפני הסתמכות על הצי בעסק אמיתי.
Production readiness checklist: רשימת ה-go/no-go הסופית (15 סעיפים) שקובעת אם הצי מוכן לרוץ על לקוחות אמיתיים — חוזה שהoperator כותב לעצמו, כל סעיף נשען על פרק שלם בקורס.

בדוק את עצמך — 5 שאלות

ארבעת התפקידים בצי החי מדגימים ארבעה דפוסי חיווט שונים. תן את הדפוס של כל אחד (SDR / Writer+Editor / Support / Finance) — ולמה תפקיד הכספים חייב approval-gate על כסף גם אחרי ש-eval pass-rate שלו מצוין. מה העיקרון (reversibility) שמסביר את זה?
מה ההבדל בין ה-Weekly All-Hands לבין tripwire, ומתי אירוע שייך לכל אחד מהם? (רמז: מגמה מול אירוע חד.) תן דוגמה אחת לכל אחד מתוך תפקיד ה-Finance.
מלכודת ה-loop הריבועי: למה session בן 10 turns עולה ~50x ולא 10x קריאה בודדת, ואיך זה משפיע על תמחור הצעת תפקיד-כשירות? מה קורה אם לקוח שולח 3× הנפח הצפוי?
ההצעה הישראלית: סוכנות 5 אנשים מתמחרת ~₪45,000. איך operator סולו מתמחר תפקיד-כשירות עם מרווח מבלי למכור בהפסד — ומאיזה מספר מתחילים את החישוב? למה תמחור מ-"מחיר הסוכנות כלפי מטה" מסוכן?
final risk audit: תן דוגמה אחת לכל אחד משלושת סוגי הסיכון (hype / freshness / lock-in) ואת הפעולה שמנטרלת אותו. מה קורה אם מדלגים על ה-audit ומגלים pre-1.0 API break שלושה חודשים אחרי ההפעלה?

סיכום הפרק — וסגירת הקורס

הגעת לסוף. לא רק לסוף הפרק — לסוף המסע מ"פרילנסר שעושה הכל" ל"operator שמפעיל חברה". בוא נסגור את שני המעגלים.

מה הפרק הזה עשה:

חיברנו את שבעת החלקים שבנית לאורך הקורס לצי 4-תפקידים חי אחד — מכירות, תוכן, תמיכה, כספים — כל אחד עם דפוס החיווט הנכון לו, כולל reversibility gate שנקבע לפי מידת ההפיכות של הפעולות, לא רק לפי eval score.
חיברנו את הכל ל-loop שרץ ומשתפר בלילה, עם Weekly All-Hands ו-tripwires כדי שתראה את התמונה הכוללת בלי לצפות בהכל — ועם heartbeat שמגן מ-loop-debt בלתי-נראי.
הפעלנו Agent Payroll אמיתי בש"ח — ROI פר-תפקיד, החלטות fire/promote/right-size, tiered routing שיכול לחסוך עד ~80% פר-conversation, וההחלטה הסופית build-vs-buy + portability.
בנינו את ההצעה הישראלית: productized-role מתומחר מעלות-כלפי-מעלה עם מרווח מוכח מול ~₪45,000 של סוכנות 5 אנשים, עם עברית כ-differentiator ו-~550,000 עצמאים ישראלים כשוק.
סגרנו עם hire-by-SOP scaling (90 דקות במקום 90 יום), final risk audit עיתי, ו-production checklist בן 15 סעיפים שהוא חוזה שה-operator כותב לעצמו.

מה הקורס כולו נתן לך: התחלת (פרק 1) כמי שמשתמש ב-AI לפי הוראה, chat task-by-task, ונשאר צוואר הבקבוק היחיד. אתה מסיים עם 'חברה של אחד' רצה ב-git: org chart כתוב, SOPs מדויקים, loop שמשתפר בלילה, סולם autonomy עם approval gates, observability שרואה הכל, ו-P&L חודשי שמתמחר כל סוכן כמו משכורת. הפכת מ-glue יחיד ל-operator של מערכת.

וזכור את הגבול הכן מפרק 1, שלא השתנה: המודל לא מבטל אותך. מישהו עדיין מנהל את הסוכנים — זה אתה, ב-2 בלילה, כשלקוח מסלים תקלה. אבל עכשיו יש לך מערכת שתופסת את רוב התקלות לפני שהן מגיעות לשם, ו-tripwire שמפנג אותך רק כשבאמת צריך. זו לא הכנסה פסיבית — זו חברה שאתה מנהל כ-operator. וזה, בדיוק, היה כל העניין.

צוות של איש אחד — סיימת. עכשיו לך תפעיל אותו.

חוט הפרויקט — איפה אנחנו על הציר

מטרות למידה

דרישות קדם

מה תפיק בסוף הפרק (5 תוצרים)

אינטגרציהמערכת אחתחיווט משבעה חלקים לחברה אחת

עשה עכשיו (2 דקות)

ארכיטקטורה4 תפקידיםדפוסי חיווט ארכיטקטורת הצי החי: ארבעה תפקידים, ארבעה דפוסים

תפקיד 1 — SDR (מכירות): דפוס ה-human-in-the-loop על outreach

תפקיד 2 — Writer+Editor (תוכן): דפוס ה-eval-gate על golden set

תפקיד 3 — Support triage (תמיכה): דפוס ה-reflexion שמשתפר

תפקיד 4 — Finance renewal (כספים): דפוס ה-approval-gate על כסף

Framework: לאיזה דפוס חיווט שייך תפקיד חדש?

Framework: איך לזהות שהחיווט מהיר מדי — "הסוכן בלי רשת"

טעות נפוצה: לחווט את ארבעת התפקידים באותו דפוס

עשה עכשיו (3 דקות) — הכן את .context/ לפני תרגיל 1

תרגיל 1 (capstone — משלב פרקים 2+3+5): מטריצת חיווט הצי

loopcronחיבור-בפועל לחבר את הכל ל-loop אחד שרץ בלילה

עשה עכשיו (3 דקות)

טעות נפוצה: cron בלי idempotency על הצי כולו

תרגיל 2 (capstone — משלב פרקים 3+4): לחבר את ה-loop על שני תפקידים

ניהולall-handsתמונה-כוללת ה-Weekly Agent All-Hands: ישיבת צוות עם צוות שלא קיים

Framework: all-hands שבועי מול tripwire בזמן אמת

עשה עכשיו (3 דקות)

תרגיל 3 (capstone — משלב פרקים 4+5+7): להפעיל את ה-All-Hands + tripwire אחד

P&Lpayrollהחלטות-ROI Agent Payroll על הצי החי: לנהל סוכנים כמו משכורות

טעות נפוצה: לשפוט תפקיד לפי "הרגשה שהוא עובד"

תרגיל 4 (capstone — משלב פרקים 6+7): Agent Payroll על נתונים אמיתיים

החלטהbuild-vs-buyportability ההחלטה הסופית: Build-vs-Buy ו-Portability

טעות נפוצה: להישען על 'Brain' של vendor בלי portability plan

עשה עכשיו (2 דקות)

שוק-ישראליproductized-roleתמחור ההצעה הישראלית: תפקיד-כשירות מול סוכנות של 5 אנשים

Framework: לתמחר תפקיד-כשירות עם מרווח

טעות נפוצה: לתמחר לפי הסוכנות בלי לבדוק מרווח מול עלות אמיתית

תרגיל 5 (capstone — משלב פרקים 1+6+8): הצעת תפקיד-כשירות מתומחרת

scaleSOP-not-headcountגיוס-סוכן לגדול בלי לגייס: scale by SOP, not headcount

עשה עכשיו (4 דקות)

שגרת העבודה המצטברת — operator של חברה שלמה

Just One Thing

risk-audithype-vs-factproduction Final Risk Audit: להפריד hype מעובדה לפני שאתה תלוי בזה

טעות נפוצה: לדלג על ה-final risk audit ולבנות עסק על קרקע זזה

productionchecklistמוכנות Production Checklist: האם הצי מוכן לעולם האמיתי?

Production Readiness — צ'קליסט סופי (15 סעיפים)

מילון מונחים — הפרק

בדוק את עצמך — 5 שאלות

סיכום הפרק — וסגירת הקורס

אינטגרציהמערכת אחתחיווט
משבעה חלקים לחברה אחת

ארכיטקטורה4 תפקידיםדפוסי חיווט
ארכיטקטורת הצי החי: ארבעה תפקידים, ארבעה דפוסים

עשה עכשיו (3 דקות) — הכן את `.context/` לפני תרגיל 1

loopcronחיבור-בפועל
לחבר את הכל ל-loop אחד שרץ בלילה

ניהולall-handsתמונה-כוללת
ה-Weekly Agent All-Hands: ישיבת צוות עם צוות שלא קיים

P&Lpayrollהחלטות-ROI
Agent Payroll על הצי החי: לנהל סוכנים כמו משכורות

החלטהbuild-vs-buyportability
ההחלטה הסופית: Build-vs-Buy ו-Portability

שוק-ישראליproductized-roleתמחור
ההצעה הישראלית: תפקיד-כשירות מול סוכנות של 5 אנשים

scaleSOP-not-headcountגיוס-סוכן
לגדול בלי לגייס: scale by SOP, not headcount

risk-audithype-vs-factproduction
Final Risk Audit: להפריד hype מעובדה לפני שאתה תלוי בזה

productionchecklistמוכנות
Production Checklist: האם הצי מוכן לעולם האמיתי?