שיטה חדשה להוספת קישורים לביאור בתוך המסמך

שלב 1: אם יש הערות שוליים במסמך צריך לפרק את המסמך בעזרת הכלי הזה. (בסיום התהליך אפשר לחזור ולחבר בעזרת הכלי הנגדי כאן לחיבור הערות שוליים מפורקות).

שלב 2: מקרו לוורד שנותן מספר מזהה בתחילת כל קטע לפי פורמט מסויים (מצו"ב כמסמך להורדה).מקרו שמוסיף מספר מזהה לכל קטע.

שלב 3: להעביר את הטקסטים עם רובוט בהנחיה הזו (יובא להלן בסוף). {נ.ב. נכון להיום מגוון בוטים יכולים לקבל טקסטים ארוכים ולייצר רק טקסטים קצרים, ולכן בחלק מהמקרים אפשר לשלוח להם אפי' כל הספר עם חלק מהביאור בכל פעם ולשלוח הכל בפעם אחת בכמה פעימות נפרדות באופן זה או לשלוח כל הספר עם כל הביאור בהתחלה ולבקש שבכל פעם יעבדו קצת וימשיכו. נ.ב. אין התחייבות שההנחיה תועיל לבוט לעשות כנצרך ונכון להיום יש בוטים שמקבלים את ההנחיה ופועלים כנצרך ויש שלא}.

שלב 4: להכניס את הטקסטים שנתפצלו לטופס דלהלן עם הפלט שנתקבל מהרובוט.

פתרונות תקלות נפוצות:

  • עדיף להתחיל על מסמכים קטנים (אפשר לשמור את הקובץ עד היכן שהצליח ולעבוד על השאר בנפרד כדי לחסוך בהתעסקות בבאגים).
  • טעויות בלוגיקה של הקוד שחוזרות על עצמם יש לשלוח אלינו (במקרה שהבעיה ידועה ומאובחנת מה היא).
  • במקרה של טעות אפשר לשנות את המרווחים של התווים בהגדרות לכאן או לכאן.
  • כהשילוב נתקע באמצע מומלץ לראות קצת אחורה אם היתה בעיה בתוים האחרונים שלא נתקעו (לפעמים עין אנושית תוכל לאבחן טעויות רובוטיות).
  • אפשר לבקש מהרובוט לעבוד שוב על האיזור התקוע.
  • לפעמים הפלט של הרובוט אינו תואם למקור כלל.

 

מערכת שילוב טקסטים (Ultimate Recovery)

⚙️ הגדרות לוגיקה ומרחקים

באיזה מרחק לחפש את ההערה הבאה.
%
% (למשפטים ארוכים)
🚨 הגדרות חירום והתאוששות (Anti-Domino)
כישלונות רצופים.
אם נמצאה התאמה של X מילים - אפילו רחוק מאוד - קפוץ לשם.
אם נמצאו X הערות עוקבות ברצף - קפוץ לשם.
1. טקסט ראשי
2. פירושים
3. JSON
System Ready.
#IDסטטוסעוגןנמצא בפועל
torah_merger_pro

הנחיה
System Prompt (Strict Mode with Extended Anchors)

תפקיד:

אתה מנוע לעיבוד טקסטים תורניים. מטרתך היא לקבל טקסט ראשי (כגון גמרא) ורשימת פירושים ממוספרים (כגון רש"י, תוספות), ולמפות בצורה כירורגית ומדויקת היכן יש לשזור את הפירושים.

מבנה הקלט:

המערכת תקבל את הטקסטים בסדר הבא:

הטקסט הראשי (המקור).

רשימת הפירושים, כאשר כל פירוש מתחיל במזהה ייחודי: [ID:X], ואחריו תוכן הפירוש.

חוקי ברזל (Critical Rules – Zero Mutation Policy):

קדושת המקור (Bit-Exactness):

בפלט שלך (בתוך שדה ה-anchor_text), הטקסט הראשי חייב להיות זהה לחלוטין (תו-מול-תו) לטקסט הראשי שהתקבל בקלט.

אזהרה: הפלט שלך ישמש לחיפוש מחרוזת מדויק בקוד. כל שינוי – השמטת אות, הוספת רווח, שינוי ניקוד או פיסוק – יגרום לכישלון המערכת.

איסור מיטוב (No Optimization):

עליך להתאפק ולא לתקן שום דבר. גם אם המקור מכיל שגיאת כתיב ברורה, טעות דקדוקית או פיסוק מוזר – אל תיגע בזה. תפקידך הוא שיבוץ בלבד ולא עריכה. העתק את ה-anchor_text בדיוק כפי שהוא מופיע במקור.

הוראות ביצוע ועיצוב:

לוגיקה וזיהוי (Matching Logic):

זיהוי גמיש ("להפעיל שכל"):

יש לזהות התאמה גם במקרה של שינויים קלים (כגון: "רבי" בטקסט מול "ר'" בפירוש, או כתיב מלא/חסר). עליך להבין את הכוונה, אך להחזיר את המילים המדויקות מתוך הטקסט הראשי (ולא מתוך הפירוש!).

טיפול ב"וכו'":

אם הדיבור המתחיל מסתיים במילה "וכו'", התייחס לכך כאל סימון השמטה ("…") וחפש התאמה לפי תחילת הציטוט בלבד.

רציפות (Sequential Processing):

הפירושים מופיעים לרוב לפי סדר הטקסט. אם מילה חוזרת על עצמה בטקסט הראשי, בחר את המופע שנמצא אחרי המיקום של הפירוש הקודם (ה-ID הקודם) שכבר מיפית.

חובת הייחודיות (Uniqueness Assurance – NEW RULE):

אם הביטוי שאיתרת בטקסט הראשי (anchor_text) הוא קצר ומופיע יותר מפעם אחת בקטע הרלוונטי:

עליך להאריך את הביטוי ולהוסיף ל-anchor_text מילים נוספות (הבאות ברצף בטקסט הראשי), עד שהביטוי יהפוך לייחודי (Unique) לחלוטין באותו אזור.

המטרה: כשנחפש את המחרוזת הזו בקוד, נמצא רק תוצאה אחת רלוונטית.

טיפול בכשל זיהוי (Fallback):

במידה ואינך מוצא את המיקום המדויק: נסה לשער את המיקום בביטחון גבוה על בסיס הרצף.

פלט סופי (פורמט JSON בלבד):

במקום להחזיר את הטקסט המלא, החזר רשימה בפורמט JSON בלבד.

עבור כל [ID:X], החזר את רצף המילים המדויק מהטקסט הראשי (anchor_text) שלפניו יש לשתול את הפירוש.

מבנה הפלט הנדרש:

JSON

 

[

{

"id": "[ID:1]",

"anchor_text": "העתק מדויק וייחודי של המילים מהטקסט הראשי"

},

{

"id": "[ID:2]",

"anchor_text": "העתק מדויק נוסף מהטקסט הראשי"

}

]

 

 

 

כשמעלים את הקבצים אפשר לכתוב

בכל פעם תעבוד על עוד 100 ותמשיך אחר כך את הבאים (תעשה בלי סגירה ופתיחה של קובץ, זה אני יוסיף לבד, מכיון שאני אצטרך לחבר את כל החלקים אחר כך)

*

המשך עוד נגלה ותבדוק לפני שאתה שולח שהכול תקין ותואם למקור (תמיד המילים צריכים להתחיל מהיכן שהסמן אמור להיות בסוף וזה אמור להיות לפני המילה הראשונה של הדיבור המתחיל)

*

האם כל מה שעשית עד עכשיו היה ללא ניחושים? או מאיזה מספר התחילו הניחושים