יום רביעי, 2 באוקטובר 2013

כלים ממוחשבים לחקר ביקורת הנוסח: מבוא ורשימה

פרופ' עמנואל טוב, האוניברסיטה העברית

כלים ממוחשבים לחקר ביקורת הנוסח: מבוא ורשימהi

המבוא
מאז הרבע האחרון של מאה כ' נעזר חקר ביקורת הנוסח רבות בכלים וחקירות ממוחשבים. על כלים אלה נמנים מאגרי נתונים גמישים ואינטראקטיביים וכן חקירות המתבצעות בעזרת מחשב. המאגרים מסייעים בידי החוקר להשיג ולנתח מידע, ובגלל היותם אינטראקטיביים הם שומרים על מידה זו או אחרת של גמישות. מצד אחר, חוקרים גם מפרסמים את תוצאות מחקריהם שהתבצעו בעזרת חקירות ממוחשבות, אבל אלה אינן גמישות, שכן החוקרים מגישים רק את תוצאות מחקריהם ולא את הנתונים האלקטרוניים עצמם. מחקר זה לא ידון בסוג אחרון זה של מחקרים. במאה כ"א מתבקש לנהל מחקר בביקורת הנוסח בסיוע כלים ממוחשבים, אבל לא בכל תחום קיימים נתונים ממוחשבים מספיקים; מחקרים מעולים נכתבים על יסוד מהדורות מודפסות ונתונים לא־ממוחשבים. קיומם של מספר הולך וגדל של מאגרים ממוחשבים מאפשר לנו להגיע לנתונים שאי אפשר להגיע אליהם באמצעים המקובלים. במחקר זה ימצא הקורא תיאור קצר של הכלים הממוחשבים העומדים לרשותנו, אבל יש לזכור שהנתונים משתנים כל העת.
א. הכלים הקיימים
רוב המודולותii של טקסטים כוללות ניתוח מורפולוגי של כל המילים,iii המאפשר חיפושים לפי מילים ולפי קטגוריות דקדוקיות,iv והמאפשר גם יצירת קונקורדנציות של כל יחידת טקסט במקרא. בשלב זה אפשר לערוך את החיפושים הבאים במודולות:
נה"מ (לפי כתב־יד ל או א, ללא הבדלי נוסח בכתבי־יד אחרים מימה"ב). מודולות של נה"מ מאפשרות עריכת חיפושים של מילים או חלקי מילים, דגמי ניקוד, פרשיות פתוחות וסתומות, גרסאות כתיב וקרי, טעמים ושל המ"ק ו-מ"ג.v
שומ' (מהדורת טל 1994 ללא הבדלי נוסח). תכנת אקורדנס מסמנת את כל ההבדלים בין שומ' לנה"מ ומאפשרת את כל חיפושי המילים והקטגוריות הדקדוקיות בתוך שומ'.
מגילות מקראיות ממדבר יהודה, או קבוצות של מגילות, כגון המגילות הטרום־שומרוניות.
נוסף על אפשרויות החיפוש של מילים וקטגוריות דקדוקיות, תכנת אקורדנס מסמנת גם את כל ההבדלים בין המגילות לנה"מ.
תה"ש (מהדורת RahlfsHanhart, Septuaginta; סדרת גֶטִינגֶן).vi מודולת CATSS של תה"ש מסמנת הבדלים בהשוואה לנה"מ, משחזרת פרטים במקורו העברי, ומסמנת תופעות בטכניקת תרגום.vii מודולת תה"ש מאפשרת חיפושים בתוך התרגום היווני, בעוד מודולת CATSS גם מסמנת אקוויולנטים עבריים־יווניים.
התרגומים, הפשיטתא והווּלגטה (בדרך כלל ללא הבדלי גרסה, בעוד המודולה של הווּלגטה בתכנת SESB כוללת מידע זה). המודולות מאפשרות חיפושים פנים־תרגומיים.
מהדורת BHS. המודולה של האפרט מאפשרת חיפושים על פרטי הרישום.viii
גם אם הכלים הממוחשבים מתפתחים מהר, בשנת 2013 הממצא לגבי כל התחום של ביקורת הנוסח מצומצם למדי, כך שאפשרויות החקירה הממוחשבת עדיין מוגבלות. מכאן שלרוב יש להיעזר בצירוף של חקירות ממוחשבות ושימוש בספרים.
סובייקטיביות וזהירות. יש להתייחס בזהירות לכלים ממוחשבים כמו אל כל המקורות המודפסים. מאחר שרוב הכלים האלקטרוניים הוכנו ידנית, הם עלולים לכלול פרטים מוטעים ולשקף שיקול דעת מוטעה.ix
הערכת הגרסאות מבוססת חלקית על נתונים שנאספו באמצעות כלים ממוחשבים שהם בחלקם אובייקטיביים, אך תהליך ההערכה עצמו כולו סובייקטיבי. פרק 6. ככלל, בשימוש בכלים ממוחשבים אין משום ויתור על שיפוט תוכני ושיקול דעת.
ב. קטגוריות של מידע
הרישום האלקטרוני של טקסטים נוגע לא רק לביקורת הנוסח, כי אם גם לדיסציפלינות אחרות כגון לשון, פרשנות, אמונות ודעות, גיאוגרפיה, היסטוריה, כרונולוגיה ומיתולוגיה, וכן לכל הסוגות הספרותיות (למשל, חכמה, נבואה, שירת המזמורים, קינות, סיפורת). בדיון בכל הדיסציפלינות והתחומים הללו ניכרת חשיבות רבה לגרסאות של נה"מ ושל כל עדי הנוסח האחרים. ברם, בשלב זה אי אפשר לדלות את הגרסאות הרלוונטיות מתוך המודולות בהתאם לסוג המידע. הסיבה לכך היא שהגרסאות הרלוונטיות לא סומנו בתור כאלה במודולות ובמאגרי המידע. דרך משל, אי אפשר לדלות פרטים גיאוגרפיים, היסטוריים או כרונולוגיים, שכן הם לא סומנו באופן מיוחד. בשלב זה, התחומים היחידים שבהם ניתן להפיק תועלת מכלים ממוחשבים הינם נוסח המקרא ולשונו.
אם נרצה לדלות מידע ממוחשב בתחומים האחרים יש לסמנו באופן מיוחד במאגרי המידע ובמודולות. עם זאת, גם היום אפשר להפיק סוגי מידע אחדים שלא סומנו כגון מספר האותיות, המילים, והפסוקים, תפוצת מילים או צירופי מילים במקרא כולו, בספר, או בפרק מסוים. בין היתר, אפשר לקבוע את המילה העברית או היוונית או האקוויולנט העברי/יווני השכיחים או הנדירים ביותר ביחידת טקסט מסוימת, דגמי שימוש בשמות האלוהות, וכיוצא בהם.
מלבד הפרטים הנזכרים בפסקה הקודמת אין המשתמש יכול להפיק מתוך מודולת טקסט מידע שלא סומן קודם לכן בקידוד מיוחד.x כל קידוד של מידע מרחיב מיד את אפשרויות החיפוש. מכלול של מידע כזה, שאפשר לקרוא לו 'מידע שסומן מראש', משמש מקור מידע חשוב לפירוש המקרא ולכתיבת מחקרים.
ג. מידע שסומן מראש
בשנת 2013 המידע שסומן מראש כולל אך ורק את הנתונים המורפולוגיים והתחביריים של נה"מ וקצת תכונות של תה"ש:
ניתוח מורפולוגי, תחבירי וסגנוני של נה"מ;xi
ניתוח מורפולוגי של שומ', מגילות מדבר יהודה, תה"ש, התרגומים, פשיטתא והווּלגטה;
סימון תופעות אחדות בטכניקת התרגום של תה"ש וסימון היחס בין תה"ש ונה"מ בתוך מודולת CATSS הערה 9
לטובת פיתוח המחקר יהיה זה מועיל אם מערכות נתונים דוגמת אלה הנזכרות בסעיף ב יוכנסו במאגרי מידע. למשל, הוספת פרטים היסטוריים במאגרי מידע דוגמת מודולת CATSS או מודולה של נה"מ, תאפשר את שליפתם האוטומטית.xii באותה מידה סימון של כל ההבדלים התיאולוגיים בין עדי הנוסח היה מועיל לחוקר. ברי שרישום כזה יישא אופי סובייקטיבי, אבל הוא יוכל לשמש בסיס להמשך המחקר. למשל, נראה שנה"מ של ספר שמואל מכיל יותר תיקונים תיאולוגיים מאשר יתר ספרי המקרא בנה"מ, אבל התרשמות זאת צריכה לעבור את מבחן הבדיקה של כל ספרי המקרא.
נתרכז כאן בשני תחומים:
 ניתוח טקסטואלי. יש לקוות שמאגרי העתיד של כל עדי הנוסח ירשמו הבדלי נוסח והערות על קטגוריות של טכניקת תרגום בדומה לאלה של CATSS וכן הערות על תופעות טקסטואליות, כגון הרמוניזציות, הוספות והחסרות, הסכמות בלעדיות בין שני תרגומים בניגוד לנה"מ וסוגי מידע כגון אלה המתוארים במדור ב לעיל.
החקירה הממוחשבת של חילופי האותיות הדומות מראה דגמי תפרוסת מסוימים והיא גם מגלה את האותיות שהוחלפו בתדירות הגבוהה ביותר.
ניתוח לשוני. התחום המיוצג בצורה הטובה ביותר במודולות המחשב הינו הניתוח המורפולוגי. ניתוח זה מאפשר את חיפושי המילים על סמך צורות היסוד של כל מילות הטקסט ועל סמך קטגוריות לשוניות.

i המבוא מבוסס על הפרק העשירי של ספרי מבוא לביקורת נוסח המקרא: פרקי מבוא העומד להופיע במהדורה מתוקנת ומורחבת אצל מוסד ביאליק בסוף שנת 2013. רשימת המקורות מעדכנת גרסה קודמת שפורסמה בתור Electronic Resources Relevant to the Textual Criticism of Hebrew Scripture,” TC: A Journal of Biblical Textual Criticism 8 (2003) [http://purl.org/TC]. אני מודה לאלה שהעירו הערות מועילות על גרסה קודמת של רשימת הכלים: מ' אבג, מ' בלומנטל, ר' בראון ומ' סיגל.

ii מודולה היא טקסט, למשל נה"מ, שאפשר לעיין בו באמצעות אחת מתכנות המחשב (למשל, אקורדנס, BibleWorks) ושאפשר לערוך בו חיפושי מילים וצורות. ככל שהתכנה מתוחכמת יותר, כך אפשר לנתח את הטקסט ביתר יעילות.

iii המפתח לכל התכנות המופעלות על הטקסטים המקראיים הוא קיומו של ניתוח מורפולוגי ברקע. למשל, בניתוח כזה, מילת "ויאמר" מסומנת בתור "ו" (מילית, מילת חיבור) וצורת "יאמר" (פועל, בניין קל, עתיד, גוף שלישי יחיד) הגזורה מן השורש אמ"ר.

iv בדוגמה הנזכרת בהערה הקודמת, אפשר לערוך חיפושים בכל הקטגוריות הדקדוקיות הנזכרות. למשל, אפשר לחפש את כל הצורות של בניין 'קל' בפועל זה או בכל הפעלים, את כל ההיקרויות של גוף שלישי זכר יחיד, את כל הצורות של בניין 'הפעיל', וכיוצא בהן. באופן כזה אפשר לאתר גם את כל סוגי שמות העצם, מילות היחס, ומילות החיבור בכל המקרא, בספר מסוים, או בכל 'טווח חיפוש' אחר.

v את רוב סוגי החיפוש אפשר לערוך ברוב תכנות המחשב, אבל תכנת "מאגר התנ"ך" שהוכנה באוניברסיטת בר־אילן מתאימה יותר מן האחרות לאיתור דגמי ניקוד.

vi המודולה של מהדורת ראהלפס–הנהרט בתכנת SESB כוללת את הבדלי הגרסה של מהדורה זאת, ומהדורת גטינגן בתכנת Logos כוללת את האפרט המלא של מהדורה זאת.

vii למשל, הבדלים בין תה"ש ונה"מ במספר, גוף, והוספה/החסרה של מילת "כל". הרישום גם כולל הערות על תעתיקים וכפלי גרסה בתה"ש, על חילופי אותיות בין שני הטקסטים ועל היחס בין תה"ש וגרסאות כתיב וקרי של נה"מ.

viii המודולה הממוחשבת של האפרט של BHS אינה משביעת רצון לצרכי חקירה. לעומתה, האפרט של BHQ, לכשתושלם, יהיה מועיל מאוד. לכשיושלם, גם האפרט של מהדורת מפעל המקרא יהיה יעיל מאוד. עם זאת שלוש מהדורות אלה כוללות רק מבחר מצומצם של גרסאות, ואינן יכולות לשמש תחליף לחקירות מקיפות.

ix שיקול דעת משתקף, למשל, בבחירת כתב־יד או מהדורה מודפסת העומדים ביסוד מהדורה ממוחשבת, רישום גרסאות כתיב/קרי, סימון הפסוקים, וכיו"ב. היבט סובייקטיבי זה בא לידי ביטוי במיוחד בהצגת מגילות מדבר יהודה בגלל אופיין המקוטע. גם הרישום המורפולוגי של המילים סובייקטיבי והוא משפיע על חיפושי המילים המבוססים על ניתוח זה. כמו כן, שחזור המקור העברי המשוער של תה"ש בתוך CATSS נושא אופי סובייקטיבי מאוד.

x למשל, אי אפשר להפיק את רשימות מלכי ישראל ויהודה, מספרם, גילם, או נשותיהם; שמותיהם של בני יעקב; הערים בתחום שבט אשר; רשימת נביאי אמת ונביאי שקר; השוואת נבואותיהם של ישעיהו, ירמיהו ויחזקאל על הגויים וכיוצא בהם.

xi הניתוחים המורפולוגיים והתחביריים הקיימים יוזכרו להלן. נתונים תחביריים כלולים בתוך SESB ובמאגר הנתונים של Andersen–Forbes, שניהם במסגרת תכנת המחשב Logos.


xii למשל, נתונים גיאוגראפיים יכללו את הבדלי הגרסה הרבים לשמות שברשימות השבטים ביהושע טו – יט ובכתובים אחרים (למשל שמ"א ט 4 נה"מ "בארץ שעלים", תה"ש–לוּק' "גדי של העיר שעלים"). בהוספת הפרטים יש להפעיל שיפוט, למשל בהכללת הגרסאות היווניות, ברישום שמות חלופיים לאותם מקומות ("תמנת חרס" בשופ' ב 9 כנגד "תמנת סרח" ביהו' יט 50, כד 30), וברישום מיוחד של שמות מקומות המופיעים בשתי נחלות בעת ובעונה אחת. למשל, ירושלים מופיעה בנחלת בנימין בשופ' א 21 ובנחלת יהודה ביהו' טו 63; שופ' א 8.

לרשימת הכלים הממוחשבים הקישו כאן

תגובה 1:

  1. מעניין/
    ושאלה - האם המיחשוב כולל גם טקסטים "לא עבריים" מהמזרח הקדום?
    כגון - כתבי אוגרית וכיו"ב

    השבמחק