דבר העובדים בארץ ישראל
menu
יום חמישי ט"ז בסיון תשפ"ה 12.06.25
20.5°תל אביב
  • 21.6°ירושלים
  • 20.5°תל אביב
  • 20.0°חיפה
  • 19.6°אשדוד
  • 21.7°באר שבע
  • 29.9°אילת
  • 24.2°טבריה
  • 22.2°צפת
  • 19.4°לוד
  • IMS הנתונים באדיבות השירות המטאורולוגי הישראלי
histadrut
Created by rgb media Powered by Salamandra
© כל הזכויות שמורות לדבר העובדים בארץ ישראל
תרבות ומורשת

"כמו בית מלאכה קטן": המיזם שסורק ומנגיש 250 שנה של עיתונות יהודית

אייל מילר (צילום: מיכאל זכרי – מרכז הדיגיטציה, הספרייה הלאומית)
אייל מילר. "בתקופה של מהפכות, יש כמה מוקדים ואז דברים לפעמים מתחברים" (צילום: מיכאל זכרי – מרכז הדיגיטציה, הספרייה הלאומית)

מיזם "עיתונות יהודית היסטורית" חוגג 20 שנות סריקה, שימור והנגשה של עיתונים יהודיים מכל העולם | מיליוני עמודים כבר באוויר, ועשרות מיליונים עוד מחכים לתורם: "אנחנו מייצרים קורפוס שמאפשר גישה ללב התרבות הישראלית והיהודית. מבינים את האחריות שיש לנו על הכתפיים"

מיה ולנטיין
מיה ולנטיין
כתבת תרבות ואמנות
צרו קשר עם המערכת:

במלאת שני עשורים להקמתו של פרויקט "עיתונות יהודית היסטורית", התחיל הבוקר (שני) כנס חגיגי בספרייה הלאומית בירושלים. הפרויקט, שנולד משיתוף פעולה בין אוניברסיטת תל אביב והספרייה הלאומית, הפך למאגר דיגיטלי מרכזי של עיתונים יהודיים מרחבי העולם, ומאפשר גישה חופשית למיליוני עמודים בשפות שונות.

"העיתון הראשון שיש אצלנו באתר נקרא 'המאסף'", מספר אייל מילר, מנהל האתר בשבע השנים האחרונות.  "הוא יצא במה שהיום קוראים לה קלינינגרד – אותו שפיץ בצפון פולין ששייך לרוסיה, בזמנו זה היה קניגסברג בפרוסיה. 'המאסף' היה כתב עת משכילי שב-1783 הוציאו אותו התלמידים של מנדלסון והוא נחשב לאחד מאבות כתבי העת היהודיים. יש עיתונות יהודית עוד מוקדמת יותר שטרם סרקנו – ואנחנו מנסים לאתר עותק טוב שלה".

"העיתוי של הקמת הפרויקט לפני שני עשורים לא היה מקרי", הוא אומר. "אנחנו מדברים על ראשית שנות האלפיים שזה תחילת עידן האינטרנט ותחילת עידן הדיגיטציה. כמו הרבה פעמים בתקופה של מהפכות, יש כמה מוקדים ואז דברים לפעמים מתחברים, מתכנסים". היו אלה שתי יוזמות מקבילות שהתמזגו בסופו של דבר והובילו להקמת "עיתונות יהודית היסטורית" – האחת באוניברסיטת תל אביב והשנייה בספרייה הלאומית.

שתי יוזמות, חזון אחד

לפני יותר מעשרים שנה החלה באוניברסיטת תל אביב עבודת דיגיטציה של עיתונות יהודית מצפון אפריקה – תוניס, אלג'יריה ומרוקו. זהו תחום המחקר של פרופ' ירון צור, שבשבוע שעבר זכה בפרס ישראל בחקר ההיסטוריה של עם ישראל. עד היום הוא מכהן כמנהל האקדמי של 'עיתונות יהודית היסטורית'.

הסדנה של אייל מילר. "הספרייה לא צריכה רק לאסוף את כל החומרים, אלא גם להנגיש אותם לציבור הרחב" (צילום: אייל מילר)
הסדנה של אייל מילר. "הספרייה לא צריכה רק לאסוף את כל החומרים, אלא גם להנגיש אותם לציבור הרחב" (צילום: אייל מילר)

באותה תקופה החלה להתפתח טכנולוגיית OCR (Optical Character Recognition ובעברית: זיהוי תווים אופטי), המאפשרת המרת סריקה של טקסט מודפס למסמך תמליל ממוחשב. פרופ' צור זיהה את הפוטנציאל בהנגשת אוסף העיתונים שחקר, שלא היו נפוצים במיוחד. הוא ראה בעיתון מקור היסטורי רב-ערך וביקש לאפשר לחוקרים מרחבי העולם גישה לעיתונות היהודית מצפון אפריקה.

במקביל, בספרייה הלאומית, פעל פרופ׳ יורם צפריר, שכיהן בשנים 2001–2005 כמנהל בית הספרים הלאומי והאוניברסיטאי, שהפך במהלך כהונתו לספרייה הלאומית. הוא יזם פרויקט לסריקת עיתונות יהודית מאוסף הספרייה, אוסף עצום בהיקפו. "מאז שהוקמה מדינת ישראל בשנת 48', ויש לה ספרייה לאומית של המדינה, קיים 'חוק הפקדת עותקי חובה'. כל דבר דפוס שיוצא לאור בישראל ביותר מ-50 עותקים, יופקד בספריה", מסביר מילר.

העיתונות היומית הגדולה כפופה אף היא לחוק זה, והספרייה הלאומית אוספת ומקטלגת בקפדנות כל גיליון. בהיותה מוסד ותיק בן 130 שנה, שנוסד עוד טרם קום המדינה, הצטברו בספרייה חומרים רבים, לצד אוספים שנתרמו לה במהלך השנים. חזונו של צפריר היה להפוך את אוצרות הרוח האלה לנגישים באמצעות דיגיטציה.

אחת מעמדות הצילום שהוקמו בראשית ימיו של הפרויקט, בבניין הספרייה הישן. בצילום: ישראל וייזר, מראשי הפרויקט בתחילת דרכו (צילום: חנן כהן)
אחת מעמדות הצילום שהוקמו בראשית ימיו של הפרויקט, בבניין הספרייה הישן. בצילום: ישראל וייזר, מראשי הפרויקט בתחילת דרכו (צילום: חנן כהן)

לפני הקמת "עיתונות יהודית היסטורית", כדי לעיין בעיתונים ולהשתמש בהם במחקר היה על החוקרים להגיע פיזית לבניין הספרייה הלאומית, להזמין כרך ענק ומתפורר של עיתונות או לעלעל דרך מכשיר מיקרופילם מסורבל. כל זאת ללא אפשרות חיפוש על פי מילות מפתח, שם הכתב או תגיות אחרות. "בחוק הספרייה הלאומית רשום בפירוש שהספרייה לא צריכה רק לאסוף את כל החומרים, אלא גם להנגיש אותם לציבור הרחב. אז באמת לספרייה זה חשוב גם כי היא ממלאת את התפקיד שלה".

"אני פדנט גדול, לפעמים יותר מדי"

גורל או מקריות – השניים, צפריר וצור, נפגשו בטיול במצרים. "ככה האגדה מספרת לפחות", מחייך מילר. "הם דיברו על כל מיני נושאים, ואז גם עלה נושא הפרויקט של ירון באוניברסיטת תל אביב, שעסק בסריקת עיתונים, ובמקביל גם בספרייה הלאומית היה פרויקט דומה. שם התחילו לדבר על שיתוף פעולה. כשהם חזרו לארץ הם חיברו בין האנשים הרלוונטיים, וב-2005 נחתם ההסכם והוקם האתר – מיזם משותף של שני המוסדות שכבר פועל עשרים שנה".

במסגרת שיתוף הפעולה הפורה, אוניברסיטת תל אביב נקבעה כמנהלת האקדמית של המיזם, בעוד הספרייה הלאומית נושאת באחריות לתהליך סריקת העיתונים והניהול הטכני של מערכת המידע המורכבת. במהלך שני העשורים האחרונים צוות האתר סרק והעלה יותר מ-6 מיליוני עמודים. הם התחילו כצוות של שניים-שלושה חברים, עם תקציב קטן וטכנולוגיה חדשה לתקופה אבל איטית בהרבה מזו שקיימת היום. "לקח כמה שנים עד שהגענו בכלל למאה אלף עמודים, והיום אנחנו מייצרים מאה אלף עמודים בחודשיים".

איך נראה תהליך הדיגיטציה בפועל?
"רוב החומר שאנחנו סורקים הוא מהאוספים שלנו – לפעמים זה ממיקרופילם ולפעמים זה ממש מכרכים של נייר. יש לי חדר עם מלא כרכים וציוד של מנתחים, ואנחנו מפרקים כרכים ישנים של עיתונים, קצת כמו בית מלאכה של המאה התשע-עשרה, ומביאים אותם למרכז דיגיטציה. הם סורקים עבורנו את העיתונים שאנחנו מפרקים".

אבל תהליך הסריקה הוא רק ההתחלה. "אחרי זה יש עוד את שלב העיבוד. יש לי צוות שעובר על החומר, בודק שהחומר שנסרק – נסרק באיכות מספיק טובה, שלא פספסו עמודים. צריך לשיים את כל הדבר הזה. למשל, אני מביא לדיגיטציה כרך של 1,950 של עיתון 'דבר', שהוא אחד החשובים והמבוקשים אצלנו, אלף עמודים לצורך העניין. אני מקבל ממרכז הדיגיטציה תיקייה עם 1,000 קבצים: 1, 2, 3, 4. אז הצוות שלי יעבור על התיקייה הזאת, יחלק את העיתון, את האלף הקבצים האלה, לגיליונות: מקובץ 1 עד 8 זה הגיליון של ה-1/1/1950, מקובץ 9 עד 17 גיליון שני – וכן הלאה".

מרכז הדיגיטציה. "יש לי צוות שעובר על החומר, בודק שהחומר שנסרק – נסרק באיכות מספיק טובה" (צילום: מיכאל זכרי – מרכז הדיגיטציה, הספרייה הלאומית)
מרכז הדיגיטציה. "יש לי צוות שעובר על החומר, בודק שהחומר שנסרק – נסרק באיכות מספיק טובה" (צילום: מיכאל זכרי – מרכז הדיגיטציה, הספרייה הלאומית)

גם שלב הגרפיקה לא נותר מאחור. "ש גם עיבוד גרפי, לפעמים החומר נסרק בצורה כזאת שהוא קצת עקום, 'מלוכלך', אז עושים קצת סידור וניקוי וליטוש. אני פדנט גדול, לפעמים יש שיגידו יותר מדי. אני פשוט חושב שפרויקט מהסוג הזה – ברגע שעושים משהו כזה, לא יחזרו על זה בעתיד".

לפני שהעיתונים עולים לאתר, הם עוברים הרצה במערכת OCR, הכוללת גם סגמנטציה של הכתבות. מכיוון שעל עמוד אחד יכולים להופיע מספר טקסטים, המערכת מחלקת אותם לכתבות נפרדות – מה שמאפשר למשתמשים באתר לחפש לפי כתבה, לשמור כקובץ PDF, לשתף ולהרכיב רשימות מותאמות אישית.

מכל קצוות תבל

את העיתונים שמרכיבים את האוסף המקוון של "עיתונות יהודית היסטורית" לא מצאו כולם בספרייה הלאומית בירושלים. חלק ניכר מהם הגיע בעקבות יצירת שותפויות עם אוניברסיטאות וספריות ציבוריות מכל רחבי העולם. "בעשור האחרון הרחבנו מאוד את שיתופי הפעולה שלנו עם מוסדות שונים בעולם, מתוך הבנה שגם שהאוסף שלנו המקומי הוא עשיר וחשוב, אבל יש הרבה חומרים שלא הגיעו לפה", מסביר מילר.

אחד המאפיינים הבולטים של הפרויקט הוא הפיזור העצום של קהילות יהודיות ברחבי הגלובוס – ומכאן גם הפיזור הרחב של העיתונות היהודית. "זו גם הסיבה שספריות לאומיות של מדינות שונות שמחות לשתף איתנו פעולה. זו לא אהבת ישראל בהכרח, אלא באמת הבנה שהעיתונות היא חלק מההיסטוריה שלהם".

לדבריו, העלאת עיתונות יהודית ממדינה מסוימת גורמת לא פעם לעלייה חדה בהתעניינות המקומית: "פולין הזדחלה מאחור בטבלת הכניסות לאתר, מקום 20–30, ואחרי שסיימנו להעלות מסה קריטית של חומר מפולין, פתאום פולין מגיעה למקום 6–7 ברשימה. אז הדברים האלה הם רלוונטיים לא רק ליהודים וישראלים – אלא בכלל לציבור במקומות שונים בעולם שבהם חיו יהודים".

מרכז הדיגיטציה. "פרויקט הנגשה, איסוף והצלה. ככה מתגלים גם דברים שבכלל לא ידעו שקיימים" (צילום:: מיכאל זכרי – מרכז הדיגיטציה, הספרייה הלאומית)
מרכז הדיגיטציה. "פרויקט הנגשה, איסוף והצלה. ככה מתגלים גם דברים שבכלל לא ידעו שקיימים" (צילום:: מיכאל זכרי – מרכז הדיגיטציה, הספרייה הלאומית)

לא פעם, פנייה פשוטה לספרייה מקומית חושפת אוספים שנשכחו במשך עשרות שנים – או שמעולם לא נגעו בהם. "היה לנו פרויקט בשנים האחרונות עם הספרייה הלאומית של לטביה. הם סרקו את האוספים שלהם, וגם עזרו לנו למצוא חומרים מספריות אחרות בלטביה עצמה. אני בקשר מול לא מעט חוקרים, שאומרים לי שככה מתגלים גם דברים שבכלל לא ידעו שקיימים. יכול להיות שבמוסדות כאלה לפעמים מחזיקים כל מיני קרטונים עם עיתונים, שאף אחד לא עבר עליהם. הרבה פעמים גם לאותם מוסדות אין את האנשים עם הכשרה. לא לכל מוסד יש היום אנשים שיודעים לקרוא נניח יידיש ולהבין איזה עיתונים יש להם. במובן הזה זה פרויקט שהוא גם פרויקט הנגשה, גם פרויקט איסוף – וגם פרויקט הצלה".

ומה לגבי תקציב? כמו במיזמים אחרים, גם כאן תמיכה כספית משקפת לעיתים את סדרי העדיפויות של התורם. "בסוף, כמו בכל תחום – בעל המאה הוא גם בעל הדעה. כלומר, אם מישהו עכשיו תורם כסף, אז הוא יכול להגיד למה הוא רוצה לתרום כסף. אבל אנחנו לא מפחדים מזה. עיתונאי בכיר מאוד, לא ניכנס לשמות, תרם כסף מכספו האישי כדי שנעלה עיתון שהוא היה עורך ומייסד שלו במשך כמה שנים. מבחינתנו כל דבר כזה הוא מבורך. ברור שלנו יש שאיפה שהאוסף יהיה כמה שיותר מגוון ומייצג".

תמיכה פרטית ואקדמית גם יחד מאפשרת לפרויקט להתרחב למחוזות חדשים. "למשל קרן אמריקנית שתומכת בנו – התחילה מתמיכה ספציפית בסריקה של עיתונות יהודית מפולין. בגלל העבודה שלנו איתם הרבה שנים הצלחנו להרחיב את זה, וככה הם היום תומכים בנו גם בסריקת כותרים מאזורים שלא זכו לייצוג. ככה הם אפשרו לנו להתחיל לסרוק עיתונות יהודית מאמריקה הלטינית, עיתונות יהודית מאוסטרליה, ועיתונות יהודית מדרום וצפון אפריקה".

"אנחנו כן שמחים כשיש גופים או מענקים שהם קצת יותר מאפשרים לנו חירות, אבל שוב – נניח מענק מהרשות הלאומית ללדינו, אז הם יתרמו מן הסתם כסף לסריקה של עיתונות בלדינו, וכן הלאה. התקציב הזה מממן את כל האופרציה הזאת – את השכר של הצוות, ואת כל עבודת המחשוב: תחזוקת השרתים, התוכנה, הסריקות והצילום – מאל"ף ועד ת"ו".

"לשמרנות יש ערך"

לא רק חוקרים בתחום ההיסטוריה נהנים מהאוסף של "עיתונות יהודית היסטורית". בעשורים האחרונים, הפך העיתון ההיסטורי למקור מרכזי במגוון רחב של תחומי מחקר – ממדעי הרוח ועד מדעי החברה. "ב-20–30 השנים האחרונות רואים עלייה מטאורית בשימוש בעיתונות כמקור למחקר, גם היסטורי וגם לדיסציפלינות שונות", קובע מילר. לדבריו, השינוי הזה נובע לא רק מהנגישות הגדולה לחומר הארכיוני, אלא גם מתפיסה אקדמית משתנה: מקורות עיתונאיים, שפעם נחשבו לפחות אמינים או איכותיים, תופסים היום מקום של כבוד בכלים המחקריים.

מרכז הדיגיטציה. "עלייה מטאורית בשימוש בעיתונות כמקור למחקר" (צילום: מיכאל זכרי – מרכז הדיגיטציה, הספרייה הלאומית)
מרכז הדיגיטציה. "עלייה מטאורית בשימוש בעיתונות כמקור למחקר" (צילום: מיכאל זכרי – מרכז הדיגיטציה, הספרייה הלאומית)

ומה בעתיד? מילר לא מהסס לכוון רחוק – אבל שומר על גישה מתונה. "פשוט להמשיך. לא נעשה אף פעם סקר מדויק כדי להגיד כמה עמודי עיתונות יהודית יש באופן כללי, אבל ההערכה שלנו זה שיש עוד עשרות מיליונים שלא סרקנו. אז קודם כל, ברמה הכי פשוטה – להמשיך. להגדיל את התפוקה כדי לסרוק יותר עמודים כל שנה. אני חושב שבמובן הזה ההתקדמות הטכנולוגית מאפשרת התקדמות וגדילה של הקצב ושל האיכות של העבודה".

לצד הכמות, הפרויקט שם לו למטרה גם לגוון את התוכן – גיאוגרפית, לשונית ורעיונית. "אנחנו שמים דגש גם על גיוון של האוסף: גם ברמה הגיאוגרפית, גם ברמה הלשונית, גם ברמה הרעיונית. כלומר, שיהיה לנו בישראל עיתונות גם של הציבור החרדי, והציונות הדתית, ושל תנועות הפועלים, וכן הלאה. זה נכון גם לגבי קהילות שונות בעולם: שלא יהיה לנו רק עיתונות יהודית ממזרח אירופה ביידיש, אלא גם עיתונות יהודית מהבלקן ומאזורים של יהודים דוברי לדינו, וגם עיתונות יהודית מצפון אפריקה, וכן הלאה".

מה לגבי בינה מלאכותית?
"אני לא קופץ עכשיו לשלב AI כי כולם מדברים על AI וחולמים על AI וישנים עם AI. אנחנו נעשה את זה רק כשאנחנו נרגיש שיש בשלות ושזה ייתן ערך אמיתי למשתמשים שלנו. כרגע אנחנו בוחנים שילוב של צ'ט בוט באתר שיאפשר לך לשוחח איתו ולשאול שאלות על האוסף עצמו. אבל שוב, אני לא יודע להגיד לך שזה משהו שיקרה מחר. השמרנות – יש לה ערך בעיניי, במיוחד כשאנחנו מתעסקים באמת בחומרים פיזיים, שאני מפחד מאוד מכל מיני עיוותים שעלולים להיווצר בעולם המוזר הזה שאנחנו חיים בו".

מילר מסכם במבט רחב על תכלית המיזם. "אנחנו אוספים עמוד לעמוד, גיליון לגיליון, ומייצרים קורפוס שבעצם מאפשר גישה בלתי אמצעית ללב של התרבות הישראלית והיהודית המודרנית. אנחנו מבינים את האחריות שיש לנו על הכתפיים".

כנס לציון עשרים שנה לייסוד "עיתונות יהודית היסטורית" יתקיים בין 12 ל-14 במאי בספרייה הלאומית. הציבור הרחב מוזמן. לפרטים לחצו כאן.

דבר היום כל בוקר אצלך במייל
על ידי התחברות אני מאשר/ת את תנאי השימוש באתר
פעמון

כל העדכונים בזמן אמת

הירשמו לקבלת פושים מאתר החדשות ״דבר״

נרשמת!