שער של הניוזלטר עם לוגו של האוניברסיטה הפתוחה
אפריל 2026
headlines_new_heb
סמינר

אפיסטמולוגיה של ארכיונים תרבותיים:
באילו נתונים אנו משתמשים
כדי להבין גיוון ושינוי תרבותי

ד"ר אינה קיזנר
הנכם מוזמנים ומוזמנות לסמינר של המרח"ב הדיגיטלי, שיתקיים ביום רביעי, 15 באפריל, בשעה 13:30. ד"ר אינה קיזנר, פוסט דוקטורנטית במרח"ב הדיגיטלי, תציג את מחקרה על ארכיונים דיגיטליים וההטיות התרבותיות המתקיימות בתהליך יצירתם. בהרצאה זו ד"ר קיזנר תדון במגבלותיהם של ארכיונים כמודלים של נתונים למחקר במדעי הרוח. במחקרה היא בוחנת את חוסר האיזון הקיים באוספים דיגיטליים ובפלטפורמות אחרות, בהם ניתנת העדפה למדינות מסוימות, לערי בירה ולמוסדות מרכזיים, על פני אחרים. ההרצאה תמקם את תנועת "האוספים כנתונים" כפרקטיקה המחייבת הבנה מעמיקה של הנסיבות התיעודיות, המשפטיות, הטכנולוגיות והפרשנויות הנמצאים בבסיס ייצור הנתונים בארכיונים דיגיטליים. 
Untitled123
headlines_Announcements_heb
ברכות לזוכי וזוכות מענק המחקר
של המרח"ב הדיגיטלי
grants33
headlines_researcspot_heb
Linguistic Annotation of Cuneiform Texts
Using Treebanks and Deep Learning

פרופ' שי גורדין וד"ר מתיו אונג
המאמר מציג תשתית מתודולוגית מבוססת למידת עמוקה (Deep Learning) לתיוג מורפו-תחבירי אוטומטי של טקסטים בשפות עתיקות ושפות מעוטות משאבים. התהליך מבוסס על טכניקת “bootstrapping”, כלומר לולאה שבה חוקר מתייג ידנית קבוצה ראשונית של טקסטים, מאמן עליה מודל שפה, ומיישם אותו על קבוצת טקסטים חדשה, ומתקן את תוצאותיו. כך, המאמץ האנושי פוחת עם כל מחזור. הגישה מוצגת כנגישה לחוקר בודד, ולא רק לצוותים טכנולוגיים גדולים.
כמקרה בוחן יושם הצינור על כ-560 מכתבים אשוריים מתקופת סרגון השני (722–705 לפנה"ס), הלקוחים משני כרכים של פרויקט State Archives of Assyria (SAA 1 ו-5) וזמינים במרשתת באופן דיגיטלי דרך Oracc.
Slide11
התוצר הוא Treebank חדש לאכדית ומודל שפה בשם AkkParser, בנוי על גבי התשתית הנפוצה של spaCy, שמגיע בשתי גרסאות: טקסטים מנורמלים (AkkParser-Norm) וטקסטים בתעתיק (AkkParser-Trans). המודל משיג דיוק של 93% בלמטיזציה ו-81% בתיוג מורפולוגי מלא. שניהם זמינים בקוד פתוח ב-GitHub לשימוש חוקרים אחריםהמאמר דן גם באתגרים הלשוניים הייחודיים של מכתבים בשפה הניאו-אשורית, כגון צורות פועל רב-משמעיות, גבולות משפט עמומים, ותלות גבוהה בהקשר פרגמטי, ומציע אסטרטגיות להתמודדות עמם.
אנו טוענים שעם צוות קטן של מומחים בודדים השולטים בשיטה זו, ניתן לתייג, למשל, את כלל כרכי
SAA תוך שנה עד שנתיים. הצינור עצמו מיועד ליישום בשפות עתיקות נוספות, ומהווה אבן דרך לקראת ניתוחים סמנטיים ומטאפוריים ברמה גבוהה יותר 
(לקריאת המאמר).
headlines_end
באפשרותך לבטל בכל עת את קבלת ההודעות והפרסומים של המרח"ב הדיגיטלי של האוניברסיטה הפתוחה, באמצעות שליחת הודעה לכתובת  dhsshub@openu.ac.il

Powered by Publicators