|
המאמר מציג תשתית מתודולוגית מבוססת למידת עמוקה (Deep Learning) לתיוג מורפו-תחבירי אוטומטי של טקסטים בשפות עתיקות ושפות מעוטות משאבים. התהליך מבוסס על טכניקת “bootstrapping”, כלומר לולאה שבה חוקר מתייג ידנית קבוצה ראשונית של טקסטים, מאמן עליה מודל שפה, ומיישם אותו על קבוצת טקסטים חדשה, ומתקן את תוצאותיו. כך, המאמץ האנושי פוחת עם כל מחזור. הגישה מוצגת כנגישה לחוקר בודד, ולא רק לצוותים טכנולוגיים גדולים. כמקרה בוחן יושם הצינור על כ-560 מכתבים אשוריים מתקופת סרגון השני (722–705 לפנה"ס), הלקוחים משני כרכים של פרויקט State Archives of Assyria (SAA 1 ו-5) וזמינים במרשתת באופן דיגיטלי דרך Oracc.
|