1 / 42

מנחה: פרופסור עוזי אורנן מגישים: יובל רוטנברג, נטלי פולנסקי

הפקולטה למדעי המחשב. סמינר בבלשנות חישובית קורס 236817 חורף 2012-13 בנושא: מורפולוגיה. מנחה: פרופסור עוזי אורנן מגישים: יובל רוטנברג, נטלי פולנסקי. הקדמה -למה מורפולוגיה?. חוקים מורפולוגיים עשויים לעזור למנתח מורפולוגי וכן לתוכנת הקראה: האם וילון הוא wilon או שמא weyalun ? הבנה סמנטית:

diallo
Download Presentation

מנחה: פרופסור עוזי אורנן מגישים: יובל רוטנברג, נטלי פולנסקי

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. הפקולטה למדעי המחשב סמינר בבלשנות חישוביתקורס 236817חורף 2012-13בנושא: מורפולוגיה מנחה: פרופסור עוזי אורנןמגישים: יובל רוטנברג, נטלי פולנסקי

  2. הקדמה -למה מורפולוגיה? • חוקים מורפולוגיים עשויים לעזור למנתח מורפולוגי וכן לתוכנת הקראה: • האם וילון הוא wilon או שמא weyalun? • הבנה סמנטית: • הבנת השורש והמשקל של מילה עשויה לעזור לכל מנתח סמנטי • ניבוי: • הבנה מורפולוגית יכולה להעניק יכולת ניבוי ואף יצירה של מילים חדשות • הערכת פרשנות סמנטית של מילים לא מוכרות

  3. תוכן ההרצאה • ו' החיבור -תנועה או עיצור? • קידומות אית"נ לצורת העתיד • טבלת שורש - משקל • יצירת מילים חדשות • פירוש מילים לא מוכרות • תוספת -תעתיק המבנה

  4. ו' החיבור- תנועה או עיצור?

  5. ו' החיבור -תנועה או עיצור? • כל המילים בעברית נפתחות תמיד בעיצורים. • למרות עובדה זו, ספרי לימוד גורסים כי לעתים ו' החיבור הופכת לתנועה: 1. כאשר ו' החיבור באה לפני העיצורים השפתיים: ב',ו',מ',פ'. 2. כאשר ו' החיבור באה לפני הברה הפותחת בשני עיצורים. בשני המקרים הללו ו' החיבור מתבצעת כתנועה u. דוגמאות: וְמִיץ > וּמִיץ , וְקלָף > וּקלָף • מנגד, נטען כי ו' החיבור היא עיצור גם במקרים אלו. נראה שהחוקים הפועלים על מילה כלשהי זהים לחוקים הפועלים על הצירוף של המילה עם ו' החיבור, ולכן החוק לפיו כל המילים נפתחות תמיד בעיצורים יחול גם על המילה בצירוף ו' החיבור.

  6. תזכורת נזכיר את שני החוקים המורפולוגיים: 1. חוק מחיקת התנועה עקב התרחקות הטעם: • נתאר תופעה פונולוגית: כאשר נוצרת מילה בעלת 3 הברות והטעם בהברה השלישית, האדם הדובר רוצה להגות במהירות את ההברה המוטעמת, לכן הוא משמיט את תנועת ה- a הראשונה šamur + im > *šamurim > šmurim paqid + im > *paqidim > pqidim • הסיומות בעברית לרוב עם הטעמה • כאשר ישנן רק שתי תנועות, לא נשמטת התנועה: šana + im > šanim

  7. תזכורת 2. חוק היבקעות הצרור המשולש: • מה קורה כאשר המילה כבר מתחילה בשני עיצורים (ללא תנועה ביניהם)? האם במקרה של התרחקות הטעם, תנועת ה- a שלאחריהם נשמטת גם היא? • נראה כי מתווספת תנועה בין העיצור הראשון לשני. • ברירת המחדל לתנועה המתווספת היא i. bgadim [+nismak] > *bgdeihayeled > bigdeihayeled • אם אחד העיצורים הוא גרוני תהיה התנועה המתווספת a. ĥdašot [+nismak] > *ĥdšothayom > ĥadšothayom • ישנם מקרים בהם התנועה המתווספת תהיה o וזאת אם צורת הבסיס של השם היא עם o. cork + im > *corakim > crakim crakim [+nismak] > *crkeihayom > corkeihayom

  8. ו' החיבור -תנועה או עיצור? • עד כה הראינו דוגמאות לפיהן החוקים פעלו על מילים כשלבסיס המילה הצטרפה סיומת או כשהמילה תפקדה כנסמך • נראה כעת שחוקים אלו תקפים גם עבור קידומות העתיד וכן עבור מילות השימוש הזעירות (משה וכלב) עבור קידומות העתיד- א,י,ת,נ: • התנועות המלוות אותיות אלו נוצרות רק מכוח החוקים הפונולוגיים: • כאשר בסיס הפועל בן הברה אחת ,תבוא הקידומת כשאחריה תנועת a קמץ . לדוגמא: laqum, taqum, yaqum : {?,t,y,n}+qum.

  9. ו' החיבור -תנועה או עיצור? • אם הפועל בן שתי הברות והטעם איננו בהברה הראשונה (למשל: qomem), כשאחת הקידומות מצטרפת אל הבסיס, תימחק תנועת ה- a (לפי החוק הראשון- השמטת התנועה) לדוגמה: {?,y,t,n}+ qomem > ?qomem , yqomem , tqomem , nqomem • אם בסיס הפועל פותח בשני עיצורים (למשל droš), כאשר נצרף את אחת הקידומות אל הבסיס יווצר צרור משולש וחוק ביקוע הצרור המשולש יחול על הצורה המתקבלת: {?,t,y,n}+droš > *?droš ,*tdroš ,*ndroš ,*ydroš > ?edroš ,tidroš ,nidrošyidroš

  10. ו' החיבור -תנועה או עיצור? • עבור מילות השימוש הזעירות חלים אותם החוקים: ניקח לדוגמה את המילה lbanim- יש לה שני מבנים, האחד כמילה מילונית (הצבע לבן) והשני כמילה המורכבת ממילת שימוש ומילה אחרת: l-banim : ל+בנים lbanim: הצבע לבן (laban) בריבוי. • נסתכל על המילה לבנים בצורת נסמך: חלים עליה שני החוקים. laban+im > lbanim[+nismak] > lbnei>libnei (חוק 2) חוק(1) • אותם שני חוקים חלים גם על צירוף מילת השימוש ל- והמילה בנים אחריה ביחד.

  11. ו' החיבור -תנועה או עיצור? עוד דוגמאות: • l-dror>*ldror>lidror • b-praĥim>*bpraĥim>bipraĥim בצירוף מילית השימוש נוצרו 3 עיצורים ולכן עפ"י החוק השני (ביקוע הצרור המשולש) שראינו מתווספת התנועה i. • כאשר העיצור הראשון במילה הוא גרוני (האות הראשונה תשא חטף) התנועה הנדחקת תהיה בגון החטף במילה. לדוגמא: ב+חֲדרים > בַּחֲדרים b+ ĥdarim>baĥdarim>[baĥadarim[ • גם מילת השימוש ו' נוהגת כך: w+ ĥdarim>waĥdarim>[waĥadarim[

  12. ו' החיבור -תנועה או עיצור? • כפי שראינו, ברירת המחדל עבור התנועות היא i. עבור ו' החיבור,בגלל היותו עיצור שפתי תנועת ברירת המחדל שלו היא u kigmul אבל wugmul • התנועה u צריכה להיות מסומנת בקובוץ, אך בשיטת הניקוד הטברני תנועת u לא תסומן בקובוץ בסמוך לאות ו' אלא תסומן ע"י שורוק באות ו'. מסקנה.. ו' החיבור הינה עיצור ולא תנועה.

  13. קידומות אית"נ לצורת עתיד

  14. קידומות אית"נ לצורת עתיד • קידומות לפועל בעתיד- אית"נ הן עיצורים בלבד ללא כל תנועה אחריהן. • התנועות מתפתחות עפ"י חוקי ביצוע לאחר שהקידומת מובאת לפני בסיס העתיד. • ראינו מעט בדוגמאות קודמות, וכעת נרחיב יותר על החוקים: • כאשר בסיס הפועל בן הברה אחת ומיד לאחר העיצור הראשון שלו יש תנועה- נוספת תנועת a אל הקידומת לדוגמה: הבסיס קוּם: אָקוּם יָקוּם תָקוּם נָקוּם • כאשר בסיס הפועל הוא בן שתי הברות לא נוספת תנועה אחרי הקידומת לדוגמה: בסיס הפועל קוֹמֵם: אֲקוֹמֵם (א בחטף –עיצור גרוני) יְקוֹמֵם ,תְקוֹמֵם ,נְקוֹמֵם

  15. קידומות אית"נ לצורת עתיד • כאשר הבסיס פותח בצרור של שני עיצורים יתבצע חוק ביקוע הצרור המשולש: • ברירת המחדל של התנועה שאחרי הקידומת תהיהi לדוגמה: בסיס העתיד הוא גְמוֹר: תִגְמוֹר יִגְמוֹר נִגְמוֹר • אבל כאשר הקידומת היא א' (עיצור גרוני) התנועה i מושפעת מן ה- א' ומתבצעת הדמות חלקית אל ה- א'. כתוצאה מכך, התנועה הנדחקת תהיה e, שהיא תנועה נמוכה יותר מ- i לדוגמה: א+בדק >אֶבדק • כך גם כאשר העיצור הראשון בבסיס הפועל הוא א. לדוגמה: ת+אֱסֹר>תֶאֱסֹר

  16. קידומות אית"נ לצורת עתיד • כאשר העיצור הראשון בבסיס הוא ה',ח' או ע'- התנועה לאחר הקידומת נמוכה עוד יותר: a אך כאשר הקידומת א' התנועה מוסיפה להיות e: לדוגמה: י+הֲרֹס > יַהֲרֹס אבל א+הֲרֹס > אֶהֱרֹס. • התנועה היא a גם כאשר העיצור האחרון בשורש (לה"פ) הוא י' והעיצור הראשון בשורש (פה"פ) הוא ע . לדוגמה: תַּעֲלִי, יַעֲנֶה , נַעֲשֶה

  17. קידומות אית"נ לצורת עתיד • בסיסי פועל שמשקלם פותח ב-ה': העיצור ה נבלע בעיצור אית"נ שלפניו והתנועה שהיתה אחרי ה-ה' באה כעת מיד אחרי הקידומת אית"נ . לדוגמה: ת+ הִתְרוֹמם >תִּתְרֹומם ת+ הִבָּחֵר > תִּבָּחֵר ב+ ה + בית > *בְהַבּית > בַבּית (בליעת ה' הידוע) • כאשר הקידומת היא העיצור א - עיצור גרוני,התנועה i אחרי הקידומת מושפעת מן ה-א' ומתרחשת הדמות חלקית אל ה - א'. נקבל תנועת e שהיא נמוכה מהתנועה i. לדוגמה: א+הִתְרומם > אֶתְרומם. הדמות חלקית חלה רק על התנועה i שהיא התנועההקדמיתהגבוהה.

  18. טבלת שורש-משקל

  19. טבלת שורש - משקל • מכילה את רוב המילים בעברית • שורות: שורשים, עמודות: משקלים

  20. טבלת שורש - משקל • הערכת גודל הטבלה: • מספר השורות (מספר השורשים): • לפי אבן שושן: 3407 שורשים שונים בעברית (מתוכם 2189 משולשים) • אם נספור משמעויות סמנטיות שונות לאותו שורש: 3904 • שורשים אפשריים: לא כל שורש אפשרי מבחינה פונטית • שורשים משולשים אפשריים בתיאוריה: • חוקים דקדוקיים עשויים להגביל, למשל: שפתיים או חכיים בלבד לא יקימו שורש • פחות מ- 5% מהשורשים המשולשים לא דקדוקיים (לא עומדים בחוקים) • מספר העמודות (מספר המשקלים): • הגדרות שונות למושג משקל בגלל חוקי ביצוע פונטיים • מפתח ומסמר: האם אותו משקל? משפט, מעמד: האם אותו משקל? • משקלים חדשים: האם צריך? האם יהיו בעלי אותן תכונות? • מספר עשרות (50~) משקלי שמות + 7 משקלי פועל • גודל הטבלה לפי הגישה התיאורטית: 170,000~

  21. טבלת שורש - משקל • מספר המילים בטבלה לעומת מספר המילים בעברית • מספר המילים בעברית -שאלה בעייתית • מילים חדשות, מילים שהתיישנו, מילים שאולות • האם מילה שהציבור משתמש בה אך לא נמצאת במילון נחשבת מילה בעברית? • מאמר מתוך אתר האקדמיה ללשון העברית[דרושה הפניה מלאה] • מספר הערכים הראשיים במילונים, כולל מילים שאולות שלא נמצאות בטבלה (טלפון, טלויזיה), הוא 45,000~ • מספר צירופי המילים הנוספים (בית-ספר): 35,000~ • סה"כ 80,000~ מילים בעברית לפי המאמר • 120,000~ לפי האנציקלופדיה של ynet, כולל מילים גנוזות ומילים לועזיות השימושיות בעברית • האם יש משבצות ריקות בטבלה? • הטבלה גדולה יותר ממספר המילים בעברית- יש מקום להמצאת מילים חדשות

  22. יצירת מילים חדשות

  23. יצירת מילים חדשות • שאלה קשה: מה זה מילה? • כמה מילים יש כאן: אישה נעלה נעלהנעלהנעלה את הדלת בפני בעלה • לפי האדם שצריך לכתוב את המילים: 9 (תמניות) • לפי מורה המלמד באולפן: 6 (תבניות) • ערכים במילון: 9 אישה נעלה את בעלה ובעלה נעל אותה • תמניות: 7 • תבניות: 6 • ערכים במילון: 4 המטרה שלנו: יצירת ערכים חדשים במילון

  24. יצירת מילים חדשות • קיימות מספר דרכים (שאילת מילים, הלחם, קיצור) אך אנו נתמקד בטבלת שורש-משקל • מה נותן את המשמעות למילה? • שורש: עיצורים • משקל: תנועות, או תנועות ועיצורים • מה יותר חשוב - שורש או משקל? • שתי גישות: • השורש חשוב יותר, ומכיל את עיקר המשמעות הסמנטית, והמשקל נותן ייחוד • חשיבות דומה לשורש ולמשקל: שתיהן מורפמות כבולות ודורשות האחת את השנייה. דוגמאות להחלפת משקל:zimmer , zimmur או miqlaţ , maqleţ • עיצורים לעומת תנועות: • העיצורים חשובים בעיקר בפועל, ואילו בשמות גם התנועות חשובות • בניגוד למה שעשויים לחשוב, עיצורי המשקל אינם חשובים מתנועותיו (איזה קשר יש בין מסע, מגדל, מלחמה ומנגינה?)

  25. המילון יצירת מילים חדשות • מילון אישי • מילון ציבורי • תהליך יצירת מילה חדשה:

  26. פירוש מילים לא מוכרות

  27. פירוש מילים לא מוכרות • הקורא מסיק את משמעותה של מילה שהוא לא מכיר כך: • מפעיל את כללי הביצוע בכיוון ההפוך • מוצא את השורש והמשקל של המילה • לפי המשמעות הסמנטית שמוחו מעניק לשורש ולמשקל, הוא מנסה להסיק את משמעות המילה שלפניו • כיצד נוצרת המשמעות הסמנטית של השורש והמשקל? • המשמעות מגיעה מתוך מילים קיימות בעלות אותו שורש ומשקל, שאותן הקורא כבר מכיר • תיתכנה משמעויות רבות לשורש או למשקל מסויים • אותו שורש: לובן, מלבן, לבנה • אותו משקל: אדמת, כספת, גננת

  28. פירוש מילים לא מוכרות • מה מתרחש במוחו של התינוק? (השערה) • ליקוט השורשים מתוך מילות שוות שורש • ליקוט המשקלים מתוך מילות שוות משקל • בנייה איטית של טבלת שורש-משקל • יצירת השורשים והמשקלים • אין השורשים והמשקלים קיימים בפני עצמם, אלא נובעים מן המילים בשפה • השורשים והמשקלים יכולים להווצר עקב פרשנות חדשה של מילים קיימות דוגמה: משקל שִפעל שהגיע מאכדית גרם ליצירת שורשים מרובעים בעקבות פרשנות ששייכה את ה-ש' לשורש, ושימוש בבניין פִעֵל. כך נוצרו, למשל, השורשים המרובעים שלהב, שחרר ושכפל. כל מילה שנוצרת בשפה, נוצרת כפרשנות של שאר המילים בשפה

  29. תעתיק המבנה

  30. תעתיק המבנה - הקדמה • נשים לב לתופעה הבאה: לפי התעתיק הרשמי של האקדמיה ללשון, העיצורים ב' (רפה) ו- ו' מתועתקים שניהם ל- v. • התעתיק הרשמי של האקדמיה על כן בהנתן המילה המתועתקת בלבד, אין אפשרות לדעת את הכתיב המקורי של המילה. למשל: האם kelev נכתב "כלב" או "כלו"? • בעיה נוספת: האות ב' מתורגמת לשני עיצורים שונים, למרות שזו אותה אות במקור • על כן נרצה לפתח תעתיק שידע לשמור את המידע על כתיב המילה גם בצורה המתועתקת שלה

  31. תעתיק המבנה - הקדמה • נסיון: נשתמש באות b גם עבור ב' רפה וגם עבור ב' דגושה • כך גם נדע את הכתיב המקורי של המילה, וגם נדע באופן חד חד ערכי ש- ב' מתורגמת ל- b ולהיפך • בעיה: כעת לא נוכל לדעת כיצד יש להגות את המילה • האם keleb נהגה ב- ב' דגושה או רפה? • אם נוסיף חוק קריאה (ב' אחרי תנועה) שיורה לנו להגות את keleb ב- ב' רפה, נוכל לדעת גם את הכתיב המקורי של המילה, וגם את הגייתה • הפתרון: נשתמש בתעתיק המפריד בין הקריאה לכתיבה. לכן מאפשר: • להבין את הכתיב המקורי של המילה בעברית (בעזרת חוקי הכתיבה) • להבין כיצד להגות את המילה כראוי (בעזרת חוקי הקריאה)

  32. תעתיק המבנה -חוקי כתיבה

  33. תעתיק המבנה -חוקי כתיבה

  34. תעתיק המבנה -חוקי כתיבה

  35. תעתיק המבנה -חוקי כתיבה • הערות לחוקי הכתיבה: • התנועה ei נועדה כדי להבחין בתנועת הצירי המלא. אין עיצור y (כמו ב-"ילד": yeled) לאחר ה- e. למשל במילה ביצה: beica האות י' הוא חלק מתנועת הצירה המלא. • מכפל עיצורים (דגש חזק) מסומן על ידי רצף של שתי אותיות זהות. אם שני עיצורים זהים לא יוצרים מכפל, נוסיף קו תחתון ביניהם. לדוגמה: ĥog_gim. העיצורים הגרוניים א,ה,ח,ע,ר, שאינם ניתנים להכפלה, יקבלו מכפל תיאורטי לפי חוקי הכתיבה לדוגמה: נָהָג נכתב nahhag (על אף שאין דגש ב- ה') זאת כמו סָבָּל, שנכתב sabbal • מילות השימוש הזעירות מ-, ש-, ה-, ו-, כ-, ל-, ב-, נפרדות מן המילה שהן צמודות אליה במקף: ha-bayt

  36. תעתיק המבנה -חוקי כתיבה • הערות לחוקי הכתיבה: • א בראש מילה- ניתן לא לכתבה, אך כדאי למען עיבוד במחשב לדוגמה: ארגון: irgun , ?irgun • חטפים הם סימן להגה ולא לפונמה. אין מקום לכתיבת החטפים בתעתיק מדויק, אך ניתן לעשות כך בתעתיק לא רשמי. דוגמה: בתעתיק מדעי: ĥdašim, בתעתיק לא מדעי: ĥodašim

  37. תעתיק המבנה -חוקי קריאה • סימונים: • פונמה תסומן כך: /פונמה/ והגה יסומן כך: [הגה] • b, k, p יבוטאו [v], [x] , [f] בהתאמה, במקרים הבאים: • כאשר האות נמצאת אחרי תנועה ואינה במכפל, כגון: šub/  [šuv]/ • כאשר היא בסוף מילה גם אם היא במכפל, כגון: /lebb/  [lev] • כאשר האות נמצאת אחרי עיצור שהוא בראש הברה, כגון: /bki/  [bxi] • כאשר האות נמצאת אחרי עיצור בתוך המילה, ובצורת הבסיס של המילה יש תנועה, כגון: /ktob+i/  /ktobi/  *ktbi /kitbi/  [kitvi] • כל מכפל עיצורים יבוטא כעיצור יחיד • שני החוקים הנ"ל הוסברו בהרחבה בהרצאה הקודמת

  38. תעתיק המבנה -חוקי קריאה • h,ĥ,ʕ- כשעיצורים אלו באים בסוף מילה ואין לפניהם תנועת a, תיווסף לפניהם a לא מוטעמת. • למשל: /ruĥ/ > [ruaĥ] • מילה המסתיימת בשני עיצורים ללא תנועה ביניהם, ובלבד שאינה פועל בעבר, נוספת בין שני העיצורים האלה תנועה לא מוטעמת כדלקמן: • אם אחד משני העיצורים האחרונים הוא גרוני, נוספת תנועת a, כגון: /do?r/  [do?ar] • אם אחד מהם הואy , נוספת תנועת i, כגון: /bayt/  [bayit] • אם שני העיצורים אינם שייכים לנ"ל, נוספת תנועתe , כגון: /yeld/  [yeled]

  39. תעתיק המבנה -חוקי קריאה • שני עיצורים בתחילת מילה, נשמעת ביניהם תנועת e אם הצליליות של הראשון אינה נמוכה מהצליליות של השני • צליליות: רמת ה"שמיעות" של הגה מסויים, כלומר- עד כמה הגה מצליח להישמע • דוגמה: /rpida/  [refida], /yladim/  [yeladim] אבל/klabim/  [klavim] /spira/  [sfira] : • ההטעמה ברוב המילים (כולל נטיותיהן) היא בהברה האחרונה, למעט פעלים בעלי סיומת -nu, -ti, -ta, וכן מילים שחלו עליהן אחד משני החוקים הקודמים

  40. תעתיק המבנה -שחזור לעברית • חוקי השחזור: עלינו להראות כי השחזור למילה המקורית הוא חד ערכי • הפעלה של החוקים הללו לפי הסדר תיתן תוצאה חד-משמעית: 1. מכפל עיצורים יועתק לאות יחידה. 2. כל עיצור יועתק לפי טבלת העיצורים. 3. התנועות a,e בסוף מילה יועתקו ל- ה', חוץ מאשר צורני הסיומת-ta בצורות העבר של הפועל, ו- -ha, -ka בנטיית השמות. למשל: סוסיה suseiha , סוסך suska, קיבלת qibbalta. 4. התנועות a,e בתוך המילה לא יועתקו. 5. התנועות o,u יועתקו ל-ו', חוץ מרשימת חריגים קצרה. 6. התנועה i אחרונה במילה תועתק ל- י'. למשל: דברים dbarim, נקיnaqi כך גם i שלאחריה אות של עיצור או מכפל, אם אחריה יש תנועה. למשל: חידה ĥida, מידה midda אבל: מגדל migdal, ארגון ?irgun

  41. שאלות?

  42. ביבליוגרפיה • בראשית היה השפה, האקדמיה ללשון העברית 2013 -עוזי אורנן (עמודים: 273-280 ,228-240) • המילה האחרונה, אוניברסיטת חיפה 2003 -עוזי אורנן (18-39) • פרקים במורפולוגיה עברית, כרך א', האוניברסיטה הפתוחה 2002 -אורה שורצולד (88-105) • חרושת המילים של העברית, לשוננו לעם, מ-מא -עוזי אורנן (247-253) • המרכיבים הדקדוקיים של השפה העברית, לשוננו נ"ד, תשנ"א -עוזי אורנן (247-268) • Mark Aronoff, Word Formation in Generative Grammar, MIT Press, 1976 (pages 1-4) • מאמרים מן המרשתת: • הערכת האקדמיה לכמות המילים בעברית • הערכת האנציקלופדיה של ynet לכמות המילים בעברית • התעתיק הרשמי של האקדמיה

More Related