1 / 48

מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע. יורם עשת. האינטרנט: חלום הבלהות של מחפש המידע המודרני. סדר: המידע מצוי ללא סדר וארגון לוגי הֶקשר : המידע מופיע ללא הקשר רחב תוכן: המידע הנו ill defined מבחינת תחום התוכן אליו הוא שייך - מה שמקשה על החיפוש איכות: לא תמיד ברורה איכות המידע

ranae
Download Presentation

מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. מתכנון לסינון: מדריך לטרמפיסט  בגלקסיית המידע יורם עשת

  2. האינטרנט: חלום הבלהות של מחפש המידע המודרני • סדר: המידע מצוי ללא סדר וארגון לוגי • הֶקשר: המידע מופיע ללא הקשר רחב • תוכן: המידע הנו ill defined מבחינת תחום התוכן אליו הוא שייך - מה שמקשה על החיפוש • איכות: לא תמיד ברורה איכות המידע • ידע: אין קנוניזציה של הידע

  3. בהרצאה אדון בשלושה נושאים: • מגמות השינוי שחלובמאפייני החיפוש בעשור האחרון • מיומנויות הנדרשות ממחפשי הרשת • אינדוקטרינציה בחסות מידע חופשי

  4. בתור פתיח: הבה נתבונן במחפשי מידע מלפני עשר שנים (כמעט) Nachmias & Gilad (2002). Needle in the hyperstack: Searching information in the Web

  5. האתגר: למצוא פריטים באינטרנט • תמונת מונה ליזה • הספר דויד קופרפילד • מרשם לעוגת תפוחים עם תמונה

  6. התוצאות כללי: • רק 15% הצליחו בכל המטלות • 39% הצליחו ב- 2 מהשלוש. • 40% הצליחו רק באחת מהמטלות. • 6% לא הצליחו באף אחת. זמן חיפוש (ממוצע) • 12 ד' חיפוש מוצלח. 20 ד' חיפוש כושל אסטרטגיות חיפוש • כתיבת מילת מפתח בודדת: 31% • Browsing בקטלוגים וספריות: 25% • חיפוש מורכב (שימוש ביותר ממילת מפתח אחת: 14% • חיפוש בוליאני: 0.3%

  7. מחקרון משווה שערכתי לקראת ההרצאה • 10 סטודנטים • משימות זהות • לא נבחנו אסטרטגיות ונמדדו זמנים

  8. תוצאות • 100% הצלחה • ביצוע תוך פחות מחמש דקות • שימוש במילת מפתח אחת • אסטרטגיה מובילה: גוגל + שימוש באופציה "תמונות

  9. מה התרחש בעשור האחרון באוטוסטרדת המידע? • חדירת האינטרנט • צמיחה בקצב ייצור המידע • שיפור ביצועים במחשבים • שיפור ביצועים במנועי החיפוש

  10. חדירת האינטרנט • חדירה לרוב הבתים והארגונים • חיפוש מידע הפך לפעילות אנושית טריויאלית • למעלה ממחצית הגולשים המבוגרים בארה"ב מעבירים 70% מהזמן בחיפוש מידע. • 90% מהגולשים תלמידי התיכון בישראל נעזרים באינטרנט לחיפוש מידע.

  11. "התפוצצות" בכמות המידע

  12. האצה בקצב הכפלת המידע 50 76 יום

  13. גידול בנפח האחסון לנפש (Sweeney, 2001)

  14. שיפור ביצועים במחשבים (Chatell, 2007)

  15. מנועי חיפוש: שתי מגמות שיפור ביצועים מכאוס לסדר מתחביר לסמנטיקה

  16. מתחביר לסמנטיקה

  17. מנועים ראשונים: נדרש ידע תחבירי • עומס קוגניטיבי גבוה • זכירת תחביר כתיבת מחרוזות • הבנת לוגיקה בוליאנית

  18. 1990s: נסיונות ראשונים בעיצוב סביבת חיפוש אינטואיטיבית • נחסך הצורך בזכירה תחבירית • עדיין נדרשת הבנת הלוגיקה הבוליאנית

  19. ממשקים עכשויים: לצקת לחיפוש סמנטיקה מלאה

  20. מכאוס לסדר

  21. מסתם רשימה אקראית לדירוג לפי מידת רלונטיות

  22. אישכּוּל (clustering)

  23. משמעות השינויים שראינו לעיל: הצפת המחפשים במידע • עליה בכמות ממצאי החיפוש: יותר אנשים מוצאים יותר מידע (הסיכוי למצוא מידע כלשהו עלה פי 1000 (Hobs, 2006). • ירידה באיכות המידע: האיכות הממוצעת של מידע ירדה באופן דרמטי (לפי Brand-Guell, 2008 - בלמעלה מ- 80%) • ירידה ברלונטיות: רוב ממצאי החיפוש אינם מספיק רלונטים (Hobs, 2006)

  24. Filter-feeding: האסטרטגיה המנצחת בעידן של היצף אם פעם היה האתגר למצוא משהו, כעת האתגר הוא לסנן החוצה את הגודש, שרובו אינו רלונטי או אינו אמין.

  25. מיומנויות סינון: מיומנויות הישרדות בעידן המידע • חשיבה ביקורתית: סינון מידע מוטעה, מניפולטיבי ושקרי בכדי להישאר עם המידע האמין • יישום קריטריונים של איכות • הבנת מגבלות החיפוש: כיצד מנותחת המידע ע"י המנוע? • יכולות הבניית ידע

  26. מיומנויות סינון: חשיבה ביקורתית בתנאי היצף

  27. הבעיה: באיזו מידה אנו מסוגלים לקריאה ביקורתית של מידע מניפולטיבי?

  28. International Business Times, May, 19th, 2007

  29. נמצאה ירידה לאורך שנים בחשיבה ביקורתית(Eshet & Chajut, 2007)

  30. האם תרבות של טיפשים בעידן של ידע חופשי?

  31. מיומנויות סינון: הבנת מגבלות התישאול

  32. מיומנויות סינון: הבנת מגבלות התשאול הסדר לעיתים דווקא קובע

  33. מיומנויות סינון: יישום קריטריונים של איכות • אמינות (reliability) • שמישות (usability) • אימוּת (verifiability לפי Brand-Gruwel, 2008, רוב המחפשים אינם מיישמים קריטריונים של איכות בחיפוש

  34. מהם הקריטריונים לזיהוי אתר המוקדש לסילוף?

  35. מיומנויות סינון: יכולת הבניית ידע

  36. מסנן המידע האנושי: מה סיכוייו לשרוד באוטוסטרדה? מתוך המחקר:קוים לדמותו של מחפש המידע העכשוי • בוחר מבין 10 ההיטים הראשונים • מסתפק בחיפוש פשוט • אינו מייחס משמעות לאופן ניסוח השאילתא • אינו מנסה ניסוח שאילתא אלטרנטיבית • מייחס ערך מוחלט לתוצאות החיפוש • אינו מיישם קריטריונים של איכות • מייחס ערך גבוה לעיצוב המידע

  37. אינדוקטרינציה בעזרת מידע חופשי • "בספר 1984 נעשתה לאדם אינדוקטרינציה בניגוד לרצונו, ואילו בעידן המודרני, האדם מקבלה על עצמו ברצון". • סלבויז'יז'ק (2002), "ברוכים הבאים למדבר של הממשי"

  38. על כוחו של מידע בתנאי אי-ודאות • לפי תיאוריית האינפורמציה, מידע מוגדר ככל גירוי המצמצם אי-ודאות • המידע אליו אנו נחשפים, מהווה המכשיר העיקרי שלנו בצמצום אי-ודאות ובקביעת ידע ועמדות כלפי נושאים שונים. • כלומר: כמות וסוגי הידע אליהם ניחשף, משפיעים על העמדות שנאמץ.

  39. העולם לפי שטיינברג: האדם קרוב אצל עצמו אנו נוטים לגבש ידע ועמדות מתוך מה שמוכר וקרוב לנו

  40. האם הרוב קובע?הידע כפונקציה של כמות ההמידע הזמין בשפתנופרויקט העתקת ספריית הקונגרס לאינטרנט "הפצצת" האינטרנט במקורות מידע המציגים בעיקר פרספקטיבה אחת, תגרום להטיית הידע הזמין לכיוון פרו-אמריקאי.

  41. מחט בערימת שחת: ידע כפונקציה של כמות המידע הזמין (מעובד מתוך Ruger, 2008)

  42. אבל הידע שלנו תלוי במידה רבה גם בעיקר במה שמאפשרים לנו למצוא בחיפוש

  43. מה מאפשרים לנו למצוא בחיפוש, או:האם יש דבר כזה "חיפוש טהור"?ומה בדבר סיסמת גוגל don’t be evil? Elinor Mills, 2006 (Cnet)

  44. מישהו מחליט בשבילך מי אתה • Enteen 2008: • חיפוש המונח gay בגוגל ארה"ב (google.com) מכיל בראש הרשימה הגדרות רציניות של המונח ואתרים על חיי גייז. המחפש מזוהה כמי שמבקש ללמוד על גייז או לפגוש גייז. אם נכתוב גם thailand, נקבל אתרים על שירותי מין+ המחפש מזוהה כצרכן שירותי מין • בחיפוש gay בגוגל תאילנד (co.th), המחפש מזוהה כצרכן המחפש שירותי מין ומקבל בעיקר אתרים המספקים שירותים אלה.

  45. האח הגדול והכיס הקטן (שלי)

  46. לסיכום • שיפור מנועי החיפוש והגדלת כמות המידע הובילו לגידול בכמות המידע שמוצאים מחפשים • הגידול, לצד הירידה באיכות המידע הזמין ברשת, מחייבים שליטה במיומנויות סינון מידע. • סינון יעיל של מידע מאפשר לגולש לגבש מידע אמין ולהתגונן מפני אפקטים של אינדוקטרינציה בעזרת מידע חופשי.

  47. בתקווה שתצאו מכאן עם כמה מחשבות מקוריות תודה

More Related