480 likes | 624 Views
מתכנון לסינון: מדריך לטרמפיסט בגלקסיית המידע. יורם עשת. האינטרנט: חלום הבלהות של מחפש המידע המודרני. סדר: המידע מצוי ללא סדר וארגון לוגי הֶקשר : המידע מופיע ללא הקשר רחב תוכן: המידע הנו ill defined מבחינת תחום התוכן אליו הוא שייך - מה שמקשה על החיפוש איכות: לא תמיד ברורה איכות המידע
E N D
מתכנון לסינון: מדריך לטרמפיסט בגלקסיית המידע יורם עשת
האינטרנט: חלום הבלהות של מחפש המידע המודרני • סדר: המידע מצוי ללא סדר וארגון לוגי • הֶקשר: המידע מופיע ללא הקשר רחב • תוכן: המידע הנו ill defined מבחינת תחום התוכן אליו הוא שייך - מה שמקשה על החיפוש • איכות: לא תמיד ברורה איכות המידע • ידע: אין קנוניזציה של הידע
בהרצאה אדון בשלושה נושאים: • מגמות השינוי שחלובמאפייני החיפוש בעשור האחרון • מיומנויות הנדרשות ממחפשי הרשת • אינדוקטרינציה בחסות מידע חופשי
בתור פתיח: הבה נתבונן במחפשי מידע מלפני עשר שנים (כמעט) Nachmias & Gilad (2002). Needle in the hyperstack: Searching information in the Web
האתגר: למצוא פריטים באינטרנט • תמונת מונה ליזה • הספר דויד קופרפילד • מרשם לעוגת תפוחים עם תמונה
התוצאות כללי: • רק 15% הצליחו בכל המטלות • 39% הצליחו ב- 2 מהשלוש. • 40% הצליחו רק באחת מהמטלות. • 6% לא הצליחו באף אחת. זמן חיפוש (ממוצע) • 12 ד' חיפוש מוצלח. 20 ד' חיפוש כושל אסטרטגיות חיפוש • כתיבת מילת מפתח בודדת: 31% • Browsing בקטלוגים וספריות: 25% • חיפוש מורכב (שימוש ביותר ממילת מפתח אחת: 14% • חיפוש בוליאני: 0.3%
מחקרון משווה שערכתי לקראת ההרצאה • 10 סטודנטים • משימות זהות • לא נבחנו אסטרטגיות ונמדדו זמנים
תוצאות • 100% הצלחה • ביצוע תוך פחות מחמש דקות • שימוש במילת מפתח אחת • אסטרטגיה מובילה: גוגל + שימוש באופציה "תמונות
מה התרחש בעשור האחרון באוטוסטרדת המידע? • חדירת האינטרנט • צמיחה בקצב ייצור המידע • שיפור ביצועים במחשבים • שיפור ביצועים במנועי החיפוש
חדירת האינטרנט • חדירה לרוב הבתים והארגונים • חיפוש מידע הפך לפעילות אנושית טריויאלית • למעלה ממחצית הגולשים המבוגרים בארה"ב מעבירים 70% מהזמן בחיפוש מידע. • 90% מהגולשים תלמידי התיכון בישראל נעזרים באינטרנט לחיפוש מידע.
האצה בקצב הכפלת המידע 50 76 יום
מנועי חיפוש: שתי מגמות שיפור ביצועים מכאוס לסדר מתחביר לסמנטיקה
מנועים ראשונים: נדרש ידע תחבירי • עומס קוגניטיבי גבוה • זכירת תחביר כתיבת מחרוזות • הבנת לוגיקה בוליאנית
1990s: נסיונות ראשונים בעיצוב סביבת חיפוש אינטואיטיבית • נחסך הצורך בזכירה תחבירית • עדיין נדרשת הבנת הלוגיקה הבוליאנית
ממשקים עכשויים: לצקת לחיפוש סמנטיקה מלאה
מסתם רשימה אקראית לדירוג לפי מידת רלונטיות
משמעות השינויים שראינו לעיל: הצפת המחפשים במידע • עליה בכמות ממצאי החיפוש: יותר אנשים מוצאים יותר מידע (הסיכוי למצוא מידע כלשהו עלה פי 1000 (Hobs, 2006). • ירידה באיכות המידע: האיכות הממוצעת של מידע ירדה באופן דרמטי (לפי Brand-Guell, 2008 - בלמעלה מ- 80%) • ירידה ברלונטיות: רוב ממצאי החיפוש אינם מספיק רלונטים (Hobs, 2006)
Filter-feeding: האסטרטגיה המנצחת בעידן של היצף אם פעם היה האתגר למצוא משהו, כעת האתגר הוא לסנן החוצה את הגודש, שרובו אינו רלונטי או אינו אמין.
מיומנויות סינון: מיומנויות הישרדות בעידן המידע • חשיבה ביקורתית: סינון מידע מוטעה, מניפולטיבי ושקרי בכדי להישאר עם המידע האמין • יישום קריטריונים של איכות • הבנת מגבלות החיפוש: כיצד מנותחת המידע ע"י המנוע? • יכולות הבניית ידע
מיומנויות סינון: חשיבה ביקורתית בתנאי היצף
הבעיה: באיזו מידה אנו מסוגלים לקריאה ביקורתית של מידע מניפולטיבי?
נמצאה ירידה לאורך שנים בחשיבה ביקורתית(Eshet & Chajut, 2007)
מיומנויות סינון: הבנת מגבלות התישאול
מיומנויות סינון: הבנת מגבלות התשאול הסדר לעיתים דווקא קובע
מיומנויות סינון: יישום קריטריונים של איכות • אמינות (reliability) • שמישות (usability) • אימוּת (verifiability לפי Brand-Gruwel, 2008, רוב המחפשים אינם מיישמים קריטריונים של איכות בחיפוש
מהם הקריטריונים לזיהוי אתר המוקדש לסילוף?
מסנן המידע האנושי: מה סיכוייו לשרוד באוטוסטרדה? מתוך המחקר:קוים לדמותו של מחפש המידע העכשוי • בוחר מבין 10 ההיטים הראשונים • מסתפק בחיפוש פשוט • אינו מייחס משמעות לאופן ניסוח השאילתא • אינו מנסה ניסוח שאילתא אלטרנטיבית • מייחס ערך מוחלט לתוצאות החיפוש • אינו מיישם קריטריונים של איכות • מייחס ערך גבוה לעיצוב המידע
אינדוקטרינציה בעזרת מידע חופשי • "בספר 1984 נעשתה לאדם אינדוקטרינציה בניגוד לרצונו, ואילו בעידן המודרני, האדם מקבלה על עצמו ברצון". • סלבויז'יז'ק (2002), "ברוכים הבאים למדבר של הממשי"
על כוחו של מידע בתנאי אי-ודאות • לפי תיאוריית האינפורמציה, מידע מוגדר ככל גירוי המצמצם אי-ודאות • המידע אליו אנו נחשפים, מהווה המכשיר העיקרי שלנו בצמצום אי-ודאות ובקביעת ידע ועמדות כלפי נושאים שונים. • כלומר: כמות וסוגי הידע אליהם ניחשף, משפיעים על העמדות שנאמץ.
העולם לפי שטיינברג: האדם קרוב אצל עצמו אנו נוטים לגבש ידע ועמדות מתוך מה שמוכר וקרוב לנו
האם הרוב קובע?הידע כפונקציה של כמות ההמידע הזמין בשפתנופרויקט העתקת ספריית הקונגרס לאינטרנט "הפצצת" האינטרנט במקורות מידע המציגים בעיקר פרספקטיבה אחת, תגרום להטיית הידע הזמין לכיוון פרו-אמריקאי.
מחט בערימת שחת: ידע כפונקציה של כמות המידע הזמין (מעובד מתוך Ruger, 2008)
אבל הידע שלנו תלוי במידה רבה גם בעיקר במה שמאפשרים לנו למצוא בחיפוש
מה מאפשרים לנו למצוא בחיפוש, או:האם יש דבר כזה "חיפוש טהור"?ומה בדבר סיסמת גוגל don’t be evil? Elinor Mills, 2006 (Cnet)
מישהו מחליט בשבילך מי אתה • Enteen 2008: • חיפוש המונח gay בגוגל ארה"ב (google.com) מכיל בראש הרשימה הגדרות רציניות של המונח ואתרים על חיי גייז. המחפש מזוהה כמי שמבקש ללמוד על גייז או לפגוש גייז. אם נכתוב גם thailand, נקבל אתרים על שירותי מין+ המחפש מזוהה כצרכן שירותי מין • בחיפוש gay בגוגל תאילנד (co.th), המחפש מזוהה כצרכן המחפש שירותי מין ומקבל בעיקר אתרים המספקים שירותים אלה.
לסיכום • שיפור מנועי החיפוש והגדלת כמות המידע הובילו לגידול בכמות המידע שמוצאים מחפשים • הגידול, לצד הירידה באיכות המידע הזמין ברשת, מחייבים שליטה במיומנויות סינון מידע. • סינון יעיל של מידע מאפשר לגולש לגבש מידע אמין ולהתגונן מפני אפקטים של אינדוקטרינציה בעזרת מידע חופשי.
בתקווה שתצאו מכאן עם כמה מחשבות מקוריות תודה