1 / 13

ОЦЕНКА ЭФФЕКТИВНОСТИ РЕКОМЕНДАТЕЛЬНЫХ СИСТЕМ

ОЦЕНКА ЭФФЕКТИВНОСТИ РЕКОМЕНДАТЕЛЬНЫХ СИСТЕМ. С.А.Амелькин Институт программных систем имени А.К.Айламазяна РАН. ЗАДАЧИ. Задача восстановления оценки Задача составления рекомендации Составление упорядоченного множества объектов. Постановка задачи. Формулировка критериев.

Download Presentation

ОЦЕНКА ЭФФЕКТИВНОСТИ РЕКОМЕНДАТЕЛЬНЫХ СИСТЕМ

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. ОЦЕНКА ЭФФЕКТИВНОСТИ РЕКОМЕНДАТЕЛЬНЫХ СИСТЕМ С.А.Амелькин Институт программных систем имени А.К.Айламазяна РАН

  2. ЗАДАЧИ • Задача восстановления оценки • Задача составления рекомендации • Составление упорядоченного множества объектов Постановка задачи Формулировка критериев Построение алгоритма решения RCDL'2012 Переславль-Залесский, 15-18 октября 2012

  3. ЗАДАЧА ВОССТАНОВЛЕНИЯ ОЦЕНКИ • <Задача 1> Задачей рекомендательной системы является расчет значений ri, максимально близких к величинам vi, при заданном множестве пар (пользователь, объект), для которых известны vi. Метрики: совместно монотонны Функция близости Другие: корреляции, Махаланобис RCDL'2012 Переславль-Залесский, 15-18 октября 2012

  4. ФУНКЦИИ БЛИЗОСТИ: МЕТРИКИ • Результат работы рекомендательной системы: вектор R=(r1, r2, …, rn) представляет собой точку в пространстве Mn, где M – множество (спектр) оценок, допустимых в используемой шкале. Этому же пространству принадлежит точка V=(v1, v2, … , vn). • Если на пространстве Мn выбрана норма ||V||, например, из класса lp, то соответствующее этой норме расстояние (метрика Минковского) может служить критерием эффективности. Нормированное расстояние . RCDL'2012 Переславль-Залесский, 15-18 октября 2012

  5. ФУНКЦИИ БЛИЗОСТИ: ДРУГИЕ , • Расстояние Махаланобиса: RCDL'2012 Переславль-Залесский, 15-18 октября 2012

  6. ЗАДАЧА СОСТАВЛЕНИЯ РЕКОМЕНДАЦИИ • <Задача 2>Разделим принятую в данной рекомендательной системе шкалу на две страты: P – положительные оценки и N – отрицательные оценки. Тогда работа рекомендательной системы представляет собой проверку гипотезы H0: viP. RCDL'2012 Переславль-Залесский, 15-18 октября 2012

  7. КОЭФФИЦИЕНТЫ АССОЦИАТИВНОСТИ RCDL'2012 Переславль-Залесский, 15-18 октября 2012

  8. КОЭФФИЦИЕНТЫ АССОЦИАТИВНОСТИ RCDL'2012 Переславль-Залесский, 15-18 октября 2012

  9. НЕОДНОЗНАЧНОСТЬ РЕЗУЛЬТАТА • Критерии могут быть противоречивыми: уменьшение уровня значимости (pa) возможно только за счет снижения мощности критерия проверки гипотезы (1 – pb). Если в качестве критериев деятельности рекомендательной системы выбраны несколько таких противоречивых критериев, то настройки системы могут обеспечить увеличение эффективности по одному из критериев только за счет ухудшения эффективности по другому. Зависимость между предельными значениями критериев эффективности называется множеством Парето. Такое множество для рекомендательных систем строится, как правило либо для показателей prc(rcl), либо для rcl(fpr). • Свертка критериев, например, коэффициент корреляции Мэтью: RCDL'2012 Переславль-Залесский, 15-18 октября 2012

  10. СОСТАВЛЕНИЕ УПОРЯДОЧЕННОГО МНОЖЕСТВА ОБЪЕКТОВ • <Задача 3> Задача рекомендательной системы – найти такие оценки ri, чтобы для максимального числа пар (i, j) (i=1, …, n; j=1, … ,n; ij) выполнялось условие: RCDL'2012 Переславль-Залесский, 15-18 октября 2012

  11. КРИТЕРИИ • Критерием эффективности для задачи <3> может служить отношение числа правильно построенных порядков. В частности к такимкритериямотносятся: • РасстояниеХэмминга (fraction of concordant pairs, dH): длявсехпар (i, j) записываютсядвоичныекоды • КорреляцияПирсона RCDL'2012 Переславль-Залесский, 15-18 октября 2012

  12. КРИТЕРИИ • Косинус угла между векторами R и V: • Выражение для cosаналогично корреляцииr,только для вычисления косинуса используются не центральные, а начальные моменты. • Непараметрические коэффициенты корреляции (Кендалла, Спирмена, Фехнера и пр.) • Нормированный показатель дисконтированной накопленной выгоды (normalized discounted cumulative gain) — ndcg, — рассчитываемый, как отношение RCDL'2012 Переславль-Залесский, 15-18 октября 2012

  13. Сергей Амелькин • sam@sam.botik.ru RCDL'2012 Переславль-Залесский, 15-18 октября 2012

More Related