1 / 21

Resumagic : система автоматической обработки резюме

Resumagic : система автоматической обработки резюме. Александр Сафронов. Работа кадрового агентства. В больших агентствах значительная доля резюме поступает по электронной почте непосредственно от соискателей. С учетом спама это могут быть сотни и тысячи писем в день. Этапы обработки писем.

nelson
Download Presentation

Resumagic : система автоматической обработки резюме

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Resumagic: система автоматической обработки резюме Александр Сафронов

  2. Работа кадрового агентства • В больших агентствах значительная доля резюме поступает по электронной почте непосредственно от соискателей. • С учетом спама это могут быть сотни и тысячи писем в день.

  3. Этапы обработки писем Просмотр письма, работа с вложенными файлами; Принятие решения о том, содержит ли данное письмо в себе информацию о соискателе (резюме); Преобразование резюме к формату, принятому в агентстве; Выявление нечетких дубликатов резюме.

  4. «Наивная» автоматизация Требование отсутствия вложений; Требования к теме письма; Отказ от преобразования резюме в единый формат;. Отказ от выявления дубликатов.

  5. Основные возможности Resumagic • Импорт резюме из внешних источников; • Отделение резюме от прочих документов; • Извлечение фактов из текста резюме; • Классификация резюме; • Нормализация основных полей; • Выявление резюме, принадлежащих одному человеку.

  6. Схема работы БД Файлы Резюме, хранящиеся на компьютере в виде файлов Письма Резюме, которые приходят по электронной почте

  7. Распознаваемые поля • Личная информация (ФИО, пол, дата рождения/возраст, семейное положение, гражданство); • Контактная информация (телефоны, электронная почта, ICQ); • Желаемая должность и пожелания по уровню дохода; • Опыт работы (период работы, название компании, сфера деятельности компании, должность, отдел, обязанности, стаж); • Образование (год выпуска, название учебного учреждения, факультет, кафедра, специальность, специализация, квалификация); • Владение иностранными языками; • Знание программного обеспечения и технологий; • Личные качества, хобби; • Рекомендации (ФИО, должность, название компании, контакты).

  8. Извлечение фактов • Графематический анализ. • Морфологический анализ. • Выделение лингвистических конструкций вокруг ключевых слов. • Факт = контекст + словосочетание.

  9. Классификация • Нет общепринятых стандартов классификации резюме. • В Resumagic используется классификатор hh.ru. • Инженерный подход + PrTFIDF.

  10. Классификация резюме: kNN

  11. Классификация резюме: kNN

  12. Классификация резюме: PrTFIDF

  13. Классификация резюме: сравнение kNN и PrTFIDF

  14. Классификация резюме: выбор термов

  15. Классификация резюме: выбор термов

  16. Классификация резюме: учет морфологии

  17. Сортировка Распознанные Резюме, которые были распознаны автоматически Файлы Резюме, хранящиеся на компьютере в виде файлов Нераспознанные Объекты, похожте на резюме, но которые не могут быть распознаны автоматически Письма Резюме, которые приходят по электронной почте Не резюме Объекты, не похожие на резюме (например, спам)‏

  18. Входящие письма • Входящие письма: • Резюме • Спам • Рабочая переписка • Информационные рассылки с биографическими данными

  19. ResumagicRank ResumagicRank - числовая характеристика,характеризующая степень похожести текста на резюме.

  20. Защита от дублирования Поиск полных совпадений с помощью хеш-сумм. Поиск по совпадению ФИО, даты рождения или контактной информации. Поиск по частичному совпадению ФИО, даты рождения или контактной информации.

  21. Спасибо за внимание! HeadHunter (hh.ru) – OnlineHiringServices http://hh.ru

More Related