120 likes | 355 Views
Обзор проекта. Тема : Исследование самопубликационного поведения авторов, пишущих в области “computer science” Докладчик : Вовк С.В. Цели проекта. Поведение авторов Вероятность нахождения документа в сети Интернет. Описание. Предыдущие работы и исследования
E N D
Обзор проекта Тема : Исследование самопубликационного поведения авторов, пишущих в области “computer science” Докладчик : Вовк С.В
Цели проекта • Поведение авторов • Вероятность нахождения документа в сети Интернет
Описание • Предыдущие работы и исследования Результаты исследований Стива Лоренса “Правда ли что, если электронная статья бесплатно доступна в сети, то на неё существует большее количество ссылок в других статьях? ”
Описание • Стиван Ханард(Stevan Hanard) “Зелёный” путь – все авторы сами разместят свои документы в сети. “Золотой ” путь – дождаться, когда все журналы будут иметь открытый публичный доступ.
Описание (методики и средства) • Библиотека DBLP • Проект “KONZ” • Binary Logistic Regression Analysis- BLRA
Описание (методики и средства) • DBLP(Digital Bibliography and Library Project) – большая компьютерная база данных. • Содержит в себе около 700000 статей. • DBLP xml файл.
Описание (методики и средства) • Проект “KONZ” • Нахождение полнотекстовых версий электронных научных документов и статей. • “KONZ” построен на библиотеке DBLP.
Ключевые переменные и наборы данных • Извлечение данных из результатов проекта “KONZ” • Переменные - Зависимая переменная “найден” - “год” - “количество авторов” - “журнал” - “ОА автор”
Ключевые переменные и наборы данных • Количество документов –461821 • Ограничения (“KONZ”)
Реализация • Система - Linux • Языки - Perl - R (для проведения BRLA)
Результаты Coef S.E. Wald Z P • Intercept -11.738 0.32168 -36.49 0.0000 • y94 1.951 0.20088 9.71 0.0000 • y95 2.167 0.19785 10.95 0.0000 • y6 2.494 0.19486 12.80 0.0000 • y7 2.629 0.19356 13.58 0.0000 • y8 4.379 0.19033 23.01 0.0000 • y9 4.566 0.19018 24.01 0.0000 • y0 4.542 0.19008 23.89 0.0000 • y1 4.536 0.19001 23.87 0.0000 • y2 4.373 0.19001 23.02 0.0000 • y3 3.976 0.19012 20.91 0.0000 • y4 2.901 0.19145 15.15 0.0000 • a1 3.019 0.25978 11.62 0.0000 • a2 3.459 0.25965 13.32 0.0000 • a3 3.564 0.25976 13.72 0.0000 • a4 3.598 0.26022 13.83 0.0000 • a5 3.602 0.26153 13.77 0.0000 • a6 3.586 0.26465 13.55 0.0000 • a7 3.578 0.27057 13.23 0.0000 • a8 3.685 0.27952 13.18 0.0000 • a9 3.819 0.29197 13.08 0.0000 • a10 3.474 0.32167 10.80 0.0000 • a11 3.603 0.33875 10.64 0.0000 • a12 3.768 0.38536 9.78 0.0000 • a13 3.599 0.41367 8.70 0.0000 • a14 2.620 0.58920 4.45 0.0000 • a15 3.737 0.50261 7.43 0.0000 • a16 4.209 0.48447 8.69 0.0000 • a17 3.261 0.81700 3.99 0.0001 • a18 3.330 0.82367 4.04 0.0001 • a19 2.918 1.10754 2.63 0.0084 • a20 2.867 1.09354 2.62 0.0088 • a21 3.082 1.09965 2.80 0.0051 • J 2.718 0.01802 150.88 0.0000
Результаты • P(found =1 ) = g(x) = c1*y 94 + c2*y95 + c3*y6 + c4*y7 + c5*y8 + c6*y9 + c7*y0 + c8*y1 + c9*y2 +c10*y3 + c11*y4 + c12*a1 + c13*a2 + c14*a3 + c15*a4 + c16*a5 + c17*a6 + c20*a7 + c21*a8 + c22*a9 + c23*a10 + c24*a11 + c25*a12 + c26*a13 + c27*a14 + c28*a15 + c30*a16 + c31*a17 + c32*a18 + c33*a19 + c34*a20 +c35*a21 + c36*J +c37*OA )