240 likes | 352 Views
Seminario Residenziale CIBER 2006. Il nuovo servizio di produzione di statistiche d'uso, compatibili COUNTER, dell'Emeroteca Virtuale. Messina, Villa Pace – 12-14 Giugno 2006. Ugo Contino – ugo.contino@caspur.it. Sommario. Promissio boni viri…
E N D
Seminario Residenziale CIBER 2006 Il nuovo servizio di produzione di statistiche d'uso, compatibili COUNTER, dell'Emeroteca Virtuale Messina, Villa Pace – 12-14 Giugno 2006 Ugo Contino – ugo.contino@caspur.it
Sommario • Promissio boni viri… • Analisi della struttura di generazione delle nuove statistiche • Statistiche d’uso per il CIBER: un esempio concreto di nuove sinergie • Ulteriori sviluppi • Conclusioni Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno
Napoli – 10 Novembre 2005… • Proposta di adesione allo standard COUNTER (2) • Generazione di report mensili con informazioni di accesso alle riviste full-text sull’Emeroteca (Journal_report_1 -> Number of Successful Article Requests by Month and Journal) • Generazione di report mensili con informazioni sui turnaways alle riviste full-text sull’Emeroteca (Journal_report_2 -> Turnaways by Month and Journal) Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno
…Messina 14 giugno 2006! • Statistiche Counter (2) disponibili (a partire dal mese di dicembre 2005 sull’area di Repository del CIBER e sull’Area Riservata -> http://www.uniciber.it/areaciber/index.php?id=185) • Analisi retrospettiva del 2005 • Lacuna sulle statistiche del maggio 2005… • Report disponibili (sull’Area Riservata) in formato csv Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno
Intestazione Ente Data generazione report Profondità analisi Totali su tutte le riviste Dettaglio singola rivista Uno sguardo al dettaglio… • Journal_report_1 Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno
Uno sguardo al dettaglio… • Journal_report_2 Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno Informazioni: http://www.uniciber.it/areaciber/fileadmin/area_ciberdoc/COUNTER_MANUALE_STATISTICHE_corretto.pdf http://www.uniciber.it/areaciber/fileadmin/area_ciberdoc/CounterRepIstruzioni1maria-1.pdf
I turnaways nell’Emeroteca Virtuale • Definizione Counter: “A turnaway (rejected session) is defined as an unsuccessful log-in to an electronic service due to exceeding the simultaneous user limit allowed by the licence” • Definizione Emeroteca: ”Un turnaway (accesso all’articolo non consentito) è definito come evento nel quale all’utente non è consentito accedere (per il particolare tipo di licenza dell’ateneo al quale appartiene) ad un ben determinato articolo in formato full-text Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno
Stastistiche@CASPUR (classic version…) • Basate sul software SAS • “Granularità giornaliera” • Disponibili in formato rapporto (PDF o HTML) • Metriche disponibili: • Distribuzioni giornaliere di accesso ai contenuti (aggregate sull’editore e sulle riviste) • Distribuzioni medie orarie di accesso ai contenuti (aggregate sull’editore e sulle riviste) • Valori aggregati per rivista ed editore di accesso agli indici di riviste e di fascicolo sia in abbonamento che fuori abbonamento (aggregate sul periodo temporale) • Dettaglio accessi ad indici di rivista, di fascicolo, di abstract e full-text(sia html che pdf) suddivisi per editore e per tipologia in abbonamento che fuori abbonamento (aggregate sul periodo temporale) • Andamento giornaliero accessi full-text (sia html e pdf) aggregati sull’editore e sulla rivista • Top 10 journals (sia Abs che FT) per tipologia in abbonamento che fuori abbonamento che in UTL (se prevista); aggregazione sul periodo temporale • Elenco accessi riviste (sia Abs che FT) per tipologia in abbonamento che fuori abbonamento che in UTL (se prevista); aggregazione sul periodo temporale Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno
Ogni mese Apache Log files L’Ambiente di produzione “classico” Servizio di Emeroteca Virtuale Page view Informazioni statistiche per ateneo o cumulative Utenti “classici” Sottomissione della richiesta via WEB Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno PDF HTML Server delle statistiche Riviste & Abbonamenti Lista IP istituzione Aggiornamenti mensili
Ogni mese XML Apache Log files …a breve L’Ambiente di produzione “attuale” Servizio di Emeroteca Virtuale Page view Informazioni statistiche per ateneo o cumulative Utenti “classici” Generazione automatica dei 2 JRC Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno Utenti “remoti” CSV Server delle Statistiche (software Open-source) Riviste & Abbonamenti Lista IP istituzione Aggiornamenti mensili
“Marcatore” di un accesso ad un PDF Black box unveiled… • Primo passo: analisi del file di log dell’Emeroteca e identificazione delle righe utili Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno
Black box unveiled… • Secondo passo: identificazione dei gruppi di analisi Accesso ai PDF Turnaways sui PDF LOG FILES (basati su IP+Remoti) Accesso ai PDF da utenza remota Turnaways sui PDF da utenza remota Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno Accesso agli HTML Turnways sugli HTML Accesso agli HTML da Utenza remota Turnaways sugli HTML da Utenza remota Script di parsing
Dati senza doppi-click SI NO Black box unveiled… • Terzo passo: eliminazione dei doppi click Accesso ai PDF Turnaways sui PDF Accesso ai PDF da utenza remota Turnaways sui PDF da utenza remota HTML consec. > 10 sec PDF consec. > 10 sec Applicazione del criterio del “doppio-click” secondo la direttiva COUNTER Accesso agli HTML Turnways sugli HTML Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno Accesso agli HTML da Utenza remota Turnaways sugli HTML da Utenza remota
Curiosità… • Esistono dei fenomeni di doppi-click anche sui turnaways… 193.204.17.XXX - - [01/Sep/2005:10:07:44 +0200] "GET /cgi-bin/sciserv.pl?collection=journals&journal=09445013&issue=v157i0004&article=267_iaioyaorgamd&form=pdf&file=file.pdf HTTP/1.1" 200 182 192.84.152.XXX - - [01/Sep/2005:10:11:46 +0200] "GET /cgi-bin/sciserv.pl?collection=journals&journal=00191035&issue=v77i0001&article=171_pooa3262a8&form=pdf&file=file.pdf HTTP/1.1" 200 182 192.84.152.XXX - - [01/Sep/2005:10:11:58 +0200] "GET /cgi-bin/sciserv.pl?collection=journals&journal=00191035&issue=v77i0001&article=171_pooa3262a8&form=pdf&file=file.pdf HTTP/1.1" 200 182 192.84.152.XXX - - [01/Sep/2005:10:12:06 +0200] "GET /cgi-bin/sciserv.pl?collection=journals&journal=00191035&issue=v77i0001&article=187_asmocbp&form=pdf&file=file.pdf HTTP/1.1" 200 182 192.84.152.XXX - - [01/Sep/2005:10:12:17 +0200] "GET /cgi-bin/sciserv.pl?collection=journals&journal=00191035&issue=v77i0001&article=109_ae5sou&form=pdf&file=file.pdf HTTP/1.1" 200 182 192.84.152.XXX - - [01/Sep/2005:10:12:45 +0200] "GET /cgi-bin/sciserv.pl?collection=journals&journal=00191035&issue=v81i0002&article=314_alof1&form=pdf&file=file.pdf HTTP/1.1" 200 182 Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno
Tipologia di materiale (html/pdf) Tipologia di accesso (locale/remoto) Data di pubblicazione Turnaways si(1), no(0) Black box unveiled… • Quarto passo: popolamento del Data Base sugli accessi/turnaways (vengono utilizzati i file di supporto sulla lista dei titoli, la lista degli IP/username, la lista della data di pubblicazione, aggiornati mensilmente) Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno Base dati “Statistiche2XXX”
Accesso art. in formato PDF=18 Accesso art. in formato HTML=8 Accesso in remoto art. in formato PDF=1 Accesso in remoto art. in formato HTML=0 Turnaways su art. in formato PDF=2 Turnaways su art. in formato HTML=0 Turnaways in remoto su art. in formato PDF=0 Turnaways in remoto su art. in formato HTML=0 Black box unveiled… • Quinto passo: costruzione delle statistiche sugli accessi Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno
Black box unveiled… • Sesto passo: generazione delle statistiche Counter Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno
Black box unveiled… • Ultimo passo: pubblicazione sull’area riservata Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno
Caratteristiche riassuntive • Pienamente compatibile con le direttive COUNTER (1/2) • Generazione dei report off-line e non onerosa in termini di tempo/risorse macchina • Disponibile su base mensile e per tutti gli enti che accedono all’Emeroteca • Disponibile la statistica cumulativa dell’ente Ciber • Report facilmente accessibili e convertibili in formato Excel grazie ad una procedura documentata sull’A.R. PRO… Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno
Caratteristiche riassuntive • Non sono disponibili Report in formato XLS (Excel) nativo • Non è attualmente disponibile un formato aperto (XML) di esportazione delle statistiche d’uso • Molte delle informazioni disponibili all’interno del DB delle statistiche d’uso non vengono utilizzate • Assenza di report ulteriori (Journal_Report_3, Number of Successfull Item Requests and Turnaways…, e Journal_Report_4, Total Searches Run…) => modifiche pesanti alle procedure di estrazione dell’informazione dai log files Apache CONTRO… Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno
Nuovi scenari di collaborazione • Esiste un’attività di collaborazione tra il CAB dell’Università di Messina ed il settore dei servizi di automazione delle biblioteche del CASPUR, finalizzata alla messa a punto di un portale dinamico sulle statistiche d’uso dell’Emeroteca • Estrazione periodica (mensile) dell’intera base dati (base dati “Statistiche2XXX) con le statistiche d’uso generali per tutto il CIBER • Inoltro dei file aggiornati di supporto alla generazione delle statistiche (lista dei titoli, IP/username per Ateneo, lista delle date di pubblicazione in funzione del fascicolo) Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno
Proposta evolutiva • Generazione di Report in formato Excel nativo • Produzione di Journal_Report_1/2 in formato XML (propedeutico a SUSHI) • Eventuale produzione di ulteriori Journal_Report (3/4) => necessario ripensamento dei filtri di estrazione dei dati dai log files di Apache • …per il resto… c’è il nuovo portale! Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno
Conclusioni • Genesi del nuovo portale sulle statistiche d’uso del CIBER: un interessante esempio di sinergia all’interno del CIBER • Grande aspettativa su tool di supporto all’ERM • Necessità di avviare un percorso di auditing per le statistiche d’uso del CIBER (direttiva COUNTER) • Apertura ai nuovi standard (SUSHI) • Tempo limite? Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno
Grazie per la vostra attenzione! ugo.contino@caspur.it Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno