390 likes | 458 Views
UFRGS. Um estudo sobre a demanda de informações em sites Web : o caso de uma unidade de pesquisa de uma empresa de P&D para o agronegócio brasileiro. Aluno: Ricardo Martins Bernardes Orientador: Professor Dr. Henrique Freitas. Agenda. Tema e justificativa Objetivo Geral
E N D
UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de uma empresa de P&D para o agronegócio brasileiro Aluno: Ricardo Martins Bernardes Orientador: Professor Dr. Henrique Freitas
Agenda • Tema e justificativa • Objetivo Geral • Objetivos específicos • Referencial teórico • Método de pesquisa • Resultados • Conclusões
Web: um canal de negócios em expansão • e-commerce: crescimento exponencial • Impacto nas organizações • Evolução da mídia Internet & Convergência tecnológica
Foco do Estudo • Necessidade de estudos de audiência em sites • Customização e personalização de conteúdos • Análise de aderência site X missão
Objetivo Geral Compreender a demanda por informações em um site Web, através da análise de registros de acessos (log de transações), visando sua configuração e evolução
Objetivos Específicos • coletar os registros de navegação de usuários através das páginas de conteúdo (clickstream), bem como os registros de palavras-chave (keywords) utilizadas no mecanismo de busca do site Web; • aplicar procedimentos quantitativos tradicionais visando elucidar as métricas básicas de acesso ao site Web; • analisar e discutir os registros de navegação de usuários através das páginas do site, procurando definir suas preferências de navegação e de conteúdo; • analisar e discutir as necessidades explícitas de consumo de informações, contidas no registro de palavras-chave utilizadas pelos visitantes no mecanismo de busca do site; • discutir as informações obtidas, verificando sua adeqüabilidade à estratégia da organização em estudo; • tecer algumas considerações visando orientar futuros estudos de análise de logs.
Método de Pesquisa • Nível e design de pesquisa • Estudo de caso Fontes de evidência Estudo simples & múltiplos sub-estudos • Nível exploratório
Resultados • Estatísticas gerais de acesso ao site • Preferências e padrões primários de navegação dos visitantes no site • Preferências explícitas dos visitantes, simbolizadas pelos termos inseridos no mecanismo de busca do site
Métricas de freqüência e de tempo de exposição do site: • duração da sessão • número de pageviews / sessão • origem de primeiro e segundo níveis • distribuição dos acessos no tempo
Preferências e padrões primários de navegação (clickstream) • primeiras ações ao entrar no site ferramenta utilizada para consultas ex.: A-B*, A*B*... • conteúdo preferido no primeiro click atividades P&D, publicações, serviços, ...
Termos de consulta (keywords) • origem • freqüência • termos mais utilizados • pertinência
Palavras-chave utilizadas pelos visitantesConsiderando o contexto
Conclusões • Quanto ao objetivo do estudo: • planejamento físico & lógico do site • subsídios: fortalecimento de relações articulação com ecossistema • demanda por informações • aderência com a proposta da organização
Conclusões • Quanto aos aspectos práticos e metodológicos • ferramentas e dados • desenho prévio do site • preparação de dados aspectos dependentes do site aspectos independentes do site • potencial para novos estudos • potencial para deselvolvimento de métodos • estratégia de pesquisa
UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de uma empresa de P&D para o agronegócio brasileiro Aluno: Ricardo Martins Bernardes Orientador: Professor Dr. Henrique Freitas
FIM DA APRESENTAÇÃO O restante dos slides são para fundamentar respostas à banca
Conjunto de dados • Limpeza dos dados e definição da amostra Conjunto 1: clickstream • registro de páginas transferidas com sucesso para visitantes não identificados, oriundos do domínio '.br' , que acessaram mais de uma página - diferentes - durante a visita, no período de 2 de fevereiro de 1999 a 30 de abril de 2000. Conjunto 2: keywords • palavras-chave inseridas no mecanismo de busca do site entre às 18h25 horas de 08/11/1999 e 11h09 horas de 15/06/2000.
Conjunto de dados • Descrição dos dados dados de navegação do visitante (clickstream):
Conjunto de dados • Descrição dos dados palavras-chave (keywords) inseridas no mecanismo de busca
Fundamentação Teórica • Rede, Estratégia e Sobrevivência • Internet, Web & convergência tecnológica • O fenômeno da rede Web: popularização exponencial • A resposta das Empresas • Usuários, suas trilhas e comportamento
Método de Pesquisa • Nível e design da pesquisa • O Caso - contextualização • O Estudo • descrição dos dados • limites e pressupostos • limpeza dos dados e definição da amostra
O caso • contextualização • Empresa de P&D para o agronegócio • Mudança orientação produto -> mercado P -> P&D
Método de Pesquisa • O Estudo • Limites e pressupostos • quanto à origem e identificação dos acessos • quanto à estruturação das sessões e visitantes • quanto ao tempo de exposição de páginas e do site • quanto à ação de robots e spiders • outros aspectos
Ferramentas • Windows 98,DOS e Solaris 2,x • dbase IV, Basic • SAS, stata, C4.5 • WUN
Alguns resultados • Em média, o visitante requisitou 5,7 páginas, e ficou conectado aproximadamente 8m:36s no site • Instituições de ensino e pesquisa do RS apresentaram uma média de 6,4 pageviews por sessão • Apenas 2,8% do total de domínios de terceiro nível registrados (19 organizações), foram responsáveis por 38,9% das sessões realizadas no site. • Existe uma predominância de provedores que servem a Região Sul e Sudeste do Brasil
Alguns resultados • Considerando apenas instituições de ensino e pesquisa do RS, a Urcamp foi responsável por 45% das sessões • UNISC e UCPEL tiveram o maior número de pageviews por sessão (7,0 e 6,7) • 20,1% das sessões ocorreram nos finais-de-semana • 46,2% das sessões ocorreram fora do horário de expediente • 26,9% das sessões tiveram duração superior a 10 minutos • 73,0% das sessões era constituída por 1 a 6 páginas
Alguns resultados • 82,7% da freqüência ao mecanismo de busca, apareceu do quarto click em diante • 45,4% do primeiro click recaiu sobre os links "Índice de Atividades de Pesquisa" (17%), "Publicações" (14,7%) e "Serviços" (13,7%) • Outras unidades de negócios da organização que mantém o site procuraram, predominantemente, informações sobre a “Equipe Técnica” (66 de 181 casos) • os links "Consultoria em Nutrição Animal" e "Laboratório de Nutrição Animal" foram a primeira escolha de 26,4% dos visitantes que acessaram o portfolio de produtos e serviços
Alguns resultados • em média, o tempo entre consultas na mesma sessão ficou 2m:49s • o percentual de consultas relacionadas diretamente à missão da unidade de pesquisa foi 64,2% • as consultas cobertas pela missão da empresa representaram 80,1%. • o percentual das consultas dentro do contexto do agronegócio, totalizou 83,7%
Alguns resultados • 2.362 termos consultados foram reduzidos para 435 termos diferentes após a sumarização • 42,5% das consultas giravam em torno de 4,1% dos termos • 82,7% das consultas buscavam as espécies animais cobertas pela missão da Unidade (bovinocultura e ovinocultura)
Palavras-chave utilizadas pelos visitantes, após classificadas pelo Thesagro
Um exemplo de saída do programa c4.5 ... Rule 13: pageviews <= 7 -> class nao acessou o feedback [99.0%] Rule 17: pageviews > 7 tempo > 241 tempo <= 467 -> class nao acessou o feedback [98.4%] Default class: nao acessou o feedback Evaluation on training data (4729 items): Rule Size Error Used Wrong Advantage ---- ---- ----- ---- ----- --------- .......... 13 1 1.0% 3918 32 (0.8%) 0 (0|0) nao acessou o feedback 17 3 1.6% 86 0 (0.0%) 0 (0|0) nao acessou o feedback Tested 4729, errors 91 (1.9%) << (a) (b) <-classified as ---- ---- 51 74 (a): class acessou o feedback 17 4587 (b): class nao acessou o feedback
Um exemplo de saída do programa c4.5 C4.5 [release 5] rule generator Wed Nov 1 13:45:14 2000 ------------------------------- Read 2905 cases (3 attributes) from busca2 ------------------ Processing tree 0 Final rules from tree 0: ... Rule 88: Termo Thesagro = alimento animal class Apr [41.7%] ... Rule Size Error Used Wrong Advantage ---- ---- ----- ---- ----- --------- 88 1 58.3% 46 24 (52.2%) 12(22|10) Apr ... Tested 2905, errors 1974 (68.0%) <<
Structure for database: E:\TUDONOVO\FILES\DBF\SESSAOBR.DBF Number of data records: 4968 Date of last update : 13/11/00 Field Field Name Type Width Dec Index NUMEROSESS Character 6 N HOSTACESSO Numeric 5 N NAORESOLV Numeric 1 N DOMNUMERO Numeric 5 N DOMPARTE1 Character 5 N DOMPARTE2 Character 15 N DOMPARTE2R Character 15 N DOMPARTE3 Character 15 N DATAACESSO Date 8 N DIASEMACES Character 3 N HORAACESSO Character 6 N CONTAHOST Numeric 3 N ELAPDAYS Numeric 4 N ROBOTS Numeric 1 N PAGINAS Character 205 N PAGINASS Character 254 N PAGINASST Character 254 N PAGINASSV Character 254 N PAGINASSA Character 70 N TOTSEGSES Numeric 5 N NUMPAG Numeric 3 N NUMPAGT Numeric 3 N PRIMPAG Character 3 N INICIO Numeric 1 N CATEPOCA Numeric 1 N CATDIA Numeric 1 N CATHORA Numeric 1 N CATPER Numeric 1 N CATEMPO Numeric 1 N CATNUMPAG Numeric 1 N CATNUMPAGR Numeric 1 N Estrutura do arquivo de sessões