1 / 39

UFRGS

UFRGS. Um estudo sobre a demanda de informações em sites Web : o caso de uma unidade de pesquisa de uma empresa de P&D para o agronegócio brasileiro. Aluno: Ricardo Martins Bernardes Orientador: Professor Dr. Henrique Freitas. Agenda. Tema e justificativa Objetivo Geral

Download Presentation

UFRGS

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de uma empresa de P&D para o agronegócio brasileiro Aluno: Ricardo Martins Bernardes Orientador: Professor Dr. Henrique Freitas

  2. Agenda • Tema e justificativa • Objetivo Geral • Objetivos específicos • Referencial teórico • Método de pesquisa • Resultados • Conclusões

  3. Web: um canal de negócios em expansão • e-commerce: crescimento exponencial • Impacto nas organizações • Evolução da mídia Internet & Convergência tecnológica

  4. Evolução da mídia Internet

  5. Foco do Estudo • Necessidade de estudos de audiência em sites • Customização e personalização de conteúdos • Análise de aderência site X missão

  6. Objetivo Geral Compreender a demanda por informações em um site Web, através da análise de registros de acessos (log de transações), visando sua configuração e evolução

  7. Objetivos Específicos • coletar os registros de navegação de usuários através das páginas de conteúdo (clickstream), bem como os registros de palavras-chave (keywords) utilizadas no mecanismo de busca do site Web; • aplicar procedimentos quantitativos tradicionais visando elucidar as métricas básicas de acesso ao site Web; • analisar e discutir os registros de navegação de usuários através das páginas do site, procurando definir suas preferências de navegação e de conteúdo; • analisar e discutir as necessidades explícitas de consumo de informações, contidas no registro de palavras-chave utilizadas pelos visitantes no mecanismo de busca do site; • discutir as informações obtidas, verificando sua adeqüabilidade à estratégia da organização em estudo; • tecer algumas considerações visando orientar futuros estudos de análise de logs.

  8. Método de Pesquisa • Nível e design de pesquisa • Estudo de caso Fontes de evidência Estudo simples & múltiplos sub-estudos • Nível exploratório

  9. Escopo da investigação

  10. Resultados • Estatísticas gerais de acesso ao site • Preferências e padrões primários de navegação dos visitantes no site • Preferências explícitas dos visitantes, simbolizadas pelos termos inseridos no mecanismo de busca do site

  11. Métricas de freqüência e de tempo de exposição do site: • duração da sessão • número de pageviews / sessão • origem de primeiro e segundo níveis • distribuição dos acessos no tempo

  12. Preferências e padrões primários de navegação (clickstream) • primeiras ações ao entrar no site ferramenta utilizada para consultas ex.: A-B*, A*B*... • conteúdo preferido no primeiro click atividades P&D, publicações, serviços, ...

  13. Primeiro click no site

  14. Termos de consulta (keywords) • origem • freqüência • termos mais utilizados • pertinência

  15. Palavras-chave utilizadas pelos visitantesConsiderando o contexto

  16. Conclusões • Quanto ao objetivo do estudo: • planejamento físico & lógico do site • subsídios: fortalecimento de relações articulação com ecossistema • demanda por informações • aderência com a proposta da organização

  17. Conclusões • Quanto aos aspectos práticos e metodológicos • ferramentas e dados • desenho prévio do site • preparação de dados aspectos dependentes do site aspectos independentes do site • potencial para novos estudos • potencial para deselvolvimento de métodos • estratégia de pesquisa

  18. UFRGS Um estudo sobre a demanda de informações em sites Web: o caso de uma unidade de pesquisa de uma empresa de P&D para o agronegócio brasileiro Aluno: Ricardo Martins Bernardes Orientador: Professor Dr. Henrique Freitas

  19. FIM DA APRESENTAÇÃO O restante dos slides são para fundamentar respostas à banca

  20. Linhas de investigação em Web Mining

  21. Conjunto de dados • Limpeza dos dados e definição da amostra Conjunto 1: clickstream • registro de páginas transferidas com sucesso para visitantes não identificados, oriundos do domínio '.br' , que acessaram mais de uma página - diferentes - durante a visita, no período de 2 de fevereiro de 1999 a 30 de abril de 2000. Conjunto 2: keywords • palavras-chave inseridas no mecanismo de busca do site entre às 18h25 horas de 08/11/1999 e 11h09 horas de 15/06/2000.

  22. Conjunto de dados • Descrição dos dados dados de navegação do visitante (clickstream):

  23. Conjunto de dados • Descrição dos dados palavras-chave (keywords) inseridas no mecanismo de busca

  24. Fundamentação Teórica • Rede, Estratégia e Sobrevivência • Internet, Web & convergência tecnológica • O fenômeno da rede Web: popularização exponencial • A resposta das Empresas • Usuários, suas trilhas e comportamento

  25. Método de Pesquisa • Nível e design da pesquisa • O Caso - contextualização • O Estudo • descrição dos dados • limites e pressupostos • limpeza dos dados e definição da amostra

  26. O caso • contextualização • Empresa de P&D para o agronegócio • Mudança orientação produto -> mercado P -> P&D

  27. Método de Pesquisa • O Estudo • Limites e pressupostos • quanto à origem e identificação dos acessos • quanto à estruturação das sessões e visitantes • quanto ao tempo de exposição de páginas e do site • quanto à ação de robots e spiders • outros aspectos

  28. Ferramentas • Windows 98,DOS e Solaris 2,x • dbase IV, Basic • SAS, stata, C4.5 • WUN

  29. Alguns resultados • Em média, o visitante requisitou 5,7 páginas, e ficou conectado aproximadamente 8m:36s no site • Instituições de ensino e pesquisa do RS apresentaram uma média de 6,4 pageviews por sessão • Apenas 2,8% do total de domínios de terceiro nível registrados (19 organizações), foram responsáveis por 38,9% das sessões realizadas no site. • Existe uma predominância de provedores que servem a Região Sul e Sudeste do Brasil

  30. Alguns resultados • Considerando apenas instituições de ensino e pesquisa do RS, a Urcamp foi responsável por 45% das sessões • UNISC e UCPEL tiveram o maior número de pageviews por sessão (7,0 e 6,7) • 20,1% das sessões ocorreram nos finais-de-semana • 46,2% das sessões ocorreram fora do horário de expediente • 26,9% das sessões tiveram duração superior a 10 minutos • 73,0% das sessões era constituída por 1 a 6 páginas

  31. Alguns resultados • 82,7% da freqüência ao mecanismo de busca, apareceu do quarto click em diante • 45,4% do primeiro click recaiu sobre os links "Índice de Atividades de Pesquisa" (17%), "Publicações" (14,7%) e "Serviços" (13,7%) • Outras unidades de negócios da organização que mantém o site procuraram, predominantemente, informações sobre a “Equipe Técnica” (66 de 181 casos) • os links "Consultoria em Nutrição Animal" e "Laboratório de Nutrição Animal" foram a primeira escolha de 26,4% dos visitantes que acessaram o portfolio de produtos e serviços

  32. Alguns resultados • em média, o tempo entre consultas na mesma sessão ficou 2m:49s • o percentual de consultas relacionadas diretamente à missão da unidade de pesquisa foi 64,2% • as consultas cobertas pela missão da empresa representaram 80,1%. • o percentual das consultas dentro do contexto do agronegócio, totalizou 83,7%

  33. Alguns resultados • 2.362 termos consultados foram reduzidos para 435 termos diferentes após a sumarização • 42,5% das consultas giravam em torno de 4,1% dos termos • 82,7% das consultas buscavam as espécies animais cobertas pela missão da Unidade (bovinocultura e ovinocultura)

  34. Palavras-chave utilizadas pelos visitantes

  35. Palavras-chave utilizadas pelos visitantes, após classificadas pelo Thesagro

  36. Atividades de criação

  37. Um exemplo de saída do programa c4.5 ... Rule 13: pageviews <= 7 -> class nao acessou o feedback [99.0%] Rule 17: pageviews > 7 tempo > 241 tempo <= 467 -> class nao acessou o feedback [98.4%] Default class: nao acessou o feedback Evaluation on training data (4729 items): Rule Size Error Used Wrong Advantage ---- ---- ----- ---- ----- --------- .......... 13 1 1.0% 3918 32 (0.8%) 0 (0|0) nao acessou o feedback 17 3 1.6% 86 0 (0.0%) 0 (0|0) nao acessou o feedback Tested 4729, errors 91 (1.9%) << (a) (b) <-classified as ---- ---- 51 74 (a): class acessou o feedback 17 4587 (b): class nao acessou o feedback

  38. Um exemplo de saída do programa c4.5 C4.5 [release 5] rule generator Wed Nov 1 13:45:14 2000 ------------------------------- Read 2905 cases (3 attributes) from busca2 ------------------ Processing tree 0 Final rules from tree 0: ... Rule 88: Termo Thesagro = alimento animal class Apr [41.7%] ... Rule Size Error Used Wrong Advantage ---- ---- ----- ---- ----- --------- 88 1 58.3% 46 24 (52.2%) 12(22|10) Apr ... Tested 2905, errors 1974 (68.0%) <<

  39. Structure for database: E:\TUDONOVO\FILES\DBF\SESSAOBR.DBF Number of data records: 4968 Date of last update : 13/11/00 Field Field Name Type Width Dec Index NUMEROSESS Character 6 N HOSTACESSO Numeric 5 N NAORESOLV Numeric 1 N DOMNUMERO Numeric 5 N DOMPARTE1 Character 5 N DOMPARTE2 Character 15 N DOMPARTE2R Character 15 N DOMPARTE3 Character 15 N DATAACESSO Date 8 N DIASEMACES Character 3 N HORAACESSO Character 6 N CONTAHOST Numeric 3 N ELAPDAYS Numeric 4 N ROBOTS Numeric 1 N PAGINAS Character 205 N PAGINASS Character 254 N PAGINASST Character 254 N PAGINASSV Character 254 N PAGINASSA Character 70 N TOTSEGSES Numeric 5 N NUMPAG Numeric 3 N NUMPAGT Numeric 3 N PRIMPAG Character 3 N INICIO Numeric 1 N CATEPOCA Numeric 1 N CATDIA Numeric 1 N CATHORA Numeric 1 N CATPER Numeric 1 N CATEMPO Numeric 1 N CATNUMPAG Numeric 1 N CATNUMPAGR Numeric 1 N Estrutura do arquivo de sessões

More Related