Estatísticas Web - webalizer
O webalizer é provavelmente a ferramenta de estatísticas opensource mais utilizado.
Em primeiro lugar é de utilização bem simples, fácil de configurar e executar automaticamente.
Em segundo lugar é pouco exigente a nível de recursos, ainda que a sua capacidade de escalar seja algo limitada.
Em terceiro lugar suporta três dos formatos de logs mais utilizados, nomeadamente CLF (combined/cummon log format, utilizador pelo Apache, por exemplo), FTP ou xferlog (o formato de logs do wu-ftp e outros servidores de FTP) e logs nativos do Squid.
Estes três servidores representam uma percentagem razoavelmente elevada dos servidores HTTP, FTP e proxies utilizados hoje em dia em ambientes de hosting e servidores de administração privada, pelo que os formatos de logs suportados são os mais usuais.
Ao nível de possibilidades de reporting, por seu lado, o webalizer disponibiliza quase toda a informação que se pode encontrar nos seus concorrentes mais fortes.
O webalizer permite proceder a reportes incrementais e mantém um histórico de até 12 meses.
Também cria tops de vários dados, bem como permite criar listagens completas com todos os dados de determinada categoria.
Os tops que o webalizer consegue gerar são:
Além dos tops, o webalizer permite ainda criar listagem de todos os dados de uma determinada categoria. Os dados para que o webalizer gera estas listagens são:
O webalizer pode ainda criar ficheiros de dumps dos dados referidos, que podem depois ser utilizados com outros programas.
Apesar de ser uma ferramenta já antiga continua a ser uma das melhores para quem pretende correr a sua própria aplicação de processamento estatístico e disponibiliza toda a informação que hoje se pretende, incluindo a tão falada Long Tail, que é na prática a listagem de todos as Expressões de pesquisa com que o site é encontrado.
A grande desvantagem do webalizer é que apenas corre em plataformas *nix (Unix, Linux, Solaris, etc).
O webalizer pode ser encontrado em http://www.mrunix.net/webalizer/.
Em primeiro lugar é de utilização bem simples, fácil de configurar e executar automaticamente.
Em segundo lugar é pouco exigente a nível de recursos, ainda que a sua capacidade de escalar seja algo limitada.
Em terceiro lugar suporta três dos formatos de logs mais utilizados, nomeadamente CLF (combined/cummon log format, utilizador pelo Apache, por exemplo), FTP ou xferlog (o formato de logs do wu-ftp e outros servidores de FTP) e logs nativos do Squid.
Estes três servidores representam uma percentagem razoavelmente elevada dos servidores HTTP, FTP e proxies utilizados hoje em dia em ambientes de hosting e servidores de administração privada, pelo que os formatos de logs suportados são os mais usuais.
Ao nível de possibilidades de reporting, por seu lado, o webalizer disponibiliza quase toda a informação que se pode encontrar nos seus concorrentes mais fortes.
O webalizer permite proceder a reportes incrementais e mantém um histórico de até 12 meses.
Também cria tops de vários dados, bem como permite criar listagens completas com todos os dados de determinada categoria.
Os tops que o webalizer consegue gerar são:
- top de sites por pageviews, que é a lista de IPs/hostnames dos utilizadores que mais pageviews geraram no site;
- top de sites por tráfego, que é a lista dos IPs/hostnames que mais tráfego geraram;
- top de URLs por pageviews, que é a lista dos URLs mais visto;
- top de URLs por tráfego, a lista dos URLs que originaram mais tráfego no site;
- top de referrers, a lista de URL de onde vinham a maioria dos utilizadores;
- top de User Agents, a lista dos browsers mais utilizados para aceder ao site;
- top de países, a lista dos países de onde foram originados a maioria dos pageviews do site;
- top de páginas de entrada, a lista das páginas por onde os utilizadores mais entram no site;
- top de páginas de saída, a lista das páginas onde os utilizadores mais vezes terminam as suas visitas ao site;
- top de pesquisas, a lista das pesquisas com que o site foi encontrado mais vezes.
Além dos tops, o webalizer permite ainda criar listagem de todos os dados de uma determinada categoria. Os dados para que o webalizer gera estas listagens são:
- Sites
- URLs
- Referrers
- User Agents
- Expressões de Pesquisa
- Utilizadores
O webalizer pode ainda criar ficheiros de dumps dos dados referidos, que podem depois ser utilizados com outros programas.
Apesar de ser uma ferramenta já antiga continua a ser uma das melhores para quem pretende correr a sua própria aplicação de processamento estatístico e disponibiliza toda a informação que hoje se pretende, incluindo a tão falada Long Tail, que é na prática a listagem de todos as Expressões de pesquisa com que o site é encontrado.
A grande desvantagem do webalizer é que apenas corre em plataformas *nix (Unix, Linux, Solaris, etc).
O webalizer pode ser encontrado em http://www.mrunix.net/webalizer/.



Feed RSS 2.0
Comentários
Dúvida
Gostaria de saber com faço para usar o Webalizer com vários domínios em meu servidor, tenho que instalar o Webalizer para cada um?
webalizer multi site
Há algum tempo eu próprio me coloquei essa questão. E na realidade existe uma solução simples para esse problema, que consiste em passar manualmente para o webalizer as opções que são diferentes de um site para o outro.
Essa opção, claro, não me deixou muito satisfeito, e por isso eu criei um pequeno script em Perl a que chamei webalizer runner, e que pode encontrar no meu site dedicado ao opensource, o http://magick-source.net, que lhe permite configurar as diversas opções relativas a cada site num pequeno ficheiro xml, e depois executa o webalizer para cada um dos seus virtualhosts a um determinado intervalo de tempo que você pode configurar no crontab.
theMage
diversos logs
Estou procurando no webalizer uma forma de ele fazer as estatisticas com vários arquivos de logs, eles ja gerados por dia e separados, será possível?
Obrigado desde já!
Renato