Ae moçada, alguém tem idéia de como pegar nos logs do squid apenas o que o usuário realmente digitou no browser?
Olhe abaixo quando digita-se www.telefonica.com.br:
192.168.254.2 - whinston [05/Jul/2005:19:41:30 -0300] "GET http://www.telefonica.com.br/img2003/bultitverd.gif HTTP/1.0" 200 364 TCP_REFRESH_MISSIRECT
192.168.254.2 - whinston [05/Jul/2005:19:41:31 -0300] "GET http://www.telefonica.com.br/img2003...ica_160305.jpg HTTP/1.0" 200 5145 TCP_IMS_HIT:NONE
192.168.254.2 - whinston [05/Jul/2005:19:41:31 -0300] "GET http://www.telefonica.com.br/img2003/ptovrd.gif HTTP/1.0" 404 605 TCP_MISSIRECT
192.168.254.2 - whinston [05/Jul/2005:19:41:31 -0300] "GET http://www.telefonica.com.br/img2003/atento_126x55.jpg HTTP/1.0" 200 3753 TCP_IMS_HIT:NONE
192.168.254.2 - whinston [05/Jul/2005:19:41:32 -0300] "GET http://www.telefonica.com.br/img2004/simbolo_124x53.gif HTTP/1.0" 200 3574 TCP_REFRESH_MISSIRECT
192.168.254.2 - whinston [05/Jul/2005:19:41:32 -0300] "GET http://www.telefonica.com.br/img2003/despleizda.gif HTTP/1.0" 200 359 TCP_IMS_HIT:NONE
192.168.254.2 - whinston [05/Jul/2005:19:41:32 -0300] "GET http://www.telefonica.com.br/img2003/bgbusca.gif HTTP/1.0" 200 329 TCP_IMS_HIT:NONE
192.168.254.2 - whinston [05/Jul/2005:19:41:32 -0300] "GET http://www.telefonica.com.br/img2003/despleidcha.gif HTTP/1.0" 200 391 TCP_IMS_HIT:NONE
192.168.254.2 - whinston [05/Jul/2005:19:41:32 -0300] "GET http://graficos.invertia.com/scripts/grTiny.dll? HTTP/1.0" 200 2877 TCP_MISSIRECT
192.168.254.2 - whinston [05/Jul/2005:19:41:33 -0300] "GET http://www.telefonica.com.br/img2003/ir.gif HTTP/1.0" 200 507 TCP_MISSIRECT
192.168.254.2 - whinston [05/Jul/2005:19:41:33 -0300] "GET http://www.telefonica.com.br/img2003/utilsup.gif HTTP/1.0" 200 414 TCP_REFRESH_MISSIRECT
192.168.254.2 - whinston [05/Jul/2005:19:41:33 -0300] "GET http://www.telefonica.com.br/img2003/bgutilizda.gif HTTP/1.0" 200 344 TCP_MISSIRECT
192.168.254.2 - whinston [05/Jul/2005:19:41:33 -0300] "GET http://www.telefonica.com.br/img2003/butil.gif HTTP/1.0" 200 347 TCP_REFRESH_MISSIRECT
192.168.254.2 - whinston [05/Jul/2005:19:41:33 -0300] "GET http://www.telefonica.com.br/img2003/bgutildcha.gif HTTP/1.0" 200 346 TCP_MISSIRECT
192.168.254.2 - whinston [05/Jul/2005:19:41:33 -0300] "GET http://www.terra.com.br/ads/telefonica/portal/popup.js HTTP/1.0" 200 1276 TCP_IMS_HIT:NONE
192.168.254.2 - whinston [05/Jul/2005:19:41:33 -0300] "GET http://www.telefonica.com.br/img2003/utilinf.gif HTTP/1.0" 200 399 TCP_REFRESH_MISSIRECT
192.168.254.2 - whinston [05/Jul/2005:19:41:34 -0300] "GET http://secure-us.imrworldwide.com/v51.js HTTP/1.0" 403 1772 TCP_DENIED:NONE
192.168.254.2 - whinston [05/Jul/2005:19:41:34 -0300] "GET http://www.terra.com.br/ads/telefoni...linktelef.html HTTP/1.0" 200 1098 TCP_MISSIRECT
192.168.254.2 - whinston [05/Jul/2005:19:41:34 -0300] "GET http://www.terra.com.br/ads/telefoni..._linktelef.swf HTTP/1.0" 304 235 TCP_IMS_HIT:NONE
Aparece um monte de domínio que estavam no site, como invertia, terra, etc.. To com uns usuários cabeçudos que entram em sites pornográficos e depois, perante os logs, dizem que entraram em sites que não eram de pornografica, mas haviam banners "estranhos".
Pior que a desculpa do lazarento até faz sentido, pq fica registrado no log tudo que o squid fez cache, ou seja, o cidadão entra num site xxx.com.br e no log consta xxx.com.br + ttt.com + aaa.net e não dá pra saber o que ele realmente digitou pra abrir e o que era link.