19 January 2006

Web Analytics Metrics - Glossario #1

Page Impression/page view (o pagina vista per dirlo all’italiana)

Per cominciare diamo un occhiata a quale definizione viene riportata nel glossario del sito IAB a questo indirizzo: http://www.iab.it/formati/glossario/detail.aspx?TRS_ID=1667000&ID=2591

“Pagina richiesta da un visitatore di un sito che viene scaricata interamente dal browser di navigazione.Tale pagina è costituita da testo ed immagini appositamente composte per fornire all’utente l’informazione richiesta. Tecnicamente una page view è costituita quindi da un certo numero di hit specifiche di tale pagina e registrate nel file di log del server che ha fisicamente mandato in rete tali contenuti. La registrazione di tali hit all’interno del file di log non é di per se garanzia che tale pagina sia stata interamente scaricata da un browser di navigazione e quindi ricevuta dall’utente che l’ha richiesta, non é quindi garanzia che si sia verificato l’evento che abbiamo invece identificato come Page View.”

Quindi, secondo IAB la "page view/impression":

- È una pagina richiesta dall’utente (il che esclude gli auto-refresh, le pop-up automatiche e quant’altro non espressamente richiesto dall’utente internet).

- La pagina deve essere stata scaricata interamente dal browser di navigazione.


Per quanto riguarda la seconda regola, non vi sono particolari problemi di definizione: se la pagina viene “stoppata” dall’utente, se non viene scaricata interamente per problemi di connettività o di programmazione, questa non deve essere considerata una “page view”. Ciò implica che le statistiche prodotte dalle analisi dei log-files non possono conteggiare le page views, poiché il dato che viene prodotto è un’elaborazione delle pagine RICHIESTE, non di quelle completamente scaricate (come viene specificato infatti nella definizione). E’ inoltre implicito il fatto che possono essere considerate pagine viste anche quelle il cui contenuto venga caricato direttamente dai file temporanei dei computer (cache – cosa che con l’analisi dei log-files non è possibile realizzare). E’ sicuramente corretto conteggiare questo tipo di pagine: l’utente vede il contenuto della pagina, e non importa se la pagina viene erogata dal server dell’editore, o da un proxy di qualche ISP o i file temporanei del suo computer.

Analizzando invece il secondo punto il terreno inizia a farsi un po’ accidentato. In base a quali criteri si può stabilire se la pagina è stata o meno espressamente richiesta dall’utente? In che modo dovrebbe essere considerato, ad esempio, un autorefresh di una pagina di news che aggiorna i contenuti on-line frequentemente? E ancora: i contenuti in Flash possono essere considerati come Pagine Viste? e in questo caso con quali criteri? (di questo parlerò tra qualche giorno in un altro post!).

E’ vero che dal punto di vista tecnico queste sono pagine NON RICHIESTE espressamente dall’utente, ma come facciamo a sapere se l’utente non voleva che la pagina si aggiornasse?

Per spiegarmi meglio farò un paio di esempil. I ticker di borsa, o le news in tempo reale (leggasi anche: cronache delle partite di calcio o altri eventi sportivi). In questi casi si intuisce che l’utente non richiede esplicitamente un aggiornamento della pagina, tuttavia il contenuto che viene mostrato è stato aggiornato in automatico dal server dell’editore allo scopo di rispondere ad un bisogno specifico dell’utente internet: ossia quello di vedere un aggiornamento sulle news in tempo reale. Che utilità avrebbe vedere una pagina che mostra la cronaca chella partita senza che questa si aggiorni in automatico ogni, poniamo, 5 minuti? Io, da utente, mi stuferei subito di premere il tasto aggiorna per poter vedere se ci sono aggiornamenti... l'auto-refresh serve a questo: facilitare la fruizione di un servizio.

Andrebbe fatto quindi un distinguo in base ad esempio alla FREQUENZA DI AGGIORNAMENTO (tempi del refresh) delle pagine con il refresh automatico. Il problema è che, sicuramente, non ci si accorderebbe su quale dovrebbe essere questa frequenza di aggiornamento minima nell’unità di tempo che possa far considerare dette pagine come vere “pagine viste”.

Personalmente penso che un tempo di autorefresh debba, per essere considerato in qualche modo “corretto”, non falsare le misurazioni di altre metriche quali, ad esempio le User Session… ma di questo parlerò in modo diffuso nel prossimo post.

TRACK.ME