Sono in mezzo a noi

Grazie a ShinyStat, che ci permette di capire per quali vie i lettori arrivino al nostro blog oltre a quella della digitazione dell'indirizzo, vi proponiamo le chiavi di ricerca (cioé le parole digitate sui motori di ricerca, che poi hanno condotto a Indiscreto) del mese di novembre con una nostra piccola risposta: idea non originale, il web è pieno di siti che fanno questo giochino, però le parole chiave sono le nostre. Non abbiamo ovviamente preso in considerazione le chiavi più scontate, contenenti nomi di squadre o di giocatori. Giuriamo che è tutto vero ed a richiesta possiamo fornirne le prove, del resto la rilevazione non dipende da noi e non avremmo la competenza tecnica per taroccarla nemmeno volendo.
1) BAMBINE BIONDE - Magari le cerchi per uno spot pubblicitario, ma in linea di massima ti auguriamo la sedia elettrica.
2) ANNI 80 MILANO MUSTAFA PIAZZA DUOMO - Con tutto il fuoco che ha mangiato sarà morto.
3) CALCIO PER FUCILE FRANCHI RAPTOR - Ammazzali tutti, Chuck.
4) BRASILE PUTTANE - Almeno hai le idee chiare.
5) CAZZO DI FRANCESCO COCO - Non siamo preparati, comunque le foto le ha comprate Galliani.
6) DANZATRIBALE COLORE SINGOLI ANALE - Prima o dopo la danza?
7) ESCORT MOLDAVE - Indirizzi e telefono li trovi sul Corriere della Sera.
8) CHI SBAGLIA IL RIGORE NELLA FINALE DEL CAMPIONATO MONDIALE 1982 CONTRO LA GERMANIA OVEST - Sei l'unico su questo pianeta a non saperlo.
9) MAURIZIO TROMBETTA ALLENATORE GUADAGNA - Pochissimo, e fra poco forse lo esonerano anche.
10) MERCKX ALESSIA - Tu dicevi di sicuro Caùsio.

(1-putroppo continua)

25 commenti:

Calvin ha detto...

Ma Alessia Merckx quella detta "la cannibale" ma non perché vince in bicicletta? :D

kalz ha detto...

@Vincenzo, va be' che il ciclismo sta passando un momentaccio, ma questo è davvero troppo :-)

jeremy ha detto...

Vincenzo dopo aver appeso la bicicletta al chiodo è diventata una madre di famiglia (con calciatore, ovviamente). Una su mille ce la fa....

Stefano Olivari ha detto...

Mi sto incatenando per non scrivere le cose peggiori digitate su Google per arrivare al nostro sito, parole inconcepibili anche per il criminale medio. C'è in giro gente davvero spaventosa, poi noi diamo la colpa agli allenatori che devono 'abbassare i toni'. Ben venga Alessia Merckx...

jeremy ha detto...

Direttore ma qual è il meccanismo per cui google aggancia indiscreto alla ricerca di un pedofilo?????

Stefano Olivari ha detto...

Brin e Page potrebbero spiegarlo meglio di me, ma se in un articolo ho scritto la parola 'bambine' ed in un altro dell'homepage la parola 'bionde', magari al decimilionesimo posto in graduatoria ma vengo indicizzato e trovato dopo dieci milioni di altri siti da chi digita quelle due parole. Escludo di avere trattato il tema 'bambine bionde', o peggio...

jeremy ha detto...

Diretto, le consiglio quando avra tempo (senno lo faccio io per spasso e poi le dico che mi risulta) di fare un'analisi aggangiando i dati di Shiny con gli argomenti e gli articoli postati. Comunque ci stiamo assestando con un trend di crescita periodico fisiologico.

Felix ha detto...

Ho forse peggio ancora il direttore ha spammato i meta tag del sito con keywords inenarrabili :-)))

jeremy ha detto...

Diretto, invece lo ha fatto il 15 giugno 2008 e si piazza terzo nella ricerca di Google. Dietro solo Paris Hilton e un sito freegames!!! Sti cazzi!!

Gargaroz ha detto...

Direttore, lei non ha trattato il tema bambine bionde però un post del blog si intitola "Solo bambine bionde" (aggiungiamo che il blog si chiama Indiscreto)...un motore di ricerca fa solo il suo mestiere...

P.S. ma Eddy Merz non si vede più in televisione?

Stefano Olivari ha detto...

Che figura...ecco l'autodenuncia: http://nuovoindiscreto.blogspot.com/2008/06/solo-bambine-bionde.html

jeremy ha detto...

Diretto, le consiglio di levare il post al piu presto onde evitare altri frequentatori "delusi" dal risultato della loro ricerca....:-) Ps Gargaroz, è mamma di famiglia. Mi pare abbia avuto due figli da Bazzani.

Dane ha detto...

1) Eh no, troppo comodo. La sedia elettrica ci mette un attimo, io lo darei in pasto ad un ergastolano turco...
2) Vabbè rimpiangere gli anni 80 ma qui si esagera...
3) L'altra sera abbiamo provato un garnde schifo vedendo un vicino rientrare con fucile e tenuta da caccia. Stamattina scendendo in cortile abbiamo visto un pettirosso serenamente accovacciato sulla sella della bicicletta. La nostra, ovviamente...
4) L'ho sempre pensato anch'io ma non son mai riuscito ad esprimere il concetto in maniera così diretta...
5 e 6) Una danza del cazzo, insomma...
7) Ma parlavano di auto rubate in viaggio verso i paesi dell'est?!...
8) Poi dicono che i media coprono il Milan...
9) Ma a quale persona potrebbe interessare?! A meno di non dover scriverci una articolo: documentati prima di tutto...
10) Io questo qua vorrei conoscerlo per sentirglielo pronunciare...

carloblacksun ha detto...

vorrei lasciarvi con la bellissima citazione "Evviva la negritudine!" frase scolpita nella roccia delle frasi più belle del cinema italiano...naturalmente parlo di Alessia Merckx nella sua meravigliosa interpretazione in "Panarea"

Nick ha detto...

Questi articoli anche se diffusissimi sul web sono sempre esilaranti!
Mi permetto di rispondere alla domanda di Jeremy perchè se c'è una cosa di cui posso parlare compiutamente senza il timore di dire cazzate è questa.
Avviene tutto grazie all'indice TFIDF (Term Frequency / Inverse Document Frequency) che detto in due parole è l'unione fra l'indice di recall e l'indice di precision: il primo ci dice quanto spesso compare una parola (o una polirematica, come in questo caso) in un documento, il secondo quanto quella parola è rilevante nel testo in questione. Alti valori di TFIDF indicano termini che meglio discriminano il contenuto di un documento...e i documenti che contengono quei termini sono quelli che ti ritrovi in alto nella ricerca con Google.
(inteso: uno stesso termine/polirematica avrà differenti valori di TFIDF a seconda del contesto nel quale è usato e, più in generale, del testo che lo circonda)

Dane ha detto...

Scusa Nick, quindi più una parola non c'entra un cazzo col contesto più il sito viene indicizzato da Google?! No, perchè nel caso delle bambine bionde non vedo altra spiegazione...

jeremy ha detto...

Nick, in parole povere è un metodo del cazzo.

Nick ha detto...

Al contrario Jeremy: è perfetto. Quante volte ti capita di cercare una cosa e NON trovarla nei primi 10 di Google? A me praticamente mai.
Dane, no...purtroppo la necessità di sintesi rende un po' complicato il punto. In realtà è l'esatto contrario: più una parola è rappresentativa del contesto e più aumenta il TFIDF, che è un indice estremamente "onesto" da questo punto di vista.
Il caso del Diretto è abbastanza esemplificativo...ci provo in due parole.
Innanzitutto teniamo presente che non parliamo di un termine ma di una polirematica ("Bambine bionde", anche se è cercato senza virgolette).
Ora, per quanto banale possa sembrare, in realtà come espressione è abbastanza caratteristica. In un qualsiasi testo sarà difficilissimo trovare esattamente questa espressione. E ancora più difficile sarà trovare queste due parole in stretta concordanza (lag 0, ovvero nessuna altra parola in mezzo alle due) nel 100% dei casi.
Per sparare numeri a caso, potremmo dire che in un testo "x" su 3mila volte che viene usata la parola "bambine", 200 volte questa è seguita da "bionde" (concordanza=6%) e su 7mila volte che viene usata la parola "bionde", 200 volte questa è preceduta da "bambine" (concordanza=2,8%). Nel testo in questione, invece, tutte le "bambine" sono "bionde" e tutte le "bionde" sono "bambine". Il che già fa spiccare tremendamente la polirematica in un'analisi di contesto e nella parte recall dell'indice.
La frequenza del termine è spaventosamente alta, e lo diventa ancora di più se paragonata alla scarsa lunghezza del documento...tanto basta per far sì che "bambine bionde" sia classificata come parola-tema (e non a caso è stata scelta dal Diretto anche come titolo del documento stesso).
Tutt'altro discorso riguarda il fatto che la parola non c'entri niente con i concetti espressi dall'articolo (misura indicizzabile, anche questa), ma Google è un motore di ricerca per forme grafiche, non per concetti.
In questo caso l'errore è a monte, ovvero nella ricerca: a occhio, infatti, direi che nessuno dei primi risultati di Google potesse interessare al nostro "ricercatore"...ha sbagliato le parole chiave, semplicemente.

Dane ha detto...

Nick, la mia era una battuta!... ;-)

p.s.: anzi, ho bisogno della tua mail per chiederti una consulenza in merito. C'è una roba che mi sta facendo impazzire... :-D

Nick ha detto...
Questo commento è stato eliminato dall'autore.
Nick ha detto...

Scrivi a clandestino84-chiocciola-libero.it e poi fammi un fischio e ti rispondo da quella vera.
(Una procedura che manco all'FBI, lo so...ma cosa non si fa per mettere anche un solo mattoncino contro lo spam!)

Felix ha detto...

Oltre al sistema di statistica Shiny Stat per avere una migliore panoramica dei referring sites (siti e motori) e una panoramica milgiore di keypharase o keywords con cui si è acceduto al sito il sistema di Tracking di Google Analitycs devo ammettere che non è male.
Io stesso ho un blog su wordpress e le piattaforme di blog sono sempre molto gradite dagli spider dei motori fra le altre cose perchè i blog hanno sempre un alto livello di refresh dei contenuti e molto permettono anche trackback ed altre forme di linkatura. Cioè tutte cose che danno peso e valenza ad un sito/blog ecc.
Inoltre anche i titoli dei post hanno la loro importanza (ecco il perchè di "bambine bionde").
Un mio parere spassionato (e non necessariamente da prendere per oro colato)

dag_nasty ha detto...

Shiny Stat referring sites keypharase keywords Tracking Analitycs blog wordpress spider blog refresh trackback linkatura post

la lingua evolve...very fast.

Felix ha detto...

@ dag nasty
Hai ragione anche io odio sti neologismi ma causa lavoro li ho interiorizzati...e a volte mi ritrovo ad usarli inconsapevolmente. Meglio tornare a parlare come si mangia

dag_nasty ha detto...

ma sai in definitiva li usi perchè esprimono velocemente e semplicemente il concetto...non è molto estetico, ma non sono fra coloro si indignano. Semplicemente mi fa sorridere, d'altra parte però il mondo cambia e la lingua cambia...