Google ha una sua sintassi con
delle regole precise. Tale sintassi permette di sfruttare al
meglio le query. Tuttavia anche la scelta di parole chiave deve
essere mirata ed il meno generica possibile. Google ha un
singolare comportamento con le parole chiave: se infatti queste
vengono ripetute più volte, il risultato della query cambia, e
si hanno molti più risultati rispetto al singolo inserimento. Di
seguito riporterò gli operatori di ricerca più comuni.
intitle: Trova le pagine
contenenti nel proprio titolo la parola chiave specificata.
Esempio: intitle:xhtml
(Nota bene: non devono esservi spazi fra i due punti e la parola chiave
specificata. Google non è case-sensitive, quindi è indifferente
rispettare le maiuscole e le minuscole.)
allintitle: Restituisce le pagine che
contengono nel titolo tutte le parole specificate.
Esempio: allintitle:xhtml
tutorials
inurl: Limita i risultati alle
pagine contenenti una determinata parola nell'URL.
Esempio: inurl:css
allinurl: Limita i risultati alle
pagine contenenti tutte le parole specificate nel proprio URL.
Esempio:
allinurl:css design
intext: Restituisce le pagine che
contengono nel testo la parola chiave specificata.
Esempio:
intext:blog
allintext: Limita i risultati alla
pagine che contengono nel testo tutte le parole specificate.
Esempio:
allintext:eric meyer
link: Ricerca le pagine Web che
contengono collegamenti al link specificato.
Esempio:
link:www.html.it
inanchor:
Ricerca negli anchor dei link presenti nelle pagine.
Esempio: inanchor:linux
site:
Restringe la ricerca ad un sito o ad un dominio di livello
superiore.
Esempi: site:com o site:it o site:www.redhat.com
cache: Trova una copia della pagina che Google ha indicizzato nella
propria cache. Utile quando le pagine non sono più online.
Esempio:
cache:www.nomesito/nomepagina.htm
filetype: o ext: Limita i risultati ad un documento avente una
determinata estensione di file (.doc, .pdf, .rtf, .pl, .sh, .xls,
eccetera).
Esempio: filetype:pdf
define:
Fornisce la descrizione di un termine ed i link ad esso
correlati.
Esempio: define:worm
related: Cerca pagine simili o affini alla pagina specificata.
Esempio: related:www.html.it
info:
Si ottengono ulteriori informazioni e link su un URL specificato.
Fondamentale per tale descrizione è l'uso accorto dei metatag.
Esempio: info:www.w3.org
::.
Altri operatori e metacaratteri AVANZATI .::
Accanto agli operatori principali, troviamo altri operatori con cui
approfondire le nostre query. Vi sono innanzitutto gli operatori
booleani (AND, OR, NOT) che possono essere usati in combinazione con gli
operatori principali. Esempio:
intitle:index.of "parent directory" images OR image
(Trattasi questo di esempio complesso che capiremo meglio più avanti.)
perl (site:edu | site:com)
(Qui ho raggruppato i membri dell'espressione logica tramite parentesi.)
Altri operatori sono gli operatori di inclusione ed esclusione (+ e -),
con i quali includiamo o escludiamo dalla nostra ricerca una determinata
espressione o combinazione di espressioni. Esempio:
windows -site:microsoft.com
(Cerco informazioni, ahimè, su Windows ma ho deciso di escludere dalla
ricerca il sito della Microsoft.)
Un altro operatore, spesso sottovalutato, è rappresentato dalle
virgolette, che spesso Google ci consiglia di omettere al fine di
ottenere maggiori risultati. Questo perché si tratta di un operatore di
specificità, che impone a Google di trovare proprio quella espressione
ed in quella successione. Esempio:
"google hacking" -site:it
(Cerco delle info su quest'espressione ma ho deciso di snobbare i siti
italiani.)
Infine vengono i metacaratteri, o nel caso di Google il metacarattere
asterisco (*), che sostituisce una parola completa (due asterischi
sostituiranno due parole e così via). Utile quando non conosciamo una
frase precisa ma solo parti di essa. Esempio:
"three
* mice"
(Consente di trovare "three blind mice", "three blue mice", "three green
mice", eccetera.)
Combinare operatori e parole chiave
Un buon metodo per ottenere il maggior numero di risultati possibili in
una ricerca è quello di combinare gli operatori con le parole chiave. Si
dovrebbero usare come parole chiave termini che caratterizzino in modo
sufficiente l'argomento ricercato e non riguardino molti altri
argomenti. Tornando all'esempio lasciato in sospeso:
intitle:index.of "parent directory" images OR image
notiamo che qui sono state usate due espressioni chiave ben precise:
index of
parent directory
le quali si riferiscono alla terminologia con cui sui server si
denominano le directory genitrici, che spesso, per motivi vari o
semplicemente per distrazione, vengono lasciate scoperte e quindi
facilmente rintracciabili tramite Google. Il fatto è che Google, se non
viene espressamente richiesto il contrario, indicizza l'intero sito, con
tutte le directory annesse e connesse. Altre parole chiave di uso
corrente che risultano particolarmente utili sono ad esempio:
"what's new"
"what's cool"
directory
categories
Per cercare fra i blog scriveremo invece:
"powered by blogger"
"powered by bloxom"
"powered by greymatter"
"a manila site"
site:livejournal.com
site:blogspot.com
intitle:"radio weblog"
site:radio.weblogs.com
Come si evince chiaramente da quanto riportato sopra, abbiamo una gamma
vastissima di combinazioni possibili. Il limite è solo la nostra
fantasia e soprattutto la nostra capacità di andare a cercare nei siti
quelle parole che li accomunano. Per esempio, avrei bisogno di cercare
del buon codice XHTML e CSS con cui sviluppare il mio sito e necessito
di esempi pratici. Sapendo che spesso (ma non sempre), le parole che li
accomunano sono "valid xhtml 1.1" e "valid css" (le famose iconcine del
W3C, spesso usate anche dove la validazione dice il contrario),
scriverò:
"valid xhtml 1.1" site:edu
"valid css" site:edu
intext:"valid xhtml 1.1" site:it
intext:"valid css" site:com
E così via. Ma ora ci siamo addentrati in quel punto di confine che
separa la semplice ricerca da qualcosa di più. Ora è tempo di parlare
dell'hacking di Google.
Hacking
continua.......
AREA PRIVATA
