Google, sempre più versione simpatica del Grande fratello orwelliano, ha pronta (o perlomeno quasi pronta) una tripletta di novità che hanno l’obiettivo di rendere ancora più efficace il proprio motore di ricerca.
La novità più importante si chiama RankBrain e, come spesso accade per le novità software incubate a Mountain View, è stata introdotta gradualmente. I prodromi sono addirittura del 2013, con una iniziativa che allora venne chiamata Hummingbird e mirava a insegnare al motore di ricerca l’uso dei sinonimi, in modo che chi cerca persiane trovi anche imposte e gelosie. L’originale team di cinque persone è stato irrobustito fino a inglobarne alcune dozzine; il sistema è stato riscritto, esteso, ispessito, rinominato appunto RankBrain. Scomodando nientepopodimeno che l’intelligenza artificiale, e in particolare una branca chiamata apprendimento automatico (machine learning in inglese) che impara a parafrasare le richieste più ambigue per trasformarle in ricerche soddisfabili. Il nuovo codice è stato incorporato nel motore di ricerca di Google a metà di quest’anno, ma chi si interessa ai retroscena l’ha scoperto solo a fine ottobre leggendo una intervista di Bloomberg a Greg Corrado, uno degli autori.
La ricerca costituisce le fondamenta stesse di Google. L’apprendimento automatico non è una pozione magica che si rovescia sul problema e migliora la situazione. C’è voluto parecchio lavoro, riflessioni e attenzione per costruire qualcosa che valesse davvero la pena. Oggi lo teniamo parecchio sotto controllo, e mi ha sorpreso: direi che è andata molto meglio di quanto ci aspettassimo.
Circa il 15 percento delle ricerche effettuate ogni giorno su Google è imprevisto, mai pervenuto in precedenza. È soprattutto su queste che lavora il nuovo codice. Secondo il sito Search Engine Land, RankBrain è oggi uno tra i più importanti segnali che Google utilizza e combina per trovare le pagine da segnalare escludendone altre. Va detto chiaro e tondo: un altro passo sulla lunga strada che porta Google a ignorare sempre di più gli sforzi fatti da chi vuole scalare le sue classifiche indipendentemente dalla (bassa) qualità dei contenuti del suo sito. Se qualche anno fa valeva la pena di dannarsi l’anima per scegliere col bilancino le parole chiave da inserire nelle proprie pagine, insomma, oggi sinonimi e giri di frase si equivalgono.
Una seconda nuova funzionalità verrà inaugurata entro dicembre: riguarda altri due importanti segnali, Panda e Penguin, responsabili rispettivamente per individuare pagine e siti con contenuto di scarsa qualità e link (collegamenti) insensati tra pagine che parlano di cose differenti. Sino ad oggi, Panda e Penguin venivano aggiornati ogni qualche mese con i risultati di elaborazioni eseguite offline dagli ingegneri di Google. Dopo questa modifica invece l’aggiornamento sarà continuo, in modo da squalificare immediatamente chi pubblica materiale riciclato, comunicati stampa, articoli brevi e vacui — e non a mesi di distanza. Meditate, gente, meditate.