Google ha pubblicato un articolo scientifico in cui presenta un nuovo algoritmo: SMITH. Secondo l'azienda, questo modello supera il precedente quando si tratta di analizzare documenti estesi e query lunghe.
SMITH è un nuovo algoritmo progettato per comprendere un documento nel suo insieme. BERT interpreta le parole nel contesto delle frasi, mentre SMITH è pensato per cogliere il rapporto tra porzioni di testo all'interno dell'intero documento.
SMITH può lavorare sui frammenti di un documento in modo simile a come BERT lavora su parole e frasi.
Gli sviluppatori addestrano il nuovo algoritmo a prevedere il blocco di frasi successivo. Questo approccio dovrebbe rendere SMITH molto più efficace di BERT nel trattamento di documenti di grandi dimensioni. BERT, invece, segue una logica diversa.
Google, di norma, non comunica ufficialmente quali algoritmi utilizza nei propri sistemi. Dopo la diffusione della notizia sono nate ipotesi sul fatto che il motore di ricerca stesse già lavorando con il nuovo modello. Da qui sono partite diverse speculazioni: non è chiaro se, e in che misura, l'introduzione di questi algoritmi possa incidere sui webmaster che usano forme particolari di promozione SEO e si fanno domande come come aumentare i clic su un link e simili.
Poco dopo, però, Danny Sullivan di Google ha smentito le voci, spiegando che l'azienda non utilizza ancora il nuovo algoritmo nei propri sistemi. Sullivan lo ha scritto sul suo profilo Twitter.
Nell'articolo pubblicato da Google vengono indicati in modo diretto i vantaggi di SMITH rispetto ad altri algoritmi. I test hanno mostrato che SMITH può gestire input testuali più lunghi. Secondo il documento, il nuovo algoritmo è una delle soluzioni più adatte per l'analisi di documenti estesi.
LIVEsurf
IT
RU


.bf739e4e9fd1c7bfdfa4.png)








