Google analiza los sistemas básicos de actualidad

Elizabeth Tucker, de Google, analizó los sesgos, la variedad de sistemas dentro de la búsqueda y los sistemas centrales de actualidad.

La última Búsqueda Off the Record de Google compartió una gran cantidad de información sobre cómo funciona realmente la Búsqueda de Google. John Mueller y Lizzi Sassman de Google hablaron con Elizabeth Tucker, directora de gestión de productos de Google, quien compartió información sobre los muchos sistemas que trabajan juntos para clasificar las páginas web, incluida una mención de un sistema de actualidad.

Google y la actualidad

La palabra «actualidad» significa cómo algo es relevante en el momento presente. Pero cuando se utiliza en la búsqueda, la palabra «actualidad» se refiere a hacer coincidir el tema de una consulta de búsqueda con el contenido de una página web. Los modelos de aprendizaje automático desempeñan un papel importante a la hora de ayudar a Google a comprender lo que quieren decir los usuarios.

Un ejemplo que menciona Elizabeth Tucker es BERT (Representaciones de codificador bidireccional de Transformers), que es un modelo de lenguaje que ayuda a Google a comprender una palabra dentro del contexto de las palabras que vienen antes y después (es más, es una explicación en miniatura).

Elizabeth explica la importancia de hacer coincidir el contenido relevante por tema con una consulta de búsqueda dentro del contexto de la satisfacción del usuario.

La Googler Lizzi Sassman preguntó sobre la satisfacción de los usuarios y Tucker mencionó que hay muchas dimensiones para buscar, con muchos sistemas, poniendo como ejemplo la importancia del concepto de relevancia temática.

Lizzi preguntó (aproximadamente en el minuto 4:20):

“In terms of the satisfaction bit that you mentioned, are there more granular ways that we’re looking at? What does it mean to be satisfied when you come away from a search?”

“En términos de la parte de satisfacción que mencionaste, ¿hay formas más granulares que estamos analizando?

Isabel respondió:

“Absolutely, Lizzi. Inside Search Quality, we think about so many important dimensions of search. We have so many systems. Obviously we want to show content that’s topically relevant to your search. In the early days of Google Search, that was sometimes a challenge.

Our systems have gotten much better, but that is still sometimes, for especially really difficult searches, we can struggle with. People search in so many ways: Everything from, of course, typing in keywords, to speaking to Google and using normal everyday language. I’ve seen amazing searches. “Hey Google, who is that person who, years ago, did this thing, and I don’t remember what it was called.” You know, these long queries that are very vague. And it’s amazing now that we have systems that can even answer some of those.”

“Absolutamente, Lizzi. Dentro de Search Quality, pensamos en muchas dimensiones importantes de la búsqueda Tenemos tantos sistemas Obviamente queremos mostrar contenido que sea relevante para su búsqueda. En los primeros días de la Búsqueda de Google, eso a veces era un desafío.

Nuestros sistemas han mejorado mucho, pero a veces todavía, para búsquedas especialmente difíciles, tenemos problemas con La gente busca de muchas maneras: desde, por supuesto, escribir palabras clave hasta hablar con Google y utilizar el lenguaje cotidiano. He visto búsquedas increíbles «Hola Google, ¿quién es esa persona que hace años hizo esto y no recuerdo cómo se llamaba?». Y es sorprendente que ahora tengamos sistemas que incluso puedan responder a algunas de esas preguntas”.

Llevar:

Una conclusión importante de ese intercambio es que hay muchos sistemas que trabajan juntos, y la actualidad es solo uno de ellos. Muchos en la comunidad de marketing de búsqueda tienden a centrarse en la importancia de algo como Autoridad o Utilidad, pero en realidad hay muchas «dimensiones» para buscar y es contraproducente reducir los factores que intervienen en la búsqueda a uno, dos o tres conceptos.

Sesgos en la búsqueda

John Mueller de Google le preguntó a Elizabeth sobre los sesgos en las búsquedas y si eso es algo en lo que Google piensa y ella respondió que hay muchos tipos de sesgos que Google vigila y trata de detectar. Tucker explica los diferentes tipos de resultados de búsqueda que pueden ser relevantes por tema (como los de hoja perenne y los frescos) y luego explica cómo es un equilibrio en el que Google se enfoca en lograrlo correctamente.

John preguntó (en el minuto 05:24):

“When you look at the data, I assume biases come up. Is that a topic that we think about as well?”

«Cuando miras los datos, asumo que surgen sesgos ¿Es ese un tema en el que pensamos también?

Isabel respondió:

“Absolutely. There are all sorts of biases that we worry about when you’re looking for information. Are we disproportionately showing certain types of sites, are we showing more, I don’t know, encyclopedias and evergreen results or are we showing more fresh results with up-to-date information, are we showing results from large institutional sites, are we showing results from small blogs, are we showing results from social media platforms where we have everyday voices?

We want to make sure we have an appropriate mix that we can surface the best of the web in any shape or size, modest goals.”

«Absolutamente Hay todo tipo de sesgos que nos preocupan cuando buscas información. ¿Estamos mostrando de manera desproporcionada ciertos tipos de sitios? ¿Estamos mostrando más, no sé, enciclopedias y resultados permanentes o estamos mostrando más resultados nuevos con información actualizada? ¿Estamos mostrando resultados de grandes sitios institucionales?

Queremos asegurarnos de tener una combinación adecuada para que podamos sacar a la luz lo mejor de la web en cualquier forma o tamaño, con objetivos modestos”.

Sistemas básicos de actualidad (y muchos otros)

A continuación, Elizabeth reiteró que trabaja con muchos tipos de sistemas en la búsqueda. Esto es algo a tener en cuenta porque la comunidad de búsqueda sólo conoce unos pocos sistemas cuando en realidad hay muchos, muchos más sistemas.

Eso significa que es importante no centrarse solo en uno, dos o tres sistemas al intentar depurar un problema de clasificación, sino mantener la mente abierta a que podría ser algo completamente distinto, no solo la utilidad o EEAT o algunas otras razones.

John Mueller preguntó si la Búsqueda de Google responde degradando un sitio cuando los usuarios se quejan de ciertos resultados de búsqueda.

Habla de varias cosas, incluido el hecho de que la mayoría de los sistemas en los que trabaja no tienen nada que ver con la degradación de sitios. Quiero subrayar cómo ella menciona que trabaja con muchos sistemas y muchas señales (no solo el puñado de señales en las que la comunidad de marketing de búsqueda tiende a centrarse).

Uno de esos sistemas que ella menciona son los sistemas centrales de actualidad. ¿Qué significa eso? Ella dice «sistemas centrales de actualidad», así que probablemente eso signifique múltiples sistemas y algoritmos.

John preguntó (en el minuto 11:20):

“When people speak up loudly, is the initial step to do some kind of a demotion where you say “Well, this was clearly a bad site that we showed, therefore we should show less of it”? Or how do you balance the positive side of things that maybe we should show more of versus the content we should show less of?”

“Cuando la gente habla en voz alta, ¿el paso inicial es hacer algún tipo de degradación en la que dices: “Bueno, claramente este fue un mal sitio que mostramos, por lo tanto, deberíamos mostrar menos”?

Isabel respondió:

“Yeah, that’s a great question. So I work on many different systems. It’s a fun part of my job in Search Quality. We have many signals, many systems, that all need to work together to produce a great search result page.

Some of the systems are by their nature demotative, and webspam would be a great example of this. If we have a problem with, say, malicious download sites, that’s something we would probably want to fix by trying to find out which sites are behaving badly and try to make sure users don’t encounter those sites.

Most of the systems I work with, though, actually are trying to find the good. An example of this: I’ve worked with some of our core topicality systems, so systems that try to match the topic of the query.

This is not so hard if you have a keyword query, but language is difficult overall. We’ve had wonderful breakthroughs in natural language understanding in recent years with ML
models, and so we want to leverage a lot of this technology to really make sure we understand people’s searches so that we can find content that matches that. This is a surprisingly hard problem.

And one of the interesting things we found in working on, what we might call, topicality, kind of a nerdy word, is that the better we’re able to do this, the more interesting and difficult searches people will do.”

«Sí, esa es una gran pregunta. Entonces trabajo en muchos sistemas diferentes. Es una parte divertida de mi trabajo en Calidad de Búsqueda Tenemos muchas señales, muchos sistemas, que deben trabajar juntos para producir una excelente página de resultados de búsqueda.

Algunos de los sistemas son por naturaleza degradantes y el spam web sería un gran ejemplo de ello. Si tenemos un problema con, digamos, sitios de descarga maliciosos, es algo que probablemente querríamos solucionar tratando de descubrir qué sitios se están comportando mal y tratando de asegurarnos de que los usuarios no encuentren esos sitios.

Sin embargo, la mayoría de los sistemas con los que trabajo en realidad intentan encontrar el buen Un ejemplo de esto: he trabajado con algunos de nuestros sistemas de actualidad principales, es decir, sistemas que intentan coincidir con el tema de la consulta.

Esto no es tan difícil si tiene una consulta de palabras clave, pero el lenguaje es difícil en general. Hemos logrado avances maravillosos en la comprensión del lenguaje natural en los últimos años con ML. Este es un problema sorprendentemente difícil.

Y una de las cosas interesantes que encontramos al trabajar en lo que podríamos llamar actualidad, una especie de palabra nerd, es que cuanto mejor seamos capaces de hacer esto, más interesantes y difíciles serán las búsquedas que realizará la gente”.

Cómo se centra Google en los temas de búsqueda

Elizabeth vuelve a hablar sobre la actualidad, esta vez refiriéndose a ella como el «espacio de actualidad» y cuánto esfuerzo ha invertido Google para hacerlo bien. De particular importancia, destaca cómo Google solía estar muy centrado en las palabras clave, con la clara implicación de que ya no están tan centrados en ellas, lo que explica la importancia de la actualidad.

Ella lo analiza en el minuto 13:16:

“So Google used to be very keyword focused. If you just put together some words with prepositions, we were likely to go wrong. Prepositions are very difficult or used to be for our systems. I mean, looking back at this, this is laughable, right?

But, in the old days, people would type in one, two, three keywords. When I started at Google, if a search had more than four words, we considered it long. I mean, nowadays I routinely see long searches that can be 10-20 words or more. When we have those longer searches, understanding what words are important becomes challenging.

For example, this was now years and years ago, maybe close to ten years ago, but we used to be challenged by searches that were questions. A classic example is “how tall is Barack Obama?” Because we wanted pages that would provide the answer, not just match the words how tall, right?

And, in fact, when our featured snippets first came about, it was motivated by this kind of problem. How can we match the answer, not just keyword match on the words in the question? Over the years, we’ve done a lot of work in, what we might call, the topicality space. This is a space that we continue to work in even now.”

“Así que Google solía centrarse mucho en las palabras clave. Si simplemente juntamos algunas palabras con preposiciones, es probable que nos equivoquemos Las preposiciones son muy difíciles o solían serlo para nuestros sistemas. Quiero decir, mirando esto en retrospectiva, es ridículo, ¿verdad?

Pero, en los viejos tiempos, la gente escribía una, dos, tres palabras clave. Cuando comencé en Google, si una búsqueda tenía más de cuatro palabras, la considerábamos larga Quiero decir, hoy en día veo rutinariamente búsquedas largas que pueden tener entre 10 y 20 palabras o más. Cuando realizamos esas búsquedas más largas, comprender qué palabras son importantes se vuelve un desafío.

Por ejemplo, esto fue hace años y años, tal vez hace cerca de diez años, pero solíamos enfrentarnos al desafío de búsquedas que eran preguntas. Un ejemplo clásico es «¿cuánto mide Barack Obama?»

Y, de hecho, cuando surgieron nuestros fragmentos destacados, fue motivado por este tipo de problema. ¿Cómo podemos hacer coincidir la respuesta, no solo la coincidencia de palabras clave con las palabras de la pregunta? Este es un espacio en el que seguimos trabajando incluso ahora”.

La importancia de los temas y la actualidad

Hay mucho que entender en la respuesta de Tucker, incluido el hecho de que puede ser útil que, al pensar en los algoritmos de clasificación de búsqueda de Google, también se consideren los sistemas centrales de actualidad que ayudan a Google a comprender los temas de las consultas de búsqueda y relacionarlos con el contenido de la página web porque subraya

Un error común que veo es que las personas que tienen dificultades con la clasificación están muy centradas en las palabras clave.  Esa es una forma multidimensional de pensar en SEO La optimización de palabras clave es unidimensional La optimización de un tema es multidimensional y se alinea con la forma en que la Búsqueda de Google clasifica las páginas web; esa temática es una parte importante de la clasificación.

Escuche el podcast Search Off The Record comenzando aproximadamente en el minuto 4:20 y luego avance rápidamente hasta el minuto 11:20:

No se pudo incrustar.

Imagen destacada de Shutterstock/dekazigzag

Leer el articulo original en Search Engine Journal.

¡Danos un Voto!

¿Tienes una pregunta?

Luis Narciso
Sobre SEO
(Posicionamiento Web)

Frank Fajardo
Sobre Diseño Web, Anuncios, Diseño y Redes Sociales