Entidades en SEO: ¿Qué son y por qué son importantes?

  • HatumSEO
  • SEO
  • Entidades en SEO: ¿Qué son y por qué son importantes?

Descubra por qué comprender y aprovechar las entidades es crucial para una estrategia de búsqueda preparada para el futuro y se alinea con la IA generativa y ChatGPT.

Celebre las fiestas con algunos de los mejores artículos de SEJ de 2023.

Nuestra serie Festive Flashback se llevará a cabo del 21 de diciembre al 5 de enero y presenta lecturas diarias sobre eventos importantes, fundamentos, estrategias viables y opiniones de líderes intelectuales.

2023 ha sido bastante agitado en la industria del SEO y nuestros colaboradores produjeron algunos artículos destacados para mantener el ritmo y reflejar estos cambios.

Póngase al día con las mejores lecturas de 2023 para tener mucho en qué reflexionar a medida que avanza hacia 2024.

Existe mucha confusión sobre cómo los profesionales de SEO deberían comprender y, lo que es más importante, aprovechar las «entidades» en SEO.

Entiendo de dónde viene esto, especialmente teniendo en cuenta que el enfoque tradicional del SEO gira en torno a palabras y frases.

De hecho, la mayoría de los algoritmos con los que creció la primera ola de profesionales de SEO (como yo) no tenían el concepto de «entidad» en la búsqueda. Los principios de SEO, desde la redacción de contenido hasta el texto ancla en enlaces y el seguimiento de SERP, se basaban (y en gran medida siguen estando) basados ​​en palabras clave, y a muchas personas todavía les resulta difícil entender qué ha cambiado.

Pero a lo largo de la última década, toda búsqueda se ha dirigido a comprender el mundo como una cadena de palabras y como una serie de entidades interconectadas.

Trabajar con entidades en SEO es la base de una estrategia de búsqueda preparada para el futuro.

También son importantes para un futuro con IA generativa y ChatGPT.

Este artículo habla de por qué Cubre:

  • ¿Qué son las entidades?
  • ¿Qué es el gráfico de conocimiento?
  • Una breve historia de las entidades en búsqueda: Freebase, Wikidata y entidades.
  • Cómo funcionan las entidades y cómo se utilizan para la clasificación.
  • Ejemplos de entidades en Google.
  • Cómo optimizar para entidades.
  • Uso de esquema para ayudar a definir entidades.

¿Qué son las entidades?

Los SEO suelen confundir entidades con palabras clave.

Una entidad (en términos de búsqueda) es un registro en una base de datos. Una entidad generalmente tiene una identificación de registro específica.

En Google, eso podría ser:

“MREID=/m/23456” o “KGMID=/g/121y50m4”.

Ciertamente no es una “palabra” o una “frase”.

  1. La primera es que los profesionales de SEO aprendieron su oficio antes de 2010 en términos de palabras clave y frases. Muchos todavía lo hacen.
  2. La segunda es que cada entidad viene con una etiqueta, que generalmente es una palabra clave o un descriptor.

Entonces, si bien la «Torre Eiffel» puede parecernos una «entidad» perfectamente identificable para nosotros como humanos, Google la ve como «KGMID=/m/02j81» y realmente no le importa si la llamas «Torre Eiffel» o «Torre». Sabe que probablemente te estés refiriendo a esa entidad subyacente en su Gráfico de conocimiento. “KGMID=/m/02j81”

Esto pasa al siguiente punto:

¿Qué es “el gráfico de conocimiento”?

Existen diferencias sutiles pero importantes entre «un gráfico de conocimiento», «el gráfico de conocimiento» y «el panel de conocimiento».

  • Un gráfico de conocimiento es una base de datos semiestructurada que contiene entidades.

Una breve historia de las entidades en búsqueda

metaweb

En 2005, Metaweb comenzó a construir una base de datos, entonces llamada Freebase, que describió como una “base de datos abierta y compartida del conocimiento del mundo”. Metaweb

Lo describiría como una enciclopedia semiestructurada.

Le dio a cada “entidad” (o artículo, para ampliar la metáfora) su propio número de identificación único y, a partir de ahí, en lugar de un artículo tradicional en palabras, el sistema intentó conectar artículos a través de sus relaciones con otros números de identificación en el sistema.

Unos 50 millones de dólares en financiación de capital y, 5 años después, el proyecto se vendió a Google.

Nunca se construyó ningún producto comercial, pero se sentaron las bases para una transición de 10 años, para Google, de un motor de búsqueda basado en palabras clave a uno basado en entidades.

Wikidatos

En 2016, unos seis años después de la compra, Google cerró formalmente Freebase porque había migrado y desarrollado las ideas en su propio “gráfico de conocimiento”, el término moderno para estas bases de datos.

En ese momento, es útil señalar que Google declaró públicamente que había sincronizado gran parte de los datos de su entidad con Wikidata y que, en el futuro, Wikidata (que sustenta los datos utilizados en Wikipedia) era una forma en la que el Knowledge Graph de Google podía interactuar. Wikidata

Cómo funcionan las entidades y cómo se utilizan para la clasificación

Entidades en el algoritmo central

Las entidades se utilizan principalmente para eliminar ideas, no para clasificar páginas con las mismas ideas.

Eso no quiere decir que el uso inteligente de entidades no pueda ayudar a que el contenido de su sitio se clasifique de manera más efectiva. Puede Pero cuando Google intenta ofrecer resultados a la búsqueda de un usuario, su objetivo principal es obtener una respuesta precisa.

No necesariamente el más merecedor.

Por lo tanto, Google dedica un tiempo considerable a convertir pasajes de texto en entidades subyacentes. Esto sucede tanto al indexar su sitio como al analizar la consulta de un usuario.

Por ejemplo, si escribo «Los nombres de los restaurantes debajo de la Torre Eiffel», Google sabe que el buscador no busca «nombres» ni la «Torre Eiffel».

estan buscando restaurantes No cualquier restaurante, sino los de una ubicación específica. Las dos entidades relevantes en esta búsqueda son “restaurante” en el contexto de “Champ de Mars, 5 Av. Anatole France, París” (La dirección de la Torre Eiffel).

Esto ayuda a Google a decidir cómo combinar sus diversos resultados de búsqueda: imágenes, mapas, empresas de Google, anuncios y páginas web orgánicas, por nombrar algunos.

Lo más importante es que para el profesional de SEO es muy importante que (digamos) el sitio del restaurante Julio Verne hable sobre su espectacular vista de la Torre Eiffel si quiere que Google reconozca que la página es relevante para esta consulta de búsqueda.

Esto puede resultar complicado ya que el restaurante Julio Verne está dentro de la Torre Eiffel.

Agnóstico del idioma

Las entidades son excelentes para los motores de búsqueda porque son independientes del idioma. Además, esa idea significa que una entidad puede describirse a través de múltiples medios.

Una imagen sería una forma obvia de describir la Torre Eiffel, ya que es muy icónica. También podría ser un archivo de discurso o la página oficial de la torre.

Todos estos representan etiquetas válidas para la entidad y, en algunos casos, identificadores válidos en otros gráficos de conocimiento.

Conexiones entre entidades

La interacción entre entidades permite a un profesional de SEO desarrollar estrategias coherentes para desarrollar tráfico orgánico relevante.

Naturalmente, la página más “autorizada” sobre la Torre Eiffel probablemente sea la página oficial o Wikipedia. A menos que seas literalmente un profesional de SEO para la Torre Eiffel, hay poco que puedas hacer para cuestionar este hecho.

Sin embargo, la interacción entre entidades le permite escribir contenido que se clasificará Ya mencionamos “restaurantes” y “Torre Eiffel”, pero ¿qué pasa con “Metro” y “Torre Eiffel”, o “Descuentos” y “Torre Eiffel”?

Tan pronto como entran en juego dos entidades, la cantidad de resultados de búsqueda relevantes cae drásticamente Cuando llegas a “Billetes con descuento para la Torre Eiffel cuando viajas en Metro”, te conviertes en una de una pequeña selección de páginas que se centran en la yuxtaposición entre boletos de Metro, boletos para la Torre Eiffel y descuentos.

Mucha menos gente escribe esta frase, pero la tasa de conversión será mucho mayor.

¡También puede resultarle un concepto más monetizable! No sé si existen esos descuentos. Pero deberían hacerlo.)

Este concepto se puede ampliar para crear páginas excepcionalmente sólidas dividiendo primero todas las páginas que compiten por una frase de búsqueda en una tabla que muestre las entidades subyacentes y su importancia relativa para la consulta principal.

Luego, esto puede actuar como un plan de contenido para que un escritor cree un nuevo contenido que tenga más autoridad que cualquiera de los otros trabajos de la competencia.

Entonces, aunque un motor de búsqueda pueda afirmar que las entidades no son un factor de clasificación, la estrategia va al corazón de la filosofía de que «si escribes buen contenido, ellos vendrán».

Ejemplos de entidades en Google

Entidades en la búsqueda de imágenes

dog on a skateboard: Google search

Las entidades también pueden resultar muy útiles para optimizar imágenes.

Google ha trabajado muy duro para analizar imágenes mediante aprendizaje automático Por lo general, Google conoce las imágenes principales en la mayoría de las fotografías.

Así que tome [un perro en patineta] como término de búsqueda… asegurarse de que su contenido sea totalmente compatible con la imagen puede ayudar a que su contenido sea más visible, justo cuando el usuario lo está buscando. a dog on a skateboard

Entidades en Google Discover

Una de las fuentes de tráfico más subestimadas para los profesionales de SEO es Google Discover.

Google proporciona un feed de páginas interesantes para los usuarios, incluso cuando no están buscando algo activamente.

Esto sucede en teléfonos Android y también en la aplicación de Google en iPhone Si bien las noticias influyen mucho en este feed, los sitios que no son de noticias pueden obtener tráfico de «Discover».

¿Cómo?

Google Discover data in GSC

No se desanime si no ve la pestaña «Descubrir» en su Google Search Console. Pero cuando lo haga, puede ser una señal positiva de que al menos una de sus páginas web se haya alineado con entidades lo suficiente como para que los intereses de al menos una persona se superpongan con su contenido lo suficiente como para tener la página en un feed dirigido específicamente al usuario.

En el ejemplo anterior, aunque los resultados de «Descubrir» no se muestran en el momento exacto en que un usuario está buscando, todavía hay una tasa de clics del 4,2%.

Esto se debe a que Google puede alinear los intereses y hábitos de muchos de sus usuarios con el contenido de Internet mediante el mapeo de entidades.

Cuando se produce una fuerte correlación, Google puede ofrecer una página a un usuario.

Cómo optimizar para entidades

Algunas investigaciones de un empleado de Google

En 2014, apareció un artículo que encuentro bastante útil para demostrar que Google (o al menos sus investigadores) estaba interesado en separar las ideas de uso de palabras clave para comprender temas versus utilizando entidades.

En este artículo, Dunietz y Gillick señalan cómo los sistemas de PNL avanzaron hacia el procesamiento basado en entidades. Destacan cómo se puede utilizar un sistema binario de “prominencia” en grandes conjuntos de datos para definir las entidades en un documento (página web).

Un “sistema de puntuación binario” sugiere que Google podría decidir si un documento ES o NO es sobre una entidad determinada.

Pistas posteriores sugieren que Google ahora mide la “prominencia” en una escala móvil de 0 a 1 (por ejemplo, la puntuación otorgada en su API de PNL).

Aun así, encuentro este artículo realmente útil para ver dónde, según la investigación de Google, deberían aparecer las “entidades” en una página para “contar” como destacadas.

Recomiendo leer el artículo para realizar una investigación seria, pero enumera cómo clasificaron la «prominencia como un estudio de los artículos del ‘New York Times'».

En concreto, citaron:

1er lugar

Esta fue la primera frase en la que aparece por primera vez una mención de una entidad.

La sugerencia es que mencionar la entidad al principio de su página web podría aumentar las posibilidades de que una entidad sea vista como «destacada» en el artículo.

Recuento de personas

Esta es básicamente la cantidad de veces que aparece la palabra «principal» de la primera mención de la entidad.

La “palabra principal” no se define específicamente en el artículo, pero entiendo que significa la palabra concatenada en su forma más simple.

Menciones

Esto se refiere no sólo a las palabras/etiquetas de la entidad, sino también a otros factores, como las referencias de la entidad (él/ella/ello).

Titular

Donde cuando aparece una entidad en un titular.

cabeza-lex

Descrita como la “palabra principal en minúscula de la primera mención”.

Centralidad de la entidad

El documento también habla sobre el uso de una variación de PageRank, ¡donde cambiaron páginas web por artículos de Freebase!

El ejemplo que compartieron fue un debate en el Senado en el que participaron FEMA, el Partido Republicano, (el presidente) Obama y un senador republicano.

Después de aplicar un algoritmo iterativo similar a PageRank a estas entidades y su proximidad entre sí en el gráfico de conocimiento, pudieron cambiar las ponderaciones de la importancia de esas entidades en el documento.

Juntando estas señales de entidad en SEO

Sin ser específico de Google, aquí, un algoritmo crearía valores para todas las variables anteriores para cada entidad que un PNL o un programa de extracción de entidades nombradas (NEEP) encuentre en una página de texto (o, de hecho, todas las entidades reconocidas en

Luego se aplicaría una ponderación a cada variable para dar una puntuación. En el artículo analizado, esta puntuación se convierte en 1 o 0 (destacante o no destacado), pero es más probable un valor de 0-1.

Google nunca compartirá los detalles de esas ponderaciones, pero lo que el documento también muestra es que las ponderaciones se determinan sólo después de que se «leen» cientos de millones de páginas.

Ésta es la naturaleza de los grandes modelos de aprendizaje de idiomas.

Pero aquí hay algunos consejos importantes para los profesionales de SEO que desean clasificar el contenido en torno a dos o más entidades. Volviendo al ejemplo “restaurantes cerca de la Torre Eiffel”:

¿Es esto suficiente para el SEO de entidades?

No Probablemente no (¡Puedes leer mi libro!) Sin embargo, no todos los factores están bajo tu control como escritor o propietario de un sitio web.

Sin embargo, dos ideas que parecen tener un impacto son vincular el contenido de otras páginas en contexto y agregar esquemas para ayudar con las definiciones.

Uso de esquemas para ayudar a definir entidades

Se podría dar mayor claridad a los motores de búsqueda utilizando el esquema «acerca de» y «menciones» para ayudar al motor de búsqueda a eliminar la ambigüedad del contenido.

Estos dos tipos de esquemas ayudan a describir de qué habla una página.

Al crear una página “sobre” una o dos entidades y “mencionar” quizás algunas más, un profesional de SEO puede resumir rápidamente un largo contenido en sus áreas clave de una manera que esté lista para ser consumida por gráficos de conocimiento.

Sin embargo, cabe señalar que Google no ha declarado expresamente de una forma u otra si utiliza este esquema en sus algoritmos centrales.

Probablemente agregaría este esquema a mi artículo:

<script type=”application/ld+json”> {

“@context”: “https://schema.org”,

“@type”: “WebPage”,

“@id”: “https://www.yoursite.com/yourURL#ContentSchema”,

“headline”: “Restaurants a small distance from the Eiffel Tower”,

“url”: “https://www.yoursite.com/yourURL”,

“about”: [

   {“@type”: “Thing”, “name”: “Restaurant”, “sameAs”: “https://en.wikipedia.org/wiki/Restaurant”},

   {“@type”: “Place”, “name”: “Eiffel Tower”, “sameAs”: “https://en.wikipedia.org/wiki/Eiffel_Tower”}

],

“mentions”: [

   {“@type”: “Thing”, “name”: “distance”, “sameAs”: “https://en.wikipedia.org/wiki/Distance”},

   {“@type”: “Place”, “name”: “Paris”, “sameAs”: “https://en.wikipedia.org/wiki/Paris”}

]

} </script>

{

“@contexto”: “https://schema.org”,

“@tipo”: “Página web”,

“@id”: “https://www.yoursite.com/yourURL#ContentSchema”,

“titular”: “Restaurantes a poca distancia de la Torre Eiffel”,

“url”: “https://www.tusitio.com/tuURL”,

«acerca de»: [

{“@tipo”: “Cosa”, “nombre”: “Restaurante”, “igual que”: “https://en.wikipedia.org/wiki/Restaurant”},

{“@tipo”: “Lugar”, “nombre”: “Torre Eiffel”, “igual que”: “https://en.wikipedia.org/wiki/Eiffel_Tower”}

],

“menciona”: [

{“@tipo”: “Cosa”, “nombre”: “distancia”, “igual que”: “https://en.wikipedia.org/wiki/Distance”},

{“@tipo”: “Lugar”, “nombre”: “París”, “igual que”: “https://en.wikipedia.org/wiki/Paris”}

]

}

La elección exacta del esquema es tanto una cuestión filosófica como una cuestión de SEO.

Pero piense en el esquema que utiliza como «eliminar la ambigüedad» de su contenido en lugar de «optimizarlo» y, con suerte, terminará con un tráfico de búsqueda más dirigido.

Nota del editor: Dixon Jones es el autor de Entity SEO: Moving from Strings to Things. Entity SEO: Moving from Strings to Things

Más recursos:

Imagen de portada: optimarc/Shutterstock

Leer el articulo original en Search Engine Journal.

¡Danos un Voto!

¿Tienes una pregunta?

Luis Narciso
Sobre SEO
(Posicionamiento Web)

Frank Fajardo
Sobre Diseño Web, Anuncios, Diseño y Redes Sociales