Los sitios de spam de IA superaron la actualización de spam de marzo de 2024 de Google

  • HatumSEO
  • Noticias
  • Los sitios de spam de IA superaron la actualización de spam de marzo de 2024 de Google

Los sitios de spam generados por IA derrotaron la actualización de spam de Google de marzo de 2024 y siguen arrasando en la parte superior de los resultados de búsqueda.

Mientras que los sitios web honestos experimentaron los altibajos de la actualización de Google de marzo de 2024, los SEO y los blogueros de recetas notaron que los sitios de spam con IA aparecían en la cima de los resultados de búsqueda. Un ejemplo se clasificó ayer para más de 217.000 consultas, 14,9.000 de las cuales se encuentran entre las 10 primeras, y ese número ha aumentado un día después. Esto es lo que está pasando y cómo los spammers siguen venciendo a Google.

Aumento en marzo de 2024

El sitio que está clasificado es un subdominio. El dominio principal existe desde el verano de 2020. El subdominio spam fue detectado por primera vez por Internet Archive el 30 de noviembre de 2022, coincidiendo con la fecha de lanzamiento de ChatGPT. El subdominio estuvo a medio terminar y esencialmente inactivo hasta marzo de 2024, cuando se expandió rápidamente e inmediatamente comenzó a clasificarse para miles de consultas de búsqueda.

El miércoles 20 de marzo, el sitio clasificó 14,9 mil consultas de búsqueda entre las 10 primeras El jueves 21 de marzo el sitio tenía 15,6K en el top 10 Aunque Google acaba de concluir su actualización de spam, este sitio en particular (y otros similares) continúan clasificándose para miles de consultas de búsqueda y Google parece incapaz de detenerlos.

Un escritor gastronómico reacciona al spam de IA

Un escritor gastronómico y autor de libros de cocina, Robin Donovan (Instagram), me llamó la atención sobre el sitio de IA y me dijo que otras personas en un grupo privado de Facebook estaban furiosas por el surgimiento de sitios de IA que solicitaban consultas de búsqueda de recetas. Instagram

Es muy obvio que el contenido es generado por IA, incluso las imágenes que acompañan a los artículos son 100% IA. Por lo tanto, es especialmente doloroso para aquellos con experiencia, conocimientos y autoridad ver que el contenido de IA obviamente los supera en rango.

Robin estaba comprensiblemente molesto:

“How on earth is this the best content? And meanwhile, bloggers who are professionally trained chefs, recipe developers, cookbook authors, and others with decades of training and experience are watching their sites be decimated with these updates. Sites that they’ve spent years building with well-researched, well-written (human-written!) articles, recipes that have been professionally developed and carefully tested, photographs they have spent hours prepping for and shooting.

They’ve done all the things Google has told them to do for years—write your own content, take your own photos, develop unique, high-quality recipes, be an expert in your subject area and have credentials to show it, don’t try to game the system, be genuine, create HELPFUL content. For what?”

“¿Cómo diablos es este el mejor contenido? Sitios que han pasado años construyendo con artículos bien investigados y bien escritos (¡escritos por humanos!), recetas que han sido desarrolladas profesionalmente y probadas cuidadosamente, fotografías que han pasado horas preparando y tomando.

Han hecho todo lo que Google les ha dicho que hagan durante años: escribir su propio contenido, tomar sus propias fotografías, desarrollar recetas únicas y de alta calidad, ser un experto en su área temática y tener credenciales para mostrarlo, no ¿Para qué?»

Detalles sobre el aspecto de los sitios de spam

1 Alojado en Squarespace

El sitio de spam está en un subdominio y tanto el subdominio como el sitio principal están alojados en Squarespace. ¿Por qué Squarespace?

2 Todas las imágenes son coloridas y simples.

Todas las imágenes son generadas por IA, creadas en un estilo plano y colorido similar al que se podría ver en una infografía, lo que indica que se utilizó una plantilla para crear las miles de imágenes que acompañan a los artículos.

Las imágenes son un componente importante de los artículos. Cada artículo presenta alrededor de siete imágenes que se relacionan con el tema general del artículo. Cada artículo contiene los colores de un arcoíris. No sé si las imágenes son intencionalmente brillantes y coloridas, pero el uso de colores fuertes es una buena opción estratégica para las imágenes porque aparecen en las SERP, Google Discover y Google SGE.

Subí una de las imágenes a ChatGPT y le pedí que generara un mensaje basado en la imagen para crear una nueva con el mismo estilo.

A continuación se muestra un ejemplo de una imagen generada por IA con el mismo estilo que los sitios de spam de IA:

Ejemplo de una imagen generada por IA utilizada por un sitio de spam

Relacionado: Más allá del SEO: John Mueller sobre imágenes generadas por IA

3 Todos los artículos siguen una plantilla rígida

Los artículos siguen una estructura tipo plantilla, que varía según el tipo de artículo. Los temas de los artículos van desde comparaciones, viajes a destinos locales, estilos de vida, recetas, beneficios para la salud de ciertos alimentos, etc.

Los artículos relacionados con la salud siguen esta estructura de plantilla:

a Introducción El tema conceptual puede ser un alimento en particular, un tipo de dieta, etc.

b Beneficios de la salud

C Fundamentos

d Orientación nutricional y nutrientes clave

mi Opciones dietéticas e impacto en la salud

F Consejos y consejos de estilo de vida

gramo Un resumen de los beneficios.

4 Mensaje subyacente para artículos generados por IA

Tenía curiosidad sobre cómo se vería un mensaje que genera ese contenido, así que le pedí a ChatGPT que creara uno.

Este es un mensaje generalizado que podría haberse utilizado para crear artículos sobre salud y dieta:

“Escriba un artículo que explore la conexión entre [concepto de elección dietética] y [enfoque de salud específico], siguiendo el siguiente modelo:

a Introducción: Comience presentando el concepto de [concepto de elección dietética], su definición y por qué es relevante para [enfoque de salud específico]. Beneficios de la salud: Fundamentos de [Tema de salud]: Nutrientes clave y su impacto: Resalte la importancia de ciertas vitaminas, minerales y otros compuestos. Influencia de las opciones dietéticas: Recomendar alimentos beneficiosos y desaconsejar determinados tipos que puedan perjudicar [enfoque específico de salud]. Consejos prácticos para la dieta y el estilo de vida: Esto podría incluir consejos sobre la preparación de comidas, el control de las porciones y el equilibrio de los diferentes tipos de alimentos. Un mensaje a utilizar para generar una conclusión: Asegúrese de que el artículo proporcione una descripción general completa que sea a la vez informativa y atractiva, dirigida a lectores interesados ​​en comprender la relación entre [el concepto de elección dietética] y [el enfoque de salud específico]”.

5 Contenido probado por herramientas de verificación de IA

Lo extraño de estos artículos es que cada artículo que probé con GPTZero AI Content Detector obtuvo una puntuación del 100% como generado por IA. El verificador de contenido Originality.AI ofreció puntuaciones similares. GPTZero AI Content Detector

Captura de pantalla de la puntuación GPTZero

Captura de pantalla de la puntuación Originality.AI

Las plantillas de Squarespace son profesionales y los artículos en sí tienen un estilo seco que es informativo pero carece de señales de autoría humana, como expresiones de conocimiento o experiencia, y una ausencia total de coloquialismos.

Relacionado: Software de detección de contenido generado por IA: ¿pueden detectar ChatGPT?

6 ¿Cómo se clasifican los sitios de spam de IA?

Mi hipótesis es que la razón por la que estos sitios de spam se clasifican es que están aprovechando una laguna en los algoritmos de Google que permite que el contenido nuevo reciba un impulso inicial, lo que John Mueller de Google ha descrito como Google probando el sitio o las páginas web. Esto sucede todo el tiempo y entusiasma a las personas cuando publican un sitio nuevo y lo ven clasificado casi de inmediato.

Lo que está sucediendo con este sitio web generado por IA es que publica cantidades masivas de páginas web todos los días y esas páginas reciben un impulso a la parte superior de las páginas de resultados del motor de búsqueda (SERP) durante las primeras 24 a 48 horas. Luego comienzan a deslizarse entre los diez primeros y, finalmente, a las segundas páginas de las SERP. Pero en ese momento, hay nuevas páginas que comienzan ese viaje desde el impulso inicial, todos los días. Esta es una estrategia clásica de la vieja escuela conocida como agitar y quemar.

John Mueller ha comentado en el pasado por qué Google clasifica los sitios web nuevos en la parte superior de los resultados de búsqueda.

Él explicó:

“In particular, with completely new websites, one of the difficulties that we have is we might not have a lot of signals for those websites so we have to make estimates.

And depending on how we make estimates, it can sometimes mean that in the beginning we show this website a little bit more visibly than like it turns out that the signals tell us in the end.

…But that can go both ways. It can go in the direction of like you’re shown very visibly in the beginning.

And it can also be that maybe you’re shown less visibly in the beginning and as we understand your website and how it fits in with the rest of the web then we can kind of adjust that.

…Sometimes it’s also new websites that show up that we try to pick up really quickly.”

“En particular, con sitios web completamente nuevos, una de las dificultades que tenemos es que es posible que no tengamos muchas señales para esos sitios web, por lo que tenemos que hacer estimaciones.

Y dependiendo de cómo hagamos estimaciones, a veces puede significar que al principio mostramos este sitio web de forma un poco más visible de lo que resulta que las señales nos dicen al final.

…Pero eso puede ser en ambos sentidos Puede ir en la dirección en la que te muestran muy visiblemente al principio.

Y también puede ser que tal vez se le muestre de manera menos visible al principio y, a medida que comprendamos su sitio web y cómo encaja con el resto de la web, podremos ajustarlo.

…A veces también aparecen nuevos sitios web que intentamos captar muy rápidamente”.

7 El spam de IA es un problema de larga data con Google

Google tiene un problema de larga data con los sitios generados por IA que dominan ciertos resultados de búsqueda y esta no es la primera vez que Google se ve abrumado por el spam. Este sitio de spam no es el único y no es un caso atípico.

Sospecho que solucionar las lagunas que permiten que ocurra este spam probablemente tenga consecuencias no deseadas que afecten negativamente a los sitios que no son spam y es por eso que Google no lo ha cerrado después de todos estos años.

Pero Google necesita hacer algo al respecto porque afecta a los autores expertos cuando sus sitios son superados por contenido no humano que carece de conocimientos y experiencia. Si no por el bien de los editores, entonces por el bien de ellos mismos, porque el público en general ya tiene la percepción de que Google no puede solucionar su problema de spam.

Lo que hace que este ejemplo sea digno de mención es que se publicó simultáneamente con la actualización de spam de Google y pasó sin verse afectado, burlándose de Google.

Ver también: ¿El algoritmo de Google odia el contenido de IA?

Imagen destacada de Shutterstock/ViDI Studio

Leer el articulo original en Search Engine Journal.

¡Danos un Voto!

¿Tienes una pregunta?

Luis Narciso
Sobre SEO
(Posicionamiento Web)

Frank Fajardo
Sobre Diseño Web, Anuncios, Diseño y Redes Sociales