Generación automatizada de contenido para SEO: posibilidades y trampas de GPT-3

  • HatumSEO
  • Contenido
  • Generación automatizada de contenido para SEO: posibilidades y trampas de GPT-3

Los modelos lingüísticos tienen mucho potencial para el marketing. Vea cómo GPT-3 puede ayudar con la generación automatizada de contenido para SEO.

Desde la llegada de GPT-3, los generadores de contenido han multiplicado los casos de uso para SEO. Parece que se necesita una actualización bimensual para revisar los nuevos avances en el campo de los modelos lingüísticos.

En primer lugar, a fines de 2021, el gran club de modelos de idiomas creció significativamente.

Cada país ha tratado de mostrar sus tecnologías y hacerlas accesibles a través de trabajos de investigación y demostraciones públicas o privadas.

Aquí están los principales competidores en la carrera:

  • EE. UU.: OpenAI – Turing NLG.
  • China: Wu Dao 2.0 – PanGu-Alpha.
  • Corea del Sur: HyperCLOVA.
  • Israel: A121 (Jurásico-1).
  • Europa: Aleph Alfa.
  • Fuente abierta: EleutherAI.

Cada modelo tiene sus puntos fuertes y débiles.

Para probarlos, muchos editores de software de SEO o agencias de SEO ahora están probando estos modelos.

¿Cómo elegir un modelo GPT-3?

Puedes pensar que cuantos más parámetros tenga el modelo, mejor será (Nota del editor: un parámetro corresponde a un concepto aprendido por la IA).

Pero estarías equivocado.

El criterio número uno no es en absoluto el número de parámetros, porque se pueden obtener grandes resultados con modelos más ligeros.

Más bien, son los datos sobre los que se entrenó el modelo.

De hecho, para ser efectivo, un modelo debe ser capaz de comprender una gran cantidad de dominios dispares.

Lo primero que debe hacer es averiguar cómo se entrenó el modelo.. Para GPT-3, el siguiente diagrama ayuda:

GPT-3 diagram.

Podemos ver que GPT-3 se entrenó principalmente con datos de:

  • Archivo web entre 2016 y 2019.
  • WebText, que corresponde a las recuperaciones de datos en la web.
  • Wikipedia.
  • Libros en inglés (Libros1)
  • Libros en otros idiomas (Libros2).

Ahora, si observamos cómo se entrenan los modelos de código abierto, vemos que las fuentes son bastante diferentes.

Sources based on the project The Pile.

Todo se basa en el proyecto The Pile, que es un conjunto de datos de 825 GB de textos diversificados en inglés que son gratuitos y accesibles al público.

Con The Pile encontramos datos muy variados como libros, repositorios de GitHub, páginas web, revistas de discusión, artículos de medicina, física, matemáticas, informática y filosofía.

En general, será importante probar el modelo de lenguaje en su idioma y especialmente en el vocabulario específico de su sitio web.

Antes de ver casos de uso específicos de SEO, veamos las trampas.

Trampas de generación de contenido GPT-3 para SEO

Para generar textos cualitativos que interesen a tus usuarios, es importante conocer los escollos a evitar.

En primer lugar, sea cual sea el modelo que elijas, debes proporcionarle ejemplos de calidad como entrada para que pueda imitarlos y, sobre todo, respetar un tipo de texto concreto.

Si le pide a un modelo de lenguaje que genere contenido sobre «plomeros de Nueva York», el modelo tomará varios caminos, a menudo inadecuados:

  • ¿Debería crear un directorio inventado?
  • ¿Debería crear contenido sobre un plomero de Nueva York?
  • ¿Debería crear un diálogo entre fontaneros en París?
  • ¿Quizás un poema sobre la plomería en Nueva York?

En definitiva, el modelo se perderá.

En segundo lugar, los modelos de lenguaje no manejan contenido duplicado en absoluto.

Por lo tanto, sea cual sea el texto que genere, tendrá que utilizar una herramienta de terceros para comprobar que el modelo no ha duplicado algo que ha aprendido y, más concretamente, que el texto no existe y que es único.

Hay muchas herramientas disponibles para confirmar si su contenido es único. Si no es así, simplemente regenere el contenido.

Además, las plantillas de generación de contenido no optimizan el texto para la búsqueda en absoluto.

Nuevamente, están capacitados en una amplia variedad de fuentes, por lo que deberá guiarlos con todas las herramientas semánticas que existen en el mercado.

También puede pedirles que enfaticen las palabras clave y que expliquen sus conceptos con más detalle.

Finalmente, el modelo puede inventar datos. De hecho, los modelos tienen un escenario de creatividad.

Si el modelo está configurado para permitir una alta creatividad, a veces puede inventar características para un objeto, por ejemplo, que pueden generar inconsistencias en sus textos.

Casos de uso de generación de contenido para SEO

Durante los últimos ocho meses, he estado probando muchos casos de uso de generación de contenido diferentes.

Con plantillas gratuitas como GPT-Neo y GPT-J, hemos obtenido muy buenos resultados en los siguientes casos de uso:

  • Extracción de conceptos (extracción de lugares, personas, etc.).
  • Extracción de preguntas de un texto.
  • Respuestas a preguntas basadas en un texto.

Por otro lado, con un modelo pago como GPT-3 con precios accesibles, no solo hemos logrado generar textos largos y específicos sino también crear resúmenes textuales sofisticados.

Sophisticated textual summaries in OpenAI.

La imagen no es fácil de leer, pero muestra los ejemplos de entrada que se dan en negrita, luego el texto generado por el modelo que está en cursiva.

Aquí, el objetivo es crear un texto de incentivo para que la gente quiera comprar un producto.

GPT-3 entiende perfectamente el tono y la longitud requeridos del texto e incluye las palabras que se utilizarán. ¡El texto se genera en menos de 10 segundos!

Aquí está el texto generado:

Déjate llevar por tus sueños de infancia. ¿Todavía recuerdas tu primer videojuego? . ¡Puedes jugar con otro jugador en el camino a través de las consolas Nintendo DS, PlayStation o Xbox!

Con Nintendo Switch, prueba juegos divertidos como Mario Kart 8 Deluxe: enfréntate a tus rivales y disfruta de aventuras mágicas con Mario, Zelda y otros personajes.. Disfruta de una increíble variedad de juegos AAA;

Xbox también ofrece acceso ilimitado a aplicaciones de entretenimiento como Netflix y Youtube por poco dinero. Ya sea que elija PS4, xbox o el nuevo Nintendo Switch, será fácil conectarse con familiares o amigos a través de aplicaciones como Skype para pasar un buen rato con sus amigos.

¡Asegúrate de no perderte esta oportunidad!

Por supuesto, aún se requiere corrección para mejorar el texto, pero esta tecnología ahorra mucho tiempo y permite que los humanos se concentren en problemas de alto valor agregado.

Pasemos a dos revoluciones en la generación de contenidos.

Dos revoluciones para el SEO

Antes, es posible que GPT-3 no haya podido generar contenido específico porque no estaba capacitado para hacerlo, como vimos anteriormente.

Ahora, tiene la capacidad de volver a entrenar el modelo.

Simplemente déle entre 20 y 100 ejemplos con sus instrucciones como entrada y la finalización ideal que desea que produzca como salida:

{"prompt":"CTA:\n\nsubject: smartphone\n\n words: smartphone, Samsung, mobile phones, Xiaomi, Samsung, Apple, Huawei, Sony, iPhone, intelligent mobile phones, Android\n\n ","completion":"Looking for a new smartphone? You've shortlisted a Samsung Galaxy or a Huawei model, but you haven't made a decision yet? Choose a smartphone in our product range and enjoy the best of the new mobile phones at an unbeatable price! You're guaranteed to find a smartphone at the best price, so don't miss out! It's never easy to find the best option among a multitude of smartphones: Xiaomi, Samsung, Apple, Huawei, Sony, or even Honor. Smartphones - intelligent mobile phones - aren't just synonymous with Apple's iPhone, but include many models. Smartphones using the Android operating system are the most common."}

La operación requiere mucho tiempo, pero luego tiene una plantilla optimizada que se adapta a su caso de uso, especialmente si necesita usar un vocabulario específico para un nicho, industria o tema en particular al optimizar su SEO.

Esto toma solo dos líneas de código Python. La parte que consume más tiempo es, por supuesto, crear este archivo de ejemplo.

Example file on OpenAI.

Finalmente, pasemos al último tema que me entusiasmó especialmente este mes: ¡generación de código!

De hecho, se ha lanzado una nueva tecnología donde damos instrucciones y el nuevo motor OpenAI Codex es capaz de generar código Python para resolver nuestros problemas.

Comencemos señalando que estos son problemas simples: no puede reemplazar a los desarrolladores porque necesitaríamos proporcionar a la IA todo el código configurado, así como todas las restricciones técnicas.

Por otro lado, desde un punto de vista pedagógico y especialmente en un enfoque sin código, es genial poder pedirle que se conecte a una fuente de datos (Mysql, Excel, CSV, API, etc.) y generar el

Fetching the NASA log file for one day.

Aquí hay un mini ejemplo en el que busco el archivo de registro de la NASA para el día 1 de agosto de 1995 y pido un gráfico de barras con el número total de URL visitadas en la hora.

Luego, con un sencillo editor de texto, puedes ver el resultado copiando y pegando el código.

Para llevar el concepto sin código aún más lejos, estoy preparando una aplicación web en la que todo estará controlado por texto.

El único límite en el uso de modelos de lenguaje en SEO es tu imaginación. Sin duda, puede crear un tablero de SEO completo de esta manera al desglosar cada una de las vistas que desea, paso a paso.

Los modelos lingüísticos todavía tienen muchas sorpresas guardadas y hay muchos usos nuevos para el marketing.

Más recursos:

Imagen destacada: Jugo vectorial/Shutterstock

Leer el articulo original en Search Engine Journal.

¡Danos un Voto!

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

¿Tienes una pregunta?

Luis Narciso
Sobre SEO
(Posicionamiento Web)

Frank Fajardo
Sobre Diseño Web, Anuncios, Diseño y Redes Sociales