Aquí hay seis cosas que debe saber sobre ChatGPT antes de usarlo para SEO y contenido
ChatGPT es un chatbot de inteligencia artificial que puede tomar direcciones y realizar tareas como escribir ensayos Hay numerosos problemas que debe comprender antes de tomar una decisión sobre cómo usarlo para contenido y SEO.
La calidad del contenido de ChatGPT es asombrosa, por lo que se debe abordar la idea de usarlo con fines de SEO.
Vamos a explorar.
Por qué ChatGPT puede hacer lo que hace
En pocas palabras, ChatGPT es un tipo de aprendizaje automático llamado Modelo de aprendizaje grande.
Un gran modelo de aprendizaje es una inteligencia artificial que se entrena con grandes cantidades de datos que pueden predecir cuál es la siguiente palabra en una oración.
Cuantos más datos reciba, más tipos de tareas podrá realizar (como escribir artículos).
A veces, los modelos de lenguaje grande desarrollan habilidades inesperadas.
La Universidad de Stanford escribe sobre cómo un aumento en los datos de entrenamiento permitió que GPT-3 tradujera texto del inglés al francés, aunque no estaba específicamente capacitado para realizar esa tarea.
Los modelos de idiomas grandes como GPT-3 (y GPT-3.5 que subyace a ChatGPT) no están capacitados para realizar tareas específicas.
Están capacitados con una amplia gama de conocimientos que luego pueden aplicar a otros dominios.
Esto es similar a cómo un humano aprende Por ejemplo, si un ser humano aprende los fundamentos de la carpintería, puede aplicar ese conocimiento para construir una mesa, aunque a esa persona nunca se le haya enseñado específicamente cómo hacerlo.
GPT-3 funciona de manera similar a un cerebro humano en el sentido de que contiene conocimientos generales que se pueden aplicar a múltiples tareas.
El artículo de la Universidad de Stanford sobre GPT-3 explica: Stanford University article
“Unlike chess engines, which solve a specific problem, humans are “generally” intelligent and can learn to do anything from writing poetry to playing soccer to filing tax returns.
In contrast to most current AI systems, GPT-3 is edging closer to such general intelligence…”
“A diferencia de los motores de ajedrez, que resuelven un problema específico, los humanos son “generalmente” inteligentes y pueden aprender a hacer cualquier cosa, desde escribir poesía hasta jugar fútbol y presentar declaraciones de impuestos.
En contraste con la mayoría de los sistemas de IA actuales, GPT-3 se está acercando a esa inteligencia general…”
ChatGPT incorpora otro gran modelo de lenguaje llamado InstructGPT, que fue entrenado para recibir instrucciones de humanos y respuestas largas a preguntas complejas.
Esta capacidad de seguir instrucciones hace que ChatGPT pueda tomar instrucciones para crear un ensayo sobre prácticamente cualquier tema y hacerlo de la forma especificada.
Puede escribir un ensayo dentro de las limitaciones como el recuento de palabras y la inclusión de puntos de temas específicos.
Seis cosas que debe saber sobre ChatGPT
ChatGPT puede escribir ensayos sobre prácticamente cualquier tema porque está capacitado en una amplia variedad de texto que está disponible para el público en general.
Sin embargo, existen limitaciones en ChatGPT que es importante conocer antes de decidir usarlo en un proyecto de SEO.
La mayor limitación es que ChatGPT no es confiable para generar información precisa La razón por la que es inexacto es porque el modelo solo predice qué palabras deben ir después de la palabra anterior en una oración en un párrafo sobre un tema determinado. No se preocupa por la precisión.
Esa debería ser una de las principales preocupaciones para cualquier persona interesada en crear contenido de calidad.
1 Programado para evitar ciertos tipos de contenido
Por ejemplo, ChatGPT está específicamente programado para no generar texto sobre temas de violencia gráfica, sexo explícito y contenido dañino, como instrucciones sobre cómo construir un artefacto explosivo.
2 Desconocedor de los acontecimientos actuales
Otra limitación es que no tiene conocimiento de ningún contenido que se cree después de 2021.
Entonces, si su contenido necesita estar actualizado y actualizado, es posible que ChatGPT en su forma actual no sea útil.
3 Tiene sesgos incorporados
Una limitación importante a tener en cuenta es que está capacitado para ser útil, veraz e inofensivo.
Esos no son solo ideales, son sesgos intencionales que están integrados en la máquina.
Parece que la programación es inofensiva y hace que la salida evite la negatividad.
Eso es algo bueno, pero también cambia sutilmente el artículo de uno que idealmente podría ser neutral.
Por así decirlo, uno tiene que tomar el volante y decirle explícitamente a ChatGPT que conduzca en la dirección deseada.
Aquí hay un ejemplo de cómo el sesgo cambia la salida.
Le pedí a ChatGPT que escribiera una historia al estilo de Raymond Carver y otra al estilo del escritor de misterio Raymond Chandler.
Ambas historias tenían finales optimistas que no eran característicos de ambos escritores.
Para obtener un resultado que cumpliera con mis expectativas, tuve que guiar a ChatGPT con instrucciones detalladas para evitar finales optimistas y para que el final al estilo de Carver evitara una resolución de la historia, porque así es como a menudo se desarrollaban las historias de Raymond Carver.
El punto es que ChatGPT tiene sesgos y que uno debe ser consciente de cómo pueden influir en el resultado.
4 ChatGPT requiere instrucciones muy detalladas
ChatGPT requiere instrucciones detalladas para generar un contenido de mayor calidad que tenga más posibilidades de ser muy original o adoptar un punto de vista específico.
Cuantas más instrucciones se le den, más sofisticado será el resultado.
Esto es tanto una fortaleza como una limitación a tener en cuenta.
Cuantas menos instrucciones haya en la solicitud de contenido, más probable es que la salida comparta una salida similar con otra solicitud.
Como prueba, copié la consulta y el resultado que varias personas publicaron en Facebook.
Cuando le hice a ChatGPT exactamente la misma consulta, la máquina produjo un ensayo completamente original que seguía una estructura similar.
Los artículos eran diferentes pero compartían la misma estructura y tocaban subtemas similares pero con palabras 100% diferentes.
ChatGPT está diseñado para elegir palabras completamente aleatorias al predecir cuál debería ser la siguiente palabra en un artículo, por lo que tiene sentido que no se plage a sí mismo.
Pero el hecho de que solicitudes similares generen artículos similares resalta las limitaciones de simplemente pedir «dame esto». ”
5 ¿Se puede identificar el contenido de ChatGPT?
Los investigadores de Google y otras organizaciones han trabajado durante muchos años en algoritmos para detectar con éxito contenido generado por IA.
Hay muchos trabajos de investigación sobre el tema y mencionaré uno de marzo de 2022 que usó resultados de GPT-2 y GPT-3.
El trabajo de investigación se titula Robustez contradictoria de las características neuronales y estadísticas en la detección de transformadores generativos (PDF).
Los investigadores estaban probando para ver qué tipo de análisis podía detectar contenido generado por IA que empleaba algoritmos diseñados para evadir la detección.
Probaron estrategias como utilizar algoritmos BERT para sustituir palabras por sinónimos, otro que añadía faltas de ortografía, entre otras estrategias.
Lo que descubrieron es que algunas características estadísticas del texto generado por IA, como las puntuaciones del índice Gunning-Fog y del índice Flesch, eran útiles para predecir si un texto fue generado por computadora, incluso si ese texto había usado un algoritmo diseñado para evadir la detección.
6 Marca de agua invisible
De mayor interés es que los investigadores de OpenAI han desarrollado marcas de agua criptográficas que ayudarán en la detección de contenido creado a través de un producto de OpenAI como ChatGPT.
Un artículo reciente llamó la atención sobre una discusión de un investigador de OpenAI que está disponible en un video titulado Scott Aaronson Talks AI Safety. article
El investigador afirma que las prácticas éticas de IA, como las marcas de agua, pueden evolucionar hasta convertirse en un estándar de la industria de la misma manera que Robots.txt se convirtió en un estándar para el rastreo ético.
Él afirmó:
“…we’ve seen over the past 30 years that the big Internet companies can agree on certain minimal standards, whether because of fear of getting sued, desire to be seen as a responsible player, or whatever else.
One simple example would be robots.txt: if you want your website not to be indexed by search engines, you can specify that, and the major search engines will respect it.
In a similar way, you could imagine something like watermarking—if we were able to demonstrate it and show that it works and that it’s cheap and doesn’t hurt the quality of the output and doesn’t need much compute and so on—that it would just become an industry standard, and anyone who wanted to be considered a responsible player would include it.”
“…hemos visto durante los últimos 30 años que las grandes empresas de Internet pueden ponerse de acuerdo sobre ciertos estándares mínimos, ya sea por temor a ser demandados, por el deseo de ser vistos como un jugador responsable, o por cualquier otra cosa.
Un ejemplo simple sería robots.txt: si desea que su sitio web no sea indexado por los motores de búsqueda, puede especificarlo y los principales motores de búsqueda lo respetarán.
De manera similar, podría imaginar algo como la marca de agua, si pudiéramos demostrarlo y mostrar que funciona y que es barato y no daña la calidad de la salida y no necesita mucha computación, etc.
La marca de agua que desarrolló el investigador se basa en una criptografía Cualquiera que tenga la clave puede probar un documento para ver si tiene la marca de agua digital que muestra que fue generado por una IA.
El código puede ser en forma de cómo se usa la puntuación o en la elección de palabras, por ejemplo.
Explicó cómo funciona la marca de agua y por qué es importante:
“My main project so far has been a tool for statistically watermarking the outputs of a text model like GPT.
Basically, whenever GPT generates some long text, we want there to be an otherwise unnoticeable secret signal in its choices of words, which you can use to prove later that, yes, this came from GPT.
We want it to be much harder to take a GPT output and pass it off as if it came from a human.
This could be helpful for preventing academic plagiarism, obviously, but also, for example, mass generation of propaganda—you know, spamming every blog with seemingly on-topic comments supporting Russia’s invasion of Ukraine, without even a building full of trolls in Moscow.
Or impersonating someone’s writing style in order to incriminate them.
These are all things one might want to make harder, right?”
“Hasta ahora, mi proyecto principal ha sido una herramienta para marcar con agua estadísticamente los resultados de un modelo de texto como GPT.
Básicamente, cada vez que GPT genera un texto largo, queremos que haya una señal secreta imperceptible en sus elecciones de palabras, que puede usar para demostrar más tarde que sí, esto proviene de GPT.
Queremos que sea mucho más difícil tomar una salida GPT y hacerla pasar como si viniera de un ser humano.
Esto podría ser útil para prevenir el plagio académico, obviamente, pero también, por ejemplo, la generación masiva de propaganda, ya sabes, enviar spam a cada blog con comentarios aparentemente sobre el tema que apoyan la invasión rusa de Ucrania, sin siquiera un edificio lleno de trolls en Moscú.
O hacerse pasar por el estilo de escritura de alguien para incriminarlo.
Estas son todas las cosas que uno podría querer hacer más difíciles, ¿verdad?
El investigador compartió que la marca de agua derrota los esfuerzos algorítmicos para evadir la detección.
¿Debe utilizar IA para fines de SEO?
El contenido de IA es detectable
Mucha gente dice que Google no tiene forma de saber si el contenido se generó con IA.
No puedo entender por qué alguien tendría esa opinión porque detectar IA es un problema que más o menos ya se ha resuelto.
Incluso se puede detectar el contenido que implementa algoritmos anti-detección (como se indica en el trabajo de investigación al que vinculé anteriormente).
La detección de contenido generado por máquinas ha sido un tema de investigación desde hace muchos años, incluida la investigación sobre cómo detectar contenido que se tradujo de otro idioma.
¿El contenido generado automáticamente viola las pautas de Google?
John Mueller de Google en abril de 2022 dijo que el contenido generado por IA viola las pautas de Google.
“For us these would, essentially, still fall into the category of automatically generated content which is something we’ve had in the Webmaster Guidelines since almost the beginning.
And people have been automatically generating content in lots of different ways. And for us, if you’re using machine learning tools to generate your content, it’s essentially the same as if you’re just shuffling words around, or looking up synonyms, or doing the translation tricks that people used to do. Those kind of things.
My suspicion is maybe the quality of content is a little bit better than the really old school tools, but for us it’s still automatically generated content, and that means for us it’s still against the Webmaster Guidelines. So we would consider that to be spam.”
“Para nosotros, estos, esencialmente, aún caerían en la categoría de contenido generado automáticamente, que es algo que hemos tenido en las Pautas para webmasters desde casi el principio.
Y la gente ha estado generando contenido automáticamente de muchas maneras diferentes. Y para nosotros, si está utilizando herramientas de aprendizaje automático para generar su contenido, es esencialmente lo mismo que si simplemente estuviera mezclando palabras, buscando sinónimos o haciendo los trucos de traducción que la gente solía hacer. Ese tipo de cosas.
Mi sospecha es que tal vez la calidad del contenido sea un poco mejor que las herramientas de la vieja escuela, pero para nosotros todavía es contenido generado automáticamente, y eso significa que para nosotros todavía está en contra de las Pautas para webmasters. Así que lo consideraríamos spam”.
Google actualizó recientemente la sección de contenido «generado automáticamente» de su página de desarrollador sobre el spam.
Creado en octubre de 2022, se actualizó a finales de noviembre de 2022.
Los cambios reflejan una aclaración sobre lo que hace que el contenido generado automáticamente sea spam.
Inicialmente decía esto: said this
“Automatically generated (or “auto-generated”) content is content that’s been generated programmatically without producing anything original or adding sufficient value;”
“El contenido generado automáticamente (o “generado automáticamente”) es contenido que se ha generado mediante programación sin producir nada original ni agregar suficiente valor;”
Google actualizó esa oración para incluir la palabra «spammy»:
“Spammy automatically generated (or “auto-generated”) content is content that’s been generated programmatically without producing anything original or adding sufficient value;”
“El contenido de spam generado automáticamente (o “autogenerado”) es contenido que se ha generado mediante programación sin producir nada original ni agregar suficiente valor;”
Ese cambio parece aclarar que el hecho de que el contenido se genere automáticamente no lo convierte en spam. Es la falta de todo el valor agregado y las cualidades generales de «spam» lo que hace que ese contenido sea problemático.
ChatGPT puede contener en algún momento una marca de agua
Por último, el investigador de OpenAI dijo (unas semanas antes del lanzamiento de ChatGPT) que la marca de agua «con suerte» llegaría en la próxima versión de GPT.
Por lo tanto, ChatGPT puede actualizarse en algún momento con una marca de agua, si aún no tiene una marca de agua.
El mejor uso de la IA para SEO
El mejor uso de las herramientas de IA es escalar el SEO de una manera que haga que un trabajador sea más productivo Eso generalmente consiste en dejar que la IA haga el tedioso trabajo de investigación y análisis.
Resumir páginas web para crear una meta descripción podría ser un uso aceptable, ya que Google dice específicamente que no va en contra de sus pautas. Google specifically says
Usar ChatGPT para generar un esquema o un resumen de contenido puede ser un uso interesante.
Transferir la creación de contenido a una IA y publicarlo tal como está podría no ser el uso más efectivo de la IA si no se revisa primero su calidad, precisión y utilidad.
Imagen destacada de Shutterstock/Roman Samborskyi
Leer el articulo original en Search Engine Journal.