Resúmenes de IA de Google = ¿Robo?

La nueva y audaz visión de Google para el futuro de las búsquedas en línea, impulsada por tecnología de inteligencia artificial, está alimentando una reacción en toda la industria por temor a que pueda dañar el ecosistema abierto de Internet.

En el centro de la controversia se encuentran las “Resúmenes de IA” recientemente lanzadas por Google, que son resúmenes generados que apuntan a responder directamente consultas de búsqueda extrayendo información de toda la web.

Las descripciones generales de IA aparecen de manera destacada en la parte superior de las páginas de resultados, lo que potencialmente limita la necesidad de los usuarios de hacer clic en los sitios web de los editores.

La medida provocó acciones legales en Francia, donde los editores presentaron casos acusando a Google de violar los derechos de propiedad intelectual al ingerir su contenido para entrenar modelos de inteligencia artificial sin permiso.

Un grupo de editores franceses ganó una batalla judicial temprana en abril de 2024 Un juez ordenó a Google negociar una compensación justa por reutilizar fragmentos de su contenido. court battle

Los editores en los EE. UU. están planteando objeciones similares a medida que las nuevas descripciones generales de búsqueda de inteligencia artificial de Google amenazan con desviar el tráfico de las fuentes. Argumentan que Google se beneficia injustamente del contenido de otros.

El debate destaca la necesidad de marcos actualizados que regulen el uso de datos en línea en la era de la IA.

Preocupaciones de los editores

Según los observadores de la industria, las implicaciones de las resúmenes de IA podrían afectar a millones de creadores independientes que dependen del tráfico de referencias de la Búsqueda de Google.

Frank Pine, editor ejecutivo de MediaNews Group, le dice a The Washington Post: The Washington Post

“If journalists did that to each other, we’d call that plagiarism.”

«Si los periodistas se hicieran eso entre sí, lo llamaríamos plagio».

La empresa de Pine, que publica el Denver Post y el Boston Herald, se encuentra entre las que demandan a OpenAI por supuestamente extraer artículos protegidos por derechos de autor para entrenar sus modelos lingüísticos. suing

El modelo de ingresos de Google se ha basado durante mucho tiempo en dirigir el tráfico a otros sitios web y monetizar ese flujo a través de canales de publicidad paga.

Las revisiones de la IA amenazan con cambiar ese modelo de ingresos.

Kimber Matherne, que dirige un blog de comida, es citada en el artículo que dice:

“[Google’s] goal is to make it as easy as possible for people to find the information they want. But if you cut out the people who are the lifeblood of creating that information, then that’s a disservice to the world.”

“El objetivo [de Google] es hacer que a las personas les resulte lo más fácil posible encontrar la información que buscan. Pero si se excluye a las personas que son el alma que crea esa información, entonces eso no le hace ningún favor al mundo”.

Según el informe del Post, Raptive, una empresa de servicios publicitarios, estima que los cambios podrían provocar una pérdida de ingresos de 2 mil millones de dólares para los creadores en línea.

También creen que algunos sitios web podrían perder dos tercios de su tráfico de búsqueda.

El director ejecutivo de Raptive, Michael Sánchez, le dice a The Post:

“What was already not a level playing field could tip its way to where the open internet starts to become in danger of surviving.”

“Lo que ya no era un campo de juego nivelado podría inclinarse hacia donde la Internet abierta comience a correr peligro de sobrevivir”.

Preocupaciones de los profesionales de la industria

Es comprensible que las descripciones generales de la IA de Google estén generando preocupaciones entre los profesionales de la industria, como se expresa en numerosos tweets que critican la medida.

Matt Gibbs cuestionó cómo Google desarrolló la base de conocimientos para su IA y afirmó sin rodeos: «Estafaron a los editores que hicieron el trabajo real para crear el conocimiento». Google son una panda de ladrones”.

Desde la parte superior del artículo de hoy «IA generativa en la búsqueda» de Google.

¿Cómo desarrollaron esa base de conocimientos?

Se lo estafaron a los editores que hicieron el trabajo real para crear el conocimiento.

Google son una panda de ladrones. pic.twitter.com/SIkPqtWZwa pic.twitter.com/SIkPqtWZwa

– Matt Gibbs (@ematt) 14 de mayo de 2024 May 14, 2024

En su tweet, Kristine Schachinger se hizo eco de sentimientos similares, refiriéndose a las respuestas de inteligencia artificial de Google como «un completo motor de robo digital que impedirá que los sitios reciban clics».

.@sundarpichai y @Google lanzan respuestas de IA en #GoogleIO2024, también conocido como un completo motor de robo digital que evitará que los sitios reciban clics. @sundarpichai

Necesitamos que el gobierno intervenga ahora y presione para traer la luz del sol.

Esta es UNA RESPUESTA AI Haga clic en él pic.twitter.com/5NNtKAURxC pic.twitter.com/5NNtKAURxC

– Kristine (@schachin en Threads) 🇺🇦 (@schachin) 14 de mayo de 2024 May 14, 2024

Gareth Boyd retuiteó una cita del artículo del Washington Post que destaca las luchas del blogger Jake Boly, cuyo sitio recientemente experimentó una caída del 96% en el tráfico de Google.

Boyd dijo: «El precedente que están sentando OpenAI y Google es aterrador…» y que «más personas deberían estar igualmente enojadas» con ambas empresas por el «robo abierto de contenido».

El precedente que están sentando OpenAI y Google es aterrador… más personas deberían estar igualmente enojadas con OpenAI y con Google por el robo abierto de contenido.

Para ser claros, ODIO la regulación, pero cuando la IA esté correctamente regulada, será demasiado tarde. https://t.co/KsbNUKopeV https://t.co/KsbNUKopeV

– Gareth Boyd (@garethaboyd) 15 de mayo de 2024 May 15, 2024

En su tweet, Avram Piltch acusó directamente a Google de robo y afirmó que «los datos utilizados para entrenar su IA provienen de los mismos editores que permitieron a Google rastrearlos y ahora se verán perjudicados». Esto es un robo, simple y llanamente. Y es una amenaza para el futuro de la web”.

Se puede decir que Google no «debe» nada a los editores, pero los datos utilizados para entrenar su IA provienen de los mismos editores que permitieron a Google rastrearlos y ahora se verán perjudicados. Esto es un robo, simple y llanamente. Y es una amenaza para el futuro de la web. https://t.co/buDZgRaSuL https://t.co/buDZgRaSuL

– Avram Piltch (@geekinchief) 15 de mayo de 2024 May 15, 2024

Lily Ray hizo una afirmación similar sobre Google: “Usando todo el contenido que tomaron de los sitios que crearon Google Con poca o ninguna atribución o tráfico”.

Usando todo el contenido que tomaron de los sitios que crearon Google Con poca o ninguna atribución o tráfico https://t.co/0sNwk2ASmT https://t.co/0sNwk2ASmT

– Lily Ray 😏 (@lilyraynyc) 14 de mayo de 2024 May 14, 2024

Área gris legal

La controversia se suma a debates más amplios sobre la propiedad intelectual y el uso legítimo, ya que los sistemas de inteligencia artificial se entrenan en escalas de datos sin precedentes recopilados en Internet.

Google argumenta que sus modelos sólo ingieren datos web disponibles públicamente y que los editores anteriormente se beneficiaban del tráfico de búsqueda.

Los editores dan su consentimiento implícito a que los motores de búsqueda indexen su contenido a menos que opten por no hacerlo.

Sin embargo, las leyes no se concibieron teniendo en mente el entrenamiento de modelos de IA.

¿Cuál es el camino a seguir?

Este debate destaca la necesidad de nuevas reglas sobre cómo la IA utiliza los datos en línea.

El camino a seguir no está claro, pero hay mucho en juego.

Algunos sugieren compartir ingresos o pagar licencias cuando el contenido del editor se utiliza para entrenar modelos de IA. Otros proponen un sistema de suscripción voluntaria que brinde a los propietarios de sitios web más control sobre cómo se utiliza su contenido para la capacitación en IA.

Los fallos franceses sugieren que los tribunales pueden intervenir sin directrices explícitas ni negociaciones de buena fe.

La web siempre se ha basado en un equilibrio entre motores de búsqueda y creadores de contenido. Si ese equilibrio se altera sin nuevas salvaguardias, podría socavar el intercambio de información que hace que Internet sea tan valiosa.

Imagen de portada: Veroniksha/Shutterstock

Leer el articulo original en Search Engine Journal.

¡Danos un Voto!

¿Tienes una pregunta?

Luis Narciso
Sobre SEO
(Posicionamiento Web)

Frank Fajardo
Sobre Diseño Web, Anuncios, Diseño y Redes Sociales