Contenidos
Aprenda cómo la herramienta Vision de Google clasifica las imágenes a escala y cómo puede usarla para ver la forma en que Google interpreta sus imágenes.
Google ofrece una herramienta de clasificación de imágenes de IA que analiza las imágenes para clasificar el contenido y asignarles etiquetas.
La herramienta pretende ser una demostración de Google Vision, que puede escalar la clasificación de imágenes de forma automática, pero puede usarse como una herramienta independiente para ver cómo un algoritmo de detección de imágenes ve sus imágenes y para qué son relevantes. Google Vision
Incluso si no usa la API de Google Vision para escalar la detección y clasificación de imágenes, la herramienta proporciona una vista interesante de lo que son capaces de hacer los algoritmos relacionados con imágenes de Google, lo que hace que sea interesante cargar imágenes para ver cómo las clasifica el algoritmo Vision de Google.
Esta herramienta demuestra los algoritmos de inteligencia artificial y aprendizaje automático de Google para comprender imágenes.
Es parte del conjunto de API Cloud Vision de Google que ofrece modelos de aprendizaje automático de visión para aplicaciones y sitios web. Cloud Vision API suite
¿La herramienta Cloud Vision refleja el algoritmo de Google?
Este es solo un modelo de aprendizaje automático y no un algoritmo de clasificación.
Por lo tanto, no es realista usar esta herramienta y esperar que refleje algo sobre el algoritmo de clasificación de imágenes de Google.
Sin embargo, es una gran herramienta para comprender cómo los algoritmos de inteligencia artificial y aprendizaje automático de Google pueden comprender las imágenes, y ofrecerá una perspectiva educativa sobre qué tan avanzados son los algoritmos relacionados con la visión de la actualidad.
La información proporcionada por esta herramienta se puede utilizar para comprender cómo una máquina puede entender de qué se trata una imagen y posiblemente proporcionar una idea de la precisión con la que esa imagen se ajusta al tema general de una página web.
¿Por qué es útil una herramienta de clasificación de imágenes?
Las imágenes pueden desempeñar un papel importante en la visibilidad de la búsqueda y el CTR de las diversas formas en que el contenido de la página web aparece en Google.
Los visitantes potenciales del sitio que están investigando un tema usan imágenes para navegar al contenido correcto.
Por lo tanto, el uso de imágenes atractivas que sean relevantes para las consultas de búsqueda puede, en ciertos contextos, ser útil para comunicar rápidamente que una página web es relevante para lo que busca una persona.
La herramienta Google Vision proporciona una manera de comprender cómo un algoritmo puede ver y clasificar una imagen en términos de lo que hay en la imagen.
Las pautas de Google para el SEO de imágenes recomiendan: guidelines
“High-quality photos appeal to users more than blurry, unclear images. Also, sharp images are more appealing to users in the result thumbnail and increase the likelihood of getting traffic from users.”
“Las fotos de alta calidad atraen más a los usuarios que las imágenes borrosas y poco claras Además, las imágenes nítidas son más atractivas para los usuarios en la miniatura de resultados y aumentan la probabilidad de obtener tráfico de los usuarios”.
Si la herramienta Vision tiene problemas para identificar de qué se trata la imagen, eso puede ser una señal de que los visitantes potenciales del sitio también pueden tener los mismos problemas y decidir no visitar el sitio.
¿Qué es la herramienta de imágenes de Google?
La herramienta es una forma de demostrar la API Cloud Vision de Google.
La API de Cloud Vision es un servicio que permite que las aplicaciones y los sitios web se conecten a la herramienta de aprendizaje automático, proporcionando servicios de análisis de imágenes que se pueden escalar.
La herramienta independiente en sí le permite cargar una imagen y le dice cómo la interpreta el algoritmo de aprendizaje automático de Google.
La página de Google Cloud Vision describe cómo se puede usar el servicio de esta manera: describes
“Cloud Vision allows developers to easily integrate vision detection features within applications, including image labeling, face and landmark detection, optical character recognition (OCR), and tagging of explicit content.”
“Cloud Vision permite a los desarrolladores integrar fácilmente las funciones de detección de visión dentro de las aplicaciones, incluido el etiquetado de imágenes, la detección de rostros y puntos de referencia, el reconocimiento óptico de caracteres (OCR) y el etiquetado de contenido explícito”.
Estas son cinco formas en que las herramientas de análisis de imágenes de Google clasifican las imágenes cargadas:
Caras
La pestaña «rostros» proporciona un análisis de la emoción expresada por la imagen.
La precisión de este resultado es bastante precisa.
La imagen de abajo es una persona descrita como confundida, pero eso no es realmente una emoción.
La IA describe la emoción expresada en el rostro como sorpresa, con una puntuación de confianza del 96 %.
Objetos
La pestaña «objetos» muestra qué objetos hay en la imagen, como anteojos, persona, etc.
La herramienta identifica con precisión caballos y personas.
Etiquetas
La pestaña «etiquetas» muestra detalles sobre la imagen que Google reconoce, como orejas y boca, pero también aspectos conceptuales como retrato y fotografía.
Esto es particularmente interesante porque muestra cuán profundamente la IA de imágenes de Google puede comprender lo que hay en una imagen.
¿Google usa eso como parte del algoritmo de clasificación?
Propiedades
Las propiedades son los colores utilizados en la imagen.
En la superficie, el objetivo de esta herramienta no es obvio y puede parecer que no tiene utilidad.
Pero en realidad, los colores de una imagen pueden ser muy importantes, particularmente para una imagen destacada.
Las imágenes que contienen una gama muy amplia de colores pueden ser una indicación de una imagen mal elegida con un tamaño inflado, que es algo a tener en cuenta.
Otra información útil sobre las imágenes y el color es que las imágenes con una gama de colores más oscura tienden a generar archivos de imagen más grandes.
En términos de SEO, la sección Propiedad puede ser útil para identificar imágenes en todo un sitio web que se pueden cambiar por otras que tengan un tamaño menos hinchado.
Además, los rangos de color para las imágenes destacadas que están apagadas o incluso en escala de grises pueden ser algo a tener en cuenta porque las imágenes destacadas que carecen de colores vivos tienden a no aparecer en las redes sociales, Google Discover y Google News.
Por ejemplo, las imágenes destacadas que son vívidas se pueden escanear fácilmente y posiblemente recibir una tasa de clics (CTR) más alta cuando se muestran en los resultados de búsqueda o en Google Discover, ya que llaman la atención mejor que las imágenes silenciadas y desvanecidas.
Hay muchas variables que pueden afectar el rendimiento de CTR de las imágenes, pero esto proporciona una forma de ampliar el proceso de auditoría de las imágenes de un sitio web completo.
eBay realizó un estudio de imágenes de productos y CTR y descubrió que las imágenes con colores de fondo más claros tendían a tener un CTR más alto. study of product images
Los investigadores de eBay señalaron:
“In this paper, we find that the product image features can have an impact on user search behavior.
We find that some image features have correlation with CTR in a product search engine and that that these features can help in modeling click through rate for shopping search applications.
This study can provide sellers with an incentive to submit better images for products that they sell.”
“En este documento, encontramos que las características de la imagen del producto pueden tener un impacto en el comportamiento de búsqueda del usuario.
Descubrimos que algunas características de la imagen tienen una correlación con el CTR en un motor de búsqueda de productos y que estas características pueden ayudar a modelar la tasa de clics para las aplicaciones de búsqueda de compras.
Este estudio puede proporcionar a los vendedores un incentivo para enviar mejores imágenes de los productos que venden”.
Como anécdota, el uso de colores vivos para las imágenes destacadas podría ser útil para aumentar el CTR de los sitios que dependen del tráfico de Google Discover y Google News.
Obviamente, hay muchos factores que afectan el CTR de Google Discover y Google News. Pero una imagen que se destaque de las demás puede ser útil.
Entonces, por esa razón, usar la herramienta Vision para comprender los colores utilizados puede ser útil para una auditoría de imágenes a escala.
Búsqueda segura
Safe Search muestra cómo se clasifica la imagen para contenido no seguro Las descripciones de las imágenes potencialmente no seguras son las siguientes:
- Adulto.
- Parodia.
- Médico.
- Violencia.
- Picante.
La búsqueda de Google tiene filtros que evalúan una página web en busca de contenido inseguro o inapropiado.
Entonces, por esa razón, la sección de búsqueda segura de la herramienta es muy importante porque, si una imagen activa involuntariamente un filtro de búsqueda seguro, es posible que la página web no se clasifique para los visitantes potenciales del sitio que buscan el contenido en la página web.
La captura de pantalla anterior muestra la evaluación de una foto de caballos de carreras en una pista de carreras. La herramienta identifica con precisión que no hay contenido médico o para adultos en la imagen.
Texto: reconocimiento óptico de caracteres (OCR)
Google Vision tiene una capacidad notable para leer el texto que se encuentra en una fotografía.
La herramienta Vision es capaz de leer con precisión el texto de la siguiente imagen:
Como se puede ver arriba, Google tiene la capacidad (a través del reconocimiento óptico de caracteres, también conocido como OCR), para leer palabras en imágenes.
Sin embargo, eso no es una indicación de que Google use OCR para fines de clasificación de búsqueda.
El hecho es que Google recomienda el uso de palabras alrededor de las imágenes para ayudarlo a comprender de qué se trata una imagen y puede ser el caso de que, incluso para las imágenes con texto dentro de ellas, Google aún dependa de las palabras que rodean la imagen para comprender de qué se trata.
Las pautas de Google sobre SEO de imágenes enfatizan repetidamente el uso de palabras para proporcionar contexto a las imágenes. guidelines on image SEO
“By adding more context around images, results can become much more useful, which can lead to higher quality traffic to your site.
…Whenever possible, place images near relevant text.
…Google extracts information about the subject matter of the image from the content of the page…
…Google uses alt text along with computer vision algorithms and the contents of the page to understand the subject matter of the image.”
“Al agregar más contexto alrededor de las imágenes, los resultados pueden volverse mucho más útiles, lo que puede conducir a un tráfico de mayor calidad a su sitio.
… Siempre que sea posible, coloque imágenes cerca del texto relevante.
…Google extrae información sobre el tema de la imagen del contenido de la página…
…Google usa texto alternativo junto con algoritmos de visión por computadora y el contenido de la página para comprender el tema de la imagen”.
Está muy claro en la documentación de Google que Google depende del contexto del texto alrededor de las imágenes para comprender de qué se trata la imagen.
Quitar
La herramienta Vision AI de Google ofrece una forma de probar Vision AI de Google para que un editor pueda conectarse a ella a través de una API y usarla para escalar la clasificación de imágenes y extraer datos para usar dentro del sitio.
Pero también proporciona una idea de hasta dónde han llegado los algoritmos para el etiquetado de imágenes, la anotación y el reconocimiento óptico de caracteres.
Sube una imagen aquí para ver cómo se clasifica y si una máquina lo ve de la misma manera que tú. Upload an image here
Más recursos:
Imagen destacada de Maksim Shmeljov/Shutterstock
Leer el articulo original en Search Engine Journal.