Búsqueda de vectores: optimización para la mente humana con aprendizaje automático

  • HatumSEO
  • Carreras
  • Búsqueda de vectores: optimización para la mente humana con aprendizaje automático

¿Qué es la búsqueda vectorial y cómo está transformando la experiencia de búsqueda?

Hemos estado hablando con profesionales e innovadores de la industria de búsquedas sobre los desafíos persistentes, las oportunidades de tendencias y las tecnologías que las personas y las empresas usan para mantenerse relevantes en los resultados de búsqueda competitivos.

Una tendencia que impulsa avances masivos en la tecnología de búsqueda es el cambio de palabras clave a datos que representan mejor el significado de la consulta y lo que se sabe al respecto.

La búsqueda de palabras clave ha estado impulsando el descubrimiento de contenido desde 1230 d.C.. Fue entonces cuando el cardenal y comentarista bíblico francés, el cardenal Hugh de St Cher, completó el primer índice conocido en la historia.

La búsqueda de vectores marca un cambio importante de este método tradicional de recuperación de información a un futuro en el que todos los datos complejos que componen los activos de contenido modernos pueden ponerse a trabajar.

Entonces, ¿qué necesitas saber al respecto en este momento?

Nos pusimos en contacto con Edo Liberty, exjefe del laboratorio de inteligencia artificial de Amazon y ahora director ejecutivo de Pinecone, para obtener una introducción a la búsqueda de vectores y por qué es posible que desee tener las tecnologías asociadas en su radar. Edo Liberty

Le preguntamos a Libertad:

  • ¿Cómo redefinirá la búsqueda vectorial la búsqueda tradicional de palabras clave?
  • ¿Cómo le explicaría la búsqueda de vectores a un niño de 5 años?
  • ¿Cuáles son algunos de los desafíos a los que se enfrentó al utilizar algoritmos de aprendizaje automático para los clientes de Amazon Web Services (AWS) y cómo los superó?
  • ¿Qué es Pinecone y qué hace?
  • ¿Qué sugerencias o consejos tiene para los principiantes de SEO que recién ingresan al mundo de ML e AI?

Comencemos con esto: ¿por qué el procesamiento del lenguaje natural (NLP) es tan importante para el futuro del SEO y cómo pueden los especialistas en marketing prepararse para lo que sigue?

Hemos quemado los barcos de la búsqueda de palabras clave

Edo Liberty: “Así como los SEO dominaron el algoritmo PageRank, ahora necesitan saber sobre PNL para tener éxito y vencer a la competencia.

Sin embargo, a diferencia de PageRank, el campo de la PNL está creciendo rápidamente y cuenta con miles de colaboradores.

Requerirá más esfuerzo que seguir a Matt Cutts (de Google) en Twitter y rastrear los cambios SERP.

Afortunadamente, aunque la PNL es un tema más complicado, no está envuelto en misterio como lo está PageRank.

Gran parte del trabajo sobre PNL se está realizando de forma abierta, con abundantes y gratuitos trabajos de investigación, software de código abierto y cursos en línea gratuitos sobre PNL. online courses on NLP

Una cosa está clara sobre la PNL: llegó para quedarse.

Está lejos de ser perfecto, pero está mejorando rápidamente, y las grandes empresas de tecnología han quemado las naves de búsqueda de palabras clave y no hay vuelta atrás”.

La búsqueda de vectores nos permite buscar de la forma en que hablamos

¿Cómo redefinirá la búsqueda vectorial la búsqueda tradicional de palabras clave?

Edo Liberty: “La búsqueda de vectores no redefine la búsqueda de palabras clave; Vector search

En lugar de trabajar con palabras clave, y sus sinónimos y errores ortográficos, la búsqueda de vectores funciona con incrustaciones de vectores. vector embeddings

Eso es un dato que representa el significado de la frase de búsqueda junto con otra información conocida sobre la consulta o el usuario.

(Para un ser humano, la incrustación de vectores es irreconocible y solo parece una larga serie de números).

Esta representación de la frase de búsqueda y el usuario se usa luego para clasificar colecciones masivas de incrustaciones que representan otro contenido y preferencias del usuario para encontrar el resultado más relevante.

Desde la perspectiva del usuario, esto significa que puede buscar la forma en que habla.

Ya no necesitan aprender las peculiaridades y sintaxis de los motores de búsqueda.

Desde la perspectiva del SEO, esto significa que realmente pueden enfocarse en temas y temas sin preocuparse por palabras clave precisas”.

¿Cómo le explicaría la búsqueda de vectores a un niño de 5 años?

Edo Liberty: “Nuestro artículo que explica los conceptos básicos de la búsqueda de vectores se acerca. vector search basics

La versión ELI5, tal como la he practicado con mi propia familia, es esta: si digo «comida italiana», podrías pensar en pizza o pasta.

Has aprendido que esas cosas están relacionadas porque recuerdas haber comido pizza en un restaurante italiano o haber aprendido que la pasta es popular en Italia.

Pero una computadora nunca aprendió eso.. Entonces, la frase «comida italiana» significa exactamente eso y no contiene información para decir que está relacionada con la pasta o la pizza.

Entonces, cuando le pido a una computadora que busque un «restaurante italiano», puede dejar de lado las pizzerías.

El aprendizaje automático es una forma de ayudar a las computadoras a comprender el significado de lo que decimos o escribimos.

Y la búsqueda vectorial es una forma en que esas computadoras buscan en todo lo que saben, basándose en el significado y no en palabras exactas.

Así que ahora, si le pido a la computadora que me recomiende un lugar italiano, podría sugerirme tu pizzería favorita tal como lo harías tú.

Las organizaciones finalmente pueden enfocarse en crear y organizar contenido para humanos.

Hay muchos miles de científicos e ingenieros que trabajan incansablemente para hacer que ML y NLP se parezcan a la mente humana.

¿De verdad quieres ir en contra de eso?

Superar los desafíos en el aprendizaje automático

¿Cuáles son algunos de los desafíos a los que se enfrentó al utilizar algoritmos de aprendizaje automático para los clientes de Amazon Web Services (AWS) y cómo los superó?

Edo Liberty: “No puedo hablar sobre proyectos o desafíos específicos de AWS. Puedo decir más ampliamente, desde mi experiencia, vi que los algoritmos ML ya no son los cuellos de botella.

Sin duda, están lejos de ser perfectos y hay mucho trabajo por hacer, pero ese trabajo se está realizando a una velocidad vertiginosa.

El siguiente desafío consiste en ejecutar esos algoritmos a la escala necesaria para respaldar los productos de consumo y las aplicaciones empresariales.

Esas representaciones que mencioné anteriormente, incrustaciones de vectores, son computacionalmente costosas de buscar.

Un índice de solo 1 millón de elementos (incrustaciones de vectores) ya requiere un software especializado junto con un ajuste cuidadoso;

(Aparte, esta es la razón por la que inicié Pinecone: para facilitar que los equipos de ingeniería agreguen la búsqueda vectorial a sus aplicaciones).

¿Qué es la piña?

¿Qué es Pinecone y qué hace?

Edo Liberty: hoy, Pinecone facilita a los ingenieros la creación de búsquedas vectoriales rápidas, frescas y filtradas en sus aplicaciones.

Brinda a los equipos de ingeniería la infraestructura de búsqueda necesaria para ejecutar la búsqueda de vectores a escala, todo empaquetado en un servicio administrado con una API sencilla.

(Hemos descartado los números de versión porque los lanzamientos llegan rápido y porque, como servicio administrado, los usuarios siempre obtienen la última versión y no necesitan preocuparse por las actualizaciones).

Trabajar con algoritmos es extremadamente divertido y los desafíos valen absolutamente la pena.

Con la búsqueda vectorial, estamos en la intersección de algoritmos de vanguardia, arquitecturas de bases de datos y aplicaciones sin servidor.

Y podemos ver a nuestros clientes aplicar esta tecnología a productos que están revolucionando las aplicaciones empresariales y de consumo, como la búsqueda semántica, los sistemas de recomendación, la seguridad de TI, los dispositivos portátiles, la visión artificial y más.

Primeros pasos en ML e IA

¿Qué sugerencias o consejos tiene para los principiantes de SEO que recién ingresan a los mundos de ML e AI?

Edo Liberty: “No te sientas intimidado. Incluso los investigadores más brillantes en este campo están «descifrando cosas».

Aprender sobre AI/ML más allá de los artículos de nivel superficial lo convertirá en un mejor profesional de SEO, y hay muchos recursos gratuitos que lo ayudarán a hacerlo.

Para aquellos interesados ​​en carreras en este campo, actualmente estamos contratando en todos los equipos: ingeniería, investigación, éxito del cliente, ventas, marketing y operaciones. hiring across all teams

Más recursos:

Imagen destacada: cortesía de Pinecone

Leer el articulo original en Search Engine Journal.

¡Danos un Voto!

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

¿Tienes una pregunta?

Luis Narciso
Sobre SEO
(Posicionamiento Web)

Frank Fajardo
Sobre Diseño Web, Anuncios, Diseño y Redes Sociales