Una introducción a Python y el aprendizaje automático para SEO técnico

  • HatumSEO
  • SEO
  • Una introducción a Python y el aprendizaje automático para SEO técnico

Python se utiliza para impulsar plataformas, realizar análisis de datos y ejecutar sus modelos de aprendizaje automático.. Comience con Python para SEO técnico.

Desde que comencé a hablar sobre cómo se usa Python en el espacio de SEO hace dos años, ha ganado aún más popularidad y muchas personas han comenzado a utilizarlo y ver los beneficios de usarlo en sus funciones diarias.

Es realmente emocionante ver a tantos SEO compartir sus experiencias, los guiones geniales que han escrito y el impacto que ha tenido en sus trabajos.

No estaría bien que publique esto sin mencionar el impacto que Hamlet Batista tuvo en mí y en tantas otras personas.. Le encantaba ver a la gente aprender y usar Python.

Sé que estaría muy orgulloso de ver a tantas personas compartir su viaje de aprendizaje de Python y todos los increíbles guiones que la gente ha escrito.

¿Qué es Python?

En resumen, Python es un lenguaje de programación interactivo orientado a objetos y de código abierto que se interpreta línea por línea.

Con una sintaxis simple y fácil de aprender, así como una legibilidad avanzada y soporte para varios módulos y bibliotecas, Python es muy apreciado debido a la mayor productividad que proporciona.

Como testimonio de esto, algunas de las organizaciones más grandes del mundo utilizan Python para potenciar sus plataformas, realizar análisis de datos y ejecutar sus modelos de aprendizaje automático.

Empresas como Google, YouTube, Netflix, NASA, Spotify e IBM han declarado públicamente que Python ha sido una parte importante de su crecimiento debido a su simplicidad, velocidad y escalabilidad.

De hecho, el primer rastreador web de Google se escribió en Python y sigue siendo uno de sus lenguajes oficiales del lado del servidor. was actually written

Cómo ejecutar Python

Puede ejecutar secuencias de comandos de Python de varias maneras, según lo que funcione mejor para usted.

La mayoría de los sistemas vienen con Python ya instalado, lo más probable es que sea Python 3, pero puede averiguar qué versión tiene escribiendo python –version en su terminal.

Si tiene instalado Python 2, puede actualizarlo a la versión 3 de Python descargando Python 3 del sitio web de Python, ya que Python 2 quedó obsoleto oficialmente en 2020 y existen algunas diferencias de sintaxis entre los dos, por lo que es mejor asegurarse de usar Python. Python website

Puede ejecutar Python desde su terminal o línea de comando IDE (Entorno de desarrollo integrado), así como plataformas basadas en escritorio, incluidas Pycharm o VSCode.. Alternativamente, puede usar alternativas basadas en la nube que incluyen:

Estos proporcionan una experiencia más fácil para que los principiantes aprendan y prueben elementos de código línea por línea, así como para compartir y colaborar con su equipo.

Cómo aprender Python

Hay varias herramientas en línea disponibles para aprender Python, y el mejor método depende de su propio estilo de aprendizaje.. Por ejemplo, si usted es un aprendiz visual y disfruta seguir la codificación de video, entonces freeCodeCamp es un excelente lugar para comenzar. freeCodeCamp

Si trabaja mejor con un estilo de aprendizaje más estructurado por proyectos, entonces Codecademy y Sololearn son excelentes lugares para probar. Estos sitios web también brindan una forma de realizar un seguimiento de su aprendizaje y comenzar una cartera de proyectos. Codecademy

Algunos sitios gamifican el viaje de aprendizaje, como CodeCombat y Checkio, que brindan una excelente manera de desarrollar el hábito de codificar todos los días, de una manera divertida. CodeCombat

Si prefiere codificar junto con un instructor en tiempo real e identificarse como mujer o no binario, también puede inscribirse en un curso gratuito de 8 semanas con Code First Girls (descargo de responsabilidad, trabajo para Code First Girls) Code First Girls

Una vez que se sienta cómodo con los fundamentos de Python, lo mejor que puede hacer es comenzar a trabajar en proyectos, ya sea creando el suyo propio o basándose en uno de los muchos scripts que se han compartido en la comunidad de Python.

Estos proyectos no necesariamente tienen que estar relacionados con SEO, pero a veces puede ser útil tener ejemplos prácticos para usar cuando se trabaja en proyectos.

Si está interesado en el lado del análisis de datos de Python, definitivamente vale la pena revisar y usar los conjuntos de datos gratuitos disponibles en Kaggle. Kaggle

Bibliotecas de Python

El principal poder de Python está en sus bibliotecas, que permiten varias funciones adicionales, entre ellas:

  • Extracción de datos.
  • Análisis y preparación.
  • Computación científica.
  • Procesamiento natural del lenguaje.
  • Aprendizaje automático.

Algunas bibliotecas útiles para tareas que involucran análisis de datos y automatización en SEO incluyen:

  • Pandas: se utiliza para la manipulación y el análisis de datos.
  • NumPy: Útil para computación científica.
  • SciPy: Utilizado para computación científica y técnica.
  • SciKit Learn: Aprendizaje automático para análisis y minería de datos.
  • Pandas: se utiliza para la manipulación y el análisis de datos.
  • SpaCy: una gran biblioteca de procesamiento de lenguaje natural.
  • Solicitudes: una biblioteca para realizar solicitudes HTTP.
  • Beautiful Soup: se utiliza para extraer datos de archivos HTML y XML.
  • Matplotlib: para crear visualizaciones a partir de datos.

Por qué Python es popular entre los SEO

Si bien es importante comprender los lenguajes que impulsan los sitios web en los que trabajamos (como HTML, CSS y JavaScript), Python brinda muchas oportunidades de automatización para tareas de bajo nivel que normalmente dedicamos varias horas a realizar.

Python empodera a los profesionales de SEO de varias maneras, ya que no solo nos permite automatizar tareas repetitivas, sino también extraer y analizar grandes conjuntos de datos.

La cantidad de datos con los que trabajan los especialistas en marketing solo está aumentando, por lo que ser capaz de analizar esto de manera eficiente ayudará a resolver muchos problemas complejos en un período de tiempo más corto.

Esto, a su vez, ahorra un tiempo valioso y nos permite ser más eficientes al realizar otras tareas importantes de SEO.. Estos factores combinados han llevado a un crecimiento en la popularidad de Python entre los profesionales de SEO.

La capacidad de comprender mejor los datos no solo nos ayudará a hacer mejor nuestro trabajo, sino que también nos permitirá tomar decisiones basadas en datos.

Estas decisiones nos permitirán brindar información concreta a nuestros clientes y partes interesadas y tener más confianza en las recomendaciones que implementamos.

Los beneficios de la automatización con Python

Si bien Python no podrá imitar estrategias humanas impulsadas por emociones, los scripts de Python se pueden usar para automatizar una gran cantidad de tareas que requieren mucho tiempo.

Esta lista de tareas que puede automatizar con Python crece continuamente, pero incluye:

  • Identificar la intención del usuario.
  • Asignación de direcciones URL antes de una migración.
  • Análisis de enlaces internos.
  • Realización de investigación de palabras clave.
  • Optimización de imágenes.
  • Raspado de sitios web.

Cómo agregar Python a su flujo de trabajo de SEO

La mejor manera de agregar Python a su flujo de trabajo es comenzar a pensar en lo que se puede automatizar, particularmente en las tareas tediosas y que consumen mucho tiempo.

Alternativamente, piense en formas en las que pueda manejar de manera más eficiente y sacar conclusiones de los datos que tiene disponibles para usted.

Una excelente manera de comenzar es jugar con los datos de su sitio web a los que ya tiene acceso, por ejemplo, desde un rastreo del sitio o su herramienta de análisis.

No tenga miedo de inspirarse en los guiones de otras personas, juegue e incluso rompa algo cuando esté aprendiendo, ya que esta suele ser la mejor manera de aprender.

Encontrar la causa de un problema y las formas de solucionarlo es una gran parte de lo que hacemos como SEO, y es realmente lo mismo cuando aprendemos y usamos Python.

También hay muchos artículos útiles de otros SEO que han compartido ejemplos prácticos de cómo usan Python para tareas relacionadas con SEO.. Recomendaría consultar SEO Pythonistas para explorar algunos de estos. SEO Pythonistas

Ejemplos de formas de usar Python

¿Listo para comenzar con Python?

Aquí hay algunos scripts útiles que he encontrado útiles para numerosas tareas, junto con una breve descripción de cómo funciona cada uno y los desafíos que resuelven.

Redirección de relevancia

La primera forma práctica en la que puede usar Python es identificar si la asignación de redireccionamiento que se implementó para una migración es precisa mediante la creación de un script de relevancia de redireccionamiento.

Esto implica realizar un rastreo de su sitio antes y después de la migración y segmentar las diferentes categorías en función de su estructura de URL. segmenting the different categories

Luego puede usar algunos de los operadores de comparación integrados de Python para determinar si la carpeta y la profundidad de cada página se han mantenido iguales o han cambiado después de la migración.

El script tomará cada una de sus URL y las comparará antes y después de la migración para identificar si son iguales y los resultados se mostrarán en una nueva tabla que indicará Verdadero si son iguales o Falso si han cambiado.

También puede utilizar Pandas, la biblioteca de Python, para crear una tabla dinámica que muestre un recuento de cuántas URL coinciden con cada categoría y cuántas han cambiado.

Esto le permitirá investigar cualquier categoría o URL que no coincida y revisar las reglas de redirección que se han configurado.

Redirect Relevancy

Análisis de enlaces internos

Otro script práctico que usa datos de rastreo es usar Python para realizar análisis de enlaces internos.

Esto le permitirá identificar las secciones de su sitio que tienen más enlaces internos, así como descubrir oportunidades para mejorar los enlaces internos para diferentes secciones.

Esto nuevamente utilizará la segmentación para determinar las diferentes categorías de las URL y las tablas dinámicas para exportar un recuento de la cantidad de enlaces internos a cada categoría en el sitio.

Internal Link Analysis

Subtítulos de imagen con Pythia

Este es el primer guión que me introdujo al idioma y el que inició mi deseo de aprender.

Usando Pythia, que es un marco modular de aprendizaje profundo creado por Facebook, este script genera un título para una URL de imagen.

Esta leyenda se puede usar para las imágenes que actualmente carecen de etiquetas alt, que son importantes para la accesibilidad y la búsqueda de imágenes.

El guión se basa en el mecanismo de abajo hacia arriba y de arriba hacia abajo, que calcula los resultados enfocando la atención en diferentes elementos dentro de una imagen.

Image Captioning

Image Captioning

Para cada palabra generada, la atención se pondera en píxeles individuales dentro de la imagen, delineando la región con la máxima atención.

La facilidad de este script se debe a que se puede ejecutar directamente desde Google Colab y no requiere codificación directa.

Una vez que se guarda una copia del código necesario en su unidad personal de Google Colab, se pueden ejecutar todas las celdas, realizando cada paso por usted.

Esto descargará las fuentes de datos necesarias para ejecutar el proceso, así como también completará automáticamente todos los pasos que normalmente deberían realizarse manualmente.

Por ejemplo, se instalarán todas las bibliotecas, se crearán clases y se asignarán funciones.

Pythia Captioning

Esto generará un área para agregar en la URL de su imagen y un botón para subtitular la imagen.

Generating a caption

Luego se proporcionará un título para cada imagen, que se puede usar directamente como una etiqueta alternativa o para inspirar la creación de una.

Google Colab notebook

Hamlet ha escrito una guía completa para generar texto a partir de imágenes con Python que muestra este script en acción.

API

Python también es excelente para usar con API, por ejemplo, la API de Page Speed ​​Insights de Google.. Esto le permitirá medir las métricas de rendimiento clave a escala, ahorrándole el tiempo de tener que probar cada URL.

Usando un archivo CSV con todas las URL que desea probar, puede ejecutar cada una a través de la API y crear un objeto de respuesta para contener todas las métricas para cada URL.

A continuación, puede extraer las métricas específicas, por ejemplo, LCP, CLS y FID, y generar una tabla que muestre estas métricas para cada URL.

También puede extraer otras cosas útiles de la API, incluidos los elementos de cambio de diseño para cada página, el elemento de pintura con contenido más grande y una lista de todas las etiquetas de bloqueo de terceros o archivos CSS y JS no utilizados en cada página.

Page Speed API

Otras posibilidades

Estos ejemplos son solo rascando la superficie, hay muchas más posibilidades de automatización y optimización utilizando scripts de Python, que incluyen:

  • Optimización de imágenes.
  • Combinar conjuntos de datos para formar conclusiones aún más sólidas.
  • Validación de Hreflang.
  • Cálculo del crecimiento de palabras clave.
  • Recopilación de datos de GSC.
  • Realización de análisis de la competencia.

Impulsando el aprendizaje automático

Python también es un lenguaje popular que se utiliza para potenciar las aplicaciones de aprendizaje automático debido a su sintaxis simple, intuitiva y accesible.

Además, hay una gran cantidad de bibliotecas útiles que son útiles al trabajar y entrenar modelos de aprendizaje automático.

¿Qué es el aprendizaje automático?

El aprendizaje automático es esencialmente «una aplicación de inteligencia artificial que proporciona a los sistemas la capacidad de aprender y mejorar automáticamente a partir de la experiencia, sin necesidad de ser programados explícitamente» (puede encontrar una definición completa aquí). here

El aprendizaje automático se usa a menudo para identificar patrones en los datos, sobre los cuales se pueden hacer predicciones.

Hay dos tipos principales de aprendizaje automático, el primero es el aprendizaje supervisado que se entrena con datos etiquetados, donde un conjunto de entrenamiento tiene una entrada con la salida deseada.

Por lo tanto, el algoritmo de aprendizaje ya recibe la respuesta al leer los datos.. El resultado correcto para cada punto de datos se etiqueta explícitamente al entrenar el modelo.

Mientras que el aprendizaje no supervisado se entrena utilizando información que no está etiquetada, por lo que permite que el algoritmo actúe sobre la información sin orientación.. Esto se usa a menudo para probar las capacidades del sistema o cuando no tiene datos preetiquetados.

Python y aprendizaje automático

Ejecutado junto con el aprendizaje automático, Python se puede usar para impulsar scripts para entrenar un conjunto de datos, antes de que resuma y visualice los datos.

A partir de aquí, el modelo evaluará los algoritmos para permitir la realización de predicciones.

Ejemplos de aprendizaje automático del mundo real

El uso del aprendizaje automático en la web aumenta constantemente, se crean nuevos modelos y los datos de capacitación se vuelven más accesibles a diario.. En algunos casos, también estamos siendo utilizados para ayudar a entrenarlos.

Algunos ejemplos de aprendizaje automático del mundo real incluyen:

  • Algoritmo RankBrain de Google.
  • Programa de voz profunda de Baidu.
  • Líneas de tiempo seleccionadas de Twitter.
  • Recomendaciones de Netflix y Spotify.
  • Función de Einstein de Salesforce.

Posibilidades de SEO con aprendizaje automático

Debido a su capacidad para resolver problemas complejos, no sorprende que los modelos de aprendizaje automático se utilicen para facilitar la vida de los especialistas en marketing.

Como dice Britney Müller: Britney Muller

“Machine Learning is becoming more accessible and will free us up to work on higher-level strategy.”

«El aprendizaje automático se está volviendo más accesible y nos liberará para trabajar en una estrategia de nivel superior».

Esto le permitirá dedicar más tiempo a encontrar soluciones, en lugar de solo identificar problemas.

Algunos ejemplos de modelos de aprendizaje automático utilizados en SEO incluyen:

  • Evaluación de la calidad del contenido.
  • Identificar brechas y oportunidades de palabras clave.
  • Obtener información sobre la participación de los usuarios.
  • Optimización de etiquetas de título.
  • Automatización de la creación de meta descripción.
  • Transcripción de audio.

Aquí hay algunos ejemplos de Machine Learning que se están utilizando para tareas de SEO, que es posible que incluso haya encontrado.

Precarga predictiva

Con base en los patrones de navegación de los usuarios de los análisis de sitios web, las herramientas como guess.js crean modelos de aprendizaje automático que pueden predecir qué páginas es más probable que los usuarios visiten a continuación y precargar los recursos que necesitarán cargarse. guess.js

Otros ejemplos de esto en la práctica incluyen predecir el siguiente contenido que un usuario probablemente quiera ver y ajustar la experiencia del usuario para tener esto en cuenta.

Además de predecir los widgets con los que es probable que un usuario interactúe y adaptar una experiencia más personalizada teniendo esto en cuenta.

Enlace interno

Hay dos formas diferentes en que el aprendizaje automático puede ayudar con los enlaces internos.

El primero es actualizar los enlaces rotos, esto se puede hacer rastreando para identificar los enlaces internos rotos, luego usando un algoritmo para sugerir la página de reemplazo más precisa y reemplazando los enlaces internos rotos.

El otro sugiere enlaces internos relevantes basados ​​en big data.. Estas herramientas utilizan algoritmos que están ajustados para adquirir constantemente nueva información para que puedan sugerir más enlaces internos después de un tiempo.

También comienzan a sugerir enlaces internos relevantes a medida que se escribe un artículo.

Calidad del contenido

El siguiente ejemplo es mejorar la calidad del contenido mediante la predicción de lo que preferirían los usuarios y los motores de búsqueda.. Puede hacerlo construyendo un modelo que genere información sobre los factores que son más importantes.

Estos factores pueden incluir cosas como el volumen de búsqueda y el tráfico, la tasa de conversión, los enlaces internos, la tasa de rebote, el tiempo en la página y el recuento de palabras.

Luego utilizará esos factores importantes para entrenar un modelo de aprendizaje automático, que genera un puntaje de calidad de contenido para cada página.

Experiencia de usuario

El aprendizaje automático también se está utilizando para ayudar a mejorar la experiencia del usuario, y hay muchos ejemplos de cómo se está utilizando, por ejemplo, Instagram utiliza el análisis de sentimientos para identificar y abordar el lenguaje intimidatorio.

Twitter también lo usa para recortar imágenes, para asegurarse de que recortan las imágenes para mostrar la parte más importante, por ejemplo, para centrarse en el texto.

Twitter Image Cropping

El texto de estas imágenes está en diferentes lugares en cada una, pero Twitter las recorta para mostrar el texto en la vista previa.. Este modelo de aprendizaje automático se entrenó en miles de imágenes y comenzó así, antes de poder identificar la parte más importante de la imagen.

Twitter Image Cropping

La visión por computadora también se está utilizando para ayudar con la experiencia del usuario, al identificar automáticamente lo que hay en una imagen, para hacer que las imágenes sean accesibles al explicarles a los usuarios qué es una imagen.

Conclusión

Espero que esto lo haya inspirado para comenzar a aprender Python y explorar cómo puede ayudarlo a automatizar tareas y analizar datos complejos para aumentar su eficiencia.

Como nota final, recuerde que no necesita aprender Python para ser un buen SEO, pero si está intrigado o interesado, espero que se divierta aprendiendo y poniendo en práctica algunos scripts de Python en su flujo de trabajo.

Contribuciones de Python de la industria SEO

Para continuar honrando la pasión de Hamlet por alentar y celebrar a los demás, quería compartir algunas de las cosas increíbles compartidas por la comunidad SEO este año.

Moshe Ma-yafit escribió un guión genial sobre cómo detectar los cambios de precios de los competidores con Python y enviar alertas por correo electrónico. Puede encontrar un artículo que explica esto junto con un repositorio de Github. Moshe Ma-yafit

Lazarina Stoy tiene un script para generar meta descripciones, así como una guía para usar Pytrends con Python. Lazarina Stoy

Francis Angelo Reyes ha escrito un script para una herramienta de mapeo de redirección simple en Python. Pasa por cada URL y encuentra su coincidencia. ¡La aplicación también está en el artículo para que puedas probarla allí! Francis Angelo Reyes

Yaniss Illoul ha trabajado en un buscador de enlaces rotos en Python. Además de una herramienta para capturar clasificaciones de palabras clave en múltiples dominios. Yaniss Illoul

Danielle Rohe compartió un script para descargar todos los mapas de sitio dentro de un índice de mapa de sitio, así como recorrer cada uno y extraer todas las URL en un archivo CSV. Danielle Rohe

Muhammad Hammad ha creado un guión realmente genial para PNL y análisis de contenido de SERP. Muhammad Hammad

Charley Warginer también compartió algunas secuencias de comandos increíbles este año, incluida una para generar preguntas frecuentes para sus páginas automáticamente, el extractor de palabras clave BERT y una aplicación de agrupación de palabras clave. Charley Warginer

Más recursos:

Imagen destacada: fatmawati achmad zaenuri/Shutterstock

Leer el articulo original en Search Engine Journal.

¡Danos un Voto!

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

¿Tienes una pregunta?

Luis Narciso
Sobre SEO
(Posicionamiento Web)

Frank Fajardo
Sobre Diseño Web, Anuncios, Diseño y Redes Sociales