Scraping Stack Overflow Usando Python

Apr 24, 2019 4 min

Scraping Stack Overflow Usando Python

Escribo este articulo debido a que estuve viendo el video Scraping Stack Overflow Using Python Tutorial | Beautiful Soup


Scraping Stack Overflow Usando Python

Escribo este articulo debido a que estuve viendo el video Scraping Stack Overflow Using Python Tutorial | Beautiful Soup

Me pareció genial como en el vídeo se nos muestra el uso de scrapping en Python y quise replicarlo y dejar mi experiencia, Nota importante sigan los vídeos y a la persona detrás de estos artículos un tipo muy inteligente y sus vídeos de Flutter son geniales.

Para los que no conozcan el termino “scraping”

La definición de scraping es la siguiente

Web scraping es una técnica utilizada mediante programas de software para extraer información de sitios web. Usualmente, estos programas simulan la navegación de un humano en la World Wide Web ya sea utilizando el protocolo HTTP manualmente, o incrustando un navegador en una aplicación.

Este tutorial se nos muestra la forma de obtener una pagina web y tomar su información para poder transformarla en un archivo json que después podrá ser encapsulada y consumida.

Lo primero es descargar python de la pagina oficial

https://www.python.org/downloads/

Asegurate de tener Python & pip

Antes de continuar, asegurate de que tienes Python y que esta disponible en tu línea de comandos. Puedes verificar esto ejecutando:

$ python —version

Deberías tener un output como 3.7.X.

Nota

Si eres nuevo y obtienes un error como este:

>>> python
Traceback (most recent call last):
 File "", line 1, in
NameError: name ‘python’ is not defined

Es porque este comando tiene la intención de correr en un shell (también llamado terminal o consola).

Adicionalmente, necesitas asegurarte que tienes pip disponible. Puedes verificar esto ejecutando:

$ pip —version
pip 9.0.1

Si tienes instalado Python desde su fuente, con un instalador de python.org, o via `Homebrew`_deberías ya tener pip. Si estas en Linux e instalaste a través de tu manejador de paquetes, tal vez necesites instalar pip por separado.

Si tu plan es instalar pipenv usando Hombrew puedes saltarte este paso. El instalador de Homebrew se encarga de pip por ti.

Instalando Pipenv

Pipenv es un manejador de dependencias para los proyectos de Python. Si estas familiarizado con Node.js” npm o Ruby bundler, es similar en espíritu a estas herramientas. Mientras pip puede instalar paquetes de Python, Pipenv es recomendado como herramienta de nivel superior que simplifica el manejo de dependencias para casos comunes.

Use pip to install Pipenv:

$ pip install —user pipenv

Algunas capturas
Lo primero que realice fue instalar homebrew

Despues de eso instale pipenv desde hombrew

Puedes descargar el código fuente desde

https://github.com/devjaime/webscraping

By Jaime Hernández on April 24, 2019.

Canonical link

Exported from Medium on March 15, 2025.

~devjaime