Scraping Stack Overflow Usando Python
Scraping Stack Overflow Usando Python
Escribo este articulo debido a que estuve viendo el video Scraping Stack Overflow Using Python Tutorial | Beautiful Soup
Scraping Stack Overflow Usando Python
Escribo este articulo debido a que estuve viendo el video Scraping Stack Overflow Using Python Tutorial | Beautiful Soup
Me pareció genial como en el vídeo se nos muestra el uso de scrapping en Python y quise replicarlo y dejar mi experiencia, Nota importante sigan los vídeos y a la persona detrás de estos artículos un tipo muy inteligente y sus vídeos de Flutter son geniales.
Para los que no conozcan el termino “scraping”
La definición de scraping es la siguiente
Web scraping es una técnica utilizada mediante programas de software para extraer información de sitios web. Usualmente, estos programas simulan la navegación de un humano en la World Wide Web ya sea utilizando el protocolo HTTP manualmente, o incrustando un navegador en una aplicación.
Este tutorial se nos muestra la forma de obtener una pagina web y tomar su información para poder transformarla en un archivo json que después podrá ser encapsulada y consumida.
Lo primero es descargar python de la pagina oficial
https://www.python.org/downloads/
Asegurate de tener Python & pip
Antes de continuar, asegurate de que tienes Python y que esta disponible en tu línea de comandos. Puedes verificar esto ejecutando:
$ python —version
Deberías tener un output como 3.7.X
.
Nota
Si eres nuevo y obtienes un error como este:
>>> python
Traceback (most recent call last):
File "", line 1, in
NameError: name ‘python’ is not defined
Es porque este comando tiene la intención de correr en un shell (también llamado terminal o consola).
Adicionalmente, necesitas asegurarte que tienes pip disponible. Puedes verificar esto ejecutando:
$ pip —version
pip 9.0.1
Si tienes instalado Python desde su fuente, con un instalador de python.org, o via `Homebrew`_deberías ya tener pip. Si estas en Linux e instalaste a través de tu manejador de paquetes, tal vez necesites instalar pip por separado.
Si tu plan es instalar pipenv usando Hombrew puedes saltarte este paso. El instalador de Homebrew se encarga de pip por ti.
Instalando Pipenv
Pipenv es un manejador de dependencias para los proyectos de Python. Si estas familiarizado con Node.js” npm o Ruby bundler, es similar en espíritu a estas herramientas. Mientras pip puede instalar paquetes de Python, Pipenv es recomendado como herramienta de nivel superior que simplifica el manejo de dependencias para casos comunes.
Use pip
to install Pipenv:
$ pip install —user pipenv
Algunas capturas
Lo primero que realice fue instalar homebrew
Despues de eso instale pipenv desde hombrew
Puedes descargar el código fuente desde
https://github.com/devjaime/webscraping
By Jaime Hernández on April 24, 2019.
Exported from Medium on March 15, 2025.
~devjaime