Crawler do site Fundamentus.com com o uso do framework scrapy, tanto da aba detalhada como a de resumo.

Last update: Oct 04, 2022

Overview

Fundamentus com framework scrapy

Crawler do site Fundamentus.com com o uso do framework scrapy, tanto da aba detalhada como a de resumo.

Baixa informacões que os outros scrapys do fundamentus não realizam.

Para iniciar, dentro da pasta fundamentus digite: scrapy crawl detalhes -O nomedoarquivocriado.csv ou scrapy crawl resultado -O nomedoarquivocriado.csv

Não é um codigo elegante, mas funcional, realiza o scrapy de forma rapida.

As informacões baixadas são:

       columns = ['Papel', 'Cotação', 'Tipo', 'Data ult cot', 'Empresa', 'Min 52 sem',
                  'Setor', 'Max 52 sem', 'Subsetor', 'Vol $ méd (2m)', 'Valor de mercado',
                  'Últ balanço processado', 'Valor da firma', 'Nro. Ações',

                  'Dia', 'P/L',
                  'LPA', 'Mês', 'P/VP', 'VPA', '30 dias', 'P/EBIT', 'Marg. Bruta',
                  '12 meses', 'PSR', 'Marg. EBIT', '2021', 'P/Ativos', 'Marg. Líquida',
                  '2020', 'P/Cap. Giro', 'EBIT / Ativo', '2019', 'P/Ativ Circ Liq',
                  'ROIC', '2018', 'Div. Yield', 'ROE', '2017', 'EV / EBITDA',
                  'Liquidez Corr', '2016', 'EV / EBIT', 'Div Br/ Patrim', '2015',
                  'Cres. Rec (5a)', 'Giro Ativos',

                  'Ativo',
                  'Dív. Bruta',
                  'Disponibilidades',
                  'Dív. Líquida',
                  'Ativo Circulante',               
                  'Depósitos',
                  'Cart. de Crédito',
                  'Patrim. Líq',

                  'Receita Líquida_12meses',         
                  'Receita Líquida_3meses', 'EBIT_12meses', 'EBIT_3meses',
                  'Lucro Líquido_12meses', 'Lucro Líquido_3meses']
                  
                  e mais algumas informações...

Realizei este projeto com o fim de aprendizado e por não encontrar no github nenhum scrapy que pegue todas as informaçoes que eu precisava como setores e subsetores para realizar modelos KNN e KMC de machine learning.

Crawler do site Fundamentus.com com o uso do framework scrapy, tanto da aba detalhada como a de resumo.

Related tags

Overview

Fundamentus com framework scrapy

Owner

Guilherme Silva Uchoa

Automatically download and crop key information from the arxiv daily paper.

Complete pipeline for crawling online newspaper article.

Unja is a fast & light tool for fetching known URLs from Wayback Machine

Web scrapping tool written in python3, using regex, to get CVEs, Source and URLs.

download NCERT books using scrapy

Scraping script for stats on covid19 pandemic status in Chiba prefecture, Japan

Amazon scraper using scrapy, a python framework for crawling websites.

A simple, configurable and expandable combined shop scraper to minimize the costs of ordering several items

a way to scrape a database of all of the isef projects

A Happy and lightweight Python Package that searches Google News RSS Feed and returns a usable JSON response and scrap complete article - No need to write scrappers for articles fetching anymore

A Telegram crawler to search groups and channels automatically and collect any type of data from them.

A Python module to bypass Cloudflare's anti-bot page.

A Python web scraper to scrape latest posts from official Coinbase's Blog.

Automatically scrapes all menu items from the Taco Bell website

Scrapes Every Email Address of Every Society in Every University

Free-Game-Scraper is a useful script that allows you to track down free games and DLCs on many platforms.

This Spider/Bot is developed using Python and based on Scrapy Framework to Fetch some items information from Amazon

Haphazard scripts for scraping bitcoin/bitcoin data from GitHub

An helper library to scrape data from TikTok in one line, using the Influencer Hunters APIs.

淘宝茅台抢购最新优化版本，淘宝茅台秒杀，优化了茅台抢购线程队列