Skip to content

caioalves19/scrapy-soccer-games

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

58 Commits
 
 
 
 
 
 
 
 

Repository files navigation

scrapy-soccer-games

Esse projeto tem por finalidade pegar informação de tabelas de jogos de futebol de diversos sites.

As informações incluem nomes dos times, data, hora, local, rodada, entre outros.

O objetivo inicial não é informações de placar e, sim, para controlar qualquer alteração em datas, horários e locais de jogos futuros.

Spiders: cbf_games - Pega informações de campeonatos presentes no site da Confederação Brasileira de Futebol (CBF). fpf_games - Pega informações de campeonatos presentes no site da Federação Paulista de Futebol (FPF)* flashscore_games - Pega informações de campeonatos presentes no site Flashscore (antigo resultados.com).

*O fpf_games não está funcionando com o Scrapy e Selinium em conjunto. Apenas consigo pegar os dados com outro script, usando apenas o Selenium.

Exemplo de resultado de um spider:

{ 'cidade_jogo': 'Curitiba', 'data_jogo': '30/05/2021', 'estadio_jogo': 'Arena da Baixada', 'estado_jogo': 'PR', 'hora_jogo': '18:15', 'nome_campeonato': 'Campeonato Brasileiro Série A', 'numero_jogo': 8, 'rodada_jogo': 1, 'time_mandante': 'Athletico - PR', 'time_visitante': 'América - MG' }

INSTRUÇÕES

O projeto foi criado no Python 3.9.6 e necessita do Scrapy e do Selenium

O Selenium é usado no fpf_games e flashscore_games para lidar com conteúdo gerado por JavaScript

Para instalação, basta digitar o comando "pip install -r requirements.txt

Depois, entre na pasta do projeto com "cd soccer_games"

Para executar um spider basta digitar o comando "scrapy crawl {nome_do_spider}"

About

This project has the goal to scraping information about soccer games from a few websites. Focused on brazilian soccer games.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages