Diário Dia 14502 de Agosto de 2019

Consegui pegar todos os dados necessários para os estudos iniciais, esta tudo organizado e funcionando. Quando a gente desenvolve um sistema como esse tem tanto recurso legal que podemos adicionar que é perigoso não conseguirmos caminhar. Neste primeiro momento deixei de lado alguns dados que acho importante para a versão funcional:
- Localização dos remates
- Gols esperados xG (pré-live)
- Valor como mandante / taxa ocupação estádio / pressão torcida
- Módulo que classifica os jogadores (capacidade e valor de mercado)
- Perfil do treinador
Vou deixar o código que desenvolvi para pegar o link dos gráficos SofaScore.
-----------------------------------------------------------------------------------------
from selenium import webdriver
from random import randint
from json import loads
# Inicia Sistema
driver = webdriver.Chrome('chromedriver.exe')
# Cria listas
graf_home = []
graf_away = []
graf_link = []
graf_rodada = []
# Número de rodadas da liga
rodadas = 34
# Faz o loop adicionando as rodadas a URL
for w in range(1, rodadas + 1):
url = '
https://www.sofascore.com/u-tournament/35/season/17597/matches/round/25' + str(w)
driver.get(url)
json_content = driver.find_element_by_css_selector('body > pre').text
data = loads(json_content)
print(url)
sleep(randint(3, 7))
for v in data['roundMatches']['tournaments'][0]['events']:
temp = '
https://www.sofascore.com/event/' + str(v['id']) + '/json'
graf_link.append(temp)
graf_home.append(v['homeTeam']['name'])
graf_away.append(v['awayTeam']['name'])
graf_rodada.append(w)
sleep(randint(3, 7))
# Exportando dados .csv
import pandas as pd
att_m = pd.DataFrame({'Rodada': graf_rodada,'Home': graf_home, 'Away': graf_away, 'ID': graf_link})
export = att_m.to_csv (r'links_sofascore_bundesliga_18_19.csv', index = None, header = True)
-----------------------------------------------------------------------------------------