import re # Regular Expressions
f = open("resultate.html") # Datei zum Lesen öffnen
html = f.read() # Alles einlesen (ohne als json zu interpretieren). Man erhät einfach eine (sehr lange) Zeichenkette.
f.close() # Datei schliessen
html = html.replace("\n","") # Alle Zeilenumbrüche löschen (werden von . nicht gematcht)
spiele = re.findall(r"<div class=\"match\">(.*?)</div></div></div></div>", html)
for s in spiele:
print(s)
# Die gewünschten Daten mit weiteren Regular Expressions auslesen, z.B Datum und Score:
datum = re.findall(r"match-date\".(.*?)</strong.*?score\">(.*?)<", s)[0] # Nur das erste Regex-Match (mehr sollte es sowieso nicht geben)
print(datum)
print("\n\n\n")