Differences
This shows you the differences between two versions of the page.
Next revision | Previous revision | ||
lehrkraefte:blc:informatik:glf4-20:datenextraktion [2021/02/08 13:42] Ivo Blöchliger created |
lehrkraefte:blc:informatik:glf4-20:datenextraktion [2021/02/08 14:08] (current) Ivo Blöchliger |
||
---|---|---|---|
Line 1: | Line 1: | ||
====== Regular Expressions ====== | ====== Regular Expressions ====== | ||
+ | |||
+ | ===== Ausprobieren in der Konsole ===== | ||
+ | Wichtig: Das Module '' | ||
+ | <code python> | ||
+ | import re | ||
+ | |||
+ | re.findall(" | ||
+ | # Liefert [" | ||
+ | |||
+ | re.findall(" | ||
+ | # Liefert [(" | ||
+ | </ | ||
+ | |||
===== Cheat Sheet ===== | ===== Cheat Sheet ===== | ||
Line 15: | Line 28: | ||
==== Zeichenklassen ==== | ==== Zeichenklassen ==== | ||
^ Zeichen ^ Bedeutung ^ Match' | ^ Zeichen ^ Bedeutung ^ Match' | ||
- | \d | Eine Ziffer, wie [0-9] | 5 | B | | + | | \d | Eine Ziffer, wie [0-9] | 5 | B | |
- | \w | Ein Zeichen, das in einem Wort vorkommen kann. | r | ; | | + | | \w | Ein Zeichen, das in einem Wort vorkommen kann. | r | ; | |
- | \b | Anfang oder Ende eines Worts | | | | + | | \b | Anfang oder Ende eines Worts | | | |
- | \s | Ein Leerschlag oder Tabulator| | | | + | | \s | Ein Leerschlag oder Tabulator| | | |
- | \n | Ein Zeilenumbruch | | | | + | | \n | Ein Zeilenumbruch | | | |
- | \\ | Ein Backslash | \ | / | | + | | < |
- | \. | Ein Punkt | . | x | | + | | \. | Ein Punkt | . | x | |
- | \( | Eine Klammer | ( | ) | | + | | \( | Eine Klammer | ( | ) | |
Wird eine Zeichenklasse gross geschrieben, | Wird eine Zeichenklasse gross geschrieben, |