Both sides previous revision
Previous revision
Next revision
|
Previous revision
|
kurse:ef05a-2021:regex [2022/05/09 10:23] Ivo Blöchliger |
kurse:ef05a-2021:regex [2022/05/12 09:07] (current) Ivo Blöchliger [Wordle-Pro mit regular Expressions] |
<a href='./0475c543/mouseEffect.html'>./0475c543/mouseEffect.html</a><br> | <a href='./0475c543/mouseEffect.html'>./0475c543/mouseEffect.html</a><br> |
<a href='./76163dbd/Taschenrechner.html'>./76163dbd/Taschenrechner.html</a><br> | <a href='./76163dbd/Taschenrechner.html'>./76163dbd/Taschenrechner.html</a><br> |
<a href='./4b29d86a/index.html'>./4b29d86a/index.html</a><br><a href='./05c7c22f/wordle.html'>./05c7c22f/wordle.html</a><br> | <a href='./4b29d86a/index.html'>./4b29d86a/index.html</a><br> |
| <a href='./05c7c22f/wordle.html'>./05c7c22f/wordle.html</a><br> |
<a href='./4d4f79fa/index.html'>./4d4f79fa/index.html</a><br> | <a href='./4d4f79fa/index.html'>./4d4f79fa/index.html</a><br> |
<a href='./2750fa3e/index.html'>./2750fa3e/index.html</a><br><a href='./projects.html'>./projects.html</a><br> | <a href='./2750fa3e/index.html'>./2750fa3e/index.html</a><br> |
| <a href='./projects.html'>./projects.html</a><br> |
</code> | </code> |
* Vervollständigen Sie obige Links mit der vollständigen Adresse: https://ofi.tech-lab.ch/2022/EF05a/ | * Vervollständigen Sie obige Links mit der vollständigen Adresse: https://ofi.tech-lab.ch/2022/EF05a/ |
| |
| |
Auf https://sourceforge.net/projects/germandict/ gibt es eine Wortliste mit 1.2 Wörten, die in deutschen Texten vorkommen können. Extrahieren Sie daraus: | Auf https://sourceforge.net/projects/germandict/ gibt es eine Wortliste mit 1.2 Millionen Wörten, die in deutschen Texten vorkommen können. Extrahieren Sie daraus: |
* Evtl. ß durch ss ersetzen. | * Evtl. ß durch ss ersetzen. |
* Evtl. ä, ö, ü durch ae, oe, ue ersetzen. | * Evtl. ä, ö, ü durch ae, oe, ue ersetzen. |
| |
{{:kurse:ef05a-2021:pasted:20220509-101601.png}} | {{:kurse:ef05a-2021:pasted:20220509-101601.png}} |
| <code txt> |
| [^OENICHKAGL\n]{3}LT |
| </code> |
<HTML><hr></HTML> | <HTML><hr></HTML> |
{{:kurse:ef05a-2021:pasted:20220509-101840.png}} | {{:kurse:ef05a-2021:pasted:20220509-101840.png}} |
| |
| |
| Hinweis: N muss an erster oder vierter Stelle stehen. Mit dem Pipe Zeichen ''|'' können mehrere Expressions durch ''oder'' verknüpft werden. |
| <code txt> |
| ^NRA[^BOTULKGZA]S|^[^BOTULKGZA]RANS |
| </code> |
<HTML><hr></HTML> | <HTML><hr></HTML> |
{{:kurse:ef05a-2021:pasted:20220509-102029.png}} | {{:kurse:ef05a-2021:pasted:20220509-102029.png}} |
| <code txt> |
| ^S[^INDZGERPT]O[^INDZGERPT]{2} |
| </code> |
<HTML><hr></HTML> | <HTML><hr></HTML> |
{{:kurse:ef05a-2021:pasted:20220509-102145.png}} | {{:kurse:ef05a-2021:pasted:20220509-102145.png}} |
| |
| <code txt> |
| ^NE[^KATJOLSHR]R[^KATJOLSHRN]|^[^KATJOLSHR]ENR[^KATJOLSHRN] |
| </code> |
==== Alternativen für HTML, JSON, XML und allg. maschinenlesabare Formate ==== | ==== Alternativen für HTML, JSON, XML und allg. maschinenlesabare Formate ==== |
Um Daten aus HTML, JSON oder XML nachhaltig zu extrahieren/manipulieren, ist es ratsam, Werkzeuge zu verwenden, die das entsprechende Format verstehen, z.B. für | Um Daten aus HTML, JSON oder XML nachhaltig zu extrahieren/manipulieren, ist es ratsam, Werkzeuge zu verwenden, die das entsprechende Format verstehen, z.B. für |