powered by SUMAGO network

Parser

Fragen zum Thema
SEO & Content Marketing?

Marketing Glossar | SUMAGO network

Parser - Was ist das?

Der Begriff beruht auf dem englischen Verb „to parse“, was übersetzt so viel wie „analysieren“ bedeutet. Gebräuchlich ist die Bezeichnung „Zerteiler“. Dabei handelt es sich um ein Computerprogramm, das die Zerlegung und Umwandlung bestimmter Eingaben in ein anderes Format übernimmt, damit sie weiterverarbeitet werden können. Er kommt als Teil des Compilers bei der Übersetzung des Quellcodes einer Webseite oder eines Programms in eine maschinenlesbare Sprache zum Einsatz.

Was ist ein Parser?

Funktionsprinzip des Parsers

Er analysiert einen in einer Programmiersprache verfassten Quelltext mithilfe eines lexikanischen Scanners. Dieser zerlegt die Daten in einzelne Eingabesymbole wie Wörter und folgt dabei der regulären Grammatik. Seine Aufgabe ist es, eine syntaktische Analyse der Daten durchzuführen und im Anschluss einen sogenannten Syntaxbaum zu erstellen. Dieser bildet die Hierarchie zwischen den einzelnen Bestandteilen ab und wird für die Weiterverarbeitung der Daten genutzt. Grundsätzlich prüft er die Angaben im Quellcode einer Webseite oder eines Programms und verarbeitet sie weiter, bevor der Compiler die Transformation in die Maschinensprache vornimmt.

 

Auch außerhalb der Informatik kommt das sogenannte Parsing zum Einsatz. In der Linguistik wird damit eine Syntaxanalyse bezeichnet, mit deren Hilfe ein Satz in seine grammatikalischen Bestandteile zerlegt wird. Diese Einzelbestandteile werden als Syntax bezeichnet.

Verschiedene Parser-Typen

In der Informatik wird eine Trennung in zwei Typen vorgenommen. Sie unterscheiden sich hinsichtlich der Reihenfolge, in der die Knoten des Syntaxbaumes erstellt werden. Bei der Top-Down-Methode erstellt er den Syntaxbaum von der „Wurzel“ her und arbeitet sich langsam bis zur „Krone“ hinauf. Das bedeutet, die Suche beginnt mit dem Startsymbol der Syntax und der Ableitungsbaum wird Schritt für Schritt nach dem Auffinden syntaktischer Ableitungen aufgebaut. Bei der Bottom-Down-Methode erfolgen die Abläufe in umgekehrter Reihenfolge. Ausgangspunkt ist die Syntax des Eingabesatzes, auf deren Grundlage syntaktische Zusammenhänge aufgebaut werden. Mit dem Erreichen des Startsymbols ist der Vorgang abgeschlossen. Vereinfacht ausgedrückt arbeitet sich ein Bottom-Down-Parser vom „Blätterdach“ bis zur „Wurzel“ des Syntaxbaumes.

Anwendungs-beispiele aus der Praxis

Im klassischen Fall übernimmt ein Parser als Teil des Compilers die Übertragung eines Textes in eine neue Struktur. In der Praxis kommt er bei folgenden Anwendungen zum Einsatz:

XML-Parser analysieren XML-Dokumente und bereiten die enthaltenen Attribute und Elemente für die Weiterverarbeitung auf.


Im Webbrowser analysieren den HTML-Code einer Webseite, der ohne den Parser lediglich aus einer Aneinanderreihung einzelner Zeichen besteht. Nach der Analyse und Übertragung in eine maschinenlesbare Sprache wird die Datenstruktur von einer Layout-Engine auf den Desktop projiziert.


Logdatei-Parser analysieren Informationen, die in Ereignisprotokollen, Protokolldateien oder anderen Logdateien gespeichert sind. RSS-Feeds können mithilfe eines RSS-Parsers in ein anderes Datenformat umgewandelt werden.
Suchmaschinen benutzen Parser, um mithilfe von Crawlern die relevanten Textzeilen von Webseiten zu extrahieren. Nach der Analyse werden sie aufbereitet und den entsprechenden Suchbegriffen zugeordnet.

Weiterführende Links:

Parser bei Wikipedia

Kann ich dir im Marketing helfen?

*“ zeigt erforderliche Felder an

Ich bin dein erster Ansprechpartner:

Inhaber & Geschäftsführer

Marco Janck

SEO Betreuung ist Chefsache

Telefon:
030 | 9599987-20
E-Mail:
support@sumago.de
Adresse:
Motzener Str. 12-14
12277 Berlin