Parser

maschinenlesbare Sprache

Parser – überträgt den Quelltext in die Computersprache

Parser erklärt von SUMAGO

Der Begriff Parser beruht auf dem englischen Verb „to parse“, was übersetzt so viel wie „analysieren“ bedeutet. Gebräuchlich ist die Bezeichnung „Zerteiler“ für den Parser. Dabei handelt es sich um ein Computerprogramm, das die Zerlegung und Umwandlung bestimmter Eingaben in ein anderes Format übernimmt, damit sie weiterverarbeitet werden können. Ein Parser kommt als Teil des Compilers bei der Übersetzung des Quellcodes einer Webseite oder eines Programms in eine maschinenlesbare Sprache zum Einsatz.

parser

Funktionsprinzip des Parsers

Der Parser analysiert einen in einer Programmiersprache verfassten Quelltext mithilfe eines lexikanischen Scanners. Dieser zerlegt die Daten in einzelne Eingabesymbole wie Wörter und folgt dabei der regulären Grammatik. Die Aufgabe des Parsers ist es, eine syntaktische Analyse der Daten durchzuführen und im Anschluss einen sogenannten Syntaxbaum zu erstellen. Dieser bildet die Hierarchie zwischen den einzelnen Bestandteilen ab und wird für die Weiterverarbeitung der Daten genutzt. Grundsätzlich prüft der Parser die Angaben im Quellcode einer Webseite oder eines Programms und verarbeitet sie weiter, bevor der Compiler die Transformation in die Maschinensprache vornimmt.

Auch außerhalb der Informatik kommt das sogenannte Parsing zum Einsatz. In der Linguistik wird damit eine Syntaxanalyse bezeichnet, mit deren Hilfe ein Satz in seine grammatikalischen Bestandteile zerlegt wird. Diese Einzelbestandteile werden als Syntax bezeichnet.

Verschiedene Parser-Typen

In der Informatik wird eine Trennung in zwei Parser-Typen vorgenommen. Sie unterscheiden sich hinsichtlich der Reihenfolge, in der die Knoten des Syntaxbaumes erstellt werden. Bei der Top-Down-Methode erstellt der Parser den Syntaxbaum von der „Wurzel“ her und arbeitet sich langsam bis zur „Krone“ hinauf. Das bedeutet, die Suche beginnt mit dem Startsymbol der Syntax und der Ableitungsbaum wird Schritt für Schritt nach dem Auffinden syntaktischer Ableitungen aufgebaut. Bei der Bottom-Down-Methode erfolgen die Abläufe in umgekehrter Reihenfolge. Ausgangspunkt ist die Syntax des Eingabesatzes, auf deren Grundlage syntaktische Zusammenhänge aufgebaut werden. Mit dem Erreichen des Startsymbols ist der Vorgang abgeschlossen. Vereinfacht ausgedrückt arbeitet sich ein Bottom-Down-Parser vom „Blätterdach“ bis zur „Wurzel“ des Syntaxbaumes.

Anwendungsbeispiele aus der Praxis

Im klassischen Fall übernimmt ein Parser als Teil des Compilers die Übertragung eines Textes in eine neue Struktur. In der Praxis kommt ein Parser bei folgenden Anwendungen zum Einsatz:

  • XML-Parser analysieren XML-Dokumente und bereiten die enthaltenen Attribute und Elemente für die Weiterverarbeitung auf.
  • Parser im Webbrowser analysieren den HTML-Code einer Webseite, der ohne den Parser lediglich aus einer Aneinanderreihung einzelner Zeichen besteht. Nach der Analyse und Übertragung in eine maschinenlesbare Sprache wird die Datenstruktur von einer Layout-Engine auf den Desktop projiziert.
  • Logdatei-Parser analysieren Informationen, die in Ereignisprotokollen, Protokolldateien oder anderen Logdateien gespeichert sind.
  • RSS-Feeds können mithilfe eines RSS-Parsers in ein anderes Datenformat umgewandelt werden.
  • Suchmaschinen benutzen Parser, um mithilfe von Crawlern die relevanten Textzeilen von Webseiten zu extrahieren. Nach der Analyse werden sie aufbereitet und den entsprechenden Suchbegriffen zugeordnet.

Weiterführende Links:

Parser bei Wikipedia

JA, ICH WILL MEHR ERFAHREN!




Ich bitte um Informationen zu (bitte auswählen):

Mit dem Absenden dieses Kontaktformulars erklären Sie sich damit einverstanden, dass Ihre Daten zur Bearbeitung Ihres Anliegens verwendet und gespeichert werden. Weitere Informationen und Widerrufshinweise finden Sie in unserer Datenschutzerklärung