Der HTML Parser basiert auf den HTML Spezifikationen 3.2 und 4.0. Er führt keine strenge Prüfung hinsichtlich der Sprachdefinition durch. Stattdessen ist er tolerant und akzeptiert inkorrekte Eingaben, wie sie in vielen HTML-Seiten zu finden sind. Der HTML Parser baut einen Syntaxbaum auf.
Referenzen
- HTML 3.2 Reference Specification, W3C Recommendation, 14-Jan-1997, http://www.w3.org/TR/REC-html32.html
- HTML 4.0 Specification, W3C Recommendation, revised on 24-Apr-1998, http://www.w3.org/TR/1998/REC-html40-19980424/
- HTML 4.01 Specification, W3C Recommendation, 24 December 1999, http://www.w3.org/TR/REC-html40/