C++ Builder 10.1 Berlin, Komponente zum auslesen von HTML-Quelltext gesucht
-
Hallo!
Ich bin auf der Suche nach einer passenden Komponente mit der ich Strings von einer HTML-Seite parsen kann.
Leider scheint der Builder keine Komponente mitzubringen mit welcher ich den Quelltext einer HTML Seite laden kann, oder bin ich blind?
Habe mir die Testversion heruntergeladen.
Viele Grüße
-
Du kannst dich mal an libcurl heranwagen, vielleicht kriegste das mit dem clang Compiler zum Laufen. Vllt gibts ja auch schon einen Borland Port für die C++ Bindings, musste halt mal googeln.
-
Hallo und erstmal danke für die Antwort.
Bin mittlerweile etwas weiter. Hatte irgendwie einen Denkfehler. Ich zieh mir die HTML-Datei per HTTP-Download und lade den Inhalt in eine TStringList. Das funktioniert auch wunderbar.
Nun bräuchte ich mal einen Anstoß beim denken. Ich möchte einen bestimmten String aus dem HTML-Quelltext auslesen und bin gerade am überlegen wie ich das am besten mache. TStringList->Find kann ich nicht nutzen da ein umsortieren alles durcheinander wirft und ich noch bestimmte Zeichenketten nach dem gefundenen String benötige. Diese stehen aber nicht mehr in der gleichen Zeile.
Hat Jemand eine Idee für mich?
Danke und viele Grüße
-
Schreib alle Strings der
TStringList
in einenstd::string
(überostringstream
!) und mach da weiter. Die STL/boost bieten mehr und mächtigere Funktionen als die Borland String Bibliotheken.
-
HTML würde ich niemals mit einfachen String-Funktionen parsen (dafür gibt es zu viele Sonderfälle).
Schau mal, ob diese Komponenten funktionieren:
Jedi (hier der Link auf den HTML-Parser: TJvHTMLParser)
HTML Component Library
Delphi DOM HTML parser and converter