Startseite ¦  was ist neu ¦  programmier tips ¦  indy artikel ¦  intraweb artikel ¦  informationen ¦  links ¦  interviews ¦  sonstiges
kylix ¦  tutorials ¦  online shop ¦  fotos ¦  Add&Win Gewinnspiel


Willkommen Gast. Bitte einloggen oder registrieren.
08.02.2012, 03:16:21
Übersicht Hilfe Suche Einloggen Registrieren

+  SwissDelphiCenter Forum
|-+  German Forums
| |-+  Internet / LAN Forum
| | |-+  Webseiten vergleichen / Änderung in eine Excel Tabelle einfügen und abspeichern
« vorheriges nächstes »
Seiten: [1] Drucken
Autor Thema: Webseiten vergleichen / Änderung in eine Excel Tabelle einfügen und abspeichern  (Gelesen 1767 mal)
Natcree
Newbie
*
Offline Offline

Beiträge: 5


« am: 16.08.2009, 16:49:01 »

Ich habe vor eine Webseite automatisch über den Twebbrowser alle 30 minuten zu öffnen. Diese soll dann mein Programm auf Änderungen Überprüfen. Wenn es Änderungen gibt soll er die Änderungen in eine Excel Datei eintragen und abspeichern. Bei jeder Änderung soll es die gleiche Datei wieder öffnen und in einer neuen zeile die Änderungen eintragen und speichern.

Wie kann ich diese Sache realisieren. Ich haben in meinem ersten Thema bereits mit eurer Hilfe ne möglichkeit gefunden alle 30 min. eine webseite zu öffnen und dann automatisch immer in eine neue Datei zu speichern.

Nun die Auswertung ist sehr aufwendig aus dem Grund möchte ich jetzt die Änderungen gleich in eine Excel Datei einbinden.

Bitte Helft mir ich hoffe jemand weiss rat und kann mir beim Aufbau des Progs helfen.
Gespeichert
Loïs Bégué
Global Moderator
Hero Member
*****
Offline Offline

Beiträge: 1718



WWW
« Antworten #1 am: 27.08.2009, 16:07:22 »

3 Ansätze:

1) Du berechnet eine Prüfsumme(Checksum wie z.B. CRC, MD5, SHA1...)  für den Quelltext (HTML-Code) der Seite.
Dann vergleichst Du die zuletzt gespeicherte Prüfsumme mit der von der aktuell berechnete.
Das setzt allerdings voraus, da der Quelltext nicht "zu dynamisch" ist.
z.B. wenn die Uhrzeit im Footer jedesmal beim Laden angepasst wird, dann ist die Prüfsumme jedesmal eine andere.

2) Mittels RegEx/MS HTML Parser könntest Du versuchen nur bestimmte Teile des Quelltextes zu erfassen und erst daraus eine Prüfsumme zu bilden.
Also mittels reguläre Expression:
- alle (X)HTML Tags
- alle Kommentare
- alle Skripten löschen.
Oder gleich aus dem Quelltext den Content eines bestimmten  <DIV..>...</DIV> herausfiltern und damit arbeiten.


3) Manche Seiten enthalten in den Meta-Tags eine Angabe über die Zeit der letzten Aktualisierung. Mit RegEx oder mit MS-HTML Parser herauslesen.

RegEx
Was sind Reguläre Ausdrücke ?
Using Regular Expressions unter anderem.
Delphi Kompo:
TRegExpr von RegEx-Studio

MS HTML Parser
Gooooglllelele nach "Delphi IHTMLDocument2"
bzw. schau hier im SDC:
...den Text einer HTML Datei extrahieren?
Gespeichert

Prof.Y
Arpoon
Natcree
Newbie
*
Offline Offline

Beiträge: 5


« Antworten #2 am: 30.08.2009, 22:44:03 »

Danke erstmal für deine Antwort.

Das hört sich für mich als Newbee noch ziemlich Fachspezifisch an und wird für mich schwer sein alles umzusetzen. Ich werde mich da mal stück für stück rantasten wäre toll wenn du ab und zu mal reinschauen könntest. ob sich hier was getan hat.

Wäre auch ne tolle Sache wenn du mir mal einen guten anfang geben könntest was ich so auf der form brauche. Damit ich stück für stück alles abarbeiten kann. Oder vielleicht hast du ja eine to do liste oder so was in der art. Selber lesen macht schlau und bringt mich sicherlich in zukunft weiter als wenn ich mir in den einzelnen Threads nur alles zusammstückele.

Vielen Dank
Gespeichert
Seiten: [1] Drucken 
« vorheriges nächstes »
Gehe zu:  


Einloggen mit Benutzername, Passwort und Sitzungslänge

Powered by MySQL Powered by PHP Powered by SMF 1.1.11 | SMF © 2006, Simple Machines LLC Prüfe XHTML 1.0 Prüfe CSS