3 Ansätze:
1) Du berechnet eine Prüfsumme(Checksum wie z.B. CRC, MD5, SHA1...) für den Quelltext (HTML-Code) der Seite.
Dann vergleichst Du die zuletzt gespeicherte Prüfsumme mit der von der aktuell berechnete.
Das setzt allerdings voraus, da der Quelltext nicht "zu dynamisch" ist.
z.B. wenn die Uhrzeit im Footer jedesmal beim Laden angepasst wird, dann ist die Prüfsumme jedesmal eine andere.
2) Mittels RegEx/MS HTML Parser könntest Du versuchen nur bestimmte Teile des Quelltextes zu erfassen und erst daraus eine Prüfsumme zu bilden.
Also mittels reguläre Expression:
- alle (X)HTML Tags
- alle Kommentare
- alle Skripten löschen.
Oder gleich aus dem Quelltext den Content eines bestimmten <DIV..>...</DIV> herausfiltern und damit arbeiten.
3) Manche Seiten enthalten in den Meta-Tags eine Angabe über die Zeit der letzten Aktualisierung. Mit RegEx oder mit MS-HTML Parser herauslesen.
RegExWas sind Reguläre Ausdrücke ?
Using Regular Expressions unter anderem.
Delphi Kompo:
TRegExpr von RegEx-StudioMS HTML ParserGooooglllelele nach "Delphi IHTMLDocument2"
bzw. schau hier im SDC:
...den Text einer HTML Datei extrahieren?