von panzi » 04 Mai 2008, 21:11
(Zumal ich noch < 1 Tag angemeldet bin darf ich noch keine URLs posten. Halt allen Pfaden die puls4 Domain prefixen.)
Mhm. Ich hab mir die Puls4 Seite mal angeschaut. Die verwenden Prototype (eine AJAX API). Auf folgenden weg kann man einen Chunk bekommen, der HTML Code beinhaltet, welcher das Programm eines Tages darstellt:
wget --header "X-Requested-With: XMLHttpRequest" "/tv/remoteGuideView/type/daily/active_day/2008-05-03"
D.h. ein Request auf /tv/remoteGuideView/type/daily/active_day/YYYY-MM-DD mit dem Header:
X-Requested-With: XMLHttpRequest
Das Ergebnis verwendet Tabellen und IDs, sollte somit relativ einfach zu parsen sein. Natürlich stellt sich die Frage wie stabil so eine Extraktion ist, also wie lange das so bleiben wird. Zumal der HTML Code hier ziemlich stark aufgeräumt ist und keine Formatierungen beinhaltet (das wird anscheinend alles per CSS gemacht) könnt ich mir vorstellen, dass das länger so bleibt (rein vom technischen Standpunkt her betrachtet).
Apropos: Firebug ruled.
(Zumal ich noch < 1 Tag angemeldet bin darf ich noch keine URLs posten. Halt allen Pfaden die puls4 Domain prefixen.)
Mhm. Ich hab mir die Puls4 Seite mal angeschaut. Die verwenden Prototype (eine AJAX API). Auf folgenden weg kann man einen Chunk bekommen, der HTML Code beinhaltet, welcher das Programm eines Tages darstellt:
wget --header "X-Requested-With: XMLHttpRequest" "/tv/remoteGuideView/type/daily/active_day/2008-05-03"
D.h. ein Request auf /tv/remoteGuideView/type/daily/active_day/YYYY-MM-DD mit dem Header:
X-Requested-With: XMLHttpRequest
Das Ergebnis verwendet Tabellen und IDs, sollte somit relativ einfach zu parsen sein. Natürlich stellt sich die Frage wie stabil so eine Extraktion ist, also wie lange das so bleiben wird. Zumal der HTML Code hier ziemlich stark aufgeräumt ist und keine Formatierungen beinhaltet (das wird anscheinend alles per CSS gemacht) könnt ich mir vorstellen, dass das länger so bleibt (rein vom technischen Standpunkt her betrachtet).
Apropos: Firebug ruled. ;)