HTML-Seite als Programmquelle

Hier wird dir geholfen, wenn du TV-Daten anbieten möchtest.
Antworten
DirkNB
Junior Member
Beiträge: 27
Registriert: 29 Okt 2007, 20:06
Wohnort: Neubrandenburg
Kontaktdaten:

HTML-Seite als Programmquelle

Beitrag von DirkNB »

Vermutlich fange ich jetzt mal mit einer Urschleimfrage an, aber nach längerem durchforsten las ich nur "Speziallösungen", aber meine eigentlich Frage blieb unbeantwortet.
Ich betreue das Webangebot eines Radiosenders, auf deren CMS ich leider keinen Einfluss habe. In diesem Webangebot gibt es eine Webseite (feste, gleichbleibende Adresse), auf der die geplanten Sendungen mit Start- und Endzeit nach Datum sortiert aufgeführt sind. Diese Seite wird durch das CMS "gefüttert", die Seite aktualisiert sich also selber, Sendungen vergangener Tage verschwinden auch automatisch.
Gibt es eine Möglichkeit, automatisch Programmdaten von einer HTML-Seite abzugrabbeln und dem TV-Browser mundgerecht aufzubereiten, so dass die Informationen dort auch erscheinen? Bei Bedarf stehen dafür auf einem anderen Webserver Kapazitäten (PHP, CGI, Perl) zur Verfügung. Eigene Programmierkenntnisse sind, wenn überhaupt, nur in PHP vorhanden. Aber anpassungen in Scripten, wenn ich weiß, wo ich was anpassen muss, sollte ich auch noch hinbekommen. ;-)
Plan B wäre die Variante, die Daten fertig aufbereitet durch das CMS zu liefern. Da die Arbeitsleistung aber vermutlich Geld kostet, möchte ich davon Abstand nehmen, außer, es lässt sich einfach realisieren. Meine Frage demzufolge: Kann der TV-Browser seine Daten direkt von einem fremden Webserver holen? Welche Struktur, Syntax etc. müssen dann die Daten haben?
"Einfach realisieren" wäre zum Beispiel eine Textdatei mit fest definiertem Namen und Pfad, in der im Klartext die Daten drinstehen. Ähnlich vermutlich wie CSV-Dateien?
Benutzeravatar
bodo
Site Admin
Beiträge: 19635
Registriert: 03 Dez 2003, 19:37
Wohnort: Köln
Kontaktdaten:

Beitrag von bodo »

Also am besten nimmt jemand die Daten von euch, konvertiert die in das TV-Browser-Format und bietet die dann an.

Das ist dann das einfachste für alle :).

Allerdings brauchen wir dann natürlich eure Erlaubnis, die Daten weiterzuverbreiten.
Jo
Site Admin
Beiträge: 11802
Registriert: 07 Apr 2006, 23:39

Beitrag von Jo »

Hier ist die Anleitung. Wenn die Daten in einem gut strukturierten Format kommen, braucht man nicht viel Java zu können. Im Starterkit sind sogar Beispieldateien.
DirkNB
Junior Member
Beiträge: 27
Registriert: 29 Okt 2007, 20:06
Wohnort: Neubrandenburg
Kontaktdaten:

Beitrag von DirkNB »

bodo hat geschrieben:Also am besten nimmt jemand die Daten von euch, konvertiert die in das TV-Browser-Format und bietet die dann an.
Allerdings brauchen wir dann natürlich eure Erlaubnis, die Daten weiterzuverbreiten.
Das Problem ist, dass an die Daten selber so einfach kein rankommen ist. Die werden ja direkt im CMS erfasst und sind aus meiner Sicht erstmal unerreichbar. Außer natürlich als schon erwähnte Webseite, und im "internen Bereich" zur Bearbeitung über Webformular. Es gibt keine Schnittstelle zu irgendwelchen Standard-Formaten wie xls und doc ...

Die Erlaubnis ist das kleinste Problem.
DirkNB
Junior Member
Beiträge: 27
Registriert: 29 Okt 2007, 20:06
Wohnort: Neubrandenburg
Kontaktdaten:

Beitrag von DirkNB »

Jo hat geschrieben:Hier ist die Anleitung. Wenn die Daten in einem gut strukturierten Format kommen, braucht man nicht viel Java zu können. Im Starterkit sind sogar Beispieldateien.
Durch das Ding habe ich mich schon durchgequält, aber keinen Ansatz gefunden. Entweder stehe ich temporär nur blöd auf dem Schlauch, oder ich begreife es nicht.
Bei dem Starterkit muss ich ja irgendwo die Webseite eingeben, auf der das Programm steht. Dann muss ich dem Kit ja sagen, wo es auf der HTML-Seite welche Daten findet. Zumindest stelle ich es mir so vor. Aber soweit kommt ich ja gar nicht erst. Dazu dann irgendwo die Standard-Werte, die nicht auf der Seite selber stehen (zumindest nicht so direkt) wie Sendername usw.
Ich bin verzweifelt. :(
DirkNB
Junior Member
Beiträge: 27
Registriert: 29 Okt 2007, 20:06
Wohnort: Neubrandenburg
Kontaktdaten:

Beitrag von DirkNB »

Ich habe mich eben durch das Starterkit durchgefressen. Soweit ist ja alles klar. Ich glaube, ich habe es verstanden. Das Problem ist nur: Es gibt keine Excel-Datei und keine XML-Datei mit den Programmdaten, es gibt erstmal nur die HTML-Webseite als Quelle.
Benutzeravatar
bodo
Site Admin
Beiträge: 19635
Registriert: 03 Dez 2003, 19:37
Wohnort: Köln
Kontaktdaten:

Beitrag von bodo »

Also da gibt es jetzt mehrere Möglichkeiten:

- Wenn du Java kannst: einen eigenen Parser schreiben, der die Webseite ausliest. Ein Beispiel für sowas ist auch im Datenkit als Java-Klasse vorhanden
- Wenn du kein Java kannst: die XML-Datei mit Hilfe von PHP selber aus der Datenbank erzeugen.
- Alternativ die Daten irgendwie öffentlich zugänglich machen, dann kann ich (oder ein anderer Freiwilliger) einen Parser für schreiben und den Sender einbauen.
Benutzeravatar
Siggi
Moderator
Beiträge: 2271
Registriert: 31 Dez 2003, 12:21
Wohnort: Doberlug - Kirchhain

Beitrag von Siggi »

Hi DirkNB,

kannst du ein bisschen PHP oder eine andere Sprache?

So könntest du einfach die Daten von der Seite, die du betreust, auslesen.

Die Rechte wirst du ja dazu haben.

Dann kannst du die Daten in einer xml Datei speichern.

Bis dann.
mfg Siggi

PS: Wer Fehler findet, darf Sie behalten!!! :-)
DirkNB
Junior Member
Beiträge: 27
Registriert: 29 Okt 2007, 20:06
Wohnort: Neubrandenburg
Kontaktdaten:

Beitrag von DirkNB »

Wie gesagt, an den das Webangebot hostenden Server komme ich nicht ran. Also auch nicht an die Daten. Das wurde an eine externe Firma vergeben ... Die einzige Quelle ist die programminformationen enthaltende Webseite. Aber ich werde mir mal die XML-Datei aus dem Starter-Kit ansehen, sowas muss sich doch unaufwendig automatisieren lassen. Und wenn der Aufwand klein genug ist, dann passt er ja vielleicht in den Service-Vertrag mit unserem Provider.
gaertsch

Beitrag von gaertsch »

Aufzeig!
Ich könnte die parsen, aber wie ist die Adresse der Seite? Oder habe ich was überlesen?
gaertsch

Beitrag von gaertsch »

Ich hätte ja schon *duck* für mich angefangen. Natürlich, Ehrenwort!, nur für private Zwecke. Aber seit keine Zeitdaten mehr auf den Event-Seiten sind, habe ich abgebrochen. Achtung, roher Output aus dem Log:

[Session started at 2008-01-03 23:28:38 +0100.]
2008-01-03 23:28:40.600 wirschauen[29023] parsing for Nachts...

2008-01-03 23:28:41.106 wirschauen[29023] Law and Order: New York
2008-01-03 23:28:41.106 wirschauen[29023] RTL 2

2008-01-03 23:28:41.579 wirschauen[29023] Popcorn Live
2008-01-03 23:28:41.580 wirschauen[29023] SuperRTL

2008-01-03 23:28:41.714 wirschauen[29023] Ein genialer Freak
2008-01-03 23:28:41.715 wirschauen[29023] SuperRTL

2008-01-03 23:28:42.380 wirschauen[29023] "Stern"-TV - Reportage
2008-01-03 23:28:42.380 wirschauen[29023] Vox

2008-01-03 23:28:42.449 wirschauen[29023] "Stern"-TV
2008-01-03 23:28:42.449 wirschauen[29023] RTL

2008-01-03 23:28:42.770 wirschauen[29023] BBC exklusiv: Freak Waves - Riesenwellen aus dem Nichts
2008-01-03 23:28:42.770 wirschauen[29023] Vox

2008-01-03 23:28:43.077 wirschauen[29023] They - Sie kommen
2008-01-03 23:28:43.077 wirschauen[29023] ProSieben


usw...
Benutzeravatar
bodo
Site Admin
Beiträge: 19635
Registriert: 03 Dez 2003, 19:37
Wohnort: Köln
Kontaktdaten:

Beitrag von bodo »

Ehm, das von DirkNB hat nix mit wirschauen.de zu tun. Bitte nicht maschinell auf Wirschauen.de zugreifen. Ich werde da noch eine Schnittstelle basteln.
Gast

Beitrag von Gast »

Schon klar!
Ich wollte nur nicht wie einer da stehen, der heiße Luft redet. Den Zugriff auf Wirschauen.de habe ich wie gesagt abgebrochen und werde ich zukünftig unterlassen.
Benutzeravatar
bodo
Site Admin
Beiträge: 19635
Registriert: 03 Dez 2003, 19:37
Wohnort: Köln
Kontaktdaten:

Beitrag von bodo »

Okidoki. Sobald es eine Schnittstelle für die Daten gibt, sage ich auch hier im Forum bescheid.
Antworten