HTML-Seite als Programmquelle
-
- Junior Member
- Beiträge: 27
- Registriert: 29 Okt 2007, 20:06
- Wohnort: Neubrandenburg
- Kontaktdaten:
HTML-Seite als Programmquelle
Vermutlich fange ich jetzt mal mit einer Urschleimfrage an, aber nach längerem durchforsten las ich nur "Speziallösungen", aber meine eigentlich Frage blieb unbeantwortet.
Ich betreue das Webangebot eines Radiosenders, auf deren CMS ich leider keinen Einfluss habe. In diesem Webangebot gibt es eine Webseite (feste, gleichbleibende Adresse), auf der die geplanten Sendungen mit Start- und Endzeit nach Datum sortiert aufgeführt sind. Diese Seite wird durch das CMS "gefüttert", die Seite aktualisiert sich also selber, Sendungen vergangener Tage verschwinden auch automatisch.
Gibt es eine Möglichkeit, automatisch Programmdaten von einer HTML-Seite abzugrabbeln und dem TV-Browser mundgerecht aufzubereiten, so dass die Informationen dort auch erscheinen? Bei Bedarf stehen dafür auf einem anderen Webserver Kapazitäten (PHP, CGI, Perl) zur Verfügung. Eigene Programmierkenntnisse sind, wenn überhaupt, nur in PHP vorhanden. Aber anpassungen in Scripten, wenn ich weiß, wo ich was anpassen muss, sollte ich auch noch hinbekommen.
Plan B wäre die Variante, die Daten fertig aufbereitet durch das CMS zu liefern. Da die Arbeitsleistung aber vermutlich Geld kostet, möchte ich davon Abstand nehmen, außer, es lässt sich einfach realisieren. Meine Frage demzufolge: Kann der TV-Browser seine Daten direkt von einem fremden Webserver holen? Welche Struktur, Syntax etc. müssen dann die Daten haben?
"Einfach realisieren" wäre zum Beispiel eine Textdatei mit fest definiertem Namen und Pfad, in der im Klartext die Daten drinstehen. Ähnlich vermutlich wie CSV-Dateien?
Ich betreue das Webangebot eines Radiosenders, auf deren CMS ich leider keinen Einfluss habe. In diesem Webangebot gibt es eine Webseite (feste, gleichbleibende Adresse), auf der die geplanten Sendungen mit Start- und Endzeit nach Datum sortiert aufgeführt sind. Diese Seite wird durch das CMS "gefüttert", die Seite aktualisiert sich also selber, Sendungen vergangener Tage verschwinden auch automatisch.
Gibt es eine Möglichkeit, automatisch Programmdaten von einer HTML-Seite abzugrabbeln und dem TV-Browser mundgerecht aufzubereiten, so dass die Informationen dort auch erscheinen? Bei Bedarf stehen dafür auf einem anderen Webserver Kapazitäten (PHP, CGI, Perl) zur Verfügung. Eigene Programmierkenntnisse sind, wenn überhaupt, nur in PHP vorhanden. Aber anpassungen in Scripten, wenn ich weiß, wo ich was anpassen muss, sollte ich auch noch hinbekommen.
Plan B wäre die Variante, die Daten fertig aufbereitet durch das CMS zu liefern. Da die Arbeitsleistung aber vermutlich Geld kostet, möchte ich davon Abstand nehmen, außer, es lässt sich einfach realisieren. Meine Frage demzufolge: Kann der TV-Browser seine Daten direkt von einem fremden Webserver holen? Welche Struktur, Syntax etc. müssen dann die Daten haben?
"Einfach realisieren" wäre zum Beispiel eine Textdatei mit fest definiertem Namen und Pfad, in der im Klartext die Daten drinstehen. Ähnlich vermutlich wie CSV-Dateien?
Hier ist die Anleitung. Wenn die Daten in einem gut strukturierten Format kommen, braucht man nicht viel Java zu können. Im Starterkit sind sogar Beispieldateien.
Biete selber TV-Daten an / Provide TV data yourself • Film-/Serienbeschreibungen → https://www.omdb.org
-
- Junior Member
- Beiträge: 27
- Registriert: 29 Okt 2007, 20:06
- Wohnort: Neubrandenburg
- Kontaktdaten:
Das Problem ist, dass an die Daten selber so einfach kein rankommen ist. Die werden ja direkt im CMS erfasst und sind aus meiner Sicht erstmal unerreichbar. Außer natürlich als schon erwähnte Webseite, und im "internen Bereich" zur Bearbeitung über Webformular. Es gibt keine Schnittstelle zu irgendwelchen Standard-Formaten wie xls und doc ...bodo hat geschrieben:Also am besten nimmt jemand die Daten von euch, konvertiert die in das TV-Browser-Format und bietet die dann an.
Allerdings brauchen wir dann natürlich eure Erlaubnis, die Daten weiterzuverbreiten.
Die Erlaubnis ist das kleinste Problem.
-
- Junior Member
- Beiträge: 27
- Registriert: 29 Okt 2007, 20:06
- Wohnort: Neubrandenburg
- Kontaktdaten:
Durch das Ding habe ich mich schon durchgequält, aber keinen Ansatz gefunden. Entweder stehe ich temporär nur blöd auf dem Schlauch, oder ich begreife es nicht.Jo hat geschrieben:Hier ist die Anleitung. Wenn die Daten in einem gut strukturierten Format kommen, braucht man nicht viel Java zu können. Im Starterkit sind sogar Beispieldateien.
Bei dem Starterkit muss ich ja irgendwo die Webseite eingeben, auf der das Programm steht. Dann muss ich dem Kit ja sagen, wo es auf der HTML-Seite welche Daten findet. Zumindest stelle ich es mir so vor. Aber soweit kommt ich ja gar nicht erst. Dazu dann irgendwo die Standard-Werte, die nicht auf der Seite selber stehen (zumindest nicht so direkt) wie Sendername usw.
Ich bin verzweifelt.
Also da gibt es jetzt mehrere Möglichkeiten:
- Wenn du Java kannst: einen eigenen Parser schreiben, der die Webseite ausliest. Ein Beispiel für sowas ist auch im Datenkit als Java-Klasse vorhanden
- Wenn du kein Java kannst: die XML-Datei mit Hilfe von PHP selber aus der Datenbank erzeugen.
- Alternativ die Daten irgendwie öffentlich zugänglich machen, dann kann ich (oder ein anderer Freiwilliger) einen Parser für schreiben und den Sender einbauen.
- Wenn du Java kannst: einen eigenen Parser schreiben, der die Webseite ausliest. Ein Beispiel für sowas ist auch im Datenkit als Java-Klasse vorhanden
- Wenn du kein Java kannst: die XML-Datei mit Hilfe von PHP selber aus der Datenbank erzeugen.
- Alternativ die Daten irgendwie öffentlich zugänglich machen, dann kann ich (oder ein anderer Freiwilliger) einen Parser für schreiben und den Sender einbauen.
-
- Junior Member
- Beiträge: 27
- Registriert: 29 Okt 2007, 20:06
- Wohnort: Neubrandenburg
- Kontaktdaten:
Wie gesagt, an den das Webangebot hostenden Server komme ich nicht ran. Also auch nicht an die Daten. Das wurde an eine externe Firma vergeben ... Die einzige Quelle ist die programminformationen enthaltende Webseite. Aber ich werde mir mal die XML-Datei aus dem Starter-Kit ansehen, sowas muss sich doch unaufwendig automatisieren lassen. Und wenn der Aufwand klein genug ist, dann passt er ja vielleicht in den Service-Vertrag mit unserem Provider.
Ich hätte ja schon *duck* für mich angefangen. Natürlich, Ehrenwort!, nur für private Zwecke. Aber seit keine Zeitdaten mehr auf den Event-Seiten sind, habe ich abgebrochen. Achtung, roher Output aus dem Log:
[Session started at 2008-01-03 23:28:38 +0100.]
2008-01-03 23:28:40.600 wirschauen[29023] parsing for Nachts...
2008-01-03 23:28:41.106 wirschauen[29023] Law and Order: New York
2008-01-03 23:28:41.106 wirschauen[29023] RTL 2
2008-01-03 23:28:41.579 wirschauen[29023] Popcorn Live
2008-01-03 23:28:41.580 wirschauen[29023] SuperRTL
2008-01-03 23:28:41.714 wirschauen[29023] Ein genialer Freak
2008-01-03 23:28:41.715 wirschauen[29023] SuperRTL
2008-01-03 23:28:42.380 wirschauen[29023] "Stern"-TV - Reportage
2008-01-03 23:28:42.380 wirschauen[29023] Vox
2008-01-03 23:28:42.449 wirschauen[29023] "Stern"-TV
2008-01-03 23:28:42.449 wirschauen[29023] RTL
2008-01-03 23:28:42.770 wirschauen[29023] BBC exklusiv: Freak Waves - Riesenwellen aus dem Nichts
2008-01-03 23:28:42.770 wirschauen[29023] Vox
2008-01-03 23:28:43.077 wirschauen[29023] They - Sie kommen
2008-01-03 23:28:43.077 wirschauen[29023] ProSieben
usw...
[Session started at 2008-01-03 23:28:38 +0100.]
2008-01-03 23:28:40.600 wirschauen[29023] parsing for Nachts...
2008-01-03 23:28:41.106 wirschauen[29023] Law and Order: New York
2008-01-03 23:28:41.106 wirschauen[29023] RTL 2
2008-01-03 23:28:41.579 wirschauen[29023] Popcorn Live
2008-01-03 23:28:41.580 wirschauen[29023] SuperRTL
2008-01-03 23:28:41.714 wirschauen[29023] Ein genialer Freak
2008-01-03 23:28:41.715 wirschauen[29023] SuperRTL
2008-01-03 23:28:42.380 wirschauen[29023] "Stern"-TV - Reportage
2008-01-03 23:28:42.380 wirschauen[29023] Vox
2008-01-03 23:28:42.449 wirschauen[29023] "Stern"-TV
2008-01-03 23:28:42.449 wirschauen[29023] RTL
2008-01-03 23:28:42.770 wirschauen[29023] BBC exklusiv: Freak Waves - Riesenwellen aus dem Nichts
2008-01-03 23:28:42.770 wirschauen[29023] Vox
2008-01-03 23:28:43.077 wirschauen[29023] They - Sie kommen
2008-01-03 23:28:43.077 wirschauen[29023] ProSieben
usw...