HTML-Seite als Programmquelle

Antwort erstellen


Diese Frage dient dazu, das automatisierte Versenden von Formularen durch Spam-Bots zu verhindern.

BBCode ist eingeschaltet
[img] ist eingeschaltet
[url] ist eingeschaltet
Smileys sind ausgeschaltet

Die letzten Beiträge des Themas

Ich habe die Datenschutzerklärung gelesen und bin damit einverstanden.

   

Ansicht erweitern Die letzten Beiträge des Themas: HTML-Seite als Programmquelle

von bodo » 03 Jan 2008, 23:43

Okidoki. Sobald es eine Schnittstelle für die Daten gibt, sage ich auch hier im Forum bescheid.

von Gast » 03 Jan 2008, 23:42

Schon klar!
Ich wollte nur nicht wie einer da stehen, der heiße Luft redet. Den Zugriff auf Wirschauen.de habe ich wie gesagt abgebrochen und werde ich zukünftig unterlassen.

von bodo » 03 Jan 2008, 23:35

Ehm, das von DirkNB hat nix mit wirschauen.de zu tun. Bitte nicht maschinell auf Wirschauen.de zugreifen. Ich werde da noch eine Schnittstelle basteln.

von gaertsch » 03 Jan 2008, 23:32

Ich hätte ja schon *duck* für mich angefangen. Natürlich, Ehrenwort!, nur für private Zwecke. Aber seit keine Zeitdaten mehr auf den Event-Seiten sind, habe ich abgebrochen. Achtung, roher Output aus dem Log:

[Session started at 2008-01-03 23:28:38 +0100.]
2008-01-03 23:28:40.600 wirschauen[29023] parsing for Nachts...

2008-01-03 23:28:41.106 wirschauen[29023] Law and Order: New York
2008-01-03 23:28:41.106 wirschauen[29023] RTL 2

2008-01-03 23:28:41.579 wirschauen[29023] Popcorn Live
2008-01-03 23:28:41.580 wirschauen[29023] SuperRTL

2008-01-03 23:28:41.714 wirschauen[29023] Ein genialer Freak
2008-01-03 23:28:41.715 wirschauen[29023] SuperRTL

2008-01-03 23:28:42.380 wirschauen[29023] "Stern"-TV - Reportage
2008-01-03 23:28:42.380 wirschauen[29023] Vox

2008-01-03 23:28:42.449 wirschauen[29023] "Stern"-TV
2008-01-03 23:28:42.449 wirschauen[29023] RTL

2008-01-03 23:28:42.770 wirschauen[29023] BBC exklusiv: Freak Waves - Riesenwellen aus dem Nichts
2008-01-03 23:28:42.770 wirschauen[29023] Vox

2008-01-03 23:28:43.077 wirschauen[29023] They - Sie kommen
2008-01-03 23:28:43.077 wirschauen[29023] ProSieben


usw...

von gaertsch » 03 Jan 2008, 22:33

Aufzeig!
Ich könnte die parsen, aber wie ist die Adresse der Seite? Oder habe ich was überlesen?

von DirkNB » 03 Jan 2008, 21:25

Wie gesagt, an den das Webangebot hostenden Server komme ich nicht ran. Also auch nicht an die Daten. Das wurde an eine externe Firma vergeben ... Die einzige Quelle ist die programminformationen enthaltende Webseite. Aber ich werde mir mal die XML-Datei aus dem Starter-Kit ansehen, sowas muss sich doch unaufwendig automatisieren lassen. Und wenn der Aufwand klein genug ist, dann passt er ja vielleicht in den Service-Vertrag mit unserem Provider.

von Siggi » 03 Jan 2008, 21:02

Hi DirkNB,

kannst du ein bisschen PHP oder eine andere Sprache?

So könntest du einfach die Daten von der Seite, die du betreust, auslesen.

Die Rechte wirst du ja dazu haben.

Dann kannst du die Daten in einer xml Datei speichern.

Bis dann.

von bodo » 03 Jan 2008, 20:59

Also da gibt es jetzt mehrere Möglichkeiten:

- Wenn du Java kannst: einen eigenen Parser schreiben, der die Webseite ausliest. Ein Beispiel für sowas ist auch im Datenkit als Java-Klasse vorhanden
- Wenn du kein Java kannst: die XML-Datei mit Hilfe von PHP selber aus der Datenbank erzeugen.
- Alternativ die Daten irgendwie öffentlich zugänglich machen, dann kann ich (oder ein anderer Freiwilliger) einen Parser für schreiben und den Sender einbauen.

von DirkNB » 03 Jan 2008, 20:54

Ich habe mich eben durch das Starterkit durchgefressen. Soweit ist ja alles klar. Ich glaube, ich habe es verstanden. Das Problem ist nur: Es gibt keine Excel-Datei und keine XML-Datei mit den Programmdaten, es gibt erstmal nur die HTML-Webseite als Quelle.

von DirkNB » 03 Jan 2008, 19:47

Jo hat geschrieben:Hier ist die Anleitung. Wenn die Daten in einem gut strukturierten Format kommen, braucht man nicht viel Java zu können. Im Starterkit sind sogar Beispieldateien.
Durch das Ding habe ich mich schon durchgequält, aber keinen Ansatz gefunden. Entweder stehe ich temporär nur blöd auf dem Schlauch, oder ich begreife es nicht.
Bei dem Starterkit muss ich ja irgendwo die Webseite eingeben, auf der das Programm steht. Dann muss ich dem Kit ja sagen, wo es auf der HTML-Seite welche Daten findet. Zumindest stelle ich es mir so vor. Aber soweit kommt ich ja gar nicht erst. Dazu dann irgendwo die Standard-Werte, die nicht auf der Seite selber stehen (zumindest nicht so direkt) wie Sendername usw.
Ich bin verzweifelt. :(

von DirkNB » 03 Jan 2008, 19:42

bodo hat geschrieben:Also am besten nimmt jemand die Daten von euch, konvertiert die in das TV-Browser-Format und bietet die dann an.
Allerdings brauchen wir dann natürlich eure Erlaubnis, die Daten weiterzuverbreiten.
Das Problem ist, dass an die Daten selber so einfach kein rankommen ist. Die werden ja direkt im CMS erfasst und sind aus meiner Sicht erstmal unerreichbar. Außer natürlich als schon erwähnte Webseite, und im "internen Bereich" zur Bearbeitung über Webformular. Es gibt keine Schnittstelle zu irgendwelchen Standard-Formaten wie xls und doc ...

Die Erlaubnis ist das kleinste Problem.

von Jo » 03 Jan 2008, 17:47

Hier ist die Anleitung. Wenn die Daten in einem gut strukturierten Format kommen, braucht man nicht viel Java zu können. Im Starterkit sind sogar Beispieldateien.

von bodo » 03 Jan 2008, 17:44

Also am besten nimmt jemand die Daten von euch, konvertiert die in das TV-Browser-Format und bietet die dann an.

Das ist dann das einfachste für alle :).

Allerdings brauchen wir dann natürlich eure Erlaubnis, die Daten weiterzuverbreiten.

HTML-Seite als Programmquelle

von DirkNB » 03 Jan 2008, 17:36

Vermutlich fange ich jetzt mal mit einer Urschleimfrage an, aber nach längerem durchforsten las ich nur "Speziallösungen", aber meine eigentlich Frage blieb unbeantwortet.
Ich betreue das Webangebot eines Radiosenders, auf deren CMS ich leider keinen Einfluss habe. In diesem Webangebot gibt es eine Webseite (feste, gleichbleibende Adresse), auf der die geplanten Sendungen mit Start- und Endzeit nach Datum sortiert aufgeführt sind. Diese Seite wird durch das CMS "gefüttert", die Seite aktualisiert sich also selber, Sendungen vergangener Tage verschwinden auch automatisch.
Gibt es eine Möglichkeit, automatisch Programmdaten von einer HTML-Seite abzugrabbeln und dem TV-Browser mundgerecht aufzubereiten, so dass die Informationen dort auch erscheinen? Bei Bedarf stehen dafür auf einem anderen Webserver Kapazitäten (PHP, CGI, Perl) zur Verfügung. Eigene Programmierkenntnisse sind, wenn überhaupt, nur in PHP vorhanden. Aber anpassungen in Scripten, wenn ich weiß, wo ich was anpassen muss, sollte ich auch noch hinbekommen. ;-)
Plan B wäre die Variante, die Daten fertig aufbereitet durch das CMS zu liefern. Da die Arbeitsleistung aber vermutlich Geld kostet, möchte ich davon Abstand nehmen, außer, es lässt sich einfach realisieren. Meine Frage demzufolge: Kann der TV-Browser seine Daten direkt von einem fremden Webserver holen? Welche Struktur, Syntax etc. müssen dann die Daten haben?
"Einfach realisieren" wäre zum Beispiel eine Textdatei mit fest definiertem Namen und Pfad, in der im Klartext die Daten drinstehen. Ähnlich vermutlich wie CSV-Dateien?

Nach oben