Puls Tv keine Daten

Beitrag von **Bananeweizen** » 07 Apr 2008, 08:22

Puls 4 wäre echt klasse. Ich habe gestern überraschend festgestellt, dass die Aufzeichnungen von "Genial daneben" senden, welches ich sonst ab und zu verpasse.

JuliaH · Beitrag von **JuliaH** » 11 Apr 2008, 18:47

Hallo,

Puls 4 sendete zumindst bis vor kurzem noch die auf Pro 7 eingestellte "4400 - Die Rückkehrer"

wäre Klasse käme der Sender durch Eure Hilfe in die Datenströme!

g Julia

Bronkoknorb · Beitrag von **Bronkoknorb** » 11 Apr 2008, 20:36

JuliaH hat geschrieben:Puls 4 sendete zumindst bis vor kurzem noch die auf Pro 7 eingestellte "4400 - Die Rückkehrer"

wäre Klasse käme der Sender durch Eure Hilfe in die Datenströme!

Das ist ja interessant!
Ich habe die Daten mal an Bodo weitergeleitet.

JuliaH · Beitrag von **JuliaH** » 13 Apr 2008, 02:37

Hi,

leider war am 1.4. mit "Das Serum" lt. online-Programmvorschau der vorerst letzte Teil von 4400. Bis zum 25.4., wo die online-Vorschau endet, scheint keine weitere Folge gesendet zu werden. Oder das Programm ändert sich noch oder irgendwas anderes. siehe auch puls4 com -> TV-Programm

Vielleicht, irgendwie,.. tut mir leid, falsche Hoffnungen gemacht zu haben.

Mein erster Beitrag in diesem Thread erinnert mich an die bekannteste Bauernweisheit: "Kräht der Hahn auf dem Mist, ändert sich das Wetter oder bleibt wie es ist"

g Julia

Beitrag von **bodo** » 16 Apr 2008, 22:43

Kleine Info nebenbei: Puls 4 wird demnächst Verschlüsselt und ist dann nur noch für Menschem mit der ORF-Decoderkarte nutzbar. Dies beschränkt den Nutzerkreis dann auf Österreicher, da das ORF die Karten nicht ins Ausland verschickt.

Beitrag von **Maria-Christine** » 16 Apr 2008, 23:06

konnte man sich ja fast denken

Beitrag von **v6ph1** » 16 Apr 2008, 23:20

ORF1 und 2 kann man ja auch nur (legal) mit den Karten empfangen.
Demzufolge sehe ich es durchaus als Sinnvoll an, diesen Sender in die Liste mit aufzunehmen.

SFdrs ist ja ebenso nur eingeschränkt zu empfangen. (Sogar eingeschränkter als die mit ORF-Karte.)

mfg
v6ph1

Beitrag von **bodo** » 17 Apr 2008, 07:42

Keine Bange, wir werden den Sender aufnehmen in die Liste. Ich wollte hat nur sagen, das deutsche Nutzer sich keine Hoffnungen machen sollten, den Sender auch langfristig sehen zu können

.

Wir bedienen nicht nur den TV-Markt hier in Deutschland. Uns ist es eigentlich Schnuppe, woher der Sender kommt

.

panzi · Beitrag von **panzi** » 04 Mai 2008, 20:16

Mich würde interessieren wie diese Word Dateien aussehn. Sind das noch doc oder schon docx? docx wäre sicher viel einfacher zu extrahieren, weils ja zip+xml ist. Ich mach dieses Semester die Lehrveranstaltung Applied Web Data Extraction and Integration an der TU Wien. Da lernt man wie und mit welchen mitteln man Daten aus Webseiten extrahieren kann. Das Web ist schön standardisiert (auch wenns nicht immer valides HTML ist), würde mich interessieren wie man das bei so proprietären Formaten wie doc macht.

Bronkoknorb · Beitrag von **Bronkoknorb** » 04 Mai 2008, 20:25

panzi hat geschrieben:Mich würde interessieren wie diese Word Dateien aussehn. Sind das noch doc oder schon docx? docx wäre sicher viel einfacher zu extrahieren, weils ja zip+xml ist. Ich mach dieses Semester die Lehrveranstaltung Applied Web Data Extraction and Integration an der TU Wien. Da lernt man wie und mit welchen mitteln man Daten aus Webseiten extrahieren kann. Das Web ist schön standardisiert (auch wenns nicht immer valides HTML ist), würde mich interessieren wie man das bei so proprietären Formaten wie doc macht.

Der einzige sinnvolle Weg ist meiner Meinung nach, die Konvertierung in ein anderes (offenes) Format mit einem Programm das doc verstehen kann. Soweit ich weiß, wird hier für alle Sender, die ihr Programm nur als doc anbieten, ein OpenOffice-Makro verwendet, dass in Plain-Text umwandelt.
Infos findest du hier: http://wiki.tvbrowser.org/index.php/Dat ... OpenOffice
Ich gehe diesen Weg für die Datenaufbereitung von gotv und 3+ und es gibt nur sehr selten Probleme.

Liebe Grüße von einem TU-Kollegen!

Beitrag von **bodo** » 04 Mai 2008, 20:26

Hast du schonmal docx angeschaut? Das ist so das schlimmste, was man mit XML machen kann

Wir konvertieren das meistens nach TXT oder RTF mit OpenOffice per Fernsteuerung und dann von da dann weiter.

Und du würdest dich wundern, wie aufwändig Webseiten manchmal zu parsen sind. Manchmal ist es echt einfacher, das RTF zu nehmen anstatt eine Webseite zu parsen.

Bronkoknorb · Beitrag von **Bronkoknorb** » 04 Mai 2008, 20:31

bodo hat geschrieben:Und du würdest dich wundern, wie aufwändig Webseiten manchmal zu parsen sind. Manchmal ist es echt einfacher, das RTF zu nehmen anstatt eine Webseite zu parsen.

Das kann ich bestätigen. Außerdem hat die Erfahrung gezeigt, dass sich das Format der Webseiten wesentlich häufiger grundlegend verändert und die Parser dann wertlos sind.

panzi · Beitrag von **panzi** » 04 Mai 2008, 21:11

(Zumal ich noch < 1 Tag angemeldet bin darf ich noch keine URLs posten. Halt allen Pfaden die puls4 Domain prefixen.)

Mhm. Ich hab mir die Puls4 Seite mal angeschaut. Die verwenden Prototype (eine AJAX API). Auf folgenden weg kann man einen Chunk bekommen, der HTML Code beinhaltet, welcher das Programm eines Tages darstellt:
wget --header "X-Requested-With: XMLHttpRequest" "/tv/remoteGuideView/type/daily/active_day/2008-05-03"

D.h. ein Request auf /tv/remoteGuideView/type/daily/active_day/YYYY-MM-DD mit dem Header:
X-Requested-With: XMLHttpRequest

Das Ergebnis verwendet Tabellen und IDs, sollte somit relativ einfach zu parsen sein. Natürlich stellt sich die Frage wie stabil so eine Extraktion ist, also wie lange das so bleiben wird. Zumal der HTML Code hier ziemlich stark aufgeräumt ist und keine Formatierungen beinhaltet (das wird anscheinend alles per CSS gemacht) könnt ich mir vorstellen, dass das länger so bleibt (rein vom technischen Standpunkt her betrachtet).

Apropos: Firebug ruled.

Beitrag von **bodo** » 04 Mai 2008, 21:46

1. Braucht man dann tortzdem die erlaubnis von Puls4, die Daten von da zu laden,

2. Sind webseiten niemals stabil, auch wenn da mit Ajax gearbeitet wird

3. Presse-Daten reichen weiter in die Zukunft.

Kurz: vergess es, wir lassen die Finger von Webseiten. Aus gutem Grund

.

Wir haben ja auch schon Kontakt zu Puls4, eigentlich sollten wir schon mit Daten von denen versorgt werden, nur ist halt leider noch nix hier angekommen

Beitrag von **Maria-Christine** » 04 Mai 2008, 21:51

das kommt schon... ist doch Wochenende
auf die Antwort auf meine mail zu Dmax habe ich auch lange warten müssen

TV-Browser-Forum

Puls Tv keine Daten

4400

Re: 4400