Fehlende Umlaut aus PDS

Antwort erstellen


Diese Frage dient dazu, das automatisierte Versenden von Formularen durch Spam-Bots zu verhindern.

BBCode ist eingeschaltet
[img] ist eingeschaltet
[flash] ist ausgeschaltet
[url] ist eingeschaltet
Smilies sind ausgeschaltet

Die letzten Beiträge des Themas
   

Ansicht erweitern Die letzten Beiträge des Themas: Fehlende Umlaut aus PDS

Beitrag von DanielRaap » 02 Dez 2007, 12:04

Für die Channelliste kann ich den Fehler mittlerweile auf das TVDataStarterKit eingrenzen:

Meine Channellist.txt ist ISO-8859-15 -> datamanager und mirrorupdater laufen lassen -> channellist.gz enthält falsch kodierte Datei -> im TVB sind Umlaut Sonderzeichenmüll.

[Edit: Die Datei direkt als gz auf den Webserver funktioniert!]

Daraus schliesse ich, dass die Datei (für das Starterkit) nicht ISO-8859-15 sein muss, sondern eine solche erstellt wird. Ich werde mal weiter forschen.

Beitrag von bodo » 01 Dez 2007, 16:58

Hintergrund des ganzen: Java liest Dateien als Default immer in dem Encoding ein, in dem das OS läuft. Da wir aber nun Windows, Linux, Mac-Systeme haben, müssen wir uns auf ein Encoding einigen. Und das ist Iso 8859-15.

Beitrag von DanielRaap » 01 Dez 2007, 16:46

[gestrichen]
Ich werde trotzdem mal damit rumspielen das explizit als ISO8859-1 auszugeben.

Edit:
habs gefunden:

tvbrowserdataservice/file/ChannelList.java

Code: Alles auswählen

  public void readFromStream(InputStream stream, TvDataService dataService) throws IOException, FileFormatException {
    GZIPInputStream gIn = new GZIPInputStream(stream);
    BufferedReader reader = new BufferedReader(new InputStreamReader(gIn, "ISO-8859-15"));

Beitrag von bodo » 01 Dez 2007, 15:51

Die Channelliste muss Iso 8859-15 sein, glaub ich. Jedenfalls haben wir da ein Encoding fest verbaut zum Laden der Datei.

Fehlende Umlaut aus PDS

Beitrag von DanielRaap » 01 Dez 2007, 15:47

Hi,

ich hab ein PDS geschrieben, welcher eine Website parst. Mein Problem: Alle Umlaute sind im TV-Browser nur Kästen.

Das Kuriose: Die Website ist in latin1/ISO8896-1. Java wandelt das beim auslesen korrekt in UTF-8 um und speicher dies in der Textdatei. Diese ist bei meinem UTF-8 System auch korrekt auslesbar und auch der Webserver zeigt die "Statusseite" mit korrekten Umlauten an (Webserver liefert UTF-8).

Meine Frage: Warum kommt im TV-Browser kein Umlaut an?

Die Channelliste ist ja eine Textdatei (welche ich mir von Java generieren lasse). Da spielt evtl. noch Dateisystem und Datei lesen mit rein. Aber die Daten werden doch direkt innerhalb von Java aus der PDS-Klasse übergeben? Oder werden Dateien zwischengespeichert welche evtl. "falsch" kodiert sind??

Nach oben