beschreibung im tvb und in omdb unterschiedlich

Fragen zu unseren Daten-Eingabesystemen omdb.org und wirschauen.de
uzi
Site Admin
Beiträge: 1817
Registriert: 02 Jul 2009, 14:32

beschreibung im tvb und in omdb unterschiedlich

Beitragvon uzi » 11 Sep 2013, 08:41

beschreibung tvb: siehe bild im anhang

beschreibung tvb rauskopioert:
David bringt endlich den Mut auf, seine Frau zu verlassen. Allerdings erwähnt er dabei nicht, dass er eine Af­fä­re mit Margaret hat. Im Reich der Märchen versucht sein Alter Ego Prinz Charming derweil, vor seiner arrangierten Ehe zu flüchten und bekommt von unerwarteter Seite Hilfe...


genau so stehts auch in der omdb. wo kommen die komischen silben-trennungen her?
Dateianhänge
desc.png
screeny der beschreibung
desc.png (89.18 KiB) 3058 mal betrachtet

Jo
Site Admin
Beiträge: 10103
Registriert: 07 Apr 2006, 23:39

Re: beschreibung im tvb und in omdb unterschiedlich

Beitragvon Jo » 11 Sep 2013, 10:40

Die sind tatsächlich drin! Sogar in dem Text, den du oben kopiert hast. Das sind bedingte Trennzeichen (soft hyphen), die sollten eigentlich nur auftauchen, wenn an der Stelle tatsächlich ein Zeilenumbruch machbar ist. Du kannst hier dein Browserfenster so verkleinern, dass bei deinem Quote oben das Wort ans Ende der Zeile kommt, oder einfacher bei omdb auf Kurzbeschreibung bearbeiten und da soviel Text vorne rauslöschen, dass "Affäre" ans Zeilenende rutscht.

Nur TVB (wahrscheinlich ganz Java) zeigt das nicht richtig an.

uzi
Site Admin
Beiträge: 1817
Registriert: 02 Jul 2009, 14:32

Re: beschreibung im tvb und in omdb unterschiedlich

Beitragvon uzi » 11 Sep 2013, 11:13

hah. ok. interessant. ich hab die teile jetzt einfach bei der omdb rausgenommen, damit sollte sich das problem ja erledigt haben. iirc hatte ich damals das wort schlicht von duden.de kopiert (affäre ist eins der worte, bei denen ich immer ins zweifeln komme :D) - und die trennzeichen dann wohl gleich mit. ich fürchte, das wird dann wohl auch in anderen beschreibungen zu fehlern führen...

es sei denn, man kann die anzeige fixen. ist das irgendeine lib, die das macht oder ist das core java? falls lib: gibts vielleicht n update?

ds10
Site Admin
Beiträge: 16234
Registriert: 23 Jun 2005, 12:36
Kontaktdaten:

Re: beschreibung im tvb und in omdb unterschiedlich

Beitragvon ds10 » 11 Sep 2013, 11:30

Die Anzeige in TV-Browser ist mit HTML realisiert, d.h. Java setzt die gegebenen Informationen nicht richtig um. Allerdings wäre es nicht schwierig die entsprechenden Zeichen einfach aus dem String zu löschen. Am Besten wäre es wenn die Datenaufbereitung dies machen würde, dann hätten alle TV-Browser Versionen etwas davon.

[ Post made via Android ] Bild
"First they ignore you, then they ridicule you, then they fight you, then you win." - Mahatma Gandhi
Unterstütze die Weiterentwicklung von TV-Browser

Jo
Site Admin
Beiträge: 10103
Registriert: 07 Apr 2006, 23:39

Re: beschreibung im tvb und in omdb unterschiedlich

Beitragvon Jo » 11 Sep 2013, 19:41

ds10 hat geschrieben:Die Anzeige in TV-Browser ist mit HTML realisiert, d.h. Java setzt die gegebenen Informationen nicht richtig um.

Es klappt allerdings auch nicht in der Programmtabelle, und die ist ja nicht mit HTML realisiert. Für die wäre es wegen des Platzmangels ja grundsätzlich gar nicht unbedingt schlecht, wenn da Trennhinweise wären. Aber hilft nichts, wenn Java das nicht kann.

ds10 hat geschrieben:Allerdings wäre es nicht schwierig die entsprechenden Zeichen einfach aus dem String zu löschen. Am Besten wäre es wenn die Datenaufbereitung dies machen würde, dann hätten alle TV-Browser Versionen etwas davon.

Es gibt derzeit im Primarydatamanager Html2TxtConverter.replaceUnsupportedChars, wo es noch dazu könnte. Da ist aber auch jedem selbst überlassen, ob und wann er das aufruft.
Vielleicht wäre es doch besser, Zeichen die nicht grundsätzlich falsch sind, sondern nur im TVB (derzeit) nicht dargestellt werden können, irgendwo im TVB selbst umzuwandeln. Falls dann jemand z.B. Soft hyphens implementieren würde, könnte man dort die Umwandlung abschalten, anstatt bei den ganzen Datentools umzuschreiben. Und falls es mal eine TVB-Version auf anderem BS gibt, wo Soft hyphens gehen, könnte man das dort lassen.

Aber im Moment konkret ist natürlich das einfachste wenn ich es im Parser umstelle.

uzi
Site Admin
Beiträge: 1817
Registriert: 02 Jul 2009, 14:32

Re: beschreibung im tvb und in omdb unterschiedlich

Beitragvon uzi » 11 Sep 2013, 20:55

oder man lässt es, wie es ist. ich bin zwar sicher, dass das nicht die einzige stelle ist, wo ich soft hyphons vom duden mitkopiert habe, aber andererseits ists jetzt auch kein regelfall (meine rechtschreibung ist soweit ganz brauchbar ;)). sprich: ich gehe nicht davon aus, dass das wirklich eine relevanz hat, die es sinnvoll erscheinen lässt, dafür den code mit nem workaround zu verschmutzen. wenn ich sowas das nächste mal sehe, weiss ich ja was sache ist und ändere es schlicht in der omdb.

v6ph1
Site Admin
Beiträge: 1209
Registriert: 13 Jan 2008, 05:07
Wohnort: Radebeul

Re: beschreibung im tvb und in omdb unterschiedlich

Beitragvon v6ph1 » 11 Sep 2013, 22:58

Zu viele von den Dingern erschweren zumindest das flüssige Lesen.
Am besten wäre natürlich eine Unterstützung in der HTML-Anzeige (aber das ist nicht unser Problem).

Hier mal die Zeichencodes:
UTF8: 0xC2AD
Unicode: U+00AD

Für die Umwandlung in TVB selbst sehe ich 2 Varianten:
1. Direkt bei der Anzeige
Mehr CPU-Last, dafür für Tabelle, Sendungsinfo,... unabhängig aktivierbar.
2. Beim Download der Daten
Last beim Verarbeiten, nur 1 Variante nutzbar.

Prinzipiell bin ich eher für Variante 1.
Nur in welcher Klasse wäre das am günstigsten?

-- v6ph1

Jo
Site Admin
Beiträge: 10103
Registriert: 07 Apr 2006, 23:39

Re: beschreibung im tvb und in omdb unterschiedlich

Beitragvon Jo » 11 Sep 2013, 23:00

Eigentlich sind Soft Hyphens ja Feature und nicht Bug. Im TVB ist ein komplizierter Algorithmus, der versucht eine automatische Silbentrennung für die Programmtabelle. Wenn TVB durch Soft Hyphens wüsste wo getrennt wird, müsste er nicht raten. Aber da (außer dir ;-)) die wohl kaum jemand jemals bei omdb eingefügt hat, ist das eher theoretisch.

Jo
Site Admin
Beiträge: 10103
Registriert: 07 Apr 2006, 23:39

Re: beschreibung im tvb und in omdb unterschiedlich

Beitragvon Jo » 11 Sep 2013, 23:12


uzi
Site Admin
Beiträge: 1817
Registriert: 02 Jul 2009, 14:32

Re: beschreibung im tvb und in omdb unterschiedlich

Beitragvon uzi » 12 Sep 2013, 00:08

liste abgearbeitet. in einer ganzen reihe von einträgen hab ich aber keine soft hyphens gefunden (dafür haufenweise typos, unsinnige zeilenumbrüche und anderen quark). jedenfalls nicht in der kurzbeschreibung, woanders hab ich nicht geguckt.

übrigens kann ich mit ziemlicher sicherheit sagen, dass ich von den ganzen teasern in der liste nur 2 geschrieben habe.

ds10
Site Admin
Beiträge: 16234
Registriert: 23 Jun 2005, 12:36
Kontaktdaten:

Re: beschreibung im tvb und in omdb unterschiedlich

Beitragvon ds10 » 12 Sep 2013, 10:12

Es wäre übrigens auch möglich ein Plugin zu schreiben, das die Soft Hyphen aus den Daten löscht.
"First they ignore you, then they ridicule you, then they fight you, then you win." - Mahatma Gandhi
Unterstütze die Weiterentwicklung von TV-Browser


Zurück zu „omdb/wirschauen“

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast