Konventionen für Schauspieler-Angaben
Konventionen für Schauspieler-Angaben
Wie sollte das Schauspieler-Feld am besten gefüllt werden (wenn man als Anbieter die Wahl hat)? Erst Schauspielername, dann in Klammern dahinter der Rollenname, oder erst die Rolle, dann der Schauspieler? Oder statt Klammern Doppelpunkte, etc.?
Biete selber TV-Daten an / Provide TV data yourself • Film-/Serienbeschreibungen → https://www.omdb.org
- Maria-Christine
- Moderator
- Beiträge: 1167
- Registriert: 21 Jun 2005, 16:59
- Wohnort: Herne
-
- Site Admin
- Beiträge: 3353
- Registriert: 09 Sep 2006, 22:45
Da ich gerade im Webplugin einen äußerst komplexen Parser dafür gebaut habe, kann ich zumindest sagen, dass folgende Varianten existieren:
Rolle (Name), Rolle (Name)
Name (Rolle), Name (Rolle)
Name, Name, Name
Name<Tab>Rolle<NewLine>Name<Tab>Rolle<NewLine>
Rolle<Tab>Name<NewLine>Rolle<Tab>Name<NewLine>
Name<NewLine>Name<NewLine>
Weitere will ich aber nicht ausschließen. Und es ist auch nicht pro Sender konstant, was vermutlich an den eingekauften Daten liegt. Wenn wir uns auf eine zusätzliche neue Variante einigen könnten, bei der das immer eine definierte Reihenfolge hat, wäre ich auch äußerst dankbar, da mein Parser ziemlich raten muss (kein Nachname -> Rolle, gleicher String wie Regisseur -> Name, ...).
Von daher bitte Vorschläge, die von obigen Varianten abweichen.
PS: In der Sendungsinfo wird das ab der 2.6 auch geparst und als Tabelle ausgegeben.
Rolle (Name), Rolle (Name)
Name (Rolle), Name (Rolle)
Name, Name, Name
Name<Tab>Rolle<NewLine>Name<Tab>Rolle<NewLine>
Rolle<Tab>Name<NewLine>Rolle<Tab>Name<NewLine>
Name<NewLine>Name<NewLine>
Weitere will ich aber nicht ausschließen. Und es ist auch nicht pro Sender konstant, was vermutlich an den eingekauften Daten liegt. Wenn wir uns auf eine zusätzliche neue Variante einigen könnten, bei der das immer eine definierte Reihenfolge hat, wäre ich auch äußerst dankbar, da mein Parser ziemlich raten muss (kein Nachname -> Rolle, gleicher String wie Regisseur -> Name, ...).
Von daher bitte Vorschläge, die von obigen Varianten abweichen.
PS: In der Sendungsinfo wird das ab der 2.6 auch geparst und als Tabelle ausgegeben.
- Maria-Christine
- Moderator
- Beiträge: 1167
- Registriert: 21 Jun 2005, 16:59
- Wohnort: Herne
-
- Site Admin
- Beiträge: 3353
- Registriert: 09 Sep 2006, 22:45
- Maria-Christine
- Moderator
- Beiträge: 1167
- Registriert: 21 Jun 2005, 16:59
- Wohnort: Herne
-
- Gold Member
- Beiträge: 331
- Registriert: 14 Mai 2006, 18:31
Ich habe mal in die Wikipedia geschaut, die machen es wie folgt:
[*]Name<Doppelpunkt><Space>Rolle<NewLine>
Wobei [*] für ein Listensymbol steht.
Aber ich glaube nicht, dass man es immer automatisieren kann. Auch Rollen haben häufig Vor- und Nachnamen und so mancher Künstlername besteht nur aus einem Teil
[*]Name<Doppelpunkt><Space>Rolle<NewLine>
Wobei [*] für ein Listensymbol steht.
Aber ich glaube nicht, dass man es immer automatisieren kann. Auch Rollen haben häufig Vor- und Nachnamen und so mancher Künstlername besteht nur aus einem Teil
TVB 3.2, Java 1.6.0, Linux-Ubuntu 12.4
-
- Site Admin
- Beiträge: 3353
- Registriert: 09 Sep 2006, 22:45
Es geht nicht um das automatisierte Parsen, sondern darum, in welchem Format man das ganze als Datenanbieter für den TV-Browser erstellen soll, wenn man schon hundertprozentig weiß, welche Daten welche sind.hubendubel hat geschrieben:Aber ich glaube nicht, dass man es immer automatisieren kann. Auch Rollen haben häufig Vor- und Nachnamen und so mancher Künstlername besteht nur aus einem Teil
Deshalb war ich nochmal auf die Idee gekommen sich darüber Gedanken zu machenBananeweizen hat geschrieben:PS: In der Sendungsinfo wird das ab der 2.6 auch geparst und als Tabelle ausgegeben.
Ich habe eine Sendergruppe, die es genau andersrum macht, also "Rolle: Name," bei den Hauptdarstellern, aber auch mit Punkt statt Komma bei den Nebendarstellern. Da ist das Problem, dass ein Punkt auch im Namen vorkommen kann.Bananeweizen hat geschrieben:Also wäre
Name<Doppelpunkt><Space>Rolle<Komma>...
ein annehmbarer Vorschlag, der allen Anforderungen entspricht, oder?
Aber nicht bei denen, die nicht updaten wollenBananeweizen hat geschrieben: Das Komma wäre in der Sendungsinfo eh nicht mehr zu sehen, da es beim Aufbau der Tabelle entfernt würde.
Nach Überlegung denke ich, dass "Name (Rolle)," vielleicht das übersichtlichste ist, wenn die Einträge in einer Reihe stehen (also für die alten TVB-Versionen). Bei Klammern hat man (oder ich) einen besseren Überblick als bei einem Doppelpunkt. Und der Schauspielername sollte vielleicht auch deshalb als erstes genannt werden, weil das Feld "Schauspieler" und nicht "Rollen" heißt.
Biete selber TV-Daten an / Provide TV data yourself • Film-/Serienbeschreibungen → https://www.omdb.org
- Maria-Christine
- Moderator
- Beiträge: 1167
- Registriert: 21 Jun 2005, 16:59
- Wohnort: Herne
OK, das liest sich gut und sieht wahrscheinlich auch genau so gut aus, Übersichtlichkeit und schlichte TransparenzJo hat geschrieben:Nach Überlegung denke ich, dass "Name (Rolle)," vielleicht das übersichtlichste ist, wenn die Einträge in einer Reihe stehen (also für die alten TVB-Versionen). Bei Klammern hat man (oder ich) einen besseren Überblick als bei einem Doppelpunkt. Und der Schauspielername sollte vielleicht auch deshalb als erstes genannt werden, weil das Feld "Schauspieler" und nicht "Rollen" heißt.
TV-B 3.0alpha2, Java (build 1.6.0_18-b07), Windows 7 pro 32bit
-
- Site Admin
- Beiträge: 3353
- Registriert: 09 Sep 2006, 22:45
Wir sind damit aber in der Datenqualität dann keinen Deut weiter als vorher. Da andere Sendungen weiterhin in umgekehrter Reihenfolge stehen ist eine automatische Auswertung der Schauspieler weiterhin fehlerbehaftet.
Und falls sich jemand fragt, wozu man die braucht: In der 2.6 kann man mit dem Webplugin auch nach den Schauspielern, dem Regisseur und den Drehbuchautoren suchen. Wenn das Plugin nicht erraten kann, welches die Rollen sind, dann tauchen die Rollen und die Namen in der Liste auf.
Und falls sich jemand fragt, wozu man die braucht: In der 2.6 kann man mit dem Webplugin auch nach den Schauspielern, dem Regisseur und den Drehbuchautoren suchen. Wenn das Plugin nicht erraten kann, welches die Rollen sind, dann tauchen die Rollen und die Namen in der Liste auf.
-
- Gold Member
- Beiträge: 331
- Registriert: 14 Mai 2006, 18:31
-
- Site Admin
- Beiträge: 3353
- Registriert: 09 Sep 2006, 22:45
Nein. Ganz anders. Wenn das Plugin es erraten kann, dann hast du z.B. 10 Untermenüpunkte, mit denen du direkt nach den Schauspielern suchen kannst. Wenn das Plugin es nicht erraten kann, dann hast du 20, bei denen die 10 Schauspieler und die 10 Rollen bunt gemischt stehen (weil natürlich alphabetisch sortiert). Und irgendjemand hält das später wieder für einen Bug. Wenn ich bei bestimmten Schreibkonventionen oder für bestimmte Sender wüsste, was was ist, dann fiele dieses Problem weg.
Ich wusste nicht, dass es auch für Websuche gedacht ist. Es dürfte schwierig sein, ein TVB-spezifisches Format zu finden, dass garantiert bei keinem Sender verwendet wird, dass aber auch auf älteren TVB-Versionen noch ansehnlich aussieht.
Biete selber TV-Daten an / Provide TV data yourself • Film-/Serienbeschreibungen → https://www.omdb.org
-
- Site Admin
- Beiträge: 3353
- Registriert: 09 Sep 2006, 22:45
Das mit den älteren Versionen ist gar nicht so schwierig. Die Sendungsinfo wird ja per HTML erzeugt. Und da werden alle Separatoren (Space, Tab, NewLine etc.) als Leerzeichen (mit Länge 1) interpretiert. Das heißt, zumindest diese Zeichen kann man frei kombinieren, ohne dass sich die Anzeige in alten Versionen ändert.
Die Websuche ist momentan eben die erste Stelle, an der die Schauspielerinfos strukturiert weiterverwendet werden. Ich kann mir aber gut vorstellen, dass es in Zukunft auch andere Plugins oder Funktionen gibt, die strukturierte Daten haben wollen, statt einen einzigen langen String. Von daher wäre es schon gut, wenn wir diese Anregung jetzt schon für die Zukunft umsetzen könnten.
Die Websuche ist momentan eben die erste Stelle, an der die Schauspielerinfos strukturiert weiterverwendet werden. Ich kann mir aber gut vorstellen, dass es in Zukunft auch andere Plugins oder Funktionen gibt, die strukturierte Daten haben wollen, statt einen einzigen langen String. Von daher wäre es schon gut, wenn wir diese Anregung jetzt schon für die Zukunft umsetzen könnten.