Lieblingssendungen werden nicht gefunden

Antwort erstellen


Diese Frage dient dazu, das automatisierte Versenden von Formularen durch Spam-Bots zu verhindern.

BBCode ist eingeschaltet
[img] ist eingeschaltet
[url] ist eingeschaltet
Smileys sind ausgeschaltet

Die letzten Beiträge des Themas

Ich habe die Datenschutzerklärung gelesen und bin damit einverstanden.

   

Ansicht erweitern Die letzten Beiträge des Themas: Lieblingssendungen werden nicht gefunden

von ab » 15 Mär 2008, 03:19

dorgo hat geschrieben:Beispielsweise aus "Planète Némo" wird demnach "plan AND te AND n AND mo". Dabei hilft das einzelstehende "n" nicht wirklich bei der Selektierung und wird daher weggelassen: "plan AND te AND mo". Aus "Me voilà" wird "me AND voil".
Die Methode hatten wir glaube ich schonmal, ist aber nicht so optimal, nach solchen "Wortfetzen" zu suchen.

... aber solange es funktioniert :)

von ab » 15 Mär 2008, 03:01

ds10 hat geschrieben:Bei der Bool'schen Suche werden sämtliche Sonderzeichen nicht beachtet
Genauer:
Mit "Sonderzeichen" meint ds10 die Satzzeichen (siehe unten), welche zum Zweck der Suche alle in ein ";" ersetzt werden.

Code: Alles auswählen

s = s.replaceAll("\\p{Punct}", ";");
//wobei: Punct=Punctuation: One of !"#$%&'()*+,-./:;<=>?@[\]^_`{|}~
Der Nutzen davon hält sich aber m.M. in Grenzen...

von Kowolf » 15 Mär 2008, 01:11

ds10 hat geschrieben:Bei der Bool'schen Suche werden sämtliche Sonderzeichen nicht beachtet um die Gefahr von nicht gefundenen Sendungen zu verringern.
Und das soll das oben beschriebene Verhalten erklären?

Auch seltsam: wenn bei der Booleschen Suche überhaupt nichts im Suchfeld steht, dann kommt zwar die Sanduhr aber es passiert sonst gar nichts, bis man etwas an der Suche ändert oder das Fenster schließt.

von ds10 » 15 Mär 2008, 00:43

Bei der Bool'schen Suche werden sämtliche Sonderzeichen nicht beachtet um die Gefahr von nicht gefundenen Sendungen zu verringern.

von Kowolf » 15 Mär 2008, 00:39

fingerhut hat geschrieben: Ja die Suche auch aber halt als Zeichen nicht als Wildcard.

In der Boolesche Suche gibt es keine "Ersatzzeichen" ist eigentlich nur ne suche auf Stichworte mit Regeln.
Irgendetwas bewirkt der Stern bei der Booleschen Suche schon:

Ich wollte z.B. bei den Lieblingssendungen ALLE Sendungen auswählen, um sie dann mit einem Filter wieder einschränken zu können.

Wenn ich den regulären Ausdruck .* verwende werden alle Sendungen korrekt gefunden.

Wenn ich bei der Booleschen Suche NUR einen * eingebe wird nur ein Drittel der Sendungen gefunden, und zwar nur jene die ein nicht-Ascii Zeichen enthalten (Beistrich, Bindestrich, Klammer, Fragezeichen, etc).

Auch bei der Sendungssuche tritt derselbe Effekt auf.

Ist das ein Bug oder ein Feature?

@ab: der von mir oben beschriebene Fall dürfte so ziemlich die einfachste Situation sein in der man reguläre Ausdrücke benötigt (zumindest weiß ich nicht wie man es sonst machen könnte).

von dorgo » 19 Mär 2007, 22:17

So, auf der Suche nach einer Lösung, die einfach und somit wenig fehlerträchtig ist, habe ich folgendes Rezept gefunden: Man nehme eine boolsche Suche und ersetze im zu suchenden Sendungstitel alle mit Akzent oder sonstigen Zeichen versehene Buchstaben sowie alle Leerzeichen durch " AND ". Dabei können beliebe geANDete Teile weggelassen werden.

Beispielsweise aus "Planète Némo" wird demnach "plan AND te AND n AND mo". Dabei hilft das einzelstehende "n" nicht wirklich bei der Selektierung und wird daher weggelassen: "plan AND te AND mo". Aus "Me voilà" wird "me AND voil".

Bisher funktioniert das in der Praxis zuverlässig. :-)

von fingerhut » 15 Feb 2007, 08:59

wie wärs noch damit?

Code: Alles auswählen

.*([0+[^1+-9+]]1/|Folge *1[^0+-9+]).*
In Titel, Folge und Kurzbeschreibung suchen.

Bei MTV geht es nicht aber sonst.

Re: Lieblingssendungen werden nicht gefunden

von ab » 14 Feb 2007, 21:17

Dorgo hat geschrieben:Beispielsweise heißen zwei der gesuchten Sendungen (in diesem Falle Serien) "Me voilà" und "Planète Némo".
"Me voilà"
"Planète Némo"

Endlich mal ein Beispiel wo tatsächlich reguläre Ausdrücke am besten geeignet sind (ich dachte schon es gibt keine, da die boolsche Suche alles abdeckt)

von fingerhut » 12 Feb 2007, 17:57

"Me voil." als regulärer Ausdruck findet die Sendung, aber "Me AND voil." als Boolsche Suche leider nicht. Warum funktioniert das Letztere nicht? Ich kenne noch von DOS das Dollarzeichen "$", das dort jeden Buchstaben ersetzen konnte. Gibt es nicht etwas Adäquates auch hier?
*g*
Ja die Suche auch aber halt als Zeichen nicht als Wildcard.
In dos geht das nur da dieses Zeichen nur als Wildcard definiert ist oder kannst du es sonst benützen?

In der Boolesche Suche gibt es keine "Ersatzzeichen" ist eigentlich nur ne suche auf Stichworte mit Regeln.

wenn dann so suchen.

Code: Alles auswählen

Me AND voil
wenn man das in einen regulären Ausdruck umwandelt suchst du dann nach

Code: Alles auswählen

.*(Me.*voil|viol.*Me).*
Und es könnte natürlich auch ein Tv-B Problem sein.

aber
  • Mi, 28. Feb · 07:50 · WDR Meilensteine der Naturwissenschaft und Technik: André-Marie Ampère und
    Fr, 16. Feb · 22:00 · SWR BW Nachtcafé
    So, 18. Feb · 10:15 · SWR BW Das Schönste aus der Czárdásfürstin
    So, 11. Mrz · 17:40 · Das Vierte Making Mr. Right - Ein Mann à la Carte
deuten he her dahin dass es im Tv-B doch geht oder?
Reicht es, in jedem Boolschen Ausdruck oder jedem regulären Ausdruck einfach alle mit irgendwelchen Zusatzzeichen (wie Akzente) versehenden Buchstaben durch einen "." (Punkt) zu ersetzen, um deren unvorhersehbare Mutationen in das Suchergebnis einzubeziehen?
nicht ganz ein regulären Ausdruck muss auf dem ganzen String passen.

darum auch min ein Leerzeichen es können ober auch belibig viele sein bedeutet beliebig viele zeichnen aber auch keins

wichtig ist das natürlich am Schluss da manche Sender manchmal auch die Episode an den Titel hängen.

zB

Code: Alles auswählen

(.*(James *Bond|\D007).*)|007.*
sind eigentlich 3 Begriffe durch das "|" oder verbunden zu einem such String.

(1)

Code: Alles auswählen

.*James *Bond.*
Beliebige Zeichen "James" gefolgt von beliebig vielen Leerzeichen, danach ein "Bond" und dann beliebige Zeichen.
(2)

Code: Alles auswählen

.*\D007.*
Beliebige Zeichen, ein nicht numerisches Zeichen (\D) danach "007" gefolgt von beliebige Zeichen.
(3)

Code: Alles auswählen

007.*
"007" gefolgt von beliebige Zeichen.


mit Boolsche Suche würde es wahrscheinlich reichen wenn du nach

Code: Alles auswählen

(James AND Bond) OR (007 AND NOT (2007 OR 2006)) 
suchst
wobei die reguläre Suche um den Faktor 3 schneller und präziser ist.

Da zB die reguläre Suche
"007 2007" (3) oder "2007 007" (2) finden würde die Boolesche aber nicht.


Die Boolesche Suche sucht nach Stichworten die logisch verknüpft sind die Reihenfolge ist egal.

Die reguläre Suche Vergleicht deine Angaben mit zB. dem Titel und die müssen exakt übereinstimmen. (natürlich mit Wildcard etc)

von Dorgo » 12 Feb 2007, 03:34

Vielen Dank für eine ausführliche Hilfe.

Wenn ich das richtig verstanden habe, gibt also Folgendes:

- Ein Fehler in der TV Daten Software, welche die von den Sendern erhaltenen Infos auswertet und im TV Browser zur Anzeige bringt, ist ausgeschlossen.
- Es gibt kein Schema, nach dem "à" immer zu "ö" mutiert, sondern kann je nach Sender unterschiedlich sein.
- Selbst die öffenlich rechtlichen Anstalten arbeiten nicht korrekt, denn nur ausschließlich in deren dritten Programmen (im Falle von "voilö" war das der SWR) werden die beiden genannten Sendungen ausgestrahlt.
- Bei den üblich verdächtigen Online Suchdiensten wurde das "voilö" jeweils händisch zu "voilà" geändert.
_______________

Da die Kombination des Wikipedia Artikel über reguläre Audrücke mit dem umfangreichen Java Artikel doch schon recht heftig ist, würde ich noch einmal nachfragen wollen:

Reicht es, in jedem Boolschen Ausdruck oder jedem regulären Ausdruck einfach alle mit irgendwelchen Zusatzzeichen (wie Akzente) versehenden Buchstaben durch einen "." (Punkt) zu ersetzen, um deren unvorhersehbare Mutationen in das Suchergebnis einzubeziehen?

"Me voil." als regulärer Ausdruck findet die Sendung, aber "Me AND voil." als Boolsche Suche leider nicht. Warum funktioniert das Letztere nicht? Ich kenne noch von DOS das Dollarzeichen "$", das dort jeden Buchstaben ersetzen konnte. Gibt es nicht etwas Adäquates auch hier?

Re: Lieblingssendungen werden nicht gefunden

von fingerhut » 10 Feb 2007, 17:16

Hier wäre das Festure "Lieblingssendung" eine probate Lösung, wenn es denn fehlerfrei funktionieren würde.
Es geht und macht genau was du eingibst. ;-)
Gibt es ein Schema, nach dem die französischen Akzente in falsche Buchstaben umgewandelt werden?
Ja das Schema des Senders. Qualität der Daten


Tipp experten Modus und mit Bool'sch suche

Code: Alles auswählen

Me AND (voilà OR  voilö)
oder

Code: Alles auswählen

Me AND voil

oder natürlich als Regulärer Ausdruck

Code: Alles auswählen

Me *voil.*
"Planète Némo" müsste dann so sein

Code: Alles auswählen

Plan.te *N.mo.*
*g* noch Fragen?

siehe Lieblingssendungen
und Reguläre Ausdrücke

Lieblingssendungen werden nicht gefunden

von Dorgo » 10 Feb 2007, 14:11

Hallo,

ein Problem, das ich schon seit längerer Zeit habe, soll mit dem TV Browser gelöst werden: Es gibt mehrere Sendungen, die ich mir gern anschauen würde und daher auf eine Wiederholung warte. Dabei ist aber nicht bekannt, wann und auf welchem Sender dies geschieht. So stellte ich im Nachhinein fest, dass eine Wiederholung stattfand, die ich jedoch verpasst habe. Hier wäre das Festure "Lieblingssendung" eine probate Lösung, wenn es denn fehlerfrei funktionieren würde.

Beispielsweise heißen zwei der gesuchten Sendungen (in diesem Falle Serien) "Me voilà" und "Planète Némo". Man beachte dabei die französischen Akzente auf den Vokalen. Die Erstere kündigte der TV Browser jedoch als "Me voilö" an und warnte mich daher nicht. Gehe ich richtig in der Annahme, dass er "Planète Némo" auch nicht finden wird? Kann man diesen Bug in der Software beseitigen? Gibt es ein Schema, nach dem die französischen Akzente in falsche Buchstaben umgewandelt werden? So könnte man die Suchwörter von vorn herein mit der falschen Schreibweise in die Suche einstellen.

Ich bedanke mich fürs Lesen und für eine Antwort

Nach oben