Lieblingssendungen - False Positives

Fehler in TV-Browser
DonPedro
Junior Member
Beiträge: 38
Registriert: 18 Mai 2009, 23:14

Lieblingssendungen - False Positives

Beitragvon DonPedro » 12 Jun 2015, 20:53

Hallo!

Ich benutze TVB 3.4.1

Seit langem (auch in Vorversionen) beobachtete ich immer wieder, daß es bei der Identifizierung von Lieblingssendungen zu falschen Treffern kommt (oder auch daß nichts gefunden wird, obwohl es müßte).

Das letzte Beispiel von dem ich Screenshots gemacht habe ist folgendes:
# Sendung: Mi, 10. 6., 1230-1400, Der Stärkste unter der Sonne, mdr
Ich habe den Schauspieler "Aldo Fabrizi" als Stichwort definiert und die Suche eingeschränkt auf "Schauspieler".
Die Sendung wird als Lieblingssendung gefunden, weil es einen "Arnaldo Fabrizio" unter den Schauspielern entdeckt. Offensichtlich verwendet die Suchroutine ein Verfahren, das nicht den vorhandenen Schauspieler mit dem Stichwort auf Übereinstimmung vergleicht, sondern ob das Stichwort "enthalten" ist.


Bei der Identifizerung eines Schauspielers kann es auch noch einen anderen Fehler geben.
# Sendung: Mo, 8. 6., 2145-2320, Inspektor Barnaby, zdfneo
Hier habe ich den Schauspieler "Gary Cooper" als Merkmal meiner Lieblingssendungen definiert und die Suche auf "Schauspieler" eingeschränkt.
Die Sendung wird als Lieblingssendung erkannt, weil ein Schauspieler anderen Namens (Phil Davis) die "Rolle" eines "Gary Cooper" spielt.


Ein anderer Fehler betrifft überhaupt die Nichtbeachtung der Einschränkung auf zB "Regie". Gesucht, gefunden und die Sendung entsprechend als Lieblingssendung identifiziert wird auch dann, wenn der Name zB im "Drehbuch" auftaucht, oder auch im "Zusatztext".
# Sendung: Mo, 15. 6., 2015-2155, Das verlorene Wochenende, arte
Die Sendung wird in diesem Beispiel zwar richtig als LS erkannt (weil "Billy Wilder" eingeschränkt auf "Regie" definiert ist und der Film tatsächlich ihn als Regisseur führt), jedoch wird der Name wie ersichtlich auch überall sonst rot markiert. Dies hätte zur Folge, daß auch dieser Film als LS erkannt werden würde, wenn die Regie jemand anderer inne hätte.


Ich hatte sogar schon den Fehler, daß eine Sendung nicht als LS erkannt wurde obwohl sie es sollte.
# Sendung: So, 24. 5., 2310-0110, Duell der Degen, br3
Hier war/ist "Philippe de Broca" unter "Regie" eingetragen, aber die Sendung wurde nicht erkannt.


Ein anderer, und dies ist der häufigste, besteht darin, daß eine Sendung als LS identifiziert wird, obwohl der Suchbegriff überhaupt nicht vorkommt.
# Sendung: Do, 12.3., 1415-1500, Der Anschlag Erinnerungen an den 11. September, zdfinfo
Hier war der Suchbegriff "9/11" angegeben (Stichwort, Suche "überall") und es war insoferne nicht störend daß die Sendung letztlich als LS erkannt wurde, jedoch stellt sich schon die Frage, wieso die Sendung als LS erkannt wird, wenn "9/11" in der gesamten Sendungsbeschreibung überhaupt nicht vorkommt.
Ebenso wird "11. September" nicht gefunden.

Die Verwirrung, was bei der Identifikation von LS funktioniert oder nicht wird auch an einem weiteren Beispiel deutlich.
# Sendung: Do, 12.3., 0055-0140, Der heilige Krieg Terror für den Glauben, zdfinfo
Zum Thema 9/11 habe ich viele Stichwörter angegeben (jeweils Suche "überall"): "9/11", "Terror", "Terrorismus", "Bin Laden", "11. September", "Verschwörung", etc.
Bei der genannten Sendung fällt auf, daß die Identifizierung zwar letztlich klappt, aber es sind zwei Fehler ersichtlich.
- Zum einen wird das Stichwort "Terror" nicht erkannt.
- zum anderen fehlen im linken Teil des Info-Fensters zur Sendung beim Abschnitt LS (Herzsymbol) jegliche Einträge zu den tatsächlich im rechten Teil gefundenen Sitchwörtern ("Bin Laden", "11. September").

Die Verwirrung wird noch größer.
# Sendung: Do, 12.3., 1715-1800, Der heilige Krieg Terror für den Glauben, zdfinfo (diese Sendung ist eine andere als die oben zuletzt genannte!)
"Terror" wird nun im Untertitel erkannt, dafür fehlt im linken Info-Fensterteil die Anzeige LS (Herzsymbol) komplett!

oder hier:
# Sendung: Do, 12.3., 0435-0519, Der Anschlag Erinnerungen an den 11. September, zdfinfo
Hier werden weder "11. September" (2x) noch "Terror" (1x) in der Sendungsbeschreibung erkannt. "9/11" schon ....

Sind diese Probleme bekannt?
Dateianhänge
tvbrowser fehler 20150612-191432.png
tvbrowser fehler 20150612-191432.png (56.09 KiB) 1240 mal betrachtet
tvbrowser fehler gary cooper schauspieler 20150606-024348.png
tvbrowser fehler gary cooper schauspieler 20150606-024348.png (52.91 KiB) 1240 mal betrachtet
tvbrowser fehler aldo fabrizi 20150608-215624.png
tvbrowser fehler aldo fabrizi 20150608-215624.png (79.63 KiB) 1240 mal betrachtet

DonPedro
Junior Member
Beiträge: 38
Registriert: 18 Mai 2009, 23:14

Re: Lieblingssendungen - False Positives

Beitragvon DonPedro » 12 Jun 2015, 20:59

die weiteren screenshots ...
Dateianhänge
tvbrowser fehler lieblingssendung terror6 20150309-143048.png
tvbrowser fehler lieblingssendung terror6 20150309-143048.png (38.85 KiB) 1239 mal betrachtet
tvbrowser fehler lieblingssendung terror8 20150309-150302.png
tvbrowser fehler lieblingssendung terror8 20150309-150302.png (30.41 KiB) 1239 mal betrachtet
tvbrowser fehler keine markierungen 20150524-202236.png
tvbrowser fehler keine markierungen 20150524-202236.png (50.27 KiB) 1239 mal betrachtet

DonPedro
Junior Member
Beiträge: 38
Registriert: 18 Mai 2009, 23:14

Re: Lieblingssendungen - False Positives

Beitragvon DonPedro » 12 Jun 2015, 21:04

die letzten screenshots ...
Dateianhänge
tvbrowser fehler lieblingssendung terror7 20150309-150210.png
tvbrowser fehler lieblingssendung terror7 20150309-150210.png (40.42 KiB) 1239 mal betrachtet
tvbrowser fehler lieblingssendung terror5 20150309-143028.png
tvbrowser fehler lieblingssendung terror5 20150309-143028.png (34.41 KiB) 1239 mal betrachtet

Jo
Site Admin
Beiträge: 10101
Registriert: 07 Apr 2006, 23:39

Re: Lieblingssendungen - False Positives

Beitragvon Jo » 12 Jun 2015, 21:18

Zu Teilen:
Die Rotmarkierungen sind nur ein Service zum besseren Finden des Ergebnisses. Das hat mit der Suche nichts direkt zu tun.
Zwischen Schauspielern und Rolle kann nicht sicher unterschieden werden. Deshalb werden auch Treffer bei Rollen angezeigt. Besser 1x zu viel als 1x zu wenig und es ist selten, dass Rollen nach Schauspielern benannt sind.

DonPedro
Junior Member
Beiträge: 38
Registriert: 18 Mai 2009, 23:14

Re: Lieblingssendungen - False Positives

Beitragvon DonPedro » 12 Jun 2015, 21:27

Die Sache mit Schauspieler gefunden in Rolle ist mein geringstes Problem. Das wird tatsächlich so selten vorkommen, daß man damit leben kann.

Die "Rot-Markierungen" mögen ja praktisch sein. Das ändert aber nichts daran daß sie deswegen vorhanden sind, weil nach den Begriffen gesucht wird und Treffer angezeigt werden. Damit ist aber das Problem nicht adressiert, daß Treffer gefunden werden, die gar nicht da sind (false positives), oder es zu keinem Treffer kommt, obwohl es einen Treffer geben müßte.

ds10
Site Admin
Beiträge: 16230
Registriert: 23 Jun 2005, 12:36
Kontaktdaten:

Re: Lieblingssendungen - False Positives

Beitragvon ds10 » 12 Jun 2015, 21:32

Der Suche liegt eine Suche mit regulären Ausdrücken zu Grunde, die findet bei Stichwortsuche alles, was passt. Bei genauer Übereinstimmung wird in der Regel gar nichts gefunden, da es praktisch ausgeschlossen ist, dass ein Feld genau dem Suchbegriff entspricht.

Übrigens bringen Beispiele aus der Vergangenheit überhaupt nichts, denn die können wir gar nicht mehr prüfen. Ein Screenshot der Sendungsinfo bringt auch nichts, da der nur, wie Jo schon sagte, darstellt, wo ein Suchbegriff vorkommt, wenn eine Sendung von einer Lieblingssendung gefunden wurde, nicht ob die angezeigte Stelle die Grundlage einer positiven Suche der Lieblingssendung ist. Diese Anzeige funktioniert übrigens auch nicht immer, nur es z.B. eine Filter-Lieblingssendung ist, sieht man keine Fundstellen.

Falsch-Positive können bei Stichwortsuche immer vorkommen, das lässt sich nicht verhindern. Dass Suchen kein Ergebnis haben, liegt entweder an einer falschen Sucheinstellung oder auch ganz einfach an Schreibfehlern in den Daten.

Generell kann die Suche gar nicht falsch sein, denn das würde bedeuten, dass Java keine korrekte Suche durchführt, schließlich reicht TV-Browser die Suchbegriffe und den zu durchsuchenden Inhalt nur an Java weiter und das gibt dann ein Ergebnis zurück.
"First they ignore you, then they ridicule you, then they fight you, then you win." - Mahatma Gandhi
Unterstütze die Weiterentwicklung von TV-Browser

DonPedro
Junior Member
Beiträge: 38
Registriert: 18 Mai 2009, 23:14

Re: Lieblingssendungen - False Positives

Beitragvon DonPedro » 13 Jun 2015, 20:24

Ich bin ein bißchen baff ob der gegebenen Antworten, so wenig Interesse hätte ich nicht erwartet.

Ich habe nie behauptet oder auch wissentlich versucht anzudeuten, daß "die angezeigte Stelle die Grundlage einer positiven Suche" nach einer LS ist. Das ergäbe ja gar keinen Sinn. Ohne VORHERIGE Suche nach den LS-Begriffen in den Sendungsbeschreibungstexten kann die für die Darstellung zuständige Programmroutine gar nicht wissen, ob und was rot einzufärben ist, oder? Es sei denn diese Markierungs-Routine ruft unabhängig davon eine eigene Suchroutine auf, getrennt von der Suche ob ein positiver Hit, eine LS, vorliegt. Aber das wissen nur Sie und ist auch bezüglich der aufgezeigten Seltsamkeiten nur insofern relevant, als es erklären würde, wieso Suchtexte trotz Einschränkung (Suche wo?) egal wo in der Sendungsbeschreibung markiert werden. Darum ging es mir aber nicht.

Ich habe eindeutig belegt, daß das Programm einmal nicht das tut was es anzeigt, und ein andermal nicht das anzeigt was es dann doch tut. Die sichtbare Oberfläche des Programmes ist das primäre Interface, um es überhaupt bedienen zu können. Auf welche Informationen wenn nicht die angezeigten soll ein Anwender sich sonst halten? Und ein Programm sollte auch das anzeigen, was es erwartungsgemäß anzeigen sollte, und das was es anzeigt sollte übereinstimmen mit den Daten im Hintergrund.

Wahrscheinlich war es nicht gut von mir, so viele Sendungen auf einmal als Beispiele zu bringen, sieht vielleicht wie ein Überfall aus und man flüchtet ohne sich mit der angezeigten Datenflut zu beschäftigen.

Mir geht es hier darum, an die Entwickler Auffälligkeiten zurückzumelden, um das Programm besser zu machen.

Daß Unstimmigkeiten bestehen belegen meine screenshots eindeutig, Anzeige/Darstellung vs Suche hin oder her. Es ist für die Anerkenntnis daß etwas nicht stimmt irrelevant, ob diese von vergangenen Sendungen sind. Die vergangenen Sendungen sind genauso reale Daten und belegen am Tag der screenshots für alle Zeiten, daß in diesem Moment etwas nicht in Ordnung ist. Das sollte jedenfalls Grund genug sein sich damit ernsthaft zu beschäftigen.

Wenn die Anzeige NICHT anzeigt (nicht rot einfärbt), daß ein Treffer besteht (nachdem die Suche POSITIV verlaufen ist), dann ist das ein bug in der Anzeige-routine und sollte doch ausgebessert werden, oder? Jetzt mag zwar die Sendung als LS markiert sein (Herz), aber daß der zuständige Suchtext nicht rot angezeigt wird ist schon ein bug, oder?

Wenn die Such-Routine nichts findet, obwohl offensichtlich (Darstellung) der Suchtext eindeutig vorliegt, dann ist das ein Fehler in der Such-Routine. Und das Suchen besteht aus mehr als der entsprechenden Routine in Java. Wenn der Fehler nicht dort ist (und gar nicht sein kann, wie ds10 meiner Meinung nach etwas dogmatisch behauptet), dann käme doch jener Teil in Frage, der das setup besorgt und den Suchtext und den Text an Java übergibt. Oder der das Ergebnis zurückübernimmt und weiterverarbeitet/weitergibt. Wenn sich Beispiele zeigen lassen, wie dargestellt in meinen screenshots, daß dies nicht korrekt funktioniert, dann sollte dem Problem doch auch auf den Grund gegangen werden. Vielleicht liegen ja keine bugs vor, aber was fehlt sind dann nachvollziehbare Erklärungen für die offensichtlichen Unstimmigkeiten.

Um das konkret anzugehen: ich habe mit dem 10. Jahrestag 9/11 (also Sommer 2011) mehrere LSn definiert und seither nicht mehr verändert. Sie funktionieren in der Regel ohne Probleme, manchmal aber mit hinterfragenswertem Ergebnis.

zB LS "11. September", Wo suchen? -> Überall, Suchbegriff ist ein Stichwort (dies ist für _alle_ meine 911-Stichworte die gleiche Einstellung)

siehe Bsp (screenshot):
# Der Anschlag, Do, 12.3., 0435-0519, zdfinfo
Hier wird der Suchtext "11. September" im Untertitel nicht rot eingefärbt, obwohl dieser korrekt als LS definiert ist.
Das kann ja nun daran liegen, daß die "Suche" dafür kein positives Ergebnis zurückgeliefert hat. Aber hätte sollen, den "11. September" steht eindeutig im Untertitel.
Es liegt wohl an der Suche, denn im linken Teil des Infofensters ist erkenntlich, daß nur die LS-Defnition für "9/11" erkannt wird (Abschnitt LS), was sich auch im rechten Teil durch Einfärbung spiegelt. Was mir hier nebenbei noch auffällt ist, daß dieser Abschnitt "LS" (Herzsymbol) eigenartigerweise nur eine Zeile hat, normalerweise ist das doch zum Ein-/Aufklappen mit allen möglichen Optionen. Aber das entdecke ich gerade erst jetzt, bin zusätzlich verwirrt ...

Nochmals "11. September" ... ANDERE Sendung, weil andere Uhrzeit, gleicher Tag, gleicher Sender
# Der Anschlag, Do, 12.3., diesmal 1415-1500, zdfinfo (also andere Sendung)
a) Wieder wird der Suchtext im Untertitel nicht gefunden.
b) Entdeckt wird aber "9/11", obwohl die Sendungsinfo dies im rechten Teil nicht hergibt.
Wo nimmt die Suchroutine den Treffer "9/11" her? Sucht die Routine in _allen_ Feldern der Sendungsinfo, auch wenn nicht angehakelt?
(Meine angehakelten Felder siehe screenshot). Falls in allen Feldern gesucht wird und sich der Text "9/11" in einem der nicht aktivierten verbirgt, wäre dies zumindest eine Erklärung für den Treffer. Seltsam wäre es aber "9/11" in einem der deaktivierten Felder unterzubringen, habe gerade nachgesehen und keines gefunden wo dies selbst unter Alkeinfluß zu erwarten wäre.

Daß im Untertitel gesucht wird, sieht man am Beispiel
# Der Heilige Krieg, Do, 12.3., 1715-1800, zdfinfo
HIer wird "Terror" im Untertitel richtigerweise gefunden (markiert).

und jetzt wirds richtig spannend durch folgendes Beispiel (gleicher Tag, gleicher Sender, gleicher Titel, GLEICHER Untertitel, andere Uhrzeit)
# Der Heilige Krieg, Do, 12.3., 0055-0140, zdfinfo
Hier wird "Terror" plötzlich nicht mehr im Untertitel gefunden (markiert)!!!!!!

Dazu ist mir besonders wichtig darauf hinzuweisen: alle diese bisher genannten Beispiele sind AM SELBEN TAG durch denselben Daten-update Vorgang entstanden.
Wie ist das zu erklären, daß in der einen Sendung "Terror" gefunden und markiert wird und in der anderen nicht?
Es gibt nur EINE LS-Definition für "Terror", EINE Suchfunktion, EINE Markierungsfunktion die in diesem Datenupdate-Vorgang und Anzeige der gefundenen LS (aufpoppendes Fenster) zur Anwendung kamen. Es steht also außer Frage, daß dies nicht an der LS-Definition liegt, also in meinem Bereich. Denn es kam dieselbe innerhalb von Sekundenbruchteilen zur Anwendung. Es steht auch außer Frage, daß in beiden Sendungen das Stichwort "Terror" im UT vorliegt, ohne Schreibfehler.

Bemerkenswert ist auch, daß im Falle der Sendung 0055 im linken Teil des Info-Fenster nur steht "Nicht als Lieblingssendung von" und dann NICHTS. Dabei müßten die Treffer der LS-Definitionen "Bin Laden" oder "11. September" aufgelistet sein. Aber es steht einfach nichts da. Was passiert hier (nicht)?


Weiteres Beispiel:
# Der Anschlag, Do, 12.3., 1415-1500, zdfinfo
"11. September" wird im Untertitel nicht erkannt.
In der gesamten weiteren Info zur Sendung steht offensichtlich kein weiterer LS-Begriff. Jedenfalls nicht "9/11".
Jedoch im linken Fensterteil steht "Nicht als LS von "9/11"... Hier also steht nach "Nicht als LS von" das gesuchte Stichwort "9/11"
Unbenommen, warum jetzt überhaupt "9/11" als Treffer erkannt wird, wieso steht hier wie auch zu erwarten das Stichwort, im obigen Beispiel aber nicht?

Damit ist für mich, den Anwender, jedenfalls klar, daß das Programm nicht immer so funktioniert wie zu erwarten wäre. Es verhält sich bei offensichtlich gleicher Ausgangslage manchmal unterschiedlich. An der LS-Defintion kann es nicht liegen, denn die ist immer gleich.

Warum im Beispiel "Duell der Degen" der Regisseur "Philippe de Broca" nicht erkannt wurde, ist nicht damit erklärt, daß es eine fehlerhafte Eingabe der LS-Def war. Selbstverständlich ist dies das Erste was ich überprüfe bevor ich erwäge deswegen einen zeitraubenden thread zu starten. Ich nehme mir gerne Zeit Programmierer von Merkwürdigkeiten eines Programms zu unterrichten. ICh gehe davon aus daß das in derem Interesse ist und in meinem als Anwender, der sich auf korrekte Funktionalität verlassen möchte, sowieso.

Zu sagen, die Daten sind veraltet und nicht mehr zugänglich ist kein sinnvoller Umgang zur Lösung eines augenscheinlichen Problems. Daß die screenshots keine fabrizierten Fakes sind um euch zu ärgern darf erstmal vorausgesetzt werden - ich habe meine Zeit auch nicht gestohlen.


Ist mein Verständnis richtig, daß die Rot-Markierungen des LS-Stichwortes sich nicht an die Beschränkung (Suche wo?) halten, falls eine solche definiert wurde?
Dateianhänge
tvbrowser sendungsinfo felder 20150613-182038.png
tvbrowser sendungsinfo felder 20150613-182038.png (24.57 KiB) 1218 mal betrachtet

ds10
Site Admin
Beiträge: 16230
Registriert: 23 Jun 2005, 12:36
Kontaktdaten:

Re: Lieblingssendungen - False Positives

Beitragvon ds10 » 13 Jun 2015, 21:52

DonPedro hat geschrieben:Zu sagen, die Daten sind veraltet und nicht mehr zugänglich ist kein sinnvoller Umgang zur Lösung eines augenscheinlichen Problems. Daß die screenshots keine fabrizierten Fakes sind um euch zu ärgern darf erstmal vorausgesetzt werden - ich habe meine Zeit auch nicht gestohlen.

Habe ich etwa behauptet, dass es sich um Fakes handelt? Ich habe nur klar gestellt, das mir das überhaupt nichts nutzt, denn ich kann nunmal nicht in die Vergangenheit zurück reisen um dann zu prüfen, ob ich die gleichen Probleme bei der Suche habe. Denn nur wenn ich ein aktuelles Beispiel habe, kann ich überhaupt testen, ansonsten würde ich irgendwo im Quellcode suchen, ohne überhaupt eine Ahnung zu haben, wo ich einen möglichen Fehler finden könnte, was weder sinnvoll noch aussichtsreich wäre.

DonPedro hat geschrieben:Ist mein Verständnis richtig, daß die Rot-Markierungen des LS-Stichwortes sich nicht an die Beschränkung (Suche wo?) halten, falls eine solche definiert wurde?

Ja genau, es wird nur geprüft, ob eine Sendung von einer Lieblingssendung gefunden wurde und falls das der Fall ist, wird deren Suchbegriff auf den angezeigten Text angewendet. Die Einschränkungen an der Stelle zu prüfen wäre kaum möglich ohne dass es zu Verzögerungen beim Öffnen der Sendungsinfo kommt, insbesondere wenn ein Filter die Grundlage bildet ist es kaum möglich den überhaupt darzustellen. Und wie weiter oben gesagt, funktioniert diese Anzeige manchmal auch gar nicht, z.B. bei Verwendung eines Filters. Daher kann man diese Funktion auch deaktivieren, falls sie zu sehr stört.

Um das nochmal klar zu stellen. Die Suche selbst kann nicht falsch arbeiten, wenn Java richtig arbeitet. Was theoretisch möglich wäre ist, dass der Suchinhalt falsch zusammen gesetzt wird, dann dürfte aber die Suche für ein Feld niemals funktionieren, wenn diese Feld falsch verarbeitet wird. Was auch noch denkbar wäre, ist dass die Daten gar nicht durchsucht wurden nach einem Datenupdate, weil es dabei zu einem Fehler in der Verarbeitung gekommen ist. Das dürfte aber aus Sicht des Quellcodes nicht vorkommen, da dort immer alle neuen Sendungen von den Lieblingssendungen durchsucht werden. Es gibt dort zwar einen Timeout, aber der hängt von der Anzahl der Lieblingssendungen ab und sollte damit reichen, wenn man z.B. 60 Lieblingssendungen hat, wird TV-Browser eine Minute auf das Beenden der Lieblingssendungssuche warten (nachdem alle Daten heruntergeladen wurden). Und selbst danach würde die Suche weiter laufen, nur TV-Browser beendet dann das Datenupdate.

Einen Fehler gibt es bei der Darstellung der Markierung der Sendungen, den konnte ich allerdings nie dingfest machen. Ein Neustart von TV-Browser nach einem Datenupdate behebt aber dieses Markierungsproblem.

Es gibt immer mehrere (nicht fehlerhafte) Möglichkeiten warum eine Sendung nicht gefunden wird:
-fehlerhafte Sucheinstellungen
-gesetzte Ausschlüsse (sowohl global als auch nur für die eine Lieblingssendung)
-Schreibfehler in den Daten, z.B. man sucht nach Götz George, in den Daten steht aber Goetz George oder man sucht nach Louis de Funès in den Daten steht aber Louis de Funés, dann wird das nicht gefunden, weil Java ganz korrekt feststellt, dass der Suchbegriff nicht vorkommt

Man muss immer bedenken, dass die Datenqualität nicht perfekt ist und auch nicht sein kann, denn wir haben nicht die Möglichkeit alles nochmal zu prüfen, was von den Sendern kommt.

Und die falsch-positiven Stichwortsuchen ergeben sich genau daraus, dass es eine Stichwortsuche ist. Die findet die Eingabe, wenn die irgendwo im Text vorkommt, auch mitten im Wort oder über mehrere Wörter, sie ist genau so programmiert worden, damit nach Möglichkeit nichts verloren geht. Bei falsch-positiven Funden kann man die Sendung dann nämlich immer noch manuell ausschließen, aber man verpasst sie nicht.

Das Thema war auch schon öfter, wenn man keine Fundstellen innerhalb von Wörtern möchte, dann muss man explizit mit regulären Ausdrücken arbeiten, siehe: viewtopic.php?f=42&t=17187&p=110549&hilit=regul%C3%A4re+ausdr%C3%BCcke#p110549

Lange ausschweifende Erklärungen sind für mich auch wenig hilfreich, das ist wie eine Textaufgabe im Mathematikunterricht die auf 3 A4-Seiten die Frage stellt, wieviel 1+1 ist? Eine kurze Meldung, wann eine Suche bei einer zukünftigen (oder maximal gestern) Sendung, mit welchen Suchbegriffen/-einstellungen nicht funktioniert ist da viel hilfreicher.

Daher bitte ich darum, bei einer Fehlermeldung immer nur so viel Informationen wie nötig anzugeben und keine Romane zu schreiben. In diesem Fall wäre das also, Suchbegriff, Sucheinstellungen, Sendung(en) die vermeintlich hätte(n) gefunden werden sollen oder nicht gefunden werden sollen.
"First they ignore you, then they ridicule you, then they fight you, then you win." - Mahatma Gandhi
Unterstütze die Weiterentwicklung von TV-Browser

Jo
Site Admin
Beiträge: 10101
Registriert: 07 Apr 2006, 23:39

Re: Lieblingssendungen - False Positives

Beitragvon Jo » 13 Jun 2015, 22:21

DonPedro hat geschrieben:In der gesamten weiteren Info zur Sendung steht offensichtlich kein weiterer LS-Begriff. Jedenfalls nicht "9/11".
Jedoch im linken Fensterteil steht "Nicht als LS von "9/11"... Hier also steht nach "Nicht als LS von" das gesuchte Stichwort "9/11"
Unbenommen, warum jetzt überhaupt "9/11" als Treffer erkannt wird, wieso steht hier wie auch zu erwarten das Stichwort, im obigen Beispiel aber nicht?

"9/11" ist nur der Name der Lieblingssendung (den du wohl irgendwann selbst vergeben hast). Das heißt nicht unbedingt, dass nach Stichwort "9/11" gesucht wird. Da müsstest du nachsehen, ob das überhaupt in der Lieblingssendung als Suchbegriff drin ist.

DonPedro
Junior Member
Beiträge: 38
Registriert: 18 Mai 2009, 23:14

Re: Lieblingssendungen - False Positives

Beitragvon DonPedro » 14 Jun 2015, 16:50

@Jo
ja, eh, die Überprüfung der richtigen Schreibweise des Suchtexts legt einen Unterschied zwischen Bezeichnung und Suchtext schnell offen. Aber es stimmt, wenn man nicht aufpaßt übersieht man das. danke.

@ds10

Danke, ein wenig Licht ins Dunkel.
Ich schreib auch lieber keine Romane.
Aber da es nicht einfach nur um 1 Sendung ging, sondern um mehrere die jede für sich Fragen aufwirft und deren Probleme nebeneinandergestellt sich selbst nochmals widersprechen mußte das aus meiner Sicht leider umfänglicher dargelegt werden. Sonst könnte ich ja nicht klarmachen worum es hier geht und wo überall Unstimmigkeiten bestehen.

ich kann nunmal nicht in die Vergangenheit zurück reisen um dann zu prüfen

Nicht einmal ihr als Entwickler habt Zugang zu den alten Daten?

wenn man z.B. 60 Lieblingssendungen hat, wird TV-Browser eine Minute auf das Beenden der Lieblingssendungssuche warten (nachdem alle Daten heruntergeladen wurden)

Also ich habe gerade nachgezählt - ich habe 355 LS definiert. Heißt das, umgelegt, daß das Programm eine Pause von 6 Minuten einlegen sollte?

Das ist bei mir nicht der Fall. Wenn das Programm nach Programmstart das Datenupdate durchführt (automatisch unmittelbar danach), dann geht das Ruckzuck. Rechts unten sieht man den Verlaufsbalken, links unten werden glaube ich hintereinander innerhalb von 10-15 Sekunden 3 Verarbeitungsschritte angezeigt nach Fertigstellung des downloads. Eine wahrnehmbare Verzögerung von 1 Minute oder gar mehr (umgerechnet auf meine # LS) bevor das Fenster mit den identifizierten LS aufpoppt gibt es da nicht.
Sollte so eine Verzögerung tatsächlich in dem Ausmaß wahrnehmbar sein? Stimmt was mit meiner Installation nicht? Mein Rechner ist von der Performance eindeutig low-end (amd e350, 1,6 GHz).

Ich werde mich jedenfalls bemühen in Zukunft sofort Rückmeldung zu machen.

Um noch einmal sicherzugehen: wird zur Identifikation einer LS nur jener Bereich (Felder) untersucht, der unter "Wo suchen?" angegeben ist? Und der Routine für die Rot-Markierung ist das egal, die sucht immer in allen Sendungsfeldern?

Wenn bei der Konfiguration der Anzeige der Sendungsinfo alle Felder aktiviert werden, beim Betrachten der Info zu einer bestimmten Sendung aber nicht alle Felder angezeigt werden, heißt das dann daß die Felder leer sind (und deswegen nicht angezeigt werden)?

Und sind die Anzeigefelder mit den Feldern bei der Bestimmung des "Suche wo?" Kriteriums (LS-Def) identisch?
D.h., wenn ich mir von nun an alle Felder anzeigen lasse habe ich damit eine objektive Grundlage zur Beurteilung, ob eine LS richtig erkannt wurde? (abgesehen von der Beachtung etwaiger Ausschluß-Definitionen)

Vorletzte Frage: wenn das LS-Kriterium als "Stichwort" definiert ist, dann ist es (alles andere gleich) sinnlos sowohl eine LS mit dem Suchtext "Verschwörung" und eine weitere "Verschwörungstheorie" zu definieren, weil aufgrund der Suche mit regexp die erste LS-Def sowieso die zweite LS-Def "inkludiert", also die 2. Def überflüssig macht (bei sonst gleichen Einstellungen)? Und die Suche erkennt positiv auch zb "Gegenverschwörung" (klein v)?

Wenn aber bei der LS-Def (obiges Bsp) das Hakerl bei "Groß/Kleinschreibung" beachten gesetzt wird, dann wird dies schon beachtet? Also "Verschwörungsheoretisch betrachtet ...." wird positiv erkannt, "... die verschwörungstheoretische Frage ..." hingegen nicht?

Wenn das so ist kann ich meine LS-Defs etwas verringern.

Vielen Dank jedenfalls!

ds10
Site Admin
Beiträge: 16230
Registriert: 23 Jun 2005, 12:36
Kontaktdaten:

Re: Lieblingssendungen - False Positives

Beitragvon ds10 » 14 Jun 2015, 18:06

DonPedro hat geschrieben:Nicht einmal ihr als Entwickler habt Zugang zu den alten Daten?

Theoretisch könnte man die Daten zwar auf dem Server aufheben, aber da alles automatisch läuft, werden auch die Daten automatisch gelöscht, was auch besser ist, denn sonst läuft irgendwann der Speicher voll, denn es sind große Datenmengen, die sich dort ergeben.

DonPedro hat geschrieben:Also ich habe gerade nachgezählt - ich habe 355 LS definiert. Heißt das, umgelegt, daß das Programm eine Pause von 6 Minuten einlegen sollte?

Das ist bei mir nicht der Fall. Wenn das Programm nach Programmstart das Datenupdate durchführt (automatisch unmittelbar danach), dann geht das Ruckzuck. Rechts unten sieht man den Verlaufsbalken, links unten werden glaube ich hintereinander innerhalb von 10-15 Sekunden 3 Verarbeitungsschritte angezeigt nach Fertigstellung des downloads. Eine wahrnehmbare Verzögerung von 1 Minute oder gar mehr (umgerechnet auf meine # LS) bevor das Fenster mit den identifizierten LS aufpoppt gibt es da nicht.
Sollte so eine Verzögerung tatsächlich in dem Ausmaß wahrnehmbar sein? Stimmt was mit meiner Installation nicht? Mein Rechner ist von der Performance eindeutig low-end (amd e350, 1,6 GHz).

Nein, die 355 Lieblingssendungen ergeben eine maximale Wartezeit von 355 Sekunden nachdem alle Daten heruntergeladen worden sind. TV-Browser durchsucht auch schon während des Downloads die bereits geladenen Daten. Auch ein AMD E350 hat ja zwei Kerne wodurch TV-Browser dann auch in zwei Threads suchen kann. Je nachdem viele Daten neu sind und wie kompliziert deine Lieblingssendungen sind, dauert das kürzer oder länger. Es ist auf jeden Fall nicht verdächtig, wenn das Datenupdate schnell durchläuft. Im Log würde man auch einen Hinweis erhalten, wenn TV-Browser noch weiter sucht, auch wenn das Datenupdate als abgeschlossen angezeigt wird. Wenn TV-Browser keine große Wartezeit hat, dann heißt das eigentlich, dass die Suche erfolgreich abgeschlossen wurde, die restliche Wartezeit ist dann einfach verfallen.

DonPedro hat geschrieben:Um noch einmal sicherzugehen: wird zur Identifikation einer LS nur jener Bereich (Felder) untersucht, der unter "Wo suchen?" angegeben ist? Und der Routine für die Rot-Markierung ist das egal, die sucht immer in allen Sendungsfeldern?

Ja und jein, die Rot-Markierung wird nur dann vorgenommen, wenn die Sendung als Lieblingssendung markiert ist, in dem Fall wird sie dann aber auf den gesamten angezeigten Text angewendet (und auch nur von den Lieblingssendungen, die die Sendung markieren).

DonPedro hat geschrieben:Wenn bei der Konfiguration der Anzeige der Sendungsinfo alle Felder aktiviert werden, beim Betrachten der Info zu einer bestimmten Sendung aber nicht alle Felder angezeigt werden, heißt das dann daß die Felder leer sind (und deswegen nicht angezeigt werden)?

Ja.

DonPedro hat geschrieben:Und sind die Anzeigefelder mit den Feldern bei der Bestimmung des "Suche wo?" Kriteriums (LS-Def) identisch?
D.h., wenn ich mir von nun an alle Felder anzeigen lasse habe ich damit eine objektive Grundlage zur Beurteilung, ob eine LS richtig erkannt wurde? (abgesehen von der Beachtung etwaiger Ausschluß-Definitionen)

Nicht hundertprozentig, die Folgennummer ist manchmal kodiert um mehrere Folgennummern innerhalb einer Sendung anzeigen zu können und die Sendungsinfos (Stereo, HD, usw.) sind immer kodiert und werden in die Info-Symbole umgewandelt. Man sieht also bei der Folgennummer nicht unbedingt, wie die Zahl in den Daten steht, das sollte aber kein Problem sein, denn wenn ich mich richtig erinnere, dann habe ich die Suche auch entsprechend angepasst, so dass das Feld Folgennummer immer erst dekodiert wird, bevor die Suche darauf angewendet wird. Und nach den Sendungsinfos kann man ja sowieso nur mit Hilfe eines Filters suchen. Also solltest du, wenn alle Felder aktiviert sind auch immer sehen, wo der Suchbegriff vorkommt. (Es kann natürlich auch vorkommen, dass eine Sendung von mehreren Lieblingssendungen markiert wird, dann sollte jeder Suchbegriff rot markiert sein.) Und falls du Filter-Lieblingssendungen einsetzt, wirst du bei denen nie eine Markierung sehen, denn die sucht intern nach .* plus Filter-Bedingung, es wäre dort also, vom Suchbegriff her, alles rot.

DonPedro hat geschrieben:Vorletzte Frage: wenn das LS-Kriterium als "Stichwort" definiert ist, dann ist es (alles andere gleich) sinnlos sowohl eine LS mit dem Suchtext "Verschwörung" und eine weitere "Verschwörungstheorie" zu definieren, weil aufgrund der Suche mit regexp die erste LS-Def sowieso die zweite LS-Def "inkludiert", also die 2. Def überflüssig macht (bei sonst gleichen Einstellungen)? Und die Suche erkennt positiv auch zb "Gegenverschwörung" (klein v)?

Ja und ja (wenn man nicht das Beachten der Groß-/Kleinschreibung aktiviert hat.)

DonPedro hat geschrieben:Wenn aber bei der LS-Def (obiges Bsp) das Hakerl bei "Groß/Kleinschreibung" beachten gesetzt wird, dann wird dies schon beachtet? Also "Verschwörungsheoretisch betrachtet ...." wird positiv erkannt, "... die verschwörungstheoretische Frage ..." hingegen nicht?

Genau so sollte es sein. Dabei sollte es auch keine Probleme geben, denn das sind einfach nur gesetzte Bedingungen für die RegEx-Suche. Die einzige Suchmethode, die nicht mit regulären Ausdrücken arbeitet, ist die Bool'sche Suche, die ist aber auch deutlich langsamer.
"First they ignore you, then they ridicule you, then they fight you, then you win." - Mahatma Gandhi
Unterstütze die Weiterentwicklung von TV-Browser

DonPedro
Junior Member
Beiträge: 38
Registriert: 18 Mai 2009, 23:14

Re: Lieblingssendungen - False Positives

Beitragvon DonPedro » 14 Jun 2015, 21:47

Danke für das Dranbleiben. Und das bei 33 Grad im Schatten ...

Bin gespannt ob nach einigen Einstellungsänderungen ich nochmals über Unstimmigkeiten stolpere. Werde dann sofort reportieren.

DonPedro
Junior Member
Beiträge: 38
Registriert: 18 Mai 2009, 23:14

Re: Lieblingssendungen - False Positives

Beitragvon DonPedro » 05 Mär 2016, 00:01

Hallo,

bin zurück mit einem hoffentlich noch genug aktuellem Beispiel für eine seltsame Markierung als LS.

Eine Sendung wird als LS gefunden, obwohl lt. komplett angezeigter Sendungsinfo (alle Felder sollen angezeigt werden) der gesuchte Begriff (hier sogar zwei, "Terror" und "Propaganda") gar nicht vorhanden ist.

Interessanterweise aber wird die Suche fündig bei der "gleichen" Sendung nur wenige Stunden zuvor, wie man auch deutlich in der Sendungsinfo sehen kann.

Wie ist das möglich?
Dateianhänge
tvb kein fehler 20160304-020310.png
tvb kein fehler 20160304-020310.png (60.84 KiB) 946 mal betrachtet
tvb fehler 20160304-020134.png
tvb fehler 20160304-020134.png (50.26 KiB) 946 mal betrachtet

ds10
Site Admin
Beiträge: 16230
Registriert: 23 Jun 2005, 12:36
Kontaktdaten:

Re: Lieblingssendungen - False Positives

Beitragvon ds10 » 05 Mär 2016, 10:33

Das liegt an fehlerhaften Daten, die ServusTV gesendet hat. Um 0:25 Uhr starten zwei Sendungen, wir haben keine Möglichkeit herauszufinden welche die richtige Sendung ist. Daher enthalten die Daten auch beide, TV-Browser kann diese beiden Sendungen aber von der ID her nicht unterscheiden und deshalb werden immer alle Sendungen die gleichzeitig starten markiert, auch wenn von diesen einige den Suchbegriff nicht enthalten.
"First they ignore you, then they ridicule you, then they fight you, then you win." - Mahatma Gandhi
Unterstütze die Weiterentwicklung von TV-Browser

DonPedro
Junior Member
Beiträge: 38
Registriert: 18 Mai 2009, 23:14

Re: Lieblingssendungen - False Positives

Beitragvon DonPedro » 05 Mär 2016, 14:19

Verstehe, aber trifft das tatsächlich auf das Beispiel zu?

die erste SEndung ist vom 3.3., 22:15 uhr
die zweite die wiederholung am 4.3., 00:25


Zurück zu „Bugs“

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 3 Gäste