Save.TV hat machmal Rechtschreibfehler

Multitalent für Mac (OSX) zur Verwaltung von Save.TV

Moderator: Tschoertschill

SGiersch
Beiträge: 58
Registriert: Mi 6. Jul 2016, 06:09
Kontaktdaten:

Save.TV hat machmal Rechtschreibfehler

Beitrag von SGiersch » Fr 26. Aug 2016, 07:39

Hallo Tschoertschill,

Save.TV hat in den Serientitel manchmal Schreibfehler drin.
In myTVShows kann dafür der Titel einer Serienepisode nachträglich geändert werden.

Dieser Titel wird aber wieder auf den Inhalt von TheTVDB.com zurück geändert, falls eine erneute Aktualisierung der Serienstafel angestossen wird.

Vorschlag:
Bei den Episoden ein neue Textfeld einfügen, nennen wir es hier mal Alternative Titel.
Dort können die Alternativen Titel, bei bedarf auch mehrere, mit einem Sonderzeichen (; oder # oder etwas anderes) getrennt eingetragen werden.

Die Vorteile wären,
- Die alternativen Titel bleiben bei einer Aktualisierung über TheTVDB.com erhalten.
- Bei Save.TV ist mir schon eine Serienepisode mit zwei verschiedenen Schreibweisen untergekommen. Beide Titel waren unterschiedlich falsch geschrieben. Auf TheTVDB.com war die Schreibweise richtig.



Link:
BBcode:
HTML:
Hide post links
Show post links

Benutzeravatar
Tschoertschill
Beiträge: 118
Registriert: Fr 1. Apr 2016, 21:08

Re: Save.TV hat machmal Rechtschreibfehler

Beitrag von Tschoertschill » Fr 26. Aug 2016, 19:57

Hi,

das mit dem fehlerhaften SaveTV-EPG Einträgen ist mir auch schon öfters aufgefallen. Dein Vorschlag ist im Prinzip nicht schlecht, ich hatte bisher daran gedacht auch die englischen Episodentitel von TheTVDB zu holen und diese in die Datenbank einzupflegen, dann ist zumindest das Problem mit den englischen Titeln weg.

ABER, und hier hatte ich das Thema erstmal verworfen. Die Dauer für das Evaluieren der Serieninformationen der einzelnen Folgen wird sich (wesentlich) verlängern. Die Aufnahmeliste bzw. die Liste der programmierten Sendungen wird später erscheinen. Erst recht, wenn noch mehr Alternativtitel dazu kommen.

Hier die Frage an euch, würdet ihr das in Kauf nehmen ?

Eine Alternative die ich auch schon programmieren wollte, wäre das man die Episodentitel-Einträge im Serien-Modul schützen kann. So überschreibt das TheTVDB-Modul diese nicht mehr.

Natürlich kann man auch beides integrieren.

Link:
BBcode:
HTML:
Hide post links
Show post links

SGiersch
Beiträge: 58
Registriert: Mi 6. Jul 2016, 06:09
Kontaktdaten:

Re: Save.TV hat machmal Rechtschreibfehler

Beitrag von SGiersch » Sa 27. Aug 2016, 08:06

Hallo,

die Sache mit dem Titelschutz ist leider auch nicht die beste Wahl, da die Rechtschreibfehler bei einer Episode nicht immer gleich sind.

Ich schätze mal das von 100 Aufnahmen 5 teilweise eine falsche Schreibweise haben.
Meinst Du das sich die zusätzlichen Prüfungen derart auf die Performance auswirkt, das die Benutzung unangenehm wird?

Link:
BBcode:
HTML:
Hide post links
Show post links

Benutzeravatar
Tschoertschill
Beiträge: 118
Registriert: Fr 1. Apr 2016, 21:08

Re: Save.TV hat machmal Rechtschreibfehler

Beitrag von Tschoertschill » Sa 27. Aug 2016, 14:28

Ich werde es im Zuge der nächsten Version von myTVShows mal einbauen und prüfen.

Zum Verständnis des Suchalgorithmus, ich prüfe nicht einfach string1 == string2.

Sondern ich entferne vorher sämtliche Sonderzeichen und Whitespaces und ersetze Wörter wie "Teil 1" in "1", oder "(1)" in "1".
Ich erhalte damit einen String, in dem nur Wörter und Zahlen hintereinander kommen. Diese tue ich mit dem SaveTV-Episodentitel (string1), sowie mit dem Episodentitel (string2).

Als nächstes wird gefragt, ob string1 in string2 enthalten ist und umgekehrt string2 in string1.

Bisher erreiche ich damit, wenn keine Rechtschreibfehler in den Titeln enthalten sind eine nahezu 90-95%ige Auflösung und die verschiedenen Schreibweisen bei Doppelfolgen sind abgedeckt.

zb:
Episodenfolge (1)
Episodenfolge, Teil 1
Episodenfolge - Teil 1
etc

wird alles zu episodenfolge1

Einziges Thema ist noch, wenn der Titel in mehreren Folgen enthalten ist. Hier bekommt man aber einen Hinweis im Status. Problem bislang ist noch, wenn ein Episodentitel ein Teil des anderen Titels ist.

zB:
1. Das Meer
2. Der Mann und das Meer

wenn ich nach "Das Meer" (dasmeer) suche, erhalte ich derzeit 2 Treffer. Dies möchte ich mit der nächsten Version durch die zusätzliche Abfrage, wenn eine Mehrdeutigkeit vorliegt, mit string1 == string2 entfernen.

Kommen zusätzliche Titel für eine Folge hinzu, müssen die obigen Schritte genauso durchgeführt werden.

Ich bin immer, wenn ich am SaveTV-Modul arbeite, dabei diesen Algorithmus zu verbessern und vor allem die Laufzeiten zu verkürzen. Vor allen bei Serien mit sehr vielen Episoden wie Tatort oder Terra X. Wirkt es sich negativ auf die Laufzeiten aus, eh ein Titel der Serie gefunden wird.

Link:
BBcode:
HTML:
Hide post links
Show post links

SGiersch
Beiträge: 58
Registriert: Mi 6. Jul 2016, 06:09
Kontaktdaten:

Re: Save.TV hat machmal Rechtschreibfehler

Beitrag von SGiersch » Sa 27. Aug 2016, 16:15

Vielen Dank für die Erklärung.

Ich bin mal gespannt wie ein Alternativer Titel sich auf die Performanz auswirkt.
Allerdings bekommt ja nicht jede Episode einen Alternativen Titel,sondern nur wenn er wirklich auch anders geschrieben wird.
Gefühlsmässig würde ich sagen von 100 Titel sind 5 fehlerhaft.

Somit wäre das im schlechtesten Fall ein Laufzeitverlängerung von 5%.

Frage:
Könnte die Laufzeit verkürzt werden, wenn die Serientitel (Im Serien-Modul) zusätzlich auf den Suchstring runtergebrochen in der Datenbank gespeichert werden.
Dann müßte nur bei einer Aktualisierung des Titels eine Aufarbeitung des Strings durchgeführt und neu in der Datenbank abgelegt werden.

Link:
BBcode:
HTML:
Hide post links
Show post links

thomasfl
STV MANAGER
STV MANAGER
Beiträge: 290
Registriert: Fr 4. Mär 2016, 11:54

Re: Save.TV hat machmal Rechtschreibfehler

Beitrag von thomasfl » Sa 27. Aug 2016, 22:46

Hast Du schon mal von der Levenshtein Distanz gehört? Damit lässt sich ein Fuzzy Vergleich der Titel realisieren, das ist deutlich leichter. Hier die Wikipedia https://de.m.wikipedia.org/wiki/Levenshtein-Distanz

Ich habe mir für den Zweck eine fertige Implementierung gegoogelt ... ;)
Bild STV MANAGER - Tool zur Verwaltung von Save.TV --- Neuigkeiten & Downloads --- Fragen & Support

Link:
BBcode:
HTML:
Hide post links
Show post links

Benutzeravatar
Tschoertschill
Beiträge: 118
Registriert: Fr 1. Apr 2016, 21:08

Re: Save.TV hat machmal Rechtschreibfehler

Beitrag von Tschoertschill » So 28. Aug 2016, 16:48

Gehört hatte ich schon davon, aber damals als ich die Suchfunktion programmierte, gab es keine vernünftige Umsetzung für Swift.

Ich habe mal eben auf die schnelle, ein Algorithmus dazu implementiert.

Ergebnis war, das mit meiner derzeitigen SaveTV-Liste das evaluieren von 56 Sekunden auf 150 Sekunden erhöht hat. Die Rechtschreibfehler wurden sauber erkannt und den richtigen Titeln zugeordnet. Probleme bereiten hier mal wieder Tatort und Terra X. In den TheTVDB-Titeln ist der Kommissar und ein Folgennummer enthalten. Die Levenshtein Distanz findet zwar mit einer sehr hohen Fehlerrate den Titel, ist so aber nicht brauchbar. Ähnliches gilt für Terra X. Ob andere Serien davon auch betroffen sind, kann ich zur Zeit nicht sagen.

Ich habe nun meinen Algorithmus mit der Levenshtein Distanz kombiniert. Kommt mein Algorithmus mit null Treffer raus, übergebe ich es an die Distanz.

Ergebnis sind nun 120 Sekunden für meine TV-Liste, aber ich habe zusätzlich die Rechtschreibfehler erkannt und eine Season- und Episodennummer erhalten.

Ich werde jetzt noch etwas feintunig betreiben und im Laufe der Woche eine Version 3.2.2 herausgeben. Ich hoffe, auch wenn sich die Zeiten nahezu verdoppeln, dass dies ein annehmbarer Kompromiss ist.

Link:
BBcode:
HTML:
Hide post links
Show post links

Benutzeravatar
Tschoertschill
Beiträge: 118
Registriert: Fr 1. Apr 2016, 21:08

Re: Save.TV hat machmal Rechtschreibfehler

Beitrag von Tschoertschill » So 28. Aug 2016, 19:11

Feintuning ging schneller als gedacht. Der Algorithmus ist nochmals etwas verfeinert wurden. Ergebnis sind nun ca. 90 Sekunden für meine Liste.

Version 3.2.2 steht zum Download bereit.

Link:
BBcode:
HTML:
Hide post links
Show post links

Benutzeravatar
Raimi
Beiträge: 56
Registriert: Do 25. Feb 2016, 19:31
bevorzugter Onlinevideorecorder: Save TV und Onlinetvrecorder

Re: Save.TV hat machmal Rechtschreibfehler

Beitrag von Raimi » So 28. Aug 2016, 20:13

Hallo zusammen
kann das sein, das durch Rechtschreibfehler, mir die ein oder andere Episode schon mal verloren gegangen ist?

Link:
BBcode:
HTML:
Hide post links
Show post links

Benutzeravatar
Tschoertschill
Beiträge: 118
Registriert: Fr 1. Apr 2016, 21:08

Re: Save.TV hat machmal Rechtschreibfehler

Beitrag von Tschoertschill » So 28. Aug 2016, 20:26

Nein, verloren geht nix.

Der Dateiname heisst dann <Serienkürzel->SxxExxx_-_<Episodentitel>

Link:
BBcode:
HTML:
Hide post links
Show post links

Antworten

Wer ist online?

Mitglieder in diesem Forum: 0 Mitglieder und 1 Gast