Revenir au contenu principal
OpenID

Sujet: Méthode de scrap / Média Passion différente ? (Lu 173 fois) sujet précédent - sujet suivant

0 Membres et 1 Invité sur ce sujet
  • ccx
  • [*][*]
Méthode de scrap / Média Passion différente ?
Bonjour,

Grâce à ma base MySql, je vois que ma médiathèque, scrapée avec IMDB & TMDB n'est pas si propre qu'elle en a l'air.
Exemple, une requête du genre

SELECT `value` FROM `uniqueid` group by `value` having count(*) > 1

me renvoie trop de lignes, signifiant que des films différents ont reçu le même identifiant IMDB ou TMDB.
Ou encore cette requête simple, où je peux voir le nom des mes fichiers, Vs ceux reconnus par les scrapers pré-cités, montre un certain pourcentage d'erreur :

SELECT `c00`, `c16`, `c22`, `strFileName` FROM `movie_view`

Je vois aussi des soucis dans les Sagas ; par exemple les deux films "La guerre des mondes (The war of the worlds _ 1953).avi" et "La guerre des mondes (War of the worlds _ 2005).avi" se trouvent embarqués dans la saga "Arthur et les minimoys" car confondus avec l'épisode 3 "Arthur 3 : La Guerre des deux mondes".
SELECT `c00`, `c22` FROM `movie` WHERE `idSet` = 6

NB : Sets.idSet = 6 : "Arthur et les Minimoys - Saga".
renvoie
   c00      c22   
   Arthur 3: la guerre des deux mondes      smb://diskstation/video/Enfants/Arthur la guerre des deux mondes (2010).avi   
   Arthur 3: la guerre des deux mondes      smb://diskstation/video/___Films/La guerre des mondes (The war of the worlds _ 1953).avi   
   Arthur 3: la guerre des deux mondes      smb://diskstation/video/___Films/La guerre des mondes (War of the worlds _ 2005).avi   
   Arthur et la vengeance de Maltazard      smb://diskstation/video/Enfants/Arthur et la vengeance de Maltazard  (2009).avi   
   Arthur et les Minimoys      smb://diskstation/video/Enfants/Arthur 1 Et les minimoys (2002).avi   

J'ai pris soin de nommer mes films de manière qu'ils soient le mieux reconnus par les scrapers par défaut de Kodi, mais je ne suis pas satisfait du résultat. Même si je suis conscient du travail réalisé derrière.

Je n'aurai qu'une seule question : le scraper Media Passion aura-t'il un meilleur taux de reconnaissance ?
Et si je détecte une erreur, au lieu de bidouiller ma base, aurais-je la possibilité de corriger l'erreur en amont, càd dans votre base, ou signaler l'anomalie à un administrateur ?

Merci !

Christophe.

  • ccx
  • [*][*]
Re : Méthode de scrap / Média Passion différente ?
Réponse #1
Salut,

Heu?? quelqu'un peut-il répondre, svp ?

Merci  :)

Christophe

  • enzo94
  • [*][*][*][*][*][*][*]
  • Guide
Re : Méthode de scrap / Média Passion différente ?
Réponse #2
Je n'aurai qu'une seule question : le scraper Media Passion aura-t'il un meilleur taux de reconnaissance ?
Impossible à dire vu que l'on ne sait pas comment fonctionne le moteur de recherche des scrapers TMDB et IMDb et qu'on a aucune visibilité sur le nommage de tous tes fichiers

Et si je détecte une erreur, au lieu de bidouiller ma base, aurais-je la possibilité de corriger l'erreur en amont, càd dans votre base, ou signaler l'anomalie à un administrateur ?
Tout dépend de l'erreur

Grâce à ma base MySql, je vois que ma médiathèque, scrapée avec IMDB & TMDB
Pourquoi utiliser 2 scrapers ?

Je nommerai tous les fichiers avec le titre exact du scraper utilisé
Par exemple : La guerre des mondes (The war of the worlds _ 1953).avi
Je le nommerai le fichier "La guerre des mondes (1953).avi" afin que ça corresponde exactement au titre de la fiche de film et l'année sur TMDB, si c'est TMDB qui est utilisé comme scraper : https://www.themoviedb.org/movie/8974-the-war-of-the-worlds

Enfin ne pas perdre de vue qu'il y aura toujours quelques erreurs de scrap même avec des fichiers parfaitement nommés.

  • ccx
  • [*][*]
Re : Méthode de scrap / Média Passion différente ?
Réponse #3
Ok, merci Enzo pour ta réponse qui a le mérite de l'honnêteté :) (Tu aurais pu me dire d'acheter un abonnement, et de voir la différence). Ce que je ferai sans doute dans le futur.

Ce weekend, je me suis rendu compte qu'une grosse part de mes films n'ont pas l'année dans le nom, et que les films peuvent avoir pas mal d'homonymes, donc je vais commencer par balayer devant ma porte ^^_

Pourquoi 2 scrapers ? J'ai lancé un scrap avec IMDB, et un autre avec TMDB ; pas impossible que ce soit cela.

Pour la guerre des mondes, qu'est-ce qui m'empêche de laisser le titre original ?

Quoique ? Si je vais sur TMDB chercher "The War of the Worlds, 1953" il ne trouve pas, alors que quand je cherche "The War of the Worlds" sans l'année, je vois dans la liste retournée "La guerre des mondes", de 1953. En français, donc, effectivement ...
Je ne comprends pas pourquoi il trouve plus facilement le titre français que le titre original ?!

J'en profite pour poser une question de fond à laquelle je n'ai pas trouvé de réponse très précise : comment nommer les fichiers de manière à ce que les scrapers galèrent le moins possible pour tomber sur le bon média ? (Pourtant, j'ai vu les articles relatifs dans le Wiki)
Me concernant, je nomme mes fichiers en "Titre français (Année).ext" pour les films français, et "Titre français (Titre orignal _ Année).ext" pour les films étrangers. Je te demandais ce midi dans un autre post s'il était opportun d'ajouter l'Id unique d'IMDB ou de TMDB, aussi.
Si je peux avoir une réponse à tout cela, ce sera un grand pas en avant pour moi.

Merci !

Christophe.
  • Edité la dernière fois le: 08 Janvier 2018 16:49:33 par ccx

  • enzo94
  • [*][*][*][*][*][*][*]
  • Guide
Re : Méthode de scrap / Média Passion différente ?
Réponse #4
Pourquoi 2 scrapers ? J'ai lancé un scrap avec IMDB, et un autre avec TMDB ; pas impossible que ce soit cela.

Inutile d'avoir 2 scrapers. Quand un film est scrapé une fois, il ne sera plus rescrapé car déjà incorporé dans la mediathèque.

Pour la guerre des mondes, qu'est-ce qui m'empêche de laisser le titre original ?

Quoique ? Si je vais sur TMDB chercher "The War of the Worlds, 1953" il ne trouve pas, alors que quand je cherche "The War of the Worlds" sans l'année, je vois dans la liste retournée "La guerre des mondes", de 1953. En français, donc, effectivement ...
Je ne comprends pas pourquoi il trouve plus facilement le titre français que le titre original ?!

Tout dépend du scraper que tu utilises. TMDB à mon avis recherche un film à partir du titre du film dans une langue (celle sélectionné dans les paramètres). Peut être existe-t-il des scrapers qui savent le faire dans plusieurs langues mais je n'en connais pas.

J'en profite pour poser une question de fond à laquelle je n'ai pas trouvé de réponse très précise : comment nommer les fichiers de manière à ce que les scrapers galèrent le moins possible pour tomber sur le bon média ? (Pourtant, j'ai vu les articles relatifs dans le Wiki)
Me concernant, je nomme mes fichiers en "Titre français (Année).ext" pour les films français, et "Titre français (Titre orignal _ Année).ext" pour les films étrangers.

Comme je te l'ai indiqué ci-dessus <titre du film en français sur le site internet du scraper utilisé> (<année sur le site internet du scraper utilisé>). Avec cette méthode tu auras de bon résultat.

Je te demandais ce midi dans un autre post s'il était opportun d'ajouter l'Id unique d'IMDB ou de TMDB, aussi.
Si je peux avoir une réponse à tout cela, ce sera un grand pas en avant pour moi.

Encore une fois tout dépend du scraper mais TMDB autant que je sache n'utilise pas un ID pour rechercher un film. Dommage car l'utilisation d'un ID permettrai de grandement fiabiliser cette recherche.

  • ccx
  • [*][*]
Re : Méthode de scrap / Média Passion différente ?
Réponse #5
Bonjour Enzo,

Certains films peuvent ne pas être reconnus par un scraper, mais l'être par un autre. Peut-être que le 2e scrap pourra boucher certains trous.

Une dernière question .. conseillerais-tu plutôt IMDB, TMDB, ou MPDB ?
Merci pour tes remarques pertinentes.

Christophe

  • athos690
  • [*][*][*][*][*][*][*]
  • Guide
Re : Méthode de scrap / Média Passion différente ?
Réponse #6
...Encore une fois tout dépend du scraper mais TMDB autant que je sache n'utilise pas un ID pour rechercher un film. Dommage car l'utilisation d'un ID permettrai de grandement fiabiliser cette recherche.
L'api de TMDB le permet mais ce n'est pas utilisé par l'addon de Kodi qui fait une recherche sur le nom.
C'est assez logique puisqu'on est pas censé connaître le n° IMDB d'un film, sauf à aller consulter des sites avant de scraper ce qui me semble un peu fastidieux.
Le plus gros problème dans Kodi c'est de ne pas proposer de choix en cas de doute lorsqu'on scrape plusieurs films d'un coup et ça c'est vrai pour tous les addons de scrape. Seul le scrape d'un seul film propose ce choix.
Donc en cas d'homonymie (ou autre cause de confusion) c'est le premier film de la liste qui sera intégré à la médiathèque et donc pas forcément le bon.

C'est pour ça que dans GMS je propose une preview des films trouvés pour pouvoir les modifier avant l'intégration si nécessaire.
  • Edité la dernière fois le: 10 Janvier 2018 17:05:57 par athos690
Beebox 7200U-Windows 10-Krypton 17.6.
La Beebox fait aussi office de serveur de fichiers et MySQL avec Uwamp.


GMS Krypton.

  • ccx
  • [*][*]
Re : Méthode de scrap / Média Passion différente ?
Réponse #7
Ok, merci.
Je ne connais pas GMS, mais ça fera l'occasion de tester, ça a l'air intéressant.

  • mikebzh44
  • [*][*][*][*][*][*][*]
  • Développeur
  • Vi
Re : Méthode de scrap / Média Passion différente ?
Réponse #8
Par contre, cela impose l'utilisation d'une base centralisée MySQL.

Mais sinon, c'est royal  :-*

 
SimplePortal 1.0.0 Beta 1 © 2008-2014