Development #37038
nanterre: pénaliser les frères/soeurs et les conjoints lors de la recherche de doublon
0%
Description
Ils sont forcément proches (nom et date de naissance identique pour les jumeaux, nom pour les fratries et les conjoints).
Fichiers
Révisions associées
nanterre: diminuer la similarité pour les membres d'une même famille (#37038)
Historique
Mis à jour par Benjamin Dauvergne il y a environ 4 ans
- Fichier 0001-nanterre-pr-vient-les-erreurs-unicode-quand-on-pipe-.patch 0001-nanterre-pr-vient-les-erreurs-unicode-quand-on-pipe-.patch ajouté
- Fichier 0002-nanterre-diminuer-la-similarit-pour-les-membres-d-un.patch 0002-nanterre-diminuer-la-similarit-pour-les-membres-d-un.patch ajouté
- Statut changé de Nouveau à Solution proposée
- Patch proposed changé de Non à Oui
Mis à jour par Benjamin Dauvergne il y a environ 4 ans
Emmanuel Cazenave a écrit :
Tes messages de commit sont originaux.
Ouais j'ai pris l'habitude de les écrire en français parce que ça ne concerne que Nanterre.
Mis à jour par Emmanuel Cazenave il y a environ 4 ans
Benjamin Dauvergne a écrit :
Ouais j'ai pris l'habitude de les écrire en français parce que ça ne concerne que Nanterre.
Ah c'est les messages dans les patchs joints qui sont foireux, dans ta branche c'est ok, bizarre.
Pas compris ça, où ce queryset est-il utilisé ?
# clear old duplicates Duplicate.objects.filter(id__in=[known[p].id for p in set(known) - set(seen)])
Mis à jour par Benjamin Dauvergne il y a environ 4 ans
Emmanuel Cazenave a écrit :
Pas compris ça, où ce queryset est-il utilisé ?
[...]
Bah nulle part, j'ai oublié le .delete()
merci :) Ça souligne juste le manque de tests sur cette fonctionnalité.
Mis à jour par Benjamin Dauvergne il y a environ 4 ans
- Statut changé de Solution proposée à En cours
Mis à jour par Benjamin Dauvergne il y a environ 4 ans
- Fichier 0001-nanterre-pr-vient-les-erreurs-unicode-quand-on-pipe-.patch 0001-nanterre-pr-vient-les-erreurs-unicode-quand-on-pipe-.patch ajouté
- Fichier 0002-nanterre-diminuer-la-similarit-pour-les-membres-d-un.patch 0002-nanterre-diminuer-la-similarit-pour-les-membres-d-un.patch ajouté
- Statut changé de En cours à Solution proposée
Avec un test c'est plus sympa.
Mis à jour par Benjamin Dauvergne il y a environ 4 ans
Mis à jour par Thomas Noël il y a environ 4 ans
Sur 0001 tu peux en profiter pour virer le "import sys"
Dans 0002 pourquoi tu utilises "limit or ..." pour sibling_factor ? Je trouve qu'un simple « sibling_factor = getattr(settings, 'ZOO_NANTERRE_DUPLICATES_SIBLING_FACTOR', 0.6) » serait plus explicite.
Détail, ligne 56 y'a une espace après conjoints dans « conjoints .add(...) »
Mis à jour par Benjamin Dauvergne il y a environ 4 ans
- Fichier 0001-nanterre-pr-vient-les-erreurs-unicode-quand-on-pipe-.patch 0001-nanterre-pr-vient-les-erreurs-unicode-quand-on-pipe-.patch ajouté
- Fichier 0002-nanterre-diminuer-la-similarit-pour-les-membres-d-un.patch 0002-nanterre-diminuer-la-similarit-pour-les-membres-d-un.patch ajouté
Dans 0002 pourquoi tu utilises "limit or ..." pour sibling_factor ? Je trouve qu'un simple « sibling_factor = getattr(settings, 'ZOO_NANTERRE_DUPLICATES_SIBLING_FACTOR', 0.6) » serait plus explicite.
Un copier/coller malheureux, j'ai corrigé.
Mis à jour par Thomas Noël il y a environ 4 ans
- Statut changé de Solution proposée à Solution validée
Mis à jour par Benjamin Dauvergne il y a environ 4 ans
- Statut changé de Solution validée à Résolu (à déployer)
commit f7183bd2ce991ef52e71d273819cc71e9a98063e Author: Benjamin Dauvergne <bdauvergne@entrouvert.com> Date: Sun Jan 12 21:57:22 2020 +0100 nanterre: diminuer la similarité pour les membres d'une même famille (#37038) commit fd0ca4b6aa35e499d9bf97df3e9b7b9638ebd1ad Author: Benjamin Dauvergne <bdauvergne@entrouvert.com> Date: Fri Jan 10 08:19:33 2020 +0100 nanterre: prévient les erreurs unicode quand on pipe rsu-duplicates (#37038)
Mis à jour par Frédéric Péters il y a environ 2 ans
- Statut changé de Résolu (à déployer) à Fermé
nanterre: prévient les erreurs unicode quand on pipe rsu-duplicates (#37038)