Projet

Général

Profil

Development #37038

nanterre: pénaliser les frères/soeurs et les conjoints lors de la recherche de doublon

Ajouté par Benjamin Dauvergne il y a plus de 4 ans. Mis à jour il y a environ 2 ans.

Statut:
Fermé
Priorité:
Normal
Assigné à:
Version cible:
-
Début:
17 octobre 2019
Echéance:
% réalisé:

0%

Temps estimé:
Patch proposed:
Oui
Planning:
Non

Description

Ils sont forcément proches (nom et date de naissance identique pour les jumeaux, nom pour les fratries et les conjoints).


Fichiers

Révisions associées

Révision fd0ca4b6 (diff)
Ajouté par Benjamin Dauvergne il y a environ 4 ans

nanterre: prévient les erreurs unicode quand on pipe rsu-duplicates (#37038)

Révision f7183bd2 (diff)
Ajouté par Benjamin Dauvergne il y a environ 4 ans

nanterre: diminuer la similarité pour les membres d'une même famille (#37038)

Historique

#2

Mis à jour par Benjamin Dauvergne il y a environ 4 ans

  • Tracker changé de Support à Development
#3

Mis à jour par Benjamin Dauvergne il y a environ 4 ans

  • Assigné à mis à Benjamin Dauvergne
#5

Mis à jour par Emmanuel Cazenave il y a environ 4 ans

Tes messages de commit sont originaux.

#6

Mis à jour par Benjamin Dauvergne il y a environ 4 ans

Emmanuel Cazenave a écrit :

Tes messages de commit sont originaux.

Ouais j'ai pris l'habitude de les écrire en français parce que ça ne concerne que Nanterre.

#7

Mis à jour par Emmanuel Cazenave il y a environ 4 ans

Benjamin Dauvergne a écrit :

Ouais j'ai pris l'habitude de les écrire en français parce que ça ne concerne que Nanterre.

Ah c'est les messages dans les patchs joints qui sont foireux, dans ta branche c'est ok, bizarre.

Pas compris ça, où ce queryset est-il utilisé ?

# clear old duplicates
Duplicate.objects.filter(id__in=[known[p].id for p in set(known) - set(seen)])
#8

Mis à jour par Benjamin Dauvergne il y a environ 4 ans

Emmanuel Cazenave a écrit :

Pas compris ça, où ce queryset est-il utilisé ?

[...]

Bah nulle part, j'ai oublié le .delete() merci :) Ça souligne juste le manque de tests sur cette fonctionnalité.

#9

Mis à jour par Benjamin Dauvergne il y a environ 4 ans

  • Statut changé de Solution proposée à En cours
#12

Mis à jour par Thomas Noël il y a environ 4 ans

Sur 0001 tu peux en profiter pour virer le "import sys"

Dans 0002 pourquoi tu utilises "limit or ..." pour sibling_factor ? Je trouve qu'un simple « sibling_factor = getattr(settings, 'ZOO_NANTERRE_DUPLICATES_SIBLING_FACTOR', 0.6) » serait plus explicite.

Détail, ligne 56 y'a une espace après conjoints dans « conjoints .add(...) »

#13

Mis à jour par Benjamin Dauvergne il y a environ 4 ans

Dans 0002 pourquoi tu utilises "limit or ..." pour sibling_factor ? Je trouve qu'un simple « sibling_factor = getattr(settings, 'ZOO_NANTERRE_DUPLICATES_SIBLING_FACTOR', 0.6) » serait plus explicite.

Un copier/coller malheureux, j'ai corrigé.

#14

Mis à jour par Thomas Noël il y a environ 4 ans

  • Statut changé de Solution proposée à Solution validée
#15

Mis à jour par Benjamin Dauvergne il y a environ 4 ans

  • Statut changé de Solution validée à Résolu (à déployer)
commit f7183bd2ce991ef52e71d273819cc71e9a98063e
Author: Benjamin Dauvergne <bdauvergne@entrouvert.com>
Date:   Sun Jan 12 21:57:22 2020 +0100

    nanterre: diminuer la similarité pour les membres d'une même famille (#37038)

commit fd0ca4b6aa35e499d9bf97df3e9b7b9638ebd1ad
Author: Benjamin Dauvergne <bdauvergne@entrouvert.com>
Date:   Fri Jan 10 08:19:33 2020 +0100

    nanterre: prévient les erreurs unicode quand on pipe rsu-duplicates (#37038)
#16

Mis à jour par Frédéric Péters il y a environ 2 ans

  • Statut changé de Résolu (à déployer) à Fermé

Formats disponibles : Atom PDF