Project

General

Profile

Development #37038

nanterre: pénaliser les frères/soeurs et les conjoints lors de la recherche de doublon

Added by Benjamin Dauvergne about 2 years ago. Updated almost 2 years ago.

Status:
Résolu (à déployer)
Priority:
Normal
Target version:
-
Start date:
17 Oct 2019
Due date:
% Done:

0%

Estimated time:
Patch proposed:
Yes
Planning:
No

Description

Ils sont forcément proches (nom et date de naissance identique pour les jumeaux, nom pour les fratries et les conjoints).


Files

Associated revisions

Revision fd0ca4b6 (diff)
Added by Benjamin Dauvergne almost 2 years ago

nanterre: prévient les erreurs unicode quand on pipe rsu-duplicates (#37038)

Revision f7183bd2 (diff)
Added by Benjamin Dauvergne almost 2 years ago

nanterre: diminuer la similarité pour les membres d'une même famille (#37038)

History

#2

Updated by Benjamin Dauvergne almost 2 years ago

  • Tracker changed from Support to Development
#3

Updated by Benjamin Dauvergne almost 2 years ago

  • Assignee set to Benjamin Dauvergne
#5

Updated by Emmanuel Cazenave almost 2 years ago

Tes messages de commit sont originaux.

#6

Updated by Benjamin Dauvergne almost 2 years ago

Emmanuel Cazenave a écrit :

Tes messages de commit sont originaux.

Ouais j'ai pris l'habitude de les écrire en français parce que ça ne concerne que Nanterre.

#7

Updated by Emmanuel Cazenave almost 2 years ago

Benjamin Dauvergne a écrit :

Ouais j'ai pris l'habitude de les écrire en français parce que ça ne concerne que Nanterre.

Ah c'est les messages dans les patchs joints qui sont foireux, dans ta branche c'est ok, bizarre.

Pas compris ça, où ce queryset est-il utilisé ?

# clear old duplicates
Duplicate.objects.filter(id__in=[known[p].id for p in set(known) - set(seen)])
#8

Updated by Benjamin Dauvergne almost 2 years ago

Emmanuel Cazenave a écrit :

Pas compris ça, où ce queryset est-il utilisé ?

[...]

Bah nulle part, j'ai oublié le .delete() merci :) Ça souligne juste le manque de tests sur cette fonctionnalité.

#9

Updated by Benjamin Dauvergne almost 2 years ago

  • Status changed from Solution proposée to En cours
#12

Updated by Thomas Noël almost 2 years ago

Sur 0001 tu peux en profiter pour virer le "import sys"

Dans 0002 pourquoi tu utilises "limit or ..." pour sibling_factor ? Je trouve qu'un simple « sibling_factor = getattr(settings, 'ZOO_NANTERRE_DUPLICATES_SIBLING_FACTOR', 0.6) » serait plus explicite.

Détail, ligne 56 y'a une espace après conjoints dans « conjoints .add(...) »

#13

Updated by Benjamin Dauvergne almost 2 years ago

Dans 0002 pourquoi tu utilises "limit or ..." pour sibling_factor ? Je trouve qu'un simple « sibling_factor = getattr(settings, 'ZOO_NANTERRE_DUPLICATES_SIBLING_FACTOR', 0.6) » serait plus explicite.

Un copier/coller malheureux, j'ai corrigé.

#14

Updated by Thomas Noël almost 2 years ago

  • Status changed from Solution proposée to Solution validée
#15

Updated by Benjamin Dauvergne almost 2 years ago

  • Status changed from Solution validée to Résolu (à déployer)
commit f7183bd2ce991ef52e71d273819cc71e9a98063e
Author: Benjamin Dauvergne <bdauvergne@entrouvert.com>
Date:   Sun Jan 12 21:57:22 2020 +0100

    nanterre: diminuer la similarité pour les membres d'une même famille (#37038)

commit fd0ca4b6aa35e499d9bf97df3e9b7b9638ebd1ad
Author: Benjamin Dauvergne <bdauvergne@entrouvert.com>
Date:   Fri Jan 10 08:19:33 2020 +0100

    nanterre: prévient les erreurs unicode quand on pipe rsu-duplicates (#37038)

Also available in: Atom PDF