Developpez.com - Rubrique MATLAB

Le Club des Développeurs et IT Pro

Défi n°4 : Comparer deux listes de mots

Venez relever les défis MATLAB.

Le 2012-06-16 03:00:33, par ol9245, Membre éprouvé
J'ai deux listes de mots en nombre arbitraire et non ordonnées. Par exemple :
Code :
1
2
A = {'un' 'deux' 'chateau' 'trois' 'quatre'} ;
B = {'deux' 'quatre' 'six' 'huit' 'dix' 'douze' 'maison' 'bateau' 'chateau'} ;
Le défi est le suivant :
Écrire le code le plus compact(*) possible pour trouver tous les mots communs aux deux listes. c'est-à-dire quelque chose comme ça :
Code :
1
2
3
4
5
>>votre formule magique ici

ans = 

    'deux'    'chateau'    'quatre'
-----------------------------------
(*) un code est compact quand il a :
  • moins de boucles (for-end, while-end, ...)
  • moins de lignes de code
  • moins d'affectations (signe =)
  • moins de variables déclarées


Pas besoin de hiérarchiser ces critères car toute amélioration de l'un impacte les autres.
  Discussion forum
9 commentaires
  • Jean Dumoncel
    Modérateur
    Salut,

    proposition avec cellfun justement :
    Code :
    1
    2
    3
    4
    5
    A = {'un' 'deux' 'chateau' 'trois' 'quatre'} ;
    B = {'deux' 'quatre' 'six' 'huit' 'dix' 'douze' 'maison' 'bateau' 'chateau'} ;
    C = repmat(A,size(B,2),1)
    D = repmat(B.',1,size(A,2))
    E = cellfun(@(x,y)strfind(x,y), C, D,'UniformOutput',false)
    ou en compactant encore plus :
    Code :
    1
    2
    3
    A = {'un' 'deux' 'chateau' 'trois' 'quatre'} ;
    B = {'deux' 'quatre' 'six' 'huit' 'dix' 'douze' 'maison' 'bateau' 'chateau'} ;
    E = cellfun(@(x,y)strfind(x,y), repmat(A,size(B,2),1), repmat(B.',1,size(A,2)),'UniformOutput',false)
    Juste une remarque pour préciser qu'un code compact n'est pas toujours un code optimisé et cela peut le rendre parfois illisible.
  • ol9245
    Membre éprouvé
    Pour un début, la barre est assez haut : une seule instruction

    Par contre tu n'obtiens pas la solution (je vais ajouter une précision dans l'énoncé). Je veux les trois chaines communes. Et toi, il te faut encore quelques instructions de plus pour les sortir :
    Code :
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    E = cellfun(@(x,y)strfind(x,y), repmat(A,size(B,2),1), repmat(B.',1,size(A,2)),'UniformOutput',false)
    
    E = 
    
         []    [1]     []     []     []
         []     []     []     []    [1]
         []     []     []     []     []
         []     []     []     []     []
         []     []     []     []     []
         []     []     []     []     []
         []     []     []     []     []
         []     []     []     []     []
         []     []    [1]     []     []
  • duf42
    Expert confirmé
    Bonjour,

    Je pense que la fonction INTERSECT doit faire l'affaire ici:
    Code :
    1
    2
    intersect(A,B)
    Duf
  • ol9245
    Membre éprouvé
    Envoyé par duf42
    Bonjour,

    Je pense que la fonction INTERSECT doit faire l'affaire ici:
    Code :
    1
    2
    3
    4
    A = {'un' 'deux' 'chateau' 'trois' 'quatre'} ;
    B = {'deux' 'quatre' 'six' 'huit' 'dix' 'douze' 'maison' 'bateau' 'chateau'} ;
    intersect(A,B)
    Duf

    Bravo Duf !

    0 boucle
    0 variables intermédiaires
    1 ligne de code,
    1 fonction matlab appelée.

    Je propose de t'accorder la victoire à ce défi

    Mon idée de départ était celle-ci, que tu as largement battu :
    Code :
    1
    2
    3
    4
    A = {'un' 'deux' 'chateau' 'trois' 'quatre'} ;
    B = {'deux' 'quatre' 'six' 'huit' 'dix' 'douze' 'maison' 'bateau' 'chateau'} ;
    [a, b]=meshgrid(1:numel(A),1:numel(B)) ;
    A(any(strcmp(A(a),B(b))))
  • ol9245
    Membre éprouvé
    @Duf :

    J'ai essayé d'appliquer ta solution dans mon code, mais mon problème n'est pas exactement celui que j'ai formulé dans le défi. Le défi est un problème symétrique. Le mien ne l'est pas.
    J'ai une liste A de mots de référence (un dictionnaire) et une liste de mots B à chercher dans A. J'ai besoin des index des mots de B dans le dictionnaire A.
    Voici un bout de code qui résume les deux solutions, appliquées au problème non symétrique. Qu'en penses-tu ?

    Code :
    1
    2
    3
    4
    5
    6
    7
    8
    9
    10
    11
    12
    13
    14
    Dico = {'deux' 'quatre' 'six' 'huit' 'dix' 'douze' 'maison' 'bateau' 'chateau'} ;
    Chercher = {'deux' 'chateau'} ;
    
    % Duf
    M = intersect(Dico, Chercher) ;
    fprintf('\nLes mots communs sont -dans le désordre- (recette Duf) : ') ;
    fprintf('%s ', M{:}) ;
    
    % OL9245
    [a, b]=meshgrid(1:numel(Dico),1:numel(Chercher)) ;
    Ix = find(any(strcmp(Dico(a),Chercher(b)))) ;
    fprintf('\nLeurs index dans le dico sont -dans l''ordre- (recette OL9245) : ') ;
    fprintf('%d ', Ix) ;
    fprintf('\n') ;
    Résultat :
    Code :
    1
    2
    Les mots communs sont -dans le désordre- (recette Duf) : chateau deux 
    Leurs index dans le dico sont -dans l'ordre- (recette OL9245) : 1 9
  • Salut,

    Petit tour du côté de la doc :
    [c, ia, ib] = intersect(a, b) also returns column index vectors ia and ib such that c = a(ia) and c = b(ib) (or c = a(ia,:) and c = b(ib,:)).
    Donc à partir de là, ce n'est pas dur d'obtenir ces indices

    Sinon, deux autres solutions :
    Code :
    1
    2
    3
    4
    5
    6
    A = {'un' 'deux' 'chateau' 'trois' 'quatre'} ;
    B = {'deux' 'quatre' 'six' 'huit' 'dix' 'douze' 'maison' 'bateau' 'chateau'} ;
    
    A(ismember(A,B))
    
    A ( cellfun(@(a) any(strcmp(a,B)), A) )
    Concernant ta solution ol9245, je rajouterais A(any(strcmp(A(a),B(b)),1)) dans le cas d'un seul mot à chercher.
  • Jerome Briot
    Rédacteur/Modérateur
    Et pour une solution encore plus spécifique que la solution "générale" de duf42 :

    Code :
    edit intersect
  • tanguy4724
    Membre habitué
    sans aucun mérite car je ne fais que résumer les messages précédents :

    Code :
    1
    2
    3
    [C,IA,IB] = INTERSECT(Dico, Chercher) ;
    IA = sort(IA)
    on a ainsi le résultat suivant :


    Dico = {'deux' 'quatre' 'six' 'huit' 'dix' 'douze' 'maison' 'bateau' 'chateau'} ;
    Chercher = {'deux' 'chateau'} ;
    [C,IA,IB] = INTERSECT(Dico, Chercher) ;
    IA = sort(IA)

    IA =

    1 9
  • ol9245
    Membre éprouvé
    Ca nous fait donc deux lignes, donc autant que ma proposition, mais ++ joli et ++ compact.