Défi n°5 : RESHAPE plus rapide que son ombre ?
Venez relever les défis MATLAB.

Le , par Jerome Briot, Rédacteur/Modérateur


je vous propose une question qui devrait vous faire aimer la fonction RESHAPE de MATLAB

Pour permettre à tous le monde de participer, soumettez-moi vos réponses par MP, je donnerai dans cette discussion la liste des membres ayant la bonne réponse.

---------------------------------------------------

Soit le programme suivant :
Code : Sélectionner tout
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
clc
clear all

for n = 500:500:8000
    
    clear X
    
    X = rand(n);
    
    tic
    
    X = reshape(X,1,[]);
    
    t = toc;
    
    fprintf('Taille de X: %5d x%5d (%5.1f Mo) : %.7f s\n',n,n,n*n*8/1024/1024,t);  
    
end
Le code ne fait que générer des tableaux aléatoires de dimension nxn de plus en plus gros puis les redimensionne en tableau 1x(nxn) avec RESHAPE.

La ligne avec FPRINTF affiche à chaque itération les dimensions du tableau, sa taille approximative en Mo et le temps d'exécution du redimensionnement en secondes.

Voici ce que j'obtiens sur ma machine :
Taille de X:   500 x  500 (  1.9 Mo) : 0.0003590 s
Taille de X:  1000 x 1000 (  7.6 Mo) : 0.0000450 s
Taille de X:  1500 x 1500 ( 17.2 Mo) : 0.0000450 s
Taille de X:  2000 x 2000 ( 30.5 Mo) : 0.0000410 s
Taille de X:  2500 x 2500 ( 47.7 Mo) : 0.0000440 s
Taille de X:  3000 x 3000 ( 68.7 Mo) : 0.0000420 s
Taille de X:  3500 x 3500 ( 93.5 Mo) : 0.0000440 s
Taille de X:  4000 x 4000 (122.1 Mo) : 0.0000450 s
Taille de X:  4500 x 4500 (154.5 Mo) : 0.0000430 s
Taille de X:  5000 x 5000 (190.7 Mo) : 0.0000440 s
Taille de X:  5500 x 5500 (230.8 Mo) : 0.0000710 s
Taille de X:  6000 x 6000 (274.7 Mo) : 0.0000430 s
Taille de X:  6500 x 6500 (322.3 Mo) : 0.0000440 s
Taille de X:  7000 x 7000 (373.8 Mo) : 0.0000430 s
Taille de X:  7500 x 7500 (429.2 Mo) : 0.0000430 s
Taille de X:  8000 x 8000 (488.3 Mo) : 0.0000430 s
Si on exclu la première itération, on remarque que la durée du redimensionnement est constante (les valeurs sont très faibles, moins d'1 milliseconde) quelque soit la taille du tableau.

Il faut aussi peu de temps pour redimensionner le tableau de 8Mo que celui de 500Mo
Cela peut sembler surprenant sachant qu'il y a 1 000 000 éléments dans le premier et qu'il y en a 64 fois plus dans le second (64 000 000 éléments)

Comment cela est-il possible ?

A vos neurones et à vos claviers !


Vous avez aimé cette actualité ? Alors partagez-la avec vos amis en cliquant sur les boutons ci-dessous :


 Poster une réponse

Avatar de Jerome Briot Jerome Briot - Rédacteur/Modérateur https://www.developpez.com
le 26/09/2012 à 11:49
Liste des membres ayant trouvé la bonne réponse



Avatar de Jerome Briot Jerome Briot - Rédacteur/Modérateur https://www.developpez.com
le 28/09/2012 à 21:26
Bon... peu de personne se sont manifestées

Allez, un petit indice : Stockage des matrices en mémoire

Il vous reste 2 jours pour m'envoyer vos réponses par MP

Fin du suspens, dimanche soir
Avatar de Jerome Briot Jerome Briot - Rédacteur/Modérateur https://www.developpez.com
le 30/09/2012 à 22:12
La solution

---------------------------------------


Il faut savoir que quelque soient les dimensions d'un tableau, MATLAB le stocke toujours sous la forme d'un vecteur en mémoire (voir ici)

Par conséquent, pour s'y retrouver, MATLAB doit bien stocker les dimensions du tableau quelque part ailleurs.

La clé du problème se trouve dans la définition "profonde" du tableau.

Pour simplifier, MATLAB stocke en fait le tableau dans une structure (1)
Cette structure possède un champ "data" qui contient le vecteur des éléments du tableau.
Elle possède également deux champs correspondant au nombre de lignes (nrows) et au nombre de colonnes (ncols) du tableau.

On peut donc l'assimiler à la structure MATLAB suivante :
Code : Sélectionner tout
1
2
3
4
S.data = [];
S.nrows = [];
S.ncols = [];
Comme la fonction RESHAPE ne modifie ni l'ordre ni le nombre des éléments du tableau, elle a juste à modifier les valeurs des champs nrows et ncols.

Ce qui revient, quelque soient les dimensions du tableau, à ne modifier que 2 valeurs.

D'où le temps d'exécution constant de la fonction RESHAPE.



---------------------------------------


Voila, j'espère avoir été clair tout en restant bref.

N'hésitez pas à laisser vos commentaires ou questions ici si nécessaire, nous y répondrons avec plaisirs.

---------------------------------------


(1) Pour être plus précis, pour MATLAB, tout tableau est un mxArray (terme courant dans les fichiers MEX) qui n'est autre qu'une structure en langage C.
Qui plus est, cette structure C est (semi) opaque, on ne sait donc pas exactement ce qu'elle contient.

La définition de cette structure se trouve dans le fichier matrix.h dans le sous-dossier /extern/include/ du dossier d'installation de MATLAB.

Plus d'informations en anglais : Undocumented MATLAB - Matlab’s internal memory representation
Avatar de tanguy4724 tanguy4724 - Membre habitué https://www.developpez.com
le 01/10/2012 à 11:51
peu de réponses à ce défi...
Avatar de Cheetor Cheetor - Membre averti https://www.developpez.com
le 01/10/2012 à 12:39
Autant le coup de la sauvegarde des matrices, j'avais vu le lien, autant pour la sauvegarde des données, j'étais très loin du compte.

Me coucherais moins bête

Merci pour ce petit défi DUT et au prochain défi.
Contacter le responsable de la rubrique MATLAB