Dans le dĂ©veloppement web, nous rencontrons des donnĂ©es binaires principalement lorsque lâon travaille avec des fichiers (crĂ©ation, envoi, tĂ©lĂ©chargement). Un autre cas dâutilisation est le traitement dâimage.
Tout ceci est possible en JavaScript, et les opérations binaires sont trÚs performantes.
Cependant, il y a de la confusion, car il y a beaucoup de classes disponibles. Pour en nommer quelques unes:
ArrayBuffer,Uint8Array,DataView,Blob,File, etc.
En javascript, les donnĂ©es binaires sont implĂ©mentĂ©es de façon non standard, comparĂ© Ă dâautres langages. Mais quand nous mettons de lâordre dans tout ça, tout devient beaucoup plus simple.
Lâobjet binaire de base est un ArrayBuffer â une rĂ©fĂ©rence Ă une zone contigĂŒe de taille fixe de la mĂ©moire.
Nous le créons comme ceci:
let buffer = new ArrayBuffer(16); // crée un Buffer de taille 16
alert(buffer.byteLength); // 16
Cela alloue une zone contigue de 16 octets dans la mémoire et la pré-remplie avec des zéros.
ArrayBuffer nâest pas un tableau de âquelque choseâ.Commençons par Ă©liminer une possible source de confusion. ArrayBuffer nâa rien en commun avec Array:
- Il possĂšde une taille fixe, nous ne pouvons ni lâaggrandir, ni le rĂ©duire.
- Il prend une taille spécifique en mémoire.
- Pour accĂ©der Ă des octets individuels, un autre objet de âvueâ est nĂ©cessaire, on nâutilise pas
buffer[index].
ArrayBuffer est une zone de la mĂ©moire. Qui yâa tâil Ă lâintĂ©rieur ? Juste une sĂ©quence dâoctets.
Pour manipuler un ArrayBuffer, nous avons besoin dâutiliser un objet de âvueâ.
Un objet de âvueâ ne stocke rien tout seul. Ce sont les lunettes qui donnent une interprĂ©tation des octets stockĂ©s dans lâArrayBuffer.
Par exemple:
Uint8Arrayâ Traite chaque octet dans lâArrayBuffercomme un nombre unique, avec des valeurs possibles entre 0 jusquâĂ 255 (Un octet est sur 8 bits, donc ça ne peut contenir que ça). On appelle ces valeurs des âentiers non signĂ©s sur 8 bitsâ.Uint16Arrayâ Traite par paquet de 2 octets en tant quâentier, avec des valeurs possibles entre 0 jusquâĂ 65535. On appelle ces valeurs des âentiers non signĂ©s sur 16 bitsâ.Uint32Arrayâ Traite par paquet de 4 octets en tant quâentier, avec des valeurs possibles entre 0 jusquâĂ 4294967295. On appelle ces valeurs des âentiers non signĂ©s sur 32bitsâ.Float64Arrayâ Traite par paquet de 8 octets en tant que nombre flottant avec des valeurs possibles entre5.0x10-324et1.8x10308.
Donc, les donnĂ©es binaires dans un ArrayBuffer de 16 octets peuvent ĂȘtre interprĂ©tĂ©es comme 16 âpetits nombresâ , ou 8 grands nombres (2 octets chacun), ou 4 encore plus grands (4 octets chacun), ou 2 valeurs flottantes avec une haute prĂ©cision (8 octets chacun).
ArrayBuffer est lâobjet central, le centre de tout, les donnĂ©es binaires brutes.
Mais si nous voulons Ă©crire Ă lâintĂ©rieur, ou itĂ©rer dessus, pour nâimporte quelle opĂ©ration â nous devons utiliser une âvueâ, e.g:
let buffer = new ArrayBuffer(16); // crée un buffer de taille 16
let view = new Uint32Array(buffer); // Traite le buffer en une séquence d'entiers de 32 bits.
alert(Uint32Array.BYTES_PER_ELEMENT); // 4 octets par entier.
alert(view.length); // 4, il stocke cette quantité d'entiers.
alert(view.byteLength); // 16, la taille en octets.
// Ecrivons une valeur
view[0] = 123456;
// Itérons sur les valeurs
for(let num of view) {
alert(num); // 123456, puis 0, 0, 0 (4 valeurs au total)
}
TypedArray â tableau typĂ©
Le terme commun pour toutes ces vues (Uint8Array, Uint32Array, etc) est TypedArray. Elles partagent le mĂȘme ensemble de mĂ©thodes et de propriĂ©tĂ©s.
Il faut noter quâil nây a pas de construteur appelĂ© TypedArray, Il sâagit dâun terme pour reprĂ©senter une des vues par dessus un ArrayBuffer: Int8Array, Uint8Array etc. La liste entiĂšre va bientĂŽt suivre.
Lorsque vous voyez quelque chose comme new TypedArray, Il sâagit de nâimporte quoi parmi new Int8Array, new Uint8Array, etc.
Les tableaux typés ressemblent à des tableaux classiques : ils ont des indexs et sont itérables.
Un constructeur TypedArray (soit Int8Array ou Float64Array, peut importe) se comporte différement en fonction du type des arguments.
Il y a 5 variantes dâarguments:
new TypedArray(buffer, [byteOffset], [length]);
new TypedArray(object);
new TypedArray(typedArray);
new TypedArray(length);
new TypedArray();
-
Si un
ArrayBufferest fourni, la vue est créée dessus. Nous avons déjà utilisé cette syntaxe.Nous pouvons éventuellement fournir un décalage (
byteOffset) pour commencer Ă partir de lĂ (0 par dĂ©faut) et la longueur (length) (jusquâĂ la fin du buffer par dĂ©faut), alors la vue ne va couvrir quâune partie dubuffer. -
Si câest un
Array, ou quelque chose ressemblant Ă un tableau qui est fourni, il crĂ©e un tableau typĂ© de la mĂȘme longueur et copie le contenu.Nous pouvons lâutiliser pour prĂ©-remplir le tableau avec les donnĂ©es:
let arr = new Uint8Array([0, 1, 2, 3]); alert( arr.length ); // 4, a créé une liste binaire de la mĂȘme taille alert( arr[1] ); // 1, remplit avec 4 octets (entiers non signĂ©s sur 8 bits) avec des valeurs donnĂ©es -
Si un autre tableau typĂ© est fourni, il fait la mĂȘme chose: il crĂ©e un tableau typĂ© de la mĂȘme taille et copie le contenu. Les valeurs sont converties vers le nouveau type dans le processus si besoin.
let arr16 = new Uint16Array([1, 1000]); let arr8 = new Uint8Array(arr16); alert( arr8[0] ); // 1 alert( arr8[1] ); // 232, 1000 ne rentre pas dans 8 bits (explications plus loin) -
Si un argument
lengthest fourni â Il crĂ©e un tableau typĂ© qui contient autant dâĂ©lĂ©ments. Sa taille en octets va ĂȘtrelengthmultipliĂ© par la taille en octets dâun seul Ă©lĂ©mentTypedArray.BYTES_PER_ELEMENT:let arr = new Uint16Array(4); // CrĂ©ation d'un tableau typĂ© de 4 entiers alert( Uint16Array.BYTES_PER_ELEMENT ); // 2 octets par entier alert( arr.byteLength ); // 8 (taille en octets) -
Sans arguments, il crée un tableau typé de taille nulle.
Nous pouvons créer un tableau typé directement sans fournir un ArrayBuffer. Mais une vue ne peut pas exister sans, donc il sera créé automatiquement dans tous les cas, sauf le premier (quand il est passé en argument).
Pour accéder au ArrayBuffer sous-jacent, il existe les propriétés suivantes dans TypedArray :
bufferâ qui fait rĂ©fĂ©rence Ă lâArrayBuffer.byteLengthâ qui correspond Ă la taille de lâArrayBuffer.
Donc nous pouvons toujours passer dâune vue Ă lâautre:
let arr8 = new Uint8Array([0, 1, 2, 3]);
// Une autre vue avec les mĂȘmes donnĂ©es
let arr16 = new Uint16Array(arr8.buffer);
Voici une liste de tableaux typés:
Uint8Array,Uint16Array,Uint32Arrayâ Pour les entiers de 8, 16 et 32 bits.Uint8ClampedArrayâ Pour les entiers de 8 bits, avec une ârestrictionâ Ă lâaffectation (voir plus loin).
Int8Array,Int16Array,Int32Arrayâ Pour les nombres entiers signĂ©s (peuvent ĂȘtre nĂ©gatifs).Float32Array,Float64Arrayâ Pour les nombres flottants signĂ©s de 32 et 64 bits.
int8 ou de types similairesMalgrĂ© la prĂ©sence de noms tels que Int8Array, il nây a pas de type comme int ou int8 dans JavaScript.
Car en effet Int8Array nâest pas un tableau de ces valeurs individuelles, mais plutĂŽt une vue sur ArrayBuffer.
Comportement hors limite
Que se passe tâil lorsque nous essayons dâĂ©crire des valeurs en dehors des limites dans un tableau typĂ© ? Il nây aura pas dâerreurs, mais les bits en trop seront supprimĂ©s.
Par exemple, essayons dâajouter 256 dans un Uint8Array. En binaire, 256 sâĂ©crit 100000000 (9 bits), mais un Uint8Array ne permet que 8 bits par valeur, ce qui donne des valeurs possibles entre 0 et 255.
Pour les grands nombres, seuls les 8 bits les plus à droite (moins significatif) sont sauvegardés, et le reste est supprimé:
Donc nous allons obtenir 0.
Pour 257, lâĂ©criture binaire est 100000001 (9 bits), les 8 bits les plus Ă droite sont gardĂ©s, donc on aura un 1 dans notre tableau:
En dâautres termes, Le nombre modulo 28 est sauvegardĂ©.
Démonstration:
let uint8array = new Uint8Array(16);
let num = 256;
alert(num.toString(2)); // 100000000 (représentation binaire)
uint8array[0] = 256;
uint8array[1] = 257;
alert(uint8array[0]); // 0
alert(uint8array[1]); // 1
Uint8ClampedArray possĂšde un comportement diffĂ©rent. Il garde 255 pour nâimporte quel nombre qui est plus grand que 255, et 0 pour nâimporte quel nombre nĂ©gatif. Ce comportement est utile dans le traitement dâimages.
Méthodes des tableaux typés
TypedArray possÚde les méthodes de Array, avec quelques exceptions notables.
Nous pouvons itérer, map, slice, find, reduce etc.
Mais certaines choses ne sont pas possibles:
- Pas de
spliceâ On ne peut pas supprimer une valeur, car les tableaux typĂ©s sont des vues sur unbuffer, qui sont des zones fixes dans la mĂ©moire. Tout ce que nous pouvons faire est de mettre un 0. - Pas de mĂ©thode
concat.
Il y a deux méthodes supplémentaires:
arr.set(fromArr, [offset])copie tous les Ă©lĂ©ments defromArrversarr, en commençant Ă partir de la positionoffset(0 par dĂ©faut).arr.subarray([begin, end])crĂ©e une nouvelle vue du mĂȘme type debeginjusquâĂend(non-inclus). Câest similaire Ă la mĂ©thodeslice(qui est Ă©galement disponible), mais elle ne copie rien â il sâagit juste dâune crĂ©ation dâune nouvelle vue, pour travailler sur un certain morceau de donnĂ©es.
Les mĂ©thodes nous permettent de copier des tableaux typĂ©s, de les mĂ©langer, de crĂ©er des nouveaux tableaux depuis ceux existants, et bien dâautres choses.
DataView
DataView est une vue spĂ©ciale ânon typĂ©eâ super flexible sur Ê»ArrayBuffer`. Il permet dâaccĂ©der aux donnĂ©es sur nâimporte quel offset dans tous les formats.
- Pour les tableaux typĂ©s, le constructeur dĂ©termine le format. Le tableau entier est supposĂ© ĂȘtre uniforme. Le i-Ăšme nombre est notĂ©
arr[i]. - Avec
DataViewnous accĂ©dons aux donnĂ©es avec des mĂ©thodes comme.getUint8(i)ou.getUint16(i). Nous choisissons le format au moment de lâutilisation de la mĂ©thode au lieu du moment de la crĂ©ation.
Voici la syntaxe:
new DataView(buffer, [byteOffset], [byteLength])
bufferâArrayBuffer. Contrairement aux tableaux typĂ©s,DataViewne crĂ©e pas soit mĂȘme un buffer. Nous avons besoin de le lui fournir directement.byteOffsetâ Lâoctet de dĂ©part de la vue (par dĂ©faut Ă 0).byteLengthâ La taille totale de la vue en octets (par dĂ©faut jusquâĂ la fin debuffer).
Pour lâexemple, nous allons rĂ©cupĂ©rer des nombres dans plusieurs formats avec le mĂȘme buffer:
// Tableau binaire de 4 octets, tous ayant la valeur maximale - 255
let buffer = new Uint8Array([255, 255, 255, 255]).buffer;
let dataView = new DataView(buffer);
// récupération d'un nombre en 8 bits avec un décalage de 0
alert( dataView.getUint8(0) ); // 255
// récupération d'un nombre en 16 bits avec un décalage de 0, soit 2 octets, qui sont interprétés ensemble en 65535
alert( dataView.getUint16(0) ); // 65535 (Plus grand entier non signé en 16 bits)
// récupération d'un nombre en 32 bits avec un décalage de 0
alert( dataView.getUint32(0) ); // 4294967295 (Plus grand entier non signé en 32 bits)
dataView.setUint32(0, 0); // Fixe le nombre sous 4 octets Ă 0, fixant ainsi tous les octets Ă 0
DataView est utile lorsque lâon met des donnĂ©es sous plusieurs formats dans le mĂȘme buffer. Par exemple, on stocke une sĂ©quence de paires (16-bit integer, 32-bit float). DataView nous permettra dây accĂ©der facilement.
Résumé
ArrayBuffer est lâobjet au coeur de tout, câest une rĂ©fĂ©rence Ă une zone de taille fixe dans la mĂ©moire.
Pour faire presque nâimporte quelle opĂ©ration sur un ArrayBuffer, nous avons besoin dâune vue.
- Il peut sâagir dâun tableau typĂ©:
Uint8Array,Uint16Array,Uint32Arrayâ pour les entiers non-signĂ©s de 8, 16, et 32 bits.Uint8ClampedArrayâ pour les entiers de 8 bits, âclampsâ them on assignment.Int8Array,Int16Array,Int32Arrayâ pour les entiers signĂ©s (peuvent ĂȘtre nĂ©gatifs).Float32Array,Float64Arrayâ pour les nombres flottants signĂ©s de 32 et 64 bits.
- Ou dâun
DataViewâ la vue qui utilise des mĂ©thodes pour spĂ©cifier un format, e.g.getUint8(offset).
Dans la majorité des cas, on crée et on opÚre directement sur les tableaux typés, laissant ArrayBuffer en arriÚre. On peut toujours y accéder avec .buffer et faire une nouvelle vue si besoin.
Il y a également 2 termes supplémentaires, qui sont utilisés dans les descriptions des méthodes pour travailler sur les données binaires:
ArrayBufferViewqui est le terme pour tous les types de vues.BufferSourcequi est un terme désignant soit unArrayBufferou unArrayBufferView.
Nous verrons ces termes dans les prochains chapitres. BufferSource est lâun des termes les plus communs, qui veut dire âtoutes sortes de donnĂ©es binairesâ â un ArrayBuffer ou une vue par dessus.
Voici un cheatsheet :
Commentaires
<code>, pour plusieurs lignes â enveloppez-les avec la balise<pre>, pour plus de 10 lignes - utilisez une sandbox (plnkr, jsbin, codepenâŠ)