ArrayBuffer

ArrayBuffer 对象、TypedArray 视图和 DataView 视图是 JavaScript 操作二进制数据的一个接口。以数组的语法处理二进制数据，所以统称为二进制数组。

背景：原始设计目的，与 WebGL 项目有关。WebGL，指浏览器与显卡之间的通信接口，为了满足 JavaScript 与显卡之间大量的、实时的数据交换，它们之间的数据通信必须是二进制的，而不能是传统的文本格式。

原因：文本格式传递一个 32 位整数，两端的 JavaScript 脚本与显卡都要进行格式转化，将非常耗时。直接操作字节，将 4 个字节的 32 位整数，以二进制形式直接传入显卡，能大幅提高性能。

二进制数组由三类对象组成

（1）ArrayBuffer 对象：代表内存之中的一段二进制数据，可以通过“视图”进行操作。“视图”部署了数组接口，这意味着，可以用数组的方法操作内存。

（2）TypedArray 视图：共包括 9 种类型的视图，比如 Uint8Array（无符号 8 位整数）数组视图, Int16Array（16 位整数）数组视图, Float32Array（32 位浮点数）数组视图等等。

（3）DataView 视图：自定义复合格式的视图，比如第一个字节是 Uint8（无符号 8 位整数）、第二、三个字节是 Int16（16 位整数）、第四个字节开始是 Float32（32 位浮点数）等等，此外还可以自定义字节序。

总结：

ArrayBuffer 对象：代表原始的二进制数据

TypedArray 视图：读写简单类型的二进制数据

DataView 视图：读写复杂类型的二进制数据

注意，二进制数组并不是真正的数组，而是类似数组的对象

浏览器操作的 API，用到了二进制数组操作二进制数据

Canvas
Fetch API
File API
WebSockets
XMLHttpRequest

ArrayBuffer 对象

概述

ArrayBuffer 对象：代表储存二进制数据的一段内存，它不能直接读写，只能通过视图（TypedArray 视图和 DataView 视图)来读写

视图作用：以指定格式解读二进制数据

ArrayBuffer 是一个构造函数，可以分配一段存放数据的连续内存区域。参数是所需内存大小（单位字节）

const buf = new ArrayBuffer(32)

生产 32 字节内存区域，每个字节默认值为 0

通过 DateView 读取这段内容，DateView 需要提供 ArrayBuffer 对象实例作为参数

const buf = new ArrayBuffer(32)
const dataView = new DataView(buf)
dataView.getUint8(0) // 0

另一种 TypedArray 视图，与 DataView 视图的一个区别是，它不是一个构造函数，而是一组构造函数，代表不同的数据格式

const buffer = new ArrayBuffer(4)
// 00 00 00 00

const x1 = new Int32Array(buffer)
x1[0] = 1024
// 00 04 00 00
// 0x0400 => 1024

const x2 = new Int8Array(buffer)
x2[0] = 1
x2[1] = 2
x2[2] = 3
// 01 02 03 00
// 0x030201 => 197121

基于同一段内存，建立两种视图：32 位带符号整数，8 位无符号整数。两个视图对应同一段内存，一个视图修改底层内存会影响到另一个视图。

TypedArray 视图的构造函数，除了接受 ArrayBuffer 实例作为参数，还可以接受普通数组作为参数，直接分配内存生成底层的 ArrayBuffer 实例，并同时完成对这段内存的赋值

const typedArray = new Uint8Array([0, 1, 2])
typedArray.length // 3

typedArray[0] = 5
typedArray // [5, 1, 2]

ArrayBuffer.prototype.byteLength

ArrayBuffer 实例 byteLength 属性：返回所分配的内存区域的字节长度

const buffer = new ArrayBuffer(32)
buffer.byteLength
// 32

分配的内存区域很大，有可能分配失败（因为没有那么多的连续空余内存），所以有必要检查是否分配成功

if (buffer.byteLength === n) {
  // 成功
} else {
  // 失败
}

ArrayBuffer.prototype.slice

slice 方法：允许将内存区域的一部分，拷贝生成一个新的 ArrayBuffer 对象

const buffer = new ArrayBuffer(8)
const newBuffer = buffer.slice(0, 3)

从 0 开始，到第 3 个字节（不包括），生成一个新 ArrayBuffer。两个步骤，分配新内存，拷贝值。

注意：除了 slice 方法，ArrayBuffer 对象不提供任何直接读写内存方法，只允许建立视图，然后通过视图读写

ArrayBuffer.isView

静态方法 isView：参数是否为 ArrayBuffer 的视图实例，返回一个布尔值

const buffer = new ArrayBuffer(8)
ArrayBuffer.isView(buffer) // false

const v = new Int32Array(buffer)
ArrayBuffer.isView(v) // true

相当于判断参数，是否为 TypedArray 实例或 DataView 实例

TypedArray 视图

概述

ArrayBuffer 对象作为内存区域，可以存放多种类型的数据。同一段内存，不同数据有不同的解读方式，这就叫做“视图”（view）。

TypedArray 视图一共包括 9 种类型，每一种视图都是一种构造函数。

	说明	长度
Int8Array	8 位有符号整数	1 字节
Uint8Array	8 位无符号整数	1 字节
Uint8ClampedArray	8 位无符号整数	1 字节（溢出处理不同）
Int16Array	6 位有符号整数	2 字节
Uint16Array	16 位无符号整数	2 字节
Int32Array	32 位有符号整数	4 字节
Uint32Array	32 位无符号整数	4 字节
Float32Array	32 位浮点数	4 字节
Float64Array	64 位浮点数	8 字节

9 个构造函数生成的数组，统称为 TypedArray 视图，与普通数组类似，主要差距如下

TypedArray 数组的所有成员，都是同一种类型
TypedArray 数组的成员是连续，没有空位
TypedArray 数组成员的默认值为 0

new Array(10) // 10个空位
new Uint8Array(10) // 10个0

TypedArray 数组本身不储存数据，它只是一层视图，操作存储在 ArrayBuffer 的数据。获取底层对象必须使用 buffer 属性

构造函数

构造函数有多种用法

（1）TypedArray(buffer, byteOffset=0, length?)

buffer（必填）：视图对应底层 ArrayBuffer 对象

byteOffset：视图开始的字节序号，默认从 0 开始

length：视图包含的数据个数，默认直到本段内存区域结束

同一个 ArrayBuffer 对象之上，可以根据不同的数据类型，建立多个视图

// 创建一个8字节的ArrayBuffer
const b = new ArrayBuffer(8)

// 创建一个指向b的Int32视图，开始于字节0，直到缓冲区的末尾
const v1 = new Int32Array(b)

// 创建一个指向b的Uint8视图，开始于字节2，直到缓冲区的末尾
const v2 = new Uint8Array(b, 2)

// 创建一个指向b的Int16视图，开始于字节2，长度为2
const v3 = new Int16Array(b, 2, 2)

// v1[0] 00 00 00 00
// v2[0] __ __ 00 __
// v3[0] __ __ 00 00

byteOffset 必须与所要建立的数据类型一致，否则会报错

const buffer = new ArrayBuffer(8)
const i16 = new Int16Array(buffer, 1)
// Uncaught RangeError: start offset of Int16Array should be a multiple of 2

带符号的 16 位整数需要两个字节，所以 byteOffset 参数必须能够被 2 整除。

（2）TypedArray(length)

视图还可以不通过ArrayBuffer对象，直接分配内存而生成

const f64a = new Float64Array(8)
f64a[0] = 10
f64a[1] = 20
f64a[2] = f64a[0] + f64a[1]

（3）TypedArray(typedArray)

TypedArray 数组的构造函数，可以接受另一个 TypedArray 实例作为参数

const typedArray = new Int8Array(new Uint8Array(4))

注意：生成的新数组，只是复制了参数数组的值，底层内存不一样。新数组会开辟新的内存存储数据，不会再原数组的内存之上建立视图。

const x = new Int8Array([1, 1])
const y = new Int8Array(x)
x[0] // 1
y[0] // 1

x[0] = 2
y[0] // 1

数组y是以数组x为模板而生成的，当x变动的时候，y并没有变动。

基于一段内存，采用下面写法

const x = new Int8Array([1, 1])
const y = new Int8Array(x.buffer)
x[0] // 1
y[0] // 1

x[0] = 2
y[0] // 2

（4）TypedArray(arrayLikeObject)

构造函数参数是一个普通数组，然后直接生成 TypedArray 实例

const typedArray = new Uint8Array([1, 2, 3, 4])

注意，这时TypedArray视图会重新开辟内存，不会在原数组的内存上建立视图。

TypedArray 数组转换回普通数组

const normalArray = [...typedArray]
// or
const normalArray = Array.from(typedArray)
// or
const normalArray = Array.prototype.slice.call(typedArray)

数组方法

普通数组的操作方法和属性，对 TypedArray 数组完全适用

但是 TypedArray 数组没有 concat 方法。合并多个 TypedArray 数组，写法如下

function concatenate(resultConstructor, ...arrays) {
  let totalLength = 0
  for (let arr of arrays) {
    totalLength += arr.length
  }
  let result = new resultConstructor(totalLength)
  let offset = 0
  for (let arr of arrays) {
    result.set(arr, offset)
    offset += arr.length
  }
  return result
}

concatenate(Uint8Array, Uint8Array.of(1, 2), Uint8Array.of(3, 4))
// Uint8Array [1, 2, 3, 4]

TypedArray 数组与普通数组一样，部署了 Iterator 接口

let ui8 = Uint8Array.of(0, 1, 2)
for (let byte of ui8) {
  console.log(byte)
}
// 0
// 1
// 2

字节序

字节序指的是数值在内存中的表示方式

const buffer = new ArrayBuffer(16)
const int32View = new Int32Array(buffer)

for (let i = 0; i < int32View.length; i++) {
  int32View[i] = i * 2
}

x86 体系计算机都采用小端字节序（little endian），相对重要的字节排在后面的内存地址，相对不重要字节排在前面的内存地址

比如，一个占据四个字节的 16 进制数 0x12345678，决定其大小的最重要的字节是“12”，最不重要的是“78”。

小端字节序存储：78563412

大端字节序存储：12345678

网络设备和特定的操作系统采用的是大端字节序。

问题：如果一段数据是大端字节序，TypedArray 数组将无法正确解析，因为它只能处理小端字节序

解决：JavaScript 引入 DataView 对象，可以设定字节序

// 假定某段buffer包含如下字节 [0x02, 0x01, 0x03, 0x07]
const buffer = new ArrayBuffer(4)
const v1 = new Uint8Array(buffer)
v1[0] = 2
v1[1] = 1
v1[2] = 3
v1[3] = 7

const uInt16View = new Uint16Array(buffer)

// 计算机采用小端字节序
// 所以头两个字节等于258
// 0x02 0x01 小端 0x0102 = 256+2 = 258
if (uInt16View[0] === 258) {
  console.log('OK') // "OK"
}

// 赋值运算
uInt16View[0] = 255 // 字节变为[0xFF, 0x00, 0x03, 0x07]
uInt16View[0] = 0xff05 // 字节变为[0x05, 0xFF, 0x03, 0x07]
uInt16View[1] = 0x0210 // 字节变为[0x05, 0xFF, 0x10, 0x02]

判断，当前视图是小端字节序，还是大端字节序

const BIG_ENDIAN = Symbol('BIG_ENDIAN')
const LITTLE_ENDIAN = Symbol('LITTLE_ENDIAN')

function getPlatformEndianness() {
  let arr32 = Uint32Array.of(0x12345678)
  let arr8 = new Uint8Array(arr32.buffer)
  switch (arr8[0] * 0x1000000 + arr8[1] * 0x10000 + arr8[2] * 0x100 + arr8[3]) {
    case 0x12345678:
      return BIG_ENDIAN
    case 0x78563412:
      return LITTLE_ENDIAN
    default:
      throw new Error('Unknown endianness')
  }
}

BYTES_PER_ELEMENT 属性

BYTES_PER_ELEMENT 属性：表示这种数据类型占据的字节数。

Int8Array.BYTES_PER_ELEMENT // 1
Uint8Array.BYTES_PER_ELEMENT // 1
Uint8ClampedArray.BYTES_PER_ELEMENT // 1
Int16Array.BYTES_PER_ELEMENT // 2
Uint16Array.BYTES_PER_ELEMENT // 2
Int32Array.BYTES_PER_ELEMENT // 4
Uint32Array.BYTES_PER_ELEMENT // 4
Float32Array.BYTES_PER_ELEMENT // 4
Float64Array.BYTES_PER_ELEMENT // 8

TypedArray 实例上也能获取，即有 TypedArray.prototype.BYTES_PER_ELEMENT

ArrayBuffer 与字符串的互相转换

ArrayBuffer 和字符串的相互转换，使用原生 TextEncoder 和 TextDecoder 方法

/**
 * Convert ArrayBuffer/TypedArray to String via TextDecoder
 *
 * @see https://developer.mozilla.org/en-US/docs/Web/API/TextDecoder
 */
function ab2str(
  input: ArrayBuffer | Uint8Array | Int8Array | Uint16Array | Int16Array | Uint32Array | Int32Array,
  outputEncoding: string = 'utf8'
): string {
  const decoder = new TextDecoder(outputEncoding)
  return decoder.decode(input)
}

/**
 * Convert String to ArrayBuffer via TextEncoder
 *
 * @see https://developer.mozilla.org/zh-CN/docs/Web/API/TextEncoder
 */
function str2ab(input: string): ArrayBuffer {
  const view = str2Uint8Array(input)
  return view.buffer
}

/** Convert String to Uint8Array */
function str2Uint8Array(input: string): Uint8Array {
  const encoder = new TextEncoder()
  const view = encoder.encode(input)
  return view
}

encode 参考 [2]

溢出

不同的视图类型，所能容纳的数值范围是确定的。超出这个范围，就会出现溢出。

TypedArray 溢出处理规则：抛弃溢出的位，然后按照视图类型进行解释

const uint8 = new Uint8Array(1)

uint8[0] = 256
// 1 0000 0000
uint8[0] // 0

// 0000 0001
// 1111 1110
// 1111 1111
uint8[0] = -1
uint8[0] // 255

补充：原码、反码、补码 [3]

原码：符号位加上真值的绝对值

[+1]原 = 0000 0001

[-1]原 = 1000 0001

反码：正数反码是其本身。负数反码，在原码基础上，符号位不变，其余位按位取反。

[+1] = [00000001]原 = [00000001]反

[-1] = [10000001]原 = [11111110]反

补码：正数补码就是其本身。负数补码，在原码基础上，符号位不变，其余位按位取反，再+1 ( 即反码 + 1)

[+1] = [00000001]原 = [00000001]反 = [00000001]补

[-1] = [10000001]原 = [11111110]反 = [11111111]补

正向溢出（overflow）：当输入值大于当前数据类型的最大值，结果等于当前数据类型的最小值加上余值，再减去 1

负向溢出（underflow）：当输入值小于当前数据类型的最小值，结果等于当前数据类型的最大值减去余值的绝对值，再加上 1

余值：模运算（%）的结果，如下。

12 % 4 // 0
12 % 5 // 2

下面的例子

const int8 = new Int8Array(1)
// [-128, 127]
// [11111111, 01111111]

int8[0] = 128
// 余值: 128 % 127 = 1
// -128 + 1 - 1
int8[0] // -128

int8[0] = -129
// 余值：128 % -129 = | -1 | = 1
// 127 - 1 + 1 = 127
int8[0] // 127

Uint8ClampedArray 视图溢出规则，与上面的规则不同。

正向溢出：一律为该类型最大值，255

负向溢出：一律为该类型最小值，0

TypedArray.prototype.buffer

实例 buffer 属性：返回整段内存区域对应的 ArrayBuffer 对象

const a = new Float32Array(64)
const b = new Uint8Array(a.buffer)

a 和 b 对应同一段内存

TypedArray.prototype.byteLength，TypedArray.prototype.byteOffset

byteLength 属性：返回 TypedArray 占据的内存长度，单位为字节

byteOffset 属性：返回 TypedArray 从底层 ArrayBuffer 哪个字节开始

byteLength 和 byteOffset 均为只读属性

const b = new ArrayBuffer(8)

const v1 = new Int32Array(b)
const v2 = new Uint8Array(b, 2)
const v3 = new Int16Array(b, 2, 2)

v1.byteLength // 8
v2.byteLength // 6
v3.byteLength // 4

v1.byteOffset // 0
v2.byteOffset // 2
v3.byteOffset // 2

TypedArray.prototype.length

length 属性： TypedArray 数组含有多少个成员

const a = new Int16Array(8)

a.length // 8
a.byteLength // 16

length 属性和 byteLength 属性区分，前者是成员长度，后者是字节长度

TypedArray.prototype.set()

set 方法：复制数组（普通数组或 TypedArray）

优势：整段内存复制，比拷贝成员的方式快

const a = new Uint8Array(8)
const b = new Uint8Array(8)

b.set(a)

第二参数：从哪个位置开始复制

const a = new Uint16Array(8)
const b = new Uint16Array(10)

b.set(a, 2)

上述代码：表示从 b2 开始复制

TypedArray.prototype.subarray()

subarray 方法：以 TypedArray 的一部分，再建立一个新的视图。

参数 1：起始的成员序号

参数 2：结束的成员序号（不含该成员）

const a = new Uint16Array(8)
const b = a.subarray(2, 3)

a.byteLength // 16
b.byteLength // 2

TypedArray.prototype.slice()

slice 方法：返回一个指定位置的新的 TypedArray 实例

参数：从哪个位置开始生成新数组，负值表示逆向的位置

let ui8 = Uint8Array.of(0, 1, 2)
ui8.slice(-1)
// Uint8Array [ 2 ]

TypedArray.of()

静态方法 of：将参数转为一个 TypedArray 实例

Float32Array.of(0.151, -8, 3.7)
// Float32Array [ 0.151, -8, 3.7 ]

以下三种方法类似

// 方法一
let tarr = new Uint8Array([1, 2, 3])

// 方法二
let tarr = Uint8Array.of(1, 2, 3)

// 方法三
let tarr = new Uint8Array(3)
tarr[0] = 1
tarr[1] = 2
tarr[2] = 3

TypedArray.from()

静态方法 from：接受可遍历的数据结构（比如数组）作为参数，返回对应的 TypedArray 实例

Uint16Array.from([0, 1, 2])
// Uint16Array [ 0, 1, 2 ]

接受函数作为第二参数，用来遍历元素，与 map 类似

Int8Array.of(127, 126, 125).map((x) => 2 * x)
// Int8Array [ -2, -4, -6 ]

Int16Array.from(Int8Array.of(127, 126, 125), (x) => 2 * x)
// Int16Array [ 254, 252, 250 ]

注意：from 方法没有发生溢出，说明遍历不是针对原来的 8 位整数数组。from 会将第一个参数指定的 TypedArray 数组，拷贝到另一段内存之中，再将结果转成指定的数组格式

案例：将一种 TypedArray 实例，转为另一种 TypeArray 实例

const ui16 = Uint16Array.from(Uint8Array.of(0, 1, 2))
ui16 instanceof Uint16Array // true

复合视图

视图构造函数可以指定起始位置和长度。所以在同一段内存之中，可以依次存放不同类型的数据，这叫做“复合视图”

const buffer = new ArrayBuffer(24)

const idView = new Uint32Array(buffer, 0, 1)
const usernameView = new Uint8Array(buffer, 4, 16)
const amountDueView = new Float32Array(buffer, 20, 1)

24 字节 ArrayBuffer 分为三个部分

Uint32Array：0 - 3

UintArray：4 - 19

Float32Array：20 - 23

可以用如下 C 语言表示

struct someStruct {
  unsigned long id;
  char username[16];
  float amountDue;
};

DataView 视图

如果一段数据包括多种类型，可以通过 DataView 视图进行操作

DataView 视图提供更多操作选项，而且支持设定字节序

TypedArray 和 DataView 的区别：

TypedArray 视图：用来向网卡、声卡之类的本机设备传送数据，所以使用本机的字节序

DataView 视图：用来处理网络设备传来的数据，所以大端字节序或小端字节序是可以自行设定

DataView 视图本身也是构造函数，接受一个 ArrayBuffer 对象作为参数，生成视图

new DataView(ArrayBuffer buffer [, 字节起始位置 [, 长度]]);

DateView 实例属性

DataView.prototype.buffer：返回对应的 ArrayBuffer 对象

DataView.prototype.byteLength：返回占据的内存字节长度

DataView.prototype.byteOffset：返回当前视图从对应的 ArrayBuffer 对象

DataView 读取方法

getInt8：读取 1 个字节，返回一个 8 位整数。

getUint8：读取 1 个字节，返回一个无符号的 8 位整数。

getInt16：读取 2 个字节，返回一个 16 位整数。

getUint16：读取 2 个字节，返回一个无符号的 16 位整数。

getInt32：读取 4 个字节，返回一个 32 位整数。

getUint32：读取 4 个字节，返回一个无符号的 32 位整数。

getFloat32：读取 4 个字节，返回一个 32 位浮点数。

getFloat64：读取 8 个字节，返回一个 64 位浮点数。

get 方法参数都是一个字节序号（不能是负数，否则会报错），表示从哪个字节开始读取

const buffer = new ArrayBuffer(24)
const dv = new DataView(buffer)

// 从第1个字节读取一个8位无符号整数
const v1 = dv.getUint8(0)

// 从第2个字节读取一个16位无符号整数
const v2 = dv.getUint16(1)

// 从第4个字节读取一个16位无符号整数
const v3 = dv.getUint16(3)

上面代码读取 ArrayBuffer 前 5 个字节

一次读取两个或两个以上字节，就必须明确数据的存储方式，到底是小端字节序还是大端字节序。默认为大端字节。

// 小端字节序
const v1 = dv.getUint16(1, true)

// 大端字节序
const v2 = dv.getUint16(3, false)

// 大端字节序
const v3 = dv.getUint16(3)

DataView 写入方法

setInt8：写入 1 个字节的 8 位整数。

setUint8：写入 1 个字节的 8 位无符号整数。

setInt16：写入 2 个字节的 16 位整数。

setUint16：写入 2 个字节的 16 位无符号整数。

setInt32：写入 4 个字节的 32 位整数。

setUint32：写入 4 个字节的 32 位无符号整数。

setFloat32：写入 4 个字节的 32 位浮点数。

setFloat64：写入 8 个字节的 64 位浮点数。

set 方法，接受两个参数，第一个参数是字节序号，表示从哪个字节开始写入，第二个参数为写入的数据。第三参数可以设置字节序，默认为大端序。

// 在第1个字节，以大端字节序写入值为25的32位整数
dv.setInt32(0, 25, false)

// 在第5个字节，以大端字节序写入值为25的32位整数
dv.setInt32(4, 25)

// 在第9个字节，以小端字节序写入值为2.5的32位浮点数
dv.setFloat32(8, 2.5, true)

判断字节序函数 ( DateView 版 )

const littleEndian = (function () {
  const buffer = new ArrayBuffer(2)
  new DataView(buffer).setInt16(0, 256, true)
  return new Int16Array(buffer)[0] === 256
})()

返回 true，小端字节序，返回 false 为大端字节序。

二进制数组的应用

大量的 Web API 用到了ArrayBuffer对象和它的视图对象

AJAX

传统上，服务器通过 AJAX 操作只能返回文本数据，即 responseType 属性默认为 text。第二版 XHR2 允许服务器返回二进制数据，把返回类型设为 arraybuffer，接受返回的二进制数据类型；如果不知道，就设为 blob。

let xhr = new XMLHttpRequest()
xhr.open('GET', someUrl)
xhr.responseType = 'arraybuffer'

xhr.onload = function () {
  let arrayBuffer = xhr.response
  // ···
}

xhr.send()

处理 32 位二进制数据

xhr.onreadystatechange = function () {
  if (req.readyState === 4) {
    const arrayResponse = xhr.response
    const dataView = new DataView(arrayResponse)
    const ints = new Uint32Array(dataView.byteLength / 4)

    xhrDiv.style.backgroundColor = '#00FF00'
    xhrDiv.innerText = 'Array is ' + ints.length + 'uints long'
  }
}

Canvas

网页 Canvas 元素输出的二进制像素数据，就是 TypedArray 数组

const canvas = document.getElementById('myCanvas')
const ctx = canvas.getContext('2d')

const imageData = ctx.getImageData(0, 0, canvas.width, canvas.height)
const uint8ClampedArray = imageData.data

uint8ClampedArray 虽然是一个 TypedArray 数组，但它的视图类型是一种针对 Canvas 元素的专有类型 Uint8ClampedArray

Uint8ClampedArray 视图：专门针对颜色，把每个字节解读为无符号的 8 位整数

只能取值 0 ～ 255
自动过滤高位溢出，确保将小于 0 的值设为 0，将大于 255 的值设为 255。

当像素颜色为 Uint8Array 类型，乘 gamma，需要做溢出处理

u8[i] = Math.min(255, Math.max(0, u8[i] * gamma))

WebSocket

WebSocket 可以通过 ArrayBuffer，发送或接收二进制数据

let socket = new WebSocket('ws://127.0.0.1:8081')
socket.binaryType = 'arraybuffer'

// Wait until socket is open
socket.addEventListener('open', function (event) {
  // Send binary data
  const typedArray = new Uint8Array(4)
  socket.send(typedArray.buffer)
})

// Receive binary data
socket.addEventListener('message', function (event) {
  const arrayBuffer = event.data
  // ···
})

Fetch API

Fetch API 取回的数据，就是 ArrayBuffer 对象。

fetch(url)
  .then(function (response) {
    return response.arrayBuffer()
  })
  .then(function (arrayBuffer) {
    // ...
  })

File API

一个文件的二进制数据类型，可以将这个文件读取为ArrayBuffer对象。

const fileInput = document.getElementById('fileInput')
const file = fileInput.files[0]
const reader = new FileReader()
reader.readAsArrayBuffer(file)
reader.onload = function () {
  const arrayBuffer = reader.result
  // ···
}

以处理 bmp 文件为例，file 变量是一个指向 bmp 文件的文件对象

首先读取文件
定义处理图像回调函数
图像展示在 canvas

const reader = new FileReader()
// 监听文件加载
reader.addEventListener('load', processimage, false)
// 读取文件
reader.readAsArrayBuffer(file)

function processimage(e) {
  const buffer = e.target.result
  const datav = new DataView(buffer)
  const bitmap = {}
  // 具体的处理步骤
}

图像数据处理时，具体参考 [4]

先处理 bmp 的文件头
处理图像元信息部分
图像本身的像素信息

SharedArrayBuffer

JavaScript 是单线程的，Web worker 引入了多线程.

主线程用来与用户互动，Worker 线程用来承担计算任务。

// 主线程
const w = new Worker('myworker.js')

上述代码，主线程新建了一个 Worker 线程。

主线程

发送数据：主线程通过 w.postMessage 向 Worker 线程发消息

接受数据：通过 message 事件监听 Worker 线程的回应

// 主线程
w.postMessage('hi')
w.onmessage = function (ev) {
  console.log(ev.data)
}

Worker 线程

发送数据：通过 postMessage 方法

接受数据：通过监听 message 事件，来获取主线程发来的消息

// Worker 线程
onmessage = function (ev) {
  console.log(ev.data)
  postMessage('ho')
}

线程之间的数据交换可以是各种格式（字符串、二进制）。

交换方式：复制机制，即一个进程将分享数据复制，通过 postMessage 方法交给另一个进程。

问题：数据量比较大，这种通信效率比较低

解决：留出一块内存区域，由主线程与 Worker 线程共享，两方都可以读写

ES2017 引入 SharedArrayBuffer，允许 Worker 线程与主线程共享同一块内存

// 主线程

// 新建 1KB 共享内存
const sharedBuffer = new SharedArrayBuffer(1024)

// 主线程将共享内存的地址发送出去
w.postMessage(sharedBuffer)

// 在共享内存上建立视图，供写入数据
const sharedArray = new Int32Array(sharedBuffer)

Worker 线程从事件的 data 属性上面取到数据

// Worker 线程
onmessage = function (ev) {
  // 主线程共享的数据，就是 1KB 的共享内存
  const sharedBuffer = ev.data

  // 在共享内存上建立视图，方便读写
  const sharedArray = new Int32Array(sharedBuffer)

  // ...
}

共享内存也可以在 Worker 线程创建，发给主线程

SharedArrayBuffer 与 ArrayBuffer 一样，本身是无法读写的，必须在上面建立视图，然后通过视图读写

// 分配 10 万个 32 位整数占据的内存空间
const sab = new SharedArrayBuffer(Int32Array.BYTES_PER_ELEMENT * 100000)

// 建立 32 位整数视图
const ia = new Int32Array(sab) // ia.length == 100000

// 新建一个质数生成器
const primes = new PrimeGenerator()

// 将 10 万个质数，写入这段内存空间
for (let i = 0; i < ia.length; i++) ia[i] = primes.next()

// 向 Worker 线程发送这段共享内存
w.postMessage(ia)

Worker 线程处理书籍

// Worker 线程
let ia
onmessage = function (ev) {
  ia = ev.data
  console.log(ia.length) // 100000
  console.log(ia[37]) // 输出 163，因为这是第38个质数
}

Atomics 对象

多线程共享内存最大的问题：如何防止两个线程同时修改某个地址，或者说，当一个线程修改共享内存以后，必须有一个机制让其他线程同步

SharedArrayBuffer API 提供 Atomics 对象，保证所有共享内存的操作都是“原子性”的，并且可以在所有线程内同步

原子性操作
一条普通的命令被编译器处理以后，会变成多条机器指令。如果是单线程运行，这是没有问题的；多线程环境并且共享内存时，就会出问题，因为这一组机器指令的运行期间，可能会插入其他线程的指令，从而导致运行结果出错

例子 1

// 主线程
ia[42] = 314159 // 原先的值 191
ia[37] = 123456 // 原先的值 163

// Worker 线程
console.log(ia[37])
console.log(ia[42])
// 可能的结果
// 123456
// 191

代码分析，主线程的原始顺序是先对 42 号位置赋值，再对 37 号位置赋值。编译器和 CPU 为了优化，可能会改变这两个操作的执行顺序（因为它们互不依赖）。可能在赋值过程中，Worker 线程就来读取数据，导致打印：123456 和 191

例子 2

// 主线程
const sab = new SharedArrayBuffer(Int32Array.BYTES_PER_ELEMENT * 100000)
const ia = new Int32Array(sab)

for (let i = 0; i < ia.length; i++) {
  ia[i] = primes.next() // 将质数放入 ia
}

// worker 线程
ia[112]++ // 错误
Atomics.add(ia, 112, 1) // 正确

Worker 线程直接改写共享内存 ia[112]++是不正确的，这行语句会被编译成多条机器指令，这些指令之间无法保证不会插入其他进程的指令。

解决：Atomics 对象可以保证一个操作所对应的多条机器指令，一定是作为一个整体运行的，中间不会被打断。

Atomics.store()，Atomics.load()

store()方法：向共享内存写入数据

load()方法：从共享内存读出数据

优点：保证读写操作原子性

还用来解决一个问题：多个线程使用共享内存的某个位置作为开关（flag），一旦该位置的值变了，就执行特定操作。保证赋值操作，在它前面的所有可能会改写内存的操作结束后执行。保证取值操作，一定是在它后面所有可能会读取该位置的操作开始之前执行

Atomics.load(typedArray, index)
Atomics.store(typedArray, index, value)

// 主线程 main.js
ia[42] = 314159 // 原先的值 191
Atomics.store(ia, 37, 123456) // 原先的值是 163

// Worker 线程 worker.js
while (Atomics.load(ia, 37) == 163);
console.log(ia[37]) // 123456
console.log(ia[42]) // 314159

另一个例子，主线程用 Atomics.store 写入数据

// 主线程
const worker = new Worker('worker.js')
const length = 10
const size = Int32Array.BYTES_PER_ELEMENT * length
// 新建一段共享内存
const sharedBuffer = new SharedArrayBuffer(size)
const sharedArray = new Int32Array(sharedBuffer)
for (let i = 0; i < 10; i++) {
  // 向共享内存写入 10 个整数
  Atomics.store(sharedArray, i, 0)
}
worker.postMessage(sharedBuffer)

Worker 线程用 Atomics.load()方法读取数据

// worker.js
self.addEventListener(
  'message',
  (event) => {
    const sharedArray = new Int32Array(event.data)
    for (let i = 0; i < 10; i++) {
      const arrayValue = Atomics.load(sharedArray, i)
      console.log(`The item at array index ${i} is ${arrayValue}`)
    }
  },
  false
)

Atomics.exchange()

与 Atomics.store 区别：Atomics.store()返回写入的值，而 Atomics.exchange()返回被替换的值

// Worker 线程
self.addEventListener(
  'message',
  (event) => {
    const sharedArray = new Int32Array(event.data)
    for (let i = 0; i < 10; i++) {
      if (i % 2 === 0) {
        const storedValue = Atomics.store(sharedArray, i, 1)
        console.log(`The item at array index ${i} is now ${storedValue}`)
      } else {
        const exchangedValue = Atomics.exchange(sharedArray, i, 2)
        console.log(`The item at array index ${i} was ${exchangedValue}, now 2`)
      }
    }
  },
  false
)

Atomics.wait()，Atomics.notify()

使用 while 循环等待主线程的通知，不是很高效，如果用在主线程，就会造成卡顿.

Atomics 对象提供了 wait()和 notify() 用于等待通知

相当于锁内存，即在一个线程进行操作时，让其他线程休眠（建立锁），等到操作结束，再唤醒那些休眠的线程（解除锁）

Atomics.notify()方法以前叫做 Atomics.wake()，现在进行改名

// Worker 线程
self.addEventListener(
  'message',
  (event) => {
    const sharedArray = new Int32Array(event.data)
    const arrayIndex = 0
    const expectedStoredValue = 50
    Atomics.wait(sharedArray, arrayIndex, expectedStoredValue)
    console.log(Atomics.load(sharedArray, arrayIndex))
  },
  false
)

Atomics.wait()方法等同于告诉 Worker 线程，只要满足给定条件（sharedArray 的 0 号位置等于 50），就在这一行 Worker 线程进入休眠

Atomics.wait(sharedArray, index, value, timeout)

参数说明

sharedArray：共享内存的视图数组
index：视图数据的位置（从 0 开始）
value：该位置的预期值。一旦实际值等于预期值，就进入休眠
timeout：整数，表示过了这个时间以后，就自动唤醒，单位毫秒。该参数可选，默认值是 Infinity，即无限期的休眠，只有通过 Atomics.notify()方法才能唤醒

返回值：一个字符串，有三种可能

not-equal：sharedArray[index]不等于 value
timed-out：not-equal
ok：Atomics.notify()方法唤醒

Atomics.notify(sharedArray, index, count)

参数说明

sharedArray：共享内存的视图数组
index：视图数据的位置（从 0 开始）
count：需要唤醒的 Worker 线程的数量，默认为 Infinity

Atomics.notify()方法一旦唤醒休眠的 Worker 线程，就会让它继续往下运行

例子

// 主线程
console.log(ia[37]) // 163
Atomics.store(ia, 37, 123456)
Atomics.notify(ia, 37, 1)

// Worker 线程
Atomics.wait(ia, 37, 163)
console.log(ia[37]) // 123456

基于 wait 和 notify 这两个方法的锁内存实现，参考[5]

运算方法

共享内存上面的某些运算是不能被打断的，即不能在运算过程中，让其他线程改写内存上面的值。

Atomics 对象提供了一些运算方法，防止数据被改写

Atomics.add(sharedArray, index, value)
Atomics.sub(sharedArray, index, value)
Atomics.and(sharedArray, index, value)
Atomics.or(sharedArray, index, value)
Atomics.xor(sharedArray, index, value)

以上方法，默认返回旧的值

其他方法

Atomics对象还有以下方法

Atomics.compareExchange(sharedArray, index, oldval, newval)：如果sharedArray[index]等于oldval，就写入newval，返回oldval。

Atomics.isLockFree(size)：返回一个布尔值，表示Atomics对象是否可以处理某个size的内存锁定。如果返回false，应用程序就需要自己来实现锁定。

Atomics.compareExchange一个用途是，从 SharedArrayBuffer 读取一个值，然后对该值进行某个操作，操作结束以后，检查一下 SharedArrayBuffer 里面原来那个值是否发生变化（即被其他线程改写过）。如果没有改写过，就将它写回原来的位置，否则读取新的值，再重头进行一次操作。

ArrayBuffer ​

ArrayBuffer 对象 ​

概述 ​

ArrayBuffer.prototype.byteLength ​

ArrayBuffer.prototype.slice ​

TypedArray 视图 ​

概述 ​

构造函数 ​

数组方法 ​

字节序 ​

BYTES_PER_ELEMENT 属性 ​

ArrayBuffer 与字符串的互相转换 ​

溢出 ​

TypedArray.prototype.buffer ​

TypedArray.prototype.byteLength，TypedArray.prototype.byteOffset ​

TypedArray.prototype.length ​

TypedArray.prototype.set() ​

TypedArray.prototype.subarray() ​

TypedArray.prototype.slice() ​

TypedArray.of() ​

TypedArray.from() ​

复合视图 ​

DataView 视图 ​

DateView 实例属性 ​

DataView 读取方法 ​

DataView 写入方法 ​

二进制数组的应用 ​

AJAX ​

Canvas ​

WebSocket ​

Fetch API ​

File API ​

SharedArrayBuffer ​

Atomics 对象 ​

Atomics.store()，Atomics.load() ​

Atomics.exchange() ​

Atomics.wait()，Atomics.notify() ​

运算方法 ​

其他方法 ​

相关链接 ​