Appearance
ArrayBuffer
ArrayBuffer 对象、TypedArray 视图和 DataView 视图是 JavaScript 操作二进制数据的一个接口。以数组的语法处理二进制数据,所以统称为二进制数组。
背景:原始设计目的,与 WebGL 项目有关。WebGL,指浏览器与显卡之间的通信接口,为了满足 JavaScript 与显卡之间大量的、实时的数据交换,它们之间的数据通信必须是二进制的,而不能是传统的文本格式。
原因:文本格式传递一个 32 位整数,两端的 JavaScript 脚本与显卡都要进行格式转化,将非常耗时。直接操作字节,将 4 个字节的 32 位整数,以二进制形式直接传入显卡,能大幅提高性能。
二进制数组由三类对象组成
(1)ArrayBuffer 对象:代表内存之中的一段二进制数据,可以通过“视图”进行操作。“视图”部署了数组接口,这意味着,可以用数组的方法操作内存。
(2)TypedArray 视图:共包括 9 种类型的视图,比如 Uint8Array(无符号 8 位整数)数组视图, Int16Array(16 位整数)数组视图, Float32Array(32 位浮点数)数组视图等等。
(3)DataView 视图:自定义复合格式的视图,比如第一个字节是 Uint8(无符号 8 位整数)、第二、三个字节是 Int16(16 位整数)、第四个字节开始是 Float32(32 位浮点数)等等,此外还可以自定义字节序。
总结:
ArrayBuffer 对象:代表原始的二进制数据
TypedArray 视图:读写简单类型的二进制数据
DataView 视图:读写复杂类型的二进制数据
注意,二进制数组并不是真正的数组,而是类似数组的对象
浏览器操作的 API,用到了二进制数组操作二进制数据
- Canvas
- Fetch API
- File API
- WebSockets
- XMLHttpRequest
ArrayBuffer 对象
概述
ArrayBuffer 对象:代表储存二进制数据的一段内存,它不能直接读写,只能通过视图(TypedArray 视图和 DataView 视图)来读写
视图作用:以指定格式解读二进制数据
ArrayBuffer 是一个构造函数,可以分配一段存放数据的连续内存区域。参数是所需内存大小(单位字节)
js
const buf = new ArrayBuffer(32)生产 32 字节内存区域,每个字节默认值为 0
通过 DateView 读取这段内容,DateView 需要提供 ArrayBuffer 对象实例作为参数
js
const buf = new ArrayBuffer(32)
const dataView = new DataView(buf)
dataView.getUint8(0) // 0另一种 TypedArray 视图,与 DataView 视图的一个区别是,它不是一个构造函数,而是一组构造函数,代表不同的数据格式
js
const buffer = new ArrayBuffer(4)
// 00 00 00 00
const x1 = new Int32Array(buffer)
x1[0] = 1024
// 00 04 00 00
// 0x0400 => 1024
const x2 = new Int8Array(buffer)
x2[0] = 1
x2[1] = 2
x2[2] = 3
// 01 02 03 00
// 0x030201 => 197121基于同一段内存,建立两种视图:32 位带符号整数,8 位无符号整数。两个视图对应同一段内存,一个视图修改底层内存会影响到另一个视图。
TypedArray 视图的构造函数,除了接受 ArrayBuffer 实例作为参数,还可以接受普通数组作为参数,直接分配内存生成底层的 ArrayBuffer 实例,并同时完成对这段内存的赋值
js
const typedArray = new Uint8Array([0, 1, 2])
typedArray.length // 3
typedArray[0] = 5
typedArray // [5, 1, 2]ArrayBuffer.prototype.byteLength
ArrayBuffer 实例 byteLength 属性:返回所分配的内存区域的字节长度
js
const buffer = new ArrayBuffer(32)
buffer.byteLength
// 32分配的内存区域很大,有可能分配失败(因为没有那么多的连续空余内存),所以有必要检查是否分配成功
js
if (buffer.byteLength === n) {
// 成功
} else {
// 失败
}ArrayBuffer.prototype.slice
slice 方法:允许将内存区域的一部分,拷贝生成一个新的 ArrayBuffer 对象
js
const buffer = new ArrayBuffer(8)
const newBuffer = buffer.slice(0, 3)从 0 开始,到第 3 个字节(不包括),生成一个新 ArrayBuffer。两个步骤,分配新内存,拷贝值。
注意:除了 slice 方法,ArrayBuffer 对象不提供任何直接读写内存方法,只允许建立视图,然后通过视图读写
ArrayBuffer.isView
静态方法 isView:参数是否为 ArrayBuffer 的视图实例,返回一个布尔值
js
const buffer = new ArrayBuffer(8)
ArrayBuffer.isView(buffer) // false
const v = new Int32Array(buffer)
ArrayBuffer.isView(v) // true相当于判断参数,是否为 TypedArray 实例或 DataView 实例
TypedArray 视图
概述
ArrayBuffer 对象作为内存区域,可以存放多种类型的数据。同一段内存,不同数据有不同的解读方式,这就叫做“视图”(view)。
TypedArray 视图一共包括 9 种类型,每一种视图都是一种构造函数。
| 说明 | 长度 | |
|---|---|---|
| Int8Array | 8 位有符号整数 | 1 字节 |
| Uint8Array | 8 位无符号整数 | 1 字节 |
| Uint8ClampedArray | 8 位无符号整数 | 1 字节(溢出处理不同) |
| Int16Array | 6 位有符号整数 | 2 字节 |
| Uint16Array | 16 位无符号整数 | 2 字节 |
| Int32Array | 32 位有符号整数 | 4 字节 |
| Uint32Array | 32 位无符号整数 | 4 字节 |
| Float32Array | 32 位浮点数 | 4 字节 |
| Float64Array | 64 位浮点数 | 8 字节 |
9 个构造函数生成的数组,统称为 TypedArray 视图,与普通数组类似,主要差距如下
- TypedArray 数组的所有成员,都是同一种类型
- TypedArray 数组的成员是连续,没有空位
- TypedArray 数组成员的默认值为 0
js
new Array(10) // 10个空位
new Uint8Array(10) // 10个0- TypedArray 数组本身不储存数据,它只是一层视图,操作存储在 ArrayBuffer 的数据。获取底层对象必须使用 buffer 属性
构造函数
构造函数有多种用法
(1)TypedArray(buffer, byteOffset=0, length?)
buffer(必填):视图对应底层 ArrayBuffer 对象
byteOffset:视图开始的字节序号,默认从 0 开始
length:视图包含的数据个数,默认直到本段内存区域结束
同一个 ArrayBuffer 对象之上,可以根据不同的数据类型,建立多个视图
js
// 创建一个8字节的ArrayBuffer
const b = new ArrayBuffer(8)
// 创建一个指向b的Int32视图,开始于字节0,直到缓冲区的末尾
const v1 = new Int32Array(b)
// 创建一个指向b的Uint8视图,开始于字节2,直到缓冲区的末尾
const v2 = new Uint8Array(b, 2)
// 创建一个指向b的Int16视图,开始于字节2,长度为2
const v3 = new Int16Array(b, 2, 2)
// v1[0] 00 00 00 00
// v2[0] __ __ 00 __
// v3[0] __ __ 00 00byteOffset 必须与所要建立的数据类型一致,否则会报错
js
const buffer = new ArrayBuffer(8)
const i16 = new Int16Array(buffer, 1)
// Uncaught RangeError: start offset of Int16Array should be a multiple of 2带符号的 16 位整数需要两个字节,所以 byteOffset 参数必须能够被 2 整除。
(2)TypedArray(length)
视图还可以不通过ArrayBuffer对象,直接分配内存而生成
js
const f64a = new Float64Array(8)
f64a[0] = 10
f64a[1] = 20
f64a[2] = f64a[0] + f64a[1](3)TypedArray(typedArray)
TypedArray 数组的构造函数,可以接受另一个 TypedArray 实例作为参数
js
const typedArray = new Int8Array(new Uint8Array(4))注意:生成的新数组,只是复制了参数数组的值,底层内存不一样。新数组会开辟新的内存存储数据,不会再原数组的内存之上建立视图。
js
const x = new Int8Array([1, 1])
const y = new Int8Array(x)
x[0] // 1
y[0] // 1
x[0] = 2
y[0] // 1数组y是以数组x为模板而生成的,当x变动的时候,y并没有变动。
基于一段内存,采用下面写法
js
const x = new Int8Array([1, 1])
const y = new Int8Array(x.buffer)
x[0] // 1
y[0] // 1
x[0] = 2
y[0] // 2(4)TypedArray(arrayLikeObject)
构造函数参数是一个普通数组,然后直接生成 TypedArray 实例
js
const typedArray = new Uint8Array([1, 2, 3, 4])注意,这时TypedArray视图会重新开辟内存,不会在原数组的内存上建立视图。
TypedArray 数组转换回普通数组
js
const normalArray = [...typedArray]
// or
const normalArray = Array.from(typedArray)
// or
const normalArray = Array.prototype.slice.call(typedArray)数组方法
普通数组的操作方法和属性,对 TypedArray 数组完全适用
但是 TypedArray 数组没有 concat 方法。合并多个 TypedArray 数组,写法如下
js
function concatenate(resultConstructor, ...arrays) {
let totalLength = 0
for (let arr of arrays) {
totalLength += arr.length
}
let result = new resultConstructor(totalLength)
let offset = 0
for (let arr of arrays) {
result.set(arr, offset)
offset += arr.length
}
return result
}
concatenate(Uint8Array, Uint8Array.of(1, 2), Uint8Array.of(3, 4))
// Uint8Array [1, 2, 3, 4]TypedArray 数组与普通数组一样,部署了 Iterator 接口
js
let ui8 = Uint8Array.of(0, 1, 2)
for (let byte of ui8) {
console.log(byte)
}
// 0
// 1
// 2字节序
字节序指的是数值在内存中的表示方式
js
const buffer = new ArrayBuffer(16)
const int32View = new Int32Array(buffer)
for (let i = 0; i < int32View.length; i++) {
int32View[i] = i * 2
}x86 体系计算机都采用小端字节序(little endian),相对重要的字节排在后面的内存地址,相对不重要字节排在前面的内存地址
比如,一个占据四个字节的 16 进制数 0x12345678,决定其大小的最重要的字节是“12”,最不重要的是“78”。
小端字节序存储:78563412
大端字节序存储:12345678
网络设备和特定的操作系统采用的是大端字节序。
问题:如果一段数据是大端字节序,TypedArray 数组将无法正确解析,因为它只能处理小端字节序
解决:JavaScript 引入 DataView 对象,可以设定字节序
js
// 假定某段buffer包含如下字节 [0x02, 0x01, 0x03, 0x07]
const buffer = new ArrayBuffer(4)
const v1 = new Uint8Array(buffer)
v1[0] = 2
v1[1] = 1
v1[2] = 3
v1[3] = 7
const uInt16View = new Uint16Array(buffer)
// 计算机采用小端字节序
// 所以头两个字节等于258
// 0x02 0x01 小端 0x0102 = 256+2 = 258
if (uInt16View[0] === 258) {
console.log('OK') // "OK"
}
// 赋值运算
uInt16View[0] = 255 // 字节变为[0xFF, 0x00, 0x03, 0x07]
uInt16View[0] = 0xff05 // 字节变为[0x05, 0xFF, 0x03, 0x07]
uInt16View[1] = 0x0210 // 字节变为[0x05, 0xFF, 0x10, 0x02]判断,当前视图是小端字节序,还是大端字节序
js
const BIG_ENDIAN = Symbol('BIG_ENDIAN')
const LITTLE_ENDIAN = Symbol('LITTLE_ENDIAN')
function getPlatformEndianness() {
let arr32 = Uint32Array.of(0x12345678)
let arr8 = new Uint8Array(arr32.buffer)
switch (arr8[0] * 0x1000000 + arr8[1] * 0x10000 + arr8[2] * 0x100 + arr8[3]) {
case 0x12345678:
return BIG_ENDIAN
case 0x78563412:
return LITTLE_ENDIAN
default:
throw new Error('Unknown endianness')
}
}BYTES_PER_ELEMENT 属性
BYTES_PER_ELEMENT 属性:表示这种数据类型占据的字节数。
js
Int8Array.BYTES_PER_ELEMENT // 1
Uint8Array.BYTES_PER_ELEMENT // 1
Uint8ClampedArray.BYTES_PER_ELEMENT // 1
Int16Array.BYTES_PER_ELEMENT // 2
Uint16Array.BYTES_PER_ELEMENT // 2
Int32Array.BYTES_PER_ELEMENT // 4
Uint32Array.BYTES_PER_ELEMENT // 4
Float32Array.BYTES_PER_ELEMENT // 4
Float64Array.BYTES_PER_ELEMENT // 8TypedArray 实例上也能获取,即有 TypedArray.prototype.BYTES_PER_ELEMENT
ArrayBuffer 与字符串的互相转换
ArrayBuffer 和字符串的相互转换,使用原生 TextEncoder 和 TextDecoder 方法
js
/**
* Convert ArrayBuffer/TypedArray to String via TextDecoder
*
* @see https://developer.mozilla.org/en-US/docs/Web/API/TextDecoder
*/
function ab2str(
input: ArrayBuffer | Uint8Array | Int8Array | Uint16Array | Int16Array | Uint32Array | Int32Array,
outputEncoding: string = 'utf8'
): string {
const decoder = new TextDecoder(outputEncoding)
return decoder.decode(input)
}
/**
* Convert String to ArrayBuffer via TextEncoder
*
* @see https://developer.mozilla.org/zh-CN/docs/Web/API/TextEncoder
*/
function str2ab(input: string): ArrayBuffer {
const view = str2Uint8Array(input)
return view.buffer
}
/** Convert String to Uint8Array */
function str2Uint8Array(input: string): Uint8Array {
const encoder = new TextEncoder()
const view = encoder.encode(input)
return view
}encode 参考 [2]
溢出
不同的视图类型,所能容纳的数值范围是确定的。超出这个范围,就会出现溢出。
TypedArray 溢出处理规则:抛弃溢出的位,然后按照视图类型进行解释
js
const uint8 = new Uint8Array(1)
uint8[0] = 256
// 1 0000 0000
uint8[0] // 0
// 0000 0001
// 1111 1110
// 1111 1111
uint8[0] = -1
uint8[0] // 255补充:原码、反码、补码 [3]
原码:符号位加上真值的绝对值
[+1]原 = 0000 0001
[-1]原 = 1000 0001
反码:正数反码是其本身。负数反码,在原码基础上,符号位不变,其余位按位取反。
[+1] = [00000001]原 = [00000001]反
[-1] = [10000001]原 = [11111110]反
补码:正数补码就是其本身。负数补码,在原码基础上,符号位不变,其余位按位取反,再+1 ( 即反码 + 1)
[+1] = [00000001]原 = [00000001]反 = [00000001]补
[-1] = [10000001]原 = [11111110]反 = [11111111]补
正向溢出(overflow):当输入值大于当前数据类型的最大值,结果等于当前数据类型的最小值加上余值,再减去 1
负向溢出(underflow):当输入值小于当前数据类型的最小值,结果等于当前数据类型的最大值减去余值的绝对值,再加上 1
余值:模运算(%)的结果,如下。
js
12 % 4 // 0
12 % 5 // 2下面的例子
js
const int8 = new Int8Array(1)
// [-128, 127]
// [11111111, 01111111]
int8[0] = 128
// 余值: 128 % 127 = 1
// -128 + 1 - 1
int8[0] // -128
int8[0] = -129
// 余值:128 % -129 = | -1 | = 1
// 127 - 1 + 1 = 127
int8[0] // 127Uint8ClampedArray 视图溢出规则,与上面的规则不同。
正向溢出:一律为该类型最大值,255
负向溢出:一律为该类型最小值,0
TypedArray.prototype.buffer
实例 buffer 属性:返回整段内存区域对应的 ArrayBuffer 对象
js
const a = new Float32Array(64)
const b = new Uint8Array(a.buffer)a 和 b 对应同一段内存
TypedArray.prototype.byteLength,TypedArray.prototype.byteOffset
byteLength 属性:返回 TypedArray 占据的内存长度,单位为字节
byteOffset 属性:返回 TypedArray 从底层 ArrayBuffer 哪个字节开始
byteLength 和 byteOffset 均为只读属性
js
const b = new ArrayBuffer(8)
const v1 = new Int32Array(b)
const v2 = new Uint8Array(b, 2)
const v3 = new Int16Array(b, 2, 2)
v1.byteLength // 8
v2.byteLength // 6
v3.byteLength // 4
v1.byteOffset // 0
v2.byteOffset // 2
v3.byteOffset // 2TypedArray.prototype.length
length 属性: TypedArray 数组含有多少个成员
js
const a = new Int16Array(8)
a.length // 8
a.byteLength // 16length 属性和 byteLength 属性区分,前者是成员长度,后者是字节长度
TypedArray.prototype.set()
set 方法:复制数组(普通数组 或 TypedArray)
优势:整段内存复制,比拷贝成员的方式快
js
const a = new Uint8Array(8)
const b = new Uint8Array(8)
b.set(a)第二参数:从哪个位置开始复制
js
const a = new Uint16Array(8)
const b = new Uint16Array(10)
b.set(a, 2)上述代码:表示从 b2 开始复制
TypedArray.prototype.subarray()
subarray 方法:以 TypedArray 的一部分,再建立一个新的视图。
参数 1:起始的成员序号
参数 2:结束的成员序号(不含该成员)
js
const a = new Uint16Array(8)
const b = a.subarray(2, 3)
a.byteLength // 16
b.byteLength // 2TypedArray.prototype.slice()
slice 方法:返回一个指定位置的新的 TypedArray 实例
参数:从哪个位置开始生成新数组,负值表示逆向的位置
js
let ui8 = Uint8Array.of(0, 1, 2)
ui8.slice(-1)
// Uint8Array [ 2 ]TypedArray.of()
静态方法 of:将参数转为一个 TypedArray 实例
js
Float32Array.of(0.151, -8, 3.7)
// Float32Array [ 0.151, -8, 3.7 ]以下三种方法类似
js
// 方法一
let tarr = new Uint8Array([1, 2, 3])
// 方法二
let tarr = Uint8Array.of(1, 2, 3)
// 方法三
let tarr = new Uint8Array(3)
tarr[0] = 1
tarr[1] = 2
tarr[2] = 3TypedArray.from()
静态方法 from:接受可遍历的数据结构(比如数组)作为参数,返回对应的 TypedArray 实例
js
Uint16Array.from([0, 1, 2])
// Uint16Array [ 0, 1, 2 ]接受函数作为第二参数,用来遍历元素,与 map 类似
js
Int8Array.of(127, 126, 125).map((x) => 2 * x)
// Int8Array [ -2, -4, -6 ]
Int16Array.from(Int8Array.of(127, 126, 125), (x) => 2 * x)
// Int16Array [ 254, 252, 250 ]注意:from 方法没有发生溢出,说明遍历不是针对原来的 8 位整数数组。from 会将第一个参数指定的 TypedArray 数组,拷贝到另一段内存之中,再将结果转成指定的数组格式
案例:将一种 TypedArray 实例,转为另一种 TypeArray 实例
js
const ui16 = Uint16Array.from(Uint8Array.of(0, 1, 2))
ui16 instanceof Uint16Array // true复合视图
视图构造函数可以指定起始位置和长度。所以在同一段内存之中,可以依次存放不同类型的数据,这叫做“复合视图”
js
const buffer = new ArrayBuffer(24)
const idView = new Uint32Array(buffer, 0, 1)
const usernameView = new Uint8Array(buffer, 4, 16)
const amountDueView = new Float32Array(buffer, 20, 1)24 字节 ArrayBuffer 分为三个部分
Uint32Array:0 - 3
UintArray:4 - 19
Float32Array:20 - 23
可以用如下 C 语言表示
js
struct someStruct {
unsigned long id;
char username[16];
float amountDue;
};DataView 视图
如果一段数据包括多种类型,可以通过 DataView 视图进行操作
DataView 视图提供更多操作选项,而且支持设定字节序
TypedArray 和 DataView 的区别:
TypedArray 视图:用来向网卡、声卡之类的本机设备传送数据,所以使用本机的字节序
DataView 视图:用来处理网络设备传来的数据,所以大端字节序或小端字节序是可以自行设定
DataView 视图本身也是构造函数,接受一个 ArrayBuffer 对象作为参数,生成视图
js
new DataView(ArrayBuffer buffer [, 字节起始位置 [, 长度]]);DateView 实例属性
DataView.prototype.buffer:返回对应的 ArrayBuffer 对象
DataView.prototype.byteLength:返回占据的内存字节长度
DataView.prototype.byteOffset:返回当前视图从对应的 ArrayBuffer 对象
DataView 读取方法
getInt8:读取 1 个字节,返回一个 8 位整数。
getUint8:读取 1 个字节,返回一个无符号的 8 位整数。
getInt16:读取 2 个字节,返回一个 16 位整数。
getUint16:读取 2 个字节,返回一个无符号的 16 位整数。
getInt32:读取 4 个字节,返回一个 32 位整数。
getUint32:读取 4 个字节,返回一个无符号的 32 位整数。
getFloat32:读取 4 个字节,返回一个 32 位浮点数。
getFloat64:读取 8 个字节,返回一个 64 位浮点数。
get 方法参数都是一个字节序号(不能是负数,否则会报错),表示从哪个字节开始读取
js
const buffer = new ArrayBuffer(24)
const dv = new DataView(buffer)
// 从第1个字节读取一个8位无符号整数
const v1 = dv.getUint8(0)
// 从第2个字节读取一个16位无符号整数
const v2 = dv.getUint16(1)
// 从第4个字节读取一个16位无符号整数
const v3 = dv.getUint16(3)上面代码读取 ArrayBuffer 前 5 个字节
一次读取两个或两个以上字节,就必须明确数据的存储方式,到底是小端字节序还是大端字节序。默认为大端字节。
js
// 小端字节序
const v1 = dv.getUint16(1, true)
// 大端字节序
const v2 = dv.getUint16(3, false)
// 大端字节序
const v3 = dv.getUint16(3)DataView 写入方法
setInt8:写入 1 个字节的 8 位整数。
setUint8:写入 1 个字节的 8 位无符号整数。
setInt16:写入 2 个字节的 16 位整数。
setUint16:写入 2 个字节的 16 位无符号整数。
setInt32:写入 4 个字节的 32 位整数。
setUint32:写入 4 个字节的 32 位无符号整数。
setFloat32:写入 4 个字节的 32 位浮点数。
setFloat64:写入 8 个字节的 64 位浮点数。
set 方法,接受两个参数,第一个参数是字节序号,表示从哪个字节开始写入,第二个参数为写入的数据。第三参数可以设置字节序,默认为大端序。
js
// 在第1个字节,以大端字节序写入值为25的32位整数
dv.setInt32(0, 25, false)
// 在第5个字节,以大端字节序写入值为25的32位整数
dv.setInt32(4, 25)
// 在第9个字节,以小端字节序写入值为2.5的32位浮点数
dv.setFloat32(8, 2.5, true)判断字节序函数 ( DateView 版 )
js
const littleEndian = (function () {
const buffer = new ArrayBuffer(2)
new DataView(buffer).setInt16(0, 256, true)
return new Int16Array(buffer)[0] === 256
})()返回 true,小端字节序,返回 false 为大端字节序。
二进制数组的应用
大量的 Web API 用到了ArrayBuffer对象和它的视图对象
AJAX
传统上,服务器通过 AJAX 操作只能返回文本数据,即 responseType 属性默认为 text。第二版 XHR2 允许服务器返回二进制数据,把返回类型设为 arraybuffer,接受返回的二进制数据类型;如果不知道,就设为 blob。
js
let xhr = new XMLHttpRequest()
xhr.open('GET', someUrl)
xhr.responseType = 'arraybuffer'
xhr.onload = function () {
let arrayBuffer = xhr.response
// ···
}
xhr.send()处理 32 位二进制数据
js
xhr.onreadystatechange = function () {
if (req.readyState === 4) {
const arrayResponse = xhr.response
const dataView = new DataView(arrayResponse)
const ints = new Uint32Array(dataView.byteLength / 4)
xhrDiv.style.backgroundColor = '#00FF00'
xhrDiv.innerText = 'Array is ' + ints.length + 'uints long'
}
}Canvas
网页 Canvas 元素输出的二进制像素数据,就是 TypedArray 数组
js
const canvas = document.getElementById('myCanvas')
const ctx = canvas.getContext('2d')
const imageData = ctx.getImageData(0, 0, canvas.width, canvas.height)
const uint8ClampedArray = imageData.datauint8ClampedArray 虽然是一个 TypedArray 数组,但它的视图类型是一种针对 Canvas 元素的专有类型 Uint8ClampedArray
Uint8ClampedArray 视图:专门针对颜色,把每个字节解读为无符号的 8 位整数
- 只能取值 0 ~ 255
- 自动过滤高位溢出,确保将小于 0 的值设为 0,将大于 255 的值设为 255。
当像素颜色为 Uint8Array 类型,乘 gamma,需要做溢出处理
js
u8[i] = Math.min(255, Math.max(0, u8[i] * gamma))WebSocket
WebSocket 可以通过 ArrayBuffer,发送或接收二进制数据
js
let socket = new WebSocket('ws://127.0.0.1:8081')
socket.binaryType = 'arraybuffer'
// Wait until socket is open
socket.addEventListener('open', function (event) {
// Send binary data
const typedArray = new Uint8Array(4)
socket.send(typedArray.buffer)
})
// Receive binary data
socket.addEventListener('message', function (event) {
const arrayBuffer = event.data
// ···
})Fetch API
Fetch API 取回的数据,就是 ArrayBuffer 对象。
js
fetch(url)
.then(function (response) {
return response.arrayBuffer()
})
.then(function (arrayBuffer) {
// ...
})File API
一个文件的二进制数据类型,可以将这个文件读取为ArrayBuffer对象。
js
const fileInput = document.getElementById('fileInput')
const file = fileInput.files[0]
const reader = new FileReader()
reader.readAsArrayBuffer(file)
reader.onload = function () {
const arrayBuffer = reader.result
// ···
}以处理 bmp 文件为例,file 变量是一个指向 bmp 文件的文件对象
- 首先读取文件
- 定义处理图像回调函数
- 图像展示在 canvas
js
const reader = new FileReader()
// 监听文件加载
reader.addEventListener('load', processimage, false)
// 读取文件
reader.readAsArrayBuffer(file)js
function processimage(e) {
const buffer = e.target.result
const datav = new DataView(buffer)
const bitmap = {}
// 具体的处理步骤
}图像数据处理时,具体参考 [4]
- 先处理 bmp 的文件头
- 处理图像元信息部分
- 图像本身的像素信息
SharedArrayBuffer
JavaScript 是单线程的,Web worker 引入了多线程.
主线程用来与用户互动,Worker 线程用来承担计算任务。
js
// 主线程
const w = new Worker('myworker.js')上述代码,主线程新建了一个 Worker 线程。
主线程
发送数据:主线程通过 w.postMessage 向 Worker 线程发消息
接受数据:通过 message 事件监听 Worker 线程的回应
js
// 主线程
w.postMessage('hi')
w.onmessage = function (ev) {
console.log(ev.data)
}Worker 线程
发送数据:通过 postMessage 方法
接受数据:通过监听 message 事件,来获取主线程发来的消息
js
// Worker 线程
onmessage = function (ev) {
console.log(ev.data)
postMessage('ho')
}线程之间的数据交换可以是各种格式(字符串、二进制)。
交换方式:复制机制,即一个进程将分享数据复制,通过 postMessage 方法交给另一个进程。
问题:数据量比较大,这种通信效率比较低
解决:留出一块内存区域,由主线程与 Worker 线程共享,两方都可以读写
ES2017 引入 SharedArrayBuffer,允许 Worker 线程与主线程共享同一块内存
js
// 主线程
// 新建 1KB 共享内存
const sharedBuffer = new SharedArrayBuffer(1024)
// 主线程将共享内存的地址发送出去
w.postMessage(sharedBuffer)
// 在共享内存上建立视图,供写入数据
const sharedArray = new Int32Array(sharedBuffer)Worker 线程从事件的 data 属性上面取到数据
js
// Worker 线程
onmessage = function (ev) {
// 主线程共享的数据,就是 1KB 的共享内存
const sharedBuffer = ev.data
// 在共享内存上建立视图,方便读写
const sharedArray = new Int32Array(sharedBuffer)
// ...
}共享内存也可以在 Worker 线程创建,发给主线程
SharedArrayBuffer 与 ArrayBuffer 一样,本身是无法读写的,必须在上面建立视图,然后通过视图读写
js
// 分配 10 万个 32 位整数占据的内存空间
const sab = new SharedArrayBuffer(Int32Array.BYTES_PER_ELEMENT * 100000)
// 建立 32 位整数视图
const ia = new Int32Array(sab) // ia.length == 100000
// 新建一个质数生成器
const primes = new PrimeGenerator()
// 将 10 万个质数,写入这段内存空间
for (let i = 0; i < ia.length; i++) ia[i] = primes.next()
// 向 Worker 线程发送这段共享内存
w.postMessage(ia)Worker 线程处理书籍
js
// Worker 线程
let ia
onmessage = function (ev) {
ia = ev.data
console.log(ia.length) // 100000
console.log(ia[37]) // 输出 163,因为这是第38个质数
}Atomics 对象
多线程共享内存最大的问题:如何防止两个线程同时修改某个地址,或者说,当一个线程修改共享内存以后,必须有一个机制让其他线程同步
SharedArrayBuffer API 提供 Atomics 对象,保证所有共享内存的操作都是“原子性”的,并且可以在所有线程内同步
原子性操作
一条普通的命令被编译器处理以后,会变成多条机器指令。如果是单线程运行,这是没有问题的;多线程环境并且共享内存时,就会出问题,因为这一组机器指令的运行期间,可能会插入其他线程的指令,从而导致运行结果出错
例子 1
js
// 主线程
ia[42] = 314159 // 原先的值 191
ia[37] = 123456 // 原先的值 163
// Worker 线程
console.log(ia[37])
console.log(ia[42])
// 可能的结果
// 123456
// 191代码分析,主线程的原始顺序是先对 42 号位置赋值,再对 37 号位置赋值。编译器和 CPU 为了优化,可能会改变这两个操作的执行顺序(因为它们互不依赖)。可能在赋值过程中,Worker 线程就来读取数据,导致打印:123456 和 191
例子 2
js
// 主线程
const sab = new SharedArrayBuffer(Int32Array.BYTES_PER_ELEMENT * 100000)
const ia = new Int32Array(sab)
for (let i = 0; i < ia.length; i++) {
ia[i] = primes.next() // 将质数放入 ia
}
// worker 线程
ia[112]++ // 错误
Atomics.add(ia, 112, 1) // 正确Worker 线程直接改写共享内存 ia[112]++是不正确的,这行语句会被编译成多条机器指令,这些指令之间无法保证不会插入其他进程的指令。
解决:Atomics 对象可以保证一个操作所对应的多条机器指令,一定是作为一个整体运行的,中间不会被打断。
Atomics.store(),Atomics.load()
store()方法:向共享内存写入数据
load()方法:从共享内存读出数据
优点:保证读写操作原子性
还用来解决一个问题:多个线程使用共享内存的某个位置作为开关(flag),一旦该位置的值变了,就执行特定操作。保证赋值操作,在它前面的所有可能会改写内存的操作结束后执行。保证取值操作,一定是在它后面所有可能会读取该位置的操作开始之前执行
js
Atomics.load(typedArray, index)
Atomics.store(typedArray, index, value)js
// 主线程 main.js
ia[42] = 314159 // 原先的值 191
Atomics.store(ia, 37, 123456) // 原先的值是 163
// Worker 线程 worker.js
while (Atomics.load(ia, 37) == 163);
console.log(ia[37]) // 123456
console.log(ia[42]) // 314159另一个例子,主线程用 Atomics.store 写入数据
js
// 主线程
const worker = new Worker('worker.js')
const length = 10
const size = Int32Array.BYTES_PER_ELEMENT * length
// 新建一段共享内存
const sharedBuffer = new SharedArrayBuffer(size)
const sharedArray = new Int32Array(sharedBuffer)
for (let i = 0; i < 10; i++) {
// 向共享内存写入 10 个整数
Atomics.store(sharedArray, i, 0)
}
worker.postMessage(sharedBuffer)Worker 线程用 Atomics.load()方法读取数据
js
// worker.js
self.addEventListener(
'message',
(event) => {
const sharedArray = new Int32Array(event.data)
for (let i = 0; i < 10; i++) {
const arrayValue = Atomics.load(sharedArray, i)
console.log(`The item at array index ${i} is ${arrayValue}`)
}
},
false
)Atomics.exchange()
与 Atomics.store 区别:Atomics.store()返回写入的值,而 Atomics.exchange()返回被替换的值
js
// Worker 线程
self.addEventListener(
'message',
(event) => {
const sharedArray = new Int32Array(event.data)
for (let i = 0; i < 10; i++) {
if (i % 2 === 0) {
const storedValue = Atomics.store(sharedArray, i, 1)
console.log(`The item at array index ${i} is now ${storedValue}`)
} else {
const exchangedValue = Atomics.exchange(sharedArray, i, 2)
console.log(`The item at array index ${i} was ${exchangedValue}, now 2`)
}
}
},
false
)Atomics.wait(),Atomics.notify()
使用 while 循环等待主线程的通知,不是很高效,如果用在主线程,就会造成卡顿.
Atomics 对象提供了 wait()和 notify() 用于等待通知
相当于锁内存,即在一个线程进行操作时,让其他线程休眠(建立锁),等到操作结束,再唤醒那些休眠的线程(解除锁)
Atomics.notify()方法以前叫做 Atomics.wake(),现在进行改名
js
// Worker 线程
self.addEventListener(
'message',
(event) => {
const sharedArray = new Int32Array(event.data)
const arrayIndex = 0
const expectedStoredValue = 50
Atomics.wait(sharedArray, arrayIndex, expectedStoredValue)
console.log(Atomics.load(sharedArray, arrayIndex))
},
false
)Atomics.wait()方法等同于告诉 Worker 线程,只要满足给定条件(sharedArray 的 0 号位置等于 50),就在这一行 Worker 线程进入休眠
Atomics.wait(sharedArray, index, value, timeout)
参数说明
sharedArray:共享内存的视图数组
index:视图数据的位置(从 0 开始)
value:该位置的预期值。一旦实际值等于预期值,就进入休眠
timeout:整数,表示过了这个时间以后,就自动唤醒,单位毫秒。该参数可选,默认值是 Infinity,即无限期的休眠,只有通过 Atomics.notify()方法才能唤醒
返回值:一个字符串,有三种可能
- not-equal:sharedArray[index]不等于 value
- timed-out:not-equal
- ok:Atomics.notify()方法唤醒
Atomics.notify(sharedArray, index, count)
参数说明
sharedArray:共享内存的视图数组
index:视图数据的位置(从 0 开始)
count:需要唤醒的 Worker 线程的数量,默认为 Infinity
Atomics.notify()方法一旦唤醒休眠的 Worker 线程,就会让它继续往下运行
例子
js
// 主线程
console.log(ia[37]) // 163
Atomics.store(ia, 37, 123456)
Atomics.notify(ia, 37, 1)
// Worker 线程
Atomics.wait(ia, 37, 163)
console.log(ia[37]) // 123456基于 wait 和 notify 这两个方法的锁内存实现,参考[5]
运算方法
共享内存上面的某些运算是不能被打断的,即不能在运算过程中,让其他线程改写内存上面的值。
Atomics 对象提供了一些运算方法,防止数据被改写
js
Atomics.add(sharedArray, index, value)
Atomics.sub(sharedArray, index, value)
Atomics.and(sharedArray, index, value)
Atomics.or(sharedArray, index, value)
Atomics.xor(sharedArray, index, value)以上方法,默认返回旧的值
其他方法
Atomics对象还有以下方法
Atomics.compareExchange(sharedArray, index, oldval, newval):如果sharedArray[index]等于oldval,就写入newval,返回oldval。
Atomics.isLockFree(size):返回一个布尔值,表示Atomics对象是否可以处理某个size的内存锁定。如果返回false,应用程序就需要自己来实现锁定。
Atomics.compareExchange一个用途是,从 SharedArrayBuffer 读取一个值,然后对该值进行某个操作,操作结束以后,检查一下 SharedArrayBuffer 里面原来那个值是否发生变化(即被其他线程改写过)。如果没有改写过,就将它写回原来的位置,否则读取新的值,再重头进行一次操作。