Tensorflow.js项目实战(3):迁移学习实践

JS Coding 纯手敲JS

在TensorFlow.js中，迁移学习是一种机器学习技术，它允许将一个预先在大规模数据集上训练好的模型应用到新的、相关的但数据较少的任务中。迁移学习的核心思想是，模型在解决原始任务时学到的底层特征和模式对于新的类似任务是有价值的，特别是对于深度学习模型中的早期层。

通过这种方式，TensorFlow.js中的迁移学习极大地提高了在有限数据条件下建立高性能模型的能力，特别是在计算机视觉领域。它避免了从零开始训练模型所需的大量时间和计算资源，加快了模型开发周期。

在TensorFlow.js中构建一个基于迁移学习的图像分类器，我们可以使用预训练的模型，如MobileNet，结合自定义的顶部层进行微调。以下是一个简化的步骤指南：

准备预训练模型首先，你需要一个预训练的模型，如MobileNet。可以从TensorFlow Hub下载，然后使用tensorflowjs_converter工具将其转换为TensorFlow.js格式：

tensorflowjs_converter \
  --input_format=tf_hub \
  --output_format=tfjs_graph_model \
  https://tfhub.dev/tensorflow/mobilenet_v2_100_224/classification/4 \
  ./web_model

加载预训练模型在JavaScript代码中加载转换后的模型：

asyncfunction loadModel() {
  const model = await tf.loadGraphModel('web_model/model.json');
  return model;
}

添加自定义顶部层若要针对特定任务进行微调，需要在预训练模型顶部添加一层或几层全连接层（如果有多个类别的分类任务）。在TensorFlow.js中，可以创建一个新的模型，将预训练模型作为一个层嵌入进去：

async function addTopLayer(model) {
  // 假设我们有N个类
  const numClasses = N;
 
  // 创建一个全连接层
  const fcLayer = tf.layers.dense({
    units: numClasses,
    activation: 'softmax',
  });

  // 从预训练模型的输出创建一个新的模型
  const newModel = tf.sequential();
  newModel.add(model);
  newModel.add(fcLayer);

  // 返回新模型
  return newModel;
}

asyncfunction setupModel() {
  const preTrainedModel = await loadModel();
  const modelWithTopLayer = await addTopLayer(preTrainedModel);
  return modelWithTopLayer;
}

数据预处理针对输入图像进行预处理，使其符合模型的输入要求：

asyncfunction preprocessImage(imageElement) {
  const tensor = tf.browser.fromPixels(imageElement)
    .resizeNearestNeighbor([224, 224])
    .toFloat()
    .expandDims();

  // 可能还需要进行归一化等操作，参照预训练模型的要求
  // 例如，对于MobileNet，可以使用mean and std
  const normalized = tensor.div(255).sub(tf.tensor([0.485, 0.456, 0.406])).div(tf.tensor([0.229, 0.224, 0.225]));

  return normalized;
}

训练模型准备好数据集后，开始训练模型：

asyncfunction trainModel(model, trainingData, labels, epochs, batchSize) {
  const xs = tf.tensor3d(trainingData, [trainingData.length, 224, 224, 3]);
  const ys = tf.oneHot(labels, numClasses);

  // 编译模型
  model.compile({
    optimizer: tf.train.adam(),
    loss: 'categoricalCrossentropy',
    metrics: ['accuracy']
  });

  // 训练模型
  await model.fit(xs, ys, {
    epochs: epochs,
    batchSize: batchSize,
    validationSplit: 0.1
  });
}

进行预测训练完成后，可以使用模型对新图像进行预测：

asyncfunction classifyImage(model, imageElement) {
  const preprocessed = await preprocessImage(imageElement);
  const predictions = model.predict(preprocessed);

  // 获取概率最高的类别
  const maxProbIndex = predictions.argMax(1).dataSync()[0];

  return maxProbIndex;  // 返回预测类别的索引
}

实际应用将上述代码整合在一起，加载预训练模型，添加顶部层，准备数据集，训练模型，然后进行图像分类预测。注意在实际项目中，你需要根据实际情况调整参数和步骤。

请确保在整个过程中遵守版权和数据隐私规则，尤其是当涉及到人脸或生物特征数据时。另外，由于浏览器环境的限制，大容量的数据集和长时间的训练可能不太适合在前端进行，这种情况更适合在后端或云端完成模型训练。