神经网络核心思想

神经网络核心思想:(1)机器学习、深度学习是一种方法论

机器学习:核心思想是使计算机系统能够从经验(通常是大量数据)中学习和改进,以优化性能并做出准确的预测或决策,而不需要传统意义上的明确编程来指定每一步骤。机器学习算法通过识别数据中的模式和规律,自动调整内部参数以优化模型性能。

机器学习 - 机器学习简介(Introduction to Machine Learning)

神经网络算法 - 一文搞懂机器学习算法

深度学习:机器学习的一个子领域,它专注于构建和训练深度神经网络(DNNs)来解决复杂的问题。深度神经网络具有多个层次的结构,每个层次都能学习到输入数据中的不同级别的抽象特征。通过堆叠多个层次,深度学习模型能够学习到越来越复杂的模式,并在各种任务上取得出色的性能,包括图像识别、语音识别、自然语言处理等。

神经网络算法 - 一文搞懂ANN(人工神经网络)

深度学习方法论强调了从数据中自动学习特征的重要性,而不是依赖手工设计的特征提取方法。通过反向传播算法和优化技术(如梯度下降),深度学习模型能够逐步调整其内部参数以最小化预测误差,并在训练过程中不断提高性能。这种自动学习和优化的能力使得深度学习在处理大规模、高维度数据时特别有效。

神经网络算法 - 一文搞懂Back Propagation(反向传播)

神经网络算法 - 一文搞懂Gradient Descent(梯度下降)

图片
神经网络核心思想
神经网络核心思想:(2)本质是通过从数据学习得到一个数学函数

神经网络的本质:通过从数据中学习得到一个数学函数,该函数能够将输入映射到期望的输出。在神经网络中,这个数学函数是由网络的权重(weights)和偏置(biases)等参数定义的。这些参数在训练过程中会进行更新和调整,以最小化预测误差或最大化模型的性能。

神经网络动画讲解 - 权重W、偏置b和激活函数

神经网络的结构:由多个神经元(或称为节点)组成,这些神经元以层次结构连接在一起。每个神经元都接收来自前一层神经元的输入,并对这些输入进行加权求和,然后通过一个激活函数(如ReLU、Sigmoid或tanh)产生输出。这个输出将作为下一层神经元的输入。

神经网络动画讲解 - 神经网络结构

神经网络模型训练:在训练过程中,神经网络会接收到大量的标记数据(即带有正确输出的输入数据)。通过使用优化算法(如梯度下降),神经网络会逐步调整其权重和偏置参数,以最小化预测输出与实际输出之间的差异(即损失函数)。这个过程称为反向传播(backpropagation),它允许神经网络从错误中学习,并不断优化其参数。

通过不断迭代训练过程,神经网络的参数将逐渐收敛到一组最优值,这组参数定义了能够将输入映射到期望输出的数学函数。一旦训练完成,神经网络就可以用于对新的、未见过的输入进行预测或分类。

神经网络算法 - 一文搞懂回归和分类
图片
神经网络核心思想

神经网络核心思想:(3)不是编写固定程序,而是构建灵活可调节的参数,调节和微调参数

无需显示编程:与传统编程方法不同,神经网络不是通过编写固定的、硬编码的规则来执行任务。相反,它们是通过学习和适应数据中的模式来自动调整其内部参数,从而能够处理各种输入并产生相应的输出。这种方法使得神经网络能够处理复杂且多变的任务,而无需显式地定义每一步的执行逻辑。

图片

神经网络核心思想

模型微调:在训练完成后,神经网络的参数已经被优化到能够处理特定任务的最佳状态。然而,这并不意味着参数一旦确定就不能再改变。相反,如果有了新的数据或任务需求发生变化,可以对神经网络进行微调(fine-tuning)。微调是通过在现有模型的基础上继续训练来改进其性能的过程,它可以使用新的数据或更复杂的优化策略来进一步调整模型的参数。

神经网络算法 - 一文搞懂模型微调Fine-tuning
图片

神经网络核心思想


**注释** 

神经网络动画素材来源于3Blue1Brown,想了解更多查看参考资料网址。

3Blue1Brown 是一个由 Grant Sanderson 创建的YouTube 频道。这个频道从独特的视觉角度解说高等数学,内容包括线性代数、微积分、人工神经网络、黎曼猜想、傅里叶变换以及四元数等。

Grant Sanderson 毕业于斯坦福大学,并获得了数学学士学位。


参考资料

  • https://www.3blue1brown.com