深度学习基本概念|张量tensor

深度学习常用于处理图像,文本,语音等数据,在计算机中,需要将这些数据用合适的数据结构来存储。以图像为例,每一幅图像可以看作由像素点构成的二维数组,而每个像素点又可以表示成RGB对应的3元组,经过这样的嵌套之后,每一幅图像实际上变成了一个高阶数组, 图示如下
在深度学习中,采用tensor来存储高阶数组对应的数据。tensor, 中文叫做张量,谷歌的开源机器学习框架TensorFlow也是建立在张量的基础上。
张量用来存储高阶数组,但本质上标量,向量,矩阵都可以看作是张量的特殊形式

tensorflow中,定义张量的方式如下

>>> import tensorflow as tf>>> rank_0_tensor = tf.constant(4)>>> rank_1_tensor = tf.constant([2.0, 3.0, 4.0])>>> rank_2_tensor = tf.constant([[1, 2],[3, 4],[5, 6]], dtype=tf.float16)>>> rank_3_tensor = tf.constant([[[0, 1, 2, 3, 4],[5, 6, 7, 8, 9]],[[10, 11, 12, 13, 14],[15, 16, 17, 18, 19]],[[20, 21, 22, 23, 24],[25, 26, 27, 28, 29]],])

对于张量,可以有多种可视化方式来帮助我们理解其结构, 以3阶张量为例

>>> rank_3_tensor = tf.constant([[[0,1,2,3,4], [5,6,7,8,9]],[[10,11,12,13,14], [15,16,17,18,19]], [[20,21,22,23,24], [25,26,27,28,29]]])>>> rank_3_tensor<tf.Tensor: shape=(3, 2, 5), dtype=int32, numpy=array([[[ 0, 1, 2, 3, 4], [ 5, 6, 7, 8, 9]],
[[10, 11, 12, 13, 14], [15, 16, 17, 18, 19]],
[[20, 21, 22, 23, 24], [25, 26, 27, 28, 29]]])>

张量有以下几个基本属性

1. shape, 形状,统计各个维度的元素数量

2. rank, 秩,维度的总数

3. axis, 轴,具体的某一个维度

>>> rank_4_tensor = tf.zeros([3, 2, 4, 5])>>> rank_4_tensor.shapeTensorShape([3, 2, 4, 5])# 张量的秩>>> rank_4_tensor.ndim4# axis 0的元素数量>>> rank_4_tensor.shape[0]3# axis 1的元素数量>>> rank_4_tensor.shape[1]2# axis 2的元素数量>>> rank_4_tensor.shape[2]4# axis 3的元素数量>>> rank_4_tensor.shape[3]5

图示如下

tensorflow通过张量这一数据结构来存储待处理的数据,并再次基础上定义了一系列的张量操作,来高效的处理深度学习运算。

·end·
(0)

相关推荐