tensorflow中tf.concat的axis的使用我一直理解的比較模糊,這次做個筆記理下自己的思路。
import tensorflow as tftf.enable_eager_execution()import numpy as np
先生成兩個矩陣m1, 和m2, 大小為兩行三列
m1 = np.random.rand(2,3) # m1.shape (2,3)m1>>array([[0.44529968, 0.42451167, 0.07463199], [0.35787143, 0.22926186, 0.34583839]])m2 = np.random.rand(2,3) # m2.shape (2,3)m2>>array([[0.92811531, 0.6180391 , 0.71969461], [0.00564108, 0.55381637, 0.17155987]])
接下來采用tf.concat進行連接,簡單來說,axis=0實際就是按行拼接,axis=1就是按列拼接
# axis = 0m3 = tf.concat([m1,m2],axis=0)m3>> array([[0.44529968, 0.42451167, 0.07463199], [0.35787143, 0.22926186, 0.34583839], [0.92811531, 0.6180391 , 0.71969461], [0.00564108, 0.55381637, 0.17155987]])m3.shape>> (4,3)# axis = 1m4 = tf.concat([m1,m2],axis=1)m4>>array([[0.44529968, 0.42451167, 0.07463199, 0.92811531, 0.6180391 , 0.71969461], [0.35787143, 0.22926186, 0.34583839, 0.00564108, 0.55381637, 0.17155987]])m4.shape>>(2,6)
但這實際上這只有在我們的輸入是二維矩陣時才可以這樣理解。axis的實際含義是根據axis指定的維度進行連接,如矩陣m1的維度為(2,3), 那么axis=0就代表了第一個維度‘2',因此,將m1和m2按照第一個維度進行連接,得到的新的矩陣就是將第一維度進行相加,其余維度不變,即維度變成了(4,3).
同理,axis=1時就是將矩陣的第二維度進行合并,其余維度不變,即維度變成了(2,6)。
接下來處理三個維度的數據,這也是我們在神經網絡數據中經常要用到的,增加的一個維度通常代表了batch_size. 如下面的m5, batch_size=5, 可以理解為每個樣本是個2*3的矩陣,一次將5個樣本放在一起。
m5 = np.random.rand(5,2,3)m6 = np.random.rand(5,2,3)m5>>array([[[0.04347217, 0.03368232, 0.36017024], [0.74223151, 0.06609717, 0.38155531]], [[0.50602728, 0.355745 , 0.93379797], [0.97572621, 0.53745311, 0.66461841]], [[0.92832972, 0.02441683, 0.48436203], [0.69651043, 0.24194495, 0.64623769]], [[0.66667596, 0.60053027, 0.2970753 ], [0.13281764, 0.29326326, 0.32393028]], [[0.40892782, 0.48516547, 0.02298178], [0.51239083, 0.40151008, 0.29913204]]])m6>>array([[[0.58001909, 0.56925704, 0.09798246], [0.20841893, 0.62683633, 0.17923217]], [[0.91216164, 0.0200782 , 0.3986682 ], [0.86687006, 0.83730576, 0.48443545]], [[0.65641654, 0.59786311, 0.2055584 ], [0.65391822, 0.74093133, 0.02416627]], [[0.80778861, 0.22644312, 0.91610686], [0.0789411 , 0.86955002, 0.41437046]], [[0.97821668, 0.97118328, 0.97714882], [0.21543173, 0.06964724, 0.35360077]]])
在這種情況下,axis=0代表的第一個維度的含義就不再是之前認為的行的概念了,現在m5的第一維度的值是5,代表的是batch_size。仍然按照之前的理解,如果設置axis=0, axis=0就是將第一維度進行相加,其余維度不變,因此我們可以得到新的維度為(10,2,3)。
新聞熱點
疑難解答