中文字幕网伦射乱中文,亚洲成a×人片在线观看,天堂在线最新版

一、介紹

缺陷檢測(cè)被廣泛使用于布匹瑕疵檢測(cè)、工件表面質(zhì)量檢測(cè)、航空航天領(lǐng)域等。傳統(tǒng)的算法對(duì)規(guī)則缺陷以及場(chǎng)景比較簡單的場(chǎng)合，能夠很好工作，但是對(duì)特征不明顯的、形狀多樣、場(chǎng)景比較混亂的場(chǎng)合，則不再適用。近年來，基于深度學(xué)習(xí)的識(shí)別算法越來越成熟，許多公司開始嘗試把深度學(xué)習(xí)算法應(yīng)用到工業(yè)場(chǎng)合中。

二、缺陷數(shù)據(jù)

這里以布匹數(shù)據(jù)作為案例，常見的有以下三種缺陷，磨損、白點(diǎn)、多線。

如何制作訓(xùn)練數(shù)據(jù)呢？這里是在原圖像上進(jìn)行截取，截取到小圖像，比如上述圖像是512x512，這里我裁剪成64x64的小圖像。這里以第一類缺陷為例，下面是制作數(shù)據(jù)的方法。

注意：在制作缺陷數(shù)據(jù)的時(shí)候，缺陷面積至少占截取圖像的2/3，否則舍棄掉，不做為缺陷圖像。

一般來說，缺陷數(shù)據(jù)都要比背景數(shù)據(jù)少很多，最后通過增強(qiáng)后的數(shù)據(jù)，缺陷：背景=1：1，每類在1000幅左右~~~

三、網(wǎng)絡(luò)結(jié)構(gòu)

具體使用的網(wǎng)絡(luò)結(jié)構(gòu)如下所示，輸入大小就是64x64x3，采用的是截取的小圖像的大小。每個(gè)Conv卷積層后都接BN層，具體層參數(shù)如下所示。

Conv1：64x3x3

Conv2：128x3x3 ResNetBlock和DenseNetBlock各兩個(gè)，具體細(xì)節(jié)請(qǐng)參考?xì)埐罹W(wǎng)絡(luò)和DenseNet。

Add：把殘差模塊輸出的結(jié)果和DenseNetBlock輸出的結(jié)果在對(duì)應(yīng)feature map上進(jìn)行相加，相加方式和殘差模塊相同。

注意，其實(shí)這里是為了更好的提取特征，方式不一定就是殘差模塊+DenseNetBlock，也可以是inception，或者其它。

Conv3：128x3x3 Maxpool：stride=2，size=2x2 FC1：4096 Dropout1：0.5 FC2：1024 Dropout1：0.5 Softmax：對(duì)應(yīng)的就是要分的類別，在這里我是二分類。

關(guān)于最后的損失函數(shù)，建議選擇Focal Loss，這是何凱明大神的杰作，源碼如下所示：

def focal_loss(y_true, y_pred):
    pt_1 = tf.where(tf.equal(y_true, 1), y_pred, tf.ones_like(y_pred))
    return -K.sum(K.pow(1. - pt_1, 2) * K.log(pt_1))

數(shù)據(jù)做好，就可以開始訓(xùn)練了~~~

四、整幅場(chǎng)景圖像的缺陷檢測(cè)

上述訓(xùn)練的網(wǎng)絡(luò)，輸入是64x64x3的，但是整幅場(chǎng)景圖像卻是512x512的，這個(gè)輸入和模型的輸入對(duì)不上號(hào)，這怎么辦呢？其實(shí)，可以把訓(xùn)練好的模型參數(shù)提取出來，然后賦值到另外一個(gè)新的模型中，然后把新的模型的輸入改成512x512就好，只是最后在conv3+maxpool層提取的feature map比較大，這個(gè)時(shí)候把feature map映射到原圖，比如原模型在最后一個(gè)maxpool層后，輸出的feature map尺寸是8x8x128，其中128是通道數(shù)。如果輸入改成512x512，那輸出的feature map就成了64x64x128，這里的每個(gè)8x8就對(duì)應(yīng)原圖上的64x64，這樣就可以使用一個(gè)8x8的滑動(dòng)窗口在64x64x128的feature map上進(jìn)行滑動(dòng)裁剪特征。然后把裁剪的特征進(jìn)行fatten，送入到全連接層。具體如下圖所示。

全連接層也需要重新建立一個(gè)模型，輸入是flatten之后的輸入，輸出是softmax層的輸出。這是一個(gè)簡單的小模型。

在這里提供一個(gè)把訓(xùn)練好的模型參數(shù)，讀取到另外一個(gè)模型中的代碼

#提取特征的大模型
def read_big_model(inputs):
    # 第一個(gè)卷積和最大池化層
    X = Conv2D(16, (3, 3), name="conv2d_1")(inputs)
    X = BatchNormalization(name="batch_normalization_1")(X)
    X = Activation('relu', name="activation_1")(X)
    X = MaxPooling2D(pool_size=(2, 2), strides=(2, 2), name="max_pooling2d_1")(X)
    # google_inception模塊
    conv_1 = Conv2D(32, (1, 1), padding='same', name='conv2d_2')(X)
    conv_1 = BatchNormalization(name='batch_normalization_2')(conv_1)
    conv_1 = Activation('relu', name='activation_2')(conv_1)
    conv_2 = Conv2D(32, (3, 3), padding='same', name='conv2d_3')(X)
    conv_2 = BatchNormalization(name='batch_normalization_3')(conv_2)
    conv_2 = Activation('relu', name='activation_3')(conv_2)
    conv_3 = Conv2D(32, (5, 5), padding='same', name='conv2d_4')(X)
    conv_3 = BatchNormalization(name='batch_normalization_4')(conv_3)
    conv_3 = Activation('relu', name='activation_4')(conv_3)
    pooling_1 = MaxPooling2D(pool_size=(2, 2), strides=(1, 1), padding='same', name='max_pooling2d_2')(X)
    X = merge([conv_1, conv_2, conv_3, pooling_1], mode='concat', name='merge_1')
    X = MaxPooling2D(pool_size=(2, 2), strides=(2, 2), name='max_pooling2d_3')(X)  # 這里的尺寸變成16x16x112
    X = Conv2D(64, (3, 3), kernel_regularizer=regularizers.l2(0.01), padding='same', name='conv2d_5')(X)
    X = BatchNormalization(name='batch_normalization_5')(X)
    X = Activation('relu', name='activation_5')(X)
    X = MaxPooling2D(pool_size=(2, 2), strides=(2, 2), name='max_pooling2d_4')(X)  # 這里尺寸變成8x8x64
    X = Conv2D(128, (3, 3), padding='same', name='conv2d_6')(X)
    X = BatchNormalization(name='batch_normalization_6')(X)
    X = Activation('relu', name='activation_6')(X)
    X = MaxPooling2D(pool_size=(2, 2), strides=(2, 2), padding='same', name='max_pooling2d_5')(X)  # 這里尺寸變成4x4x128

    return X

def read_big_model_classify(inputs_sec):
    X_ = Flatten(name='flatten_1')(inputs_sec)
    X_ = Dense(256, activation='relu', name="dense_1")(X_)
    X_ = Dropout(0.5, name="dropout_1")(X_)
    predictions = Dense(2, activation='softmax', name="dense_2")(X_)
    return predictions
#建立的小模型

inputs=Input(shape=(512,512,3))
X=read_big_model(inputs)#讀取訓(xùn)練好模型的網(wǎng)絡(luò)參數(shù)
#建立第一個(gè)model
model=Model(inputs=inputs, outputs=X)
model.load_weights('model_halcon.h5', by_name=True)

五、識(shí)別定位結(jié)果

上述的滑窗方式可以定位到原圖像，8x8的滑窗定位到原圖就是64x64，同樣，在原圖中根據(jù)滑窗方式不同（在這里選擇的是左右和上下的步長為16個(gè)像素）識(shí)別定位到的缺陷位置也不止一個(gè)，這樣就涉及到定位精度了。在這里選擇投票的方式，其實(shí)就是對(duì)原圖像上每個(gè)被標(biāo)記的像素位置進(jìn)行計(jì)數(shù)，當(dāng)數(shù)字大于指定的閾值，就被判斷為缺陷像素。

識(shí)別結(jié)果如下圖所示：

六、一些Trick

對(duì)上述案例來說，其實(shí)64x64大小的定位框不夠準(zhǔn)確，可以考慮訓(xùn)練一個(gè)32x32大小的模型，然后應(yīng)用方式和64x64的模型相同，最后基于32x32的定位位置和64x64的定位位置進(jìn)行投票，但是這會(huì)涉及到一個(gè)問題，就是時(shí)間上會(huì)增加很多，要慎用。

對(duì)背景和前景相差不大的時(shí)候，網(wǎng)絡(luò)盡量不要太深，因?yàn)樘畹木W(wǎng)絡(luò)到后面基本學(xué)到的東西都是相同的，沒有很好的區(qū)分能力，這也是我在這里為什么不用object detection的原因，這些檢測(cè)模型網(wǎng)絡(luò)，深度動(dòng)輒都是50+，效果反而不好，雖然有殘差模塊作為backbone。

但是對(duì)背景和前景相差很大的時(shí)候，可以選擇較深的網(wǎng)絡(luò)，這個(gè)時(shí)候，object detection方式就派上用場(chǎng)了。

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

CMOS

CMOS

+關(guān)注

關(guān)注
58

文章
6106

瀏覽量
241218
CCD

CCD

+關(guān)注

關(guān)注
32

文章
898

瀏覽量
148034
機(jī)器視覺

機(jī)器視覺

+關(guān)注

關(guān)注
163

文章
4685

瀏覽量
124717
工業(yè)相機(jī)

工業(yè)相機(jī)

+關(guān)注

關(guān)注
5

文章
403

瀏覽量
25318
機(jī)器視覺系統(tǒng)

機(jī)器視覺系統(tǒng)

+關(guān)注

關(guān)注
1

文章
86

瀏覽量
19451

原文標(biāo)題：基于深度學(xué)習(xí)識(shí)別模型的缺陷檢測(cè)

文章出處：【微信號(hào)：vision263com，微信公眾號(hào)：新機(jī)器視覺】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

搜索歷史

基于深度學(xué)習(xí)識(shí)別模型的缺陷檢測(cè)方法

評(píng)論