一、介紹
缺陷檢測(cè)被廣泛使用于布匹瑕疵檢測(cè)、工件表面質(zhì)量檢測(cè)、航空航天領(lǐng)域等。傳統(tǒng)的算法對(duì)規(guī)則缺陷以及場(chǎng)景比較簡單的場(chǎng)合,能夠很好工作,但是對(duì)特征不明顯的、形狀多樣、場(chǎng)景比較混亂的場(chǎng)合,則不再適用。近年來,基于深度學(xué)習(xí)的識(shí)別算法越來越成熟,許多公司開始嘗試把深度學(xué)習(xí)算法應(yīng)用到工業(yè)場(chǎng)合中。
二、缺陷數(shù)據(jù)
這里以布匹數(shù)據(jù)作為案例,常見的有以下三種缺陷,磨損、白點(diǎn)、多線。
如何制作訓(xùn)練數(shù)據(jù)呢?這里是在原圖像上進(jìn)行截取,截取到小圖像,比如上述圖像是512x512,這里我裁剪成64x64的小圖像。這里以第一類缺陷為例,下面是制作數(shù)據(jù)的方法。
	

注意:在制作缺陷數(shù)據(jù)的時(shí)候,缺陷面積至少占截取圖像的2/3,否則舍棄掉,不做為缺陷圖像。
一般來說,缺陷數(shù)據(jù)都要比背景數(shù)據(jù)少很多, 最后通過增強(qiáng)后的數(shù)據(jù),缺陷:背景=1:1,每類在1000幅左右~~~
三、網(wǎng)絡(luò)結(jié)構(gòu)
	具體使用的網(wǎng)絡(luò)結(jié)構(gòu)如下所示,輸入大小就是64x64x3,采用的是截取的小圖像的大小。每個(gè)Conv卷積層后都接BN層,具體層參數(shù)如下所示。
	Conv1:64x3x3
	Conv2:128x3x3 ResNetBlock和DenseNetBlock各兩個(gè),具體細(xì)節(jié)請(qǐng)參考?xì)埐罹W(wǎng)絡(luò)和DenseNet。
	Add:把殘差模塊輸出的結(jié)果和DenseNetBlock輸出的結(jié)果在對(duì)應(yīng)feature map上進(jìn)行相加,相加方式和殘差模塊相同。
	注意,其實(shí)這里是為了更好的提取特征,方式不一定就是殘差模塊+DenseNetBlock,也可以是inception,或者其它。
	Conv3:128x3x3 Maxpool:stride=2,size=2x2 FC1:4096 Dropout1:0.5 FC2:1024 Dropout1:0.5 Softmax:對(duì)應(yīng)的就是要分的類別,在這里我是二分類。
	
關(guān)于最后的損失函數(shù),建議選擇Focal Loss,這是何凱明大神的杰作,源碼如下所示:
def focal_loss(y_true, y_pred):
    pt_1 = tf.where(tf.equal(y_true, 1), y_pred, tf.ones_like(y_pred))
    return -K.sum(K.pow(1. - pt_1, 2) * K.log(pt_1))
數(shù)據(jù)做好,就可以開始訓(xùn)練了~~~
四、整幅場(chǎng)景圖像的缺陷檢測(cè)
上述訓(xùn)練的網(wǎng)絡(luò),輸入是64x64x3的,但是整幅場(chǎng)景圖像卻是512x512的,這個(gè)輸入和模型的輸入對(duì)不上號(hào),這怎么辦呢?其實(shí),可以把訓(xùn)練好的模型參數(shù)提取出來,然后賦值到另外一個(gè)新的模型中,然后把新的模型的輸入改成512x512就好,只是最后在conv3+maxpool層提取的feature map比較大,這個(gè)時(shí)候把feature map映射到原圖,比如原模型在最后一個(gè)maxpool層后,輸出的feature map尺寸是8x8x128,其中128是通道數(shù)。如果輸入改成512x512,那輸出的feature map就成了64x64x128,這里的每個(gè)8x8就對(duì)應(yīng)原圖上的64x64,這樣就可以使用一個(gè)8x8的滑動(dòng)窗口在64x64x128的feature map上進(jìn)行滑動(dòng)裁剪特征。然后把裁剪的特征進(jìn)行fatten,送入到全連接層。具體如下圖所示。
全連接層也需要重新建立一個(gè)模型,輸入是flatten之后的輸入,輸出是softmax層的輸出。這是一個(gè)簡單的小模型。
	
在這里提供一個(gè)把訓(xùn)練好的模型參數(shù),讀取到另外一個(gè)模型中的代碼
#提取特征的大模型
def read_big_model(inputs):
    # 第一個(gè)卷積和最大池化層
    X = Conv2D(16, (3, 3), name="conv2d_1")(inputs)
    X = BatchNormalization(name="batch_normalization_1")(X)
    X = Activation('relu', name="activation_1")(X)
    X = MaxPooling2D(pool_size=(2, 2), strides=(2, 2), name="max_pooling2d_1")(X)
    # google_inception模塊
    conv_1 = Conv2D(32, (1, 1), padding='same', name='conv2d_2')(X)
    conv_1 = BatchNormalization(name='batch_normalization_2')(conv_1)
    conv_1 = Activation('relu', name='activation_2')(conv_1)
    conv_2 = Conv2D(32, (3, 3), padding='same', name='conv2d_3')(X)
    conv_2 = BatchNormalization(name='batch_normalization_3')(conv_2)
    conv_2 = Activation('relu', name='activation_3')(conv_2)
    conv_3 = Conv2D(32, (5, 5), padding='same', name='conv2d_4')(X)
    conv_3 = BatchNormalization(name='batch_normalization_4')(conv_3)
    conv_3 = Activation('relu', name='activation_4')(conv_3)
    pooling_1 = MaxPooling2D(pool_size=(2, 2), strides=(1, 1), padding='same', name='max_pooling2d_2')(X)
    X = merge([conv_1, conv_2, conv_3, pooling_1], mode='concat', name='merge_1')
    X = MaxPooling2D(pool_size=(2, 2), strides=(2, 2), name='max_pooling2d_3')(X)  # 這里的尺寸變成16x16x112
    X = Conv2D(64, (3, 3), kernel_regularizer=regularizers.l2(0.01), padding='same', name='conv2d_5')(X)
    X = BatchNormalization(name='batch_normalization_5')(X)
    X = Activation('relu', name='activation_5')(X)
    X = MaxPooling2D(pool_size=(2, 2), strides=(2, 2), name='max_pooling2d_4')(X)  # 這里尺寸變成8x8x64
    X = Conv2D(128, (3, 3), padding='same', name='conv2d_6')(X)
    X = BatchNormalization(name='batch_normalization_6')(X)
    X = Activation('relu', name='activation_6')(X)
    X = MaxPooling2D(pool_size=(2, 2), strides=(2, 2), padding='same', name='max_pooling2d_5')(X)  # 這里尺寸變成4x4x128
    return X
def read_big_model_classify(inputs_sec):
    X_ = Flatten(name='flatten_1')(inputs_sec)
    X_ = Dense(256, activation='relu', name="dense_1")(X_)
    X_ = Dropout(0.5, name="dropout_1")(X_)
    predictions = Dense(2, activation='softmax', name="dense_2")(X_)
    return predictions
#建立的小模型
inputs=Input(shape=(512,512,3))
X=read_big_model(inputs)#讀取訓(xùn)練好模型的網(wǎng)絡(luò)參數(shù)
#建立第一個(gè)model
model=Model(inputs=inputs, outputs=X)
model.load_weights('model_halcon.h5', by_name=True)
五、識(shí)別定位結(jié)果
上述的滑窗方式可以定位到原圖像,8x8的滑窗定位到原圖就是64x64,同樣,在原圖中根據(jù)滑窗方式不同(在這里選擇的是左右和上下的步長為16個(gè)像素)識(shí)別定位到的缺陷位置也不止一個(gè),這樣就涉及到定位精度了。在這里選擇投票的方式,其實(shí)就是對(duì)原圖像上每個(gè)被標(biāo)記的像素位置進(jìn)行計(jì)數(shù),當(dāng)數(shù)字大于指定的閾值,就被判斷為缺陷像素。
	識(shí)別結(jié)果如下圖所示:


六、一些Trick
對(duì)上述案例來說,其實(shí)64x64大小的定位框不夠準(zhǔn)確,可以考慮訓(xùn)練一個(gè)32x32大小的模型,然后應(yīng)用方式和64x64的模型相同,最后基于32x32的定位位置和64x64的定位位置進(jìn)行投票,但是這會(huì)涉及到一個(gè)問題,就是時(shí)間上會(huì)增加很多,要慎用。
對(duì)背景和前景相差不大的時(shí)候,網(wǎng)絡(luò)盡量不要太深,因?yàn)樘畹木W(wǎng)絡(luò)到后面基本學(xué)到的東西都是相同的,沒有很好的區(qū)分能力,這也是我在這里為什么不用object detection的原因,這些檢測(cè)模型網(wǎng)絡(luò),深度動(dòng)輒都是50+,效果反而不好,雖然有殘差模塊作為backbone。
但是對(duì)背景和前景相差很大的時(shí)候,可以選擇較深的網(wǎng)絡(luò),這個(gè)時(shí)候,object detection方式就派上用場(chǎng)了。
	
	審核編輯:劉清
- 
                                CMOS
                                +關(guān)注
關(guān)注
58文章
6106瀏覽量
241218 - 
                                CCD
                                +關(guān)注
關(guān)注
32文章
898瀏覽量
148034 - 
                                機(jī)器視覺
                                +關(guān)注
關(guān)注
163文章
4685瀏覽量
124717 - 
                                工業(yè)相機(jī)
                                +關(guān)注
關(guān)注
5文章
403瀏覽量
25318 - 
                                機(jī)器視覺系統(tǒng)
                                +關(guān)注
關(guān)注
1文章
86瀏覽量
19451 
原文標(biāo)題:基于深度學(xué)習(xí)識(shí)別模型的缺陷檢測(cè)
文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
全網(wǎng)唯一一套labview深度學(xué)習(xí)教程:tensorflow+目標(biāo)檢測(cè):龍哥教你學(xué)視覺—LabVIEW深度學(xué)習(xí)教程
labview測(cè)試tensorflow深度學(xué)習(xí)SSD模型識(shí)別物體
labview缺陷檢測(cè)算法寫不出來?你OUT了!直接上深度學(xué)習(xí)吧!
labview深度學(xué)習(xí)應(yīng)用于缺陷檢測(cè)
labview+yolov4+tensorflow+openvion深度學(xué)習(xí)
labview深度學(xué)習(xí)檢測(cè)藥品兩類缺陷
基于深度學(xué)習(xí)和3D圖像處理的精密加工件外觀缺陷檢測(cè)系統(tǒng)
基于深度學(xué)習(xí)模型的點(diǎn)云目標(biāo)檢測(cè)及ROS實(shí)現(xiàn)
基于深度學(xué)習(xí)的小樣本墻壁缺陷目標(biāo)檢測(cè)及分類
基于深度學(xué)習(xí)的工業(yè)缺陷檢測(cè)方法
基于深度學(xué)習(xí)的焊接焊點(diǎn)缺陷檢測(cè)
一文梳理缺陷檢測(cè)的深度學(xué)習(xí)和傳統(tǒng)方法
基于深度學(xué)習(xí)的車牌識(shí)別偵測(cè)網(wǎng)絡(luò)模型
深度學(xué)習(xí)在工業(yè)缺陷檢測(cè)中的應(yīng)用
    
          
        
        
基于深度學(xué)習(xí)識(shí)別模型的缺陷檢測(cè)方法
                
 
           
            
            
                
            
評(píng)論