亚洲精品久久久久久久久久久,亚洲国产精品一区二区制服,亚洲精品午夜精品,国产成人精品综合在线观看,最近2019中文字幕一页二页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

二進(jìn)制代碼相似度比較研究技術(shù)匯總

清歡科技 ? 來源:清歡科技 ? 作者:清歡科技 ? 2022-10-13 08:59 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在對二進(jìn)制應(yīng)用程序進(jìn)行安全分析過程中,二進(jìn)制代碼相似度比較技術(shù)是重要的技術(shù)手段之一,基于此技術(shù),可以實(shí)現(xiàn)對惡意代碼極其變種的追蹤,已知漏洞檢測、補(bǔ)丁存在性檢測。該技術(shù)基礎(chǔ)理論依據(jù)是如果源代碼中存在的屬性(惡意代碼、已知漏洞、漏洞修復(fù)補(bǔ)丁)即使相同源代碼編譯出不同的二進(jìn)制代碼(cpu架構(gòu)、OS、編譯選項(xiàng)等會直接導(dǎo)致編譯出來的二進(jìn)制會存在較大的差別),這些屬性在二進(jìn)制代碼中也是存在的(好像是廢話,不然編譯構(gòu)建工具就有問題了)。因此若在一個(gè)樣本二進(jìn)制文件中已知存在上述類型的屬性,如果發(fā)現(xiàn)另外一個(gè)待檢測二進(jìn)制代碼和樣本二進(jìn)制代碼相似,那么可以認(rèn)為待檢測二進(jìn)制代碼也存在相同類型的屬性。

我們知道編譯生成二進(jìn)制代碼的影響因素非常的多,同一套源代碼基于不同因素的組合可以生成非常多不同二進(jìn)制程序。

CPU架構(gòu):X86、ARM、MIPS、PPC、RISC-V;

架構(gòu)位數(shù):32bits、64bits;

OS:Linux、Windows、Android、鴻蒙、VxWork;

編譯選項(xiàng):O0~O3;

安全編譯選項(xiàng):BIND_NOW、NX、PIC、PIE、RELRO、SP、FS、Ftrapv等;

按這些選項(xiàng)可以有5x2x5x4x8 =1600個(gè)組合,從中可以看出二進(jìn)制代碼相似度比較技術(shù)不管是學(xué)術(shù)界還是工業(yè)界來說都是一個(gè)挑戰(zhàn)技術(shù)。但是基于廣闊的應(yīng)用前景,20多年來學(xué)術(shù)界一直在不停的探索和研究新的方法想來解決這個(gè)技術(shù)挑戰(zhàn),并且也取得了一定的成果,下面就該方面的技術(shù)進(jìn)行一些梳理,讓大家對二進(jìn)制代碼相似度比較技術(shù)有一個(gè)大致的了解。

源代碼到二進(jìn)制代碼的生成過程

pYYBAGNGp_2Ab1jJAAClwC8Ks0Y533.png

從源代碼編譯生成二進(jìn)制過程中,有很多有助于理解代碼意圖的信息會被丟失,比如:函數(shù)名稱、變量名稱、數(shù)據(jù)結(jié)構(gòu)定義、變量類型定義、注釋信息等;因?yàn)槎M(jìn)制代碼是給CPU運(yùn)行用的,因此這些信息對計(jì)算機(jī)來說不是必須的,但這些信息對人類來理解代碼是有很大幫助的,這就大大的提升了二進(jìn)制代碼語義理解的難度。其次,為了更好的保護(hù)二進(jìn)制代碼的知識產(chǎn)權(quán)或最大程度的提升對二進(jìn)制代碼的理解難度,還會對二進(jìn)制代碼進(jìn)行混淆處理,使得混淆后的二進(jìn)制代碼與編譯器編譯出來的二進(jìn)制之間又存在很大的不同。

從歷史發(fā)表的二進(jìn)制代碼相似度比較技術(shù)論文統(tǒng)計(jì)來看,有61種二進(jìn)制代碼相似性比較方法,這些在不同研究場所發(fā)表的數(shù)百篇論文涵蓋了計(jì)算機(jī)安全、軟件工程、編程語言和機(jī)器學(xué)習(xí)等計(jì)算機(jī)科學(xué)領(lǐng)域,主要發(fā)表在IEEE S&P、ACM CCS、USENIX Security、NDSS、ACSAC、RAID、ESORICS、ASIACCS、DIMVA、ICSE、FSE、ISSTA、ASE、MSR等頂級刊物上。根據(jù)上述論文得到如下統(tǒng)計(jì)數(shù)據(jù):

輸入比較:一對一(21種)、一對多(30種)、多對多(10種);

比較方法:大多數(shù)方法使用單一類型的比較:相似性(42種)、等效性(5種)和相同(2種);即使方法中僅使用一種類型的比較,它也可能有不同的輸入比較不同;

分析粒度:分為輸入粒度、方法粒度;有8中不同的比較粒度,分別是指令級、基本快、函數(shù)以及相關(guān)集合、執(zhí)行軌跡、程序。最常見的輸入粒度是函數(shù)(26個(gè)),然后是整個(gè)程序(25個(gè))和相關(guān)的基本塊(4)。最常見的方法粒度是函數(shù)(30個(gè)),然后是基本塊(20);

語法相似性:通過語法方法來捕獲代碼表示的相似性,更具體地說,它們比較指令序列。最常見的是序列中的指令在虛擬地址空間中是連續(xù)的,屬于同一函數(shù)。

語義相似性:語義相似性是指所比較的代碼是否具有類似的效果,而語法相似性則是指代碼表示中的相似性。其中有26種計(jì)算語義相似度的方法。它們中的大多數(shù)以基本塊粒度捕獲語義,因?yàn)榛緣K是沒有控制流的直線代碼。有三種方法用于捕獲語義:指令分類、輸入-輸出對和符號公式。

結(jié)構(gòu)相似度:結(jié)構(gòu)相似性計(jì)算二進(jìn)制代碼的圖表示上的相似性。它位于句法和語義相似性之間,因?yàn)閳D可以捕獲同一代碼的多個(gè)句法表示,并可以用語義信息注釋。結(jié)構(gòu)相似性可以在不同的圖上計(jì)算。常見的有控制流圖CFG、過程間控制流圖ICFG、調(diào)用圖CG;(子)圖同構(gòu)—大多數(shù)結(jié)構(gòu)相似性方法是檢查圖同構(gòu)的變化,其中涉及到方法有K子圖匹配、路徑相似性、圖嵌入。

基于特征的相似度:計(jì)算相似性的常見方法(28種)是將一段二進(jìn)制代碼表示為向量或一組特征,使得類似的二進(jìn)制代碼具有相似的特征向量或特征集。這里應(yīng)用最多的是利用機(jī)器學(xué)習(xí)來實(shí)現(xiàn)。

Hash匹配相似度:對于多維向量數(shù)據(jù)相似度快速匹配,通常使用局部敏感hash算法LSH來實(shí)現(xiàn)。

跨架構(gòu)比較方法:對不同CPU架構(gòu)二進(jìn)制代碼的相似度比較,通??珞w系結(jié)構(gòu)方法通過計(jì)算語義相似性來實(shí)現(xiàn)。方法之一是通過轉(zhuǎn)換成與架構(gòu)無關(guān)的中間語言IR來處理(7種),另外一種是使用基于特征的相似性方法(9種)。

分析類型:從分析類型來看有:靜態(tài)分析、動態(tài)分析、數(shù)據(jù)流分析3種類型;

歸一化方法:語法相似性方法通常會對指令進(jìn)行規(guī)范化,來盡量減少語法上的差異;有33種方法使用指令規(guī)范化。具體的包括操作數(shù)移除法、操作數(shù)歸一化法、助記符歸一化法

論文發(fā)表的時(shí)間、發(fā)表刊物、技術(shù)方法匯總

poYBAGNGqAWABLO7AARTgKRVwF8195.png

不同二進(jìn)制代碼相似度比較方法的具體應(yīng)用情況

pYYBAGNGqAmADxvWAADoMUuBQ_s268.png

從上表中可以看出二進(jìn)制代碼相似度比較主要應(yīng)用于漏洞查找,其次是補(bǔ)丁分析和惡意代碼分析;

針對上述不同的技術(shù)方法,分別從魯棒性、準(zhǔn)確度評估與比較、性能指標(biāo)3個(gè)維度進(jìn)行評測,結(jié)果如下:

poYBAGNGqA6ARnB9AARbK0K2eBU214.png

總結(jié):二進(jìn)制代碼相似性比較技術(shù)隨著研究的持續(xù)進(jìn)行,學(xué)術(shù)界雖然取得的一定的進(jìn)步和成果,但仍然還有很多挑戰(zhàn)在等著攻克,小片段的二進(jìn)制代碼比較,源代碼與二進(jìn)制的相似度比較、數(shù)據(jù)相似度比較、語義關(guān)系、可擴(kuò)展性、混淆、比較方法等等都是后續(xù)需要持續(xù)研究的方向。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 二進(jìn)制
    +關(guān)注

    關(guān)注

    2

    文章

    808

    瀏覽量

    42754
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4932

    瀏覽量

    72840
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    如何在vivado上基于二進(jìn)制碼對指令運(yùn)行狀態(tài)進(jìn)行判斷

    在擴(kuò)展指令時(shí)我們常常需要一些手段來幫助我們判斷指令是否能夠成功運(yùn)行、運(yùn)行狀態(tài)是否正確。一方面,我們可以通過模擬器來實(shí)現(xiàn),另一方面,在沒有模擬器的情況下,我們可以通過將所擴(kuò)展指令的二進(jìn)制代碼導(dǎo)入
    發(fā)表于 10-24 06:46

    在vivado上基于二進(jìn)制碼對指令運(yùn)行狀態(tài)進(jìn)行判斷

    在擴(kuò)展指令時(shí)我們常常需要一些手段來幫助我們判斷指令是否能夠成功運(yùn)行、運(yùn)行狀態(tài)是否正確。一方面,我們可以通過模擬器來實(shí)現(xiàn),另一方面,在沒有模擬器的情況下,我們可以通過將所擴(kuò)展指令的二進(jìn)制代碼導(dǎo)入
    發(fā)表于 10-24 06:31

    二進(jìn)制數(shù)據(jù)處理方法分享

    時(shí),我們?nèi)绾稳ソ馕鰯?shù)據(jù)并且應(yīng)用它們。本次的技術(shù)分享文章,我們就從如何傳輸數(shù)據(jù)和解析二進(jìn)制數(shù)據(jù)來一步一步剝絲抽繭,搞清楚他的運(yùn)作原理和二進(jìn)制數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)。
    的頭像 發(fā)表于 07-30 15:41 ?2022次閱讀
    <b class='flag-5'>二進(jìn)制</b>數(shù)據(jù)處理方法分享

    MAX14001/MAX14002可配置、隔離型10位ADC,用于多范圍二進(jìn)制輸入技術(shù)手冊

    MAX14001/MAX14002為隔離型、單通道模數(shù)轉(zhuǎn)換器(ADC),帶有可編程電壓比較器和浪涌電流控制,優(yōu)化用于可配置二進(jìn)制輸入應(yīng)用。MAX14001/MAX14002的二進(jìn)制輸入側(cè)(現(xiàn)場側(cè)
    的頭像 發(fā)表于 06-03 10:15 ?594次閱讀
    MAX14001/MAX14002可配置、隔離型10位ADC,用于多范圍<b class='flag-5'>二進(jìn)制</b>輸入<b class='flag-5'>技術(shù)</b>手冊

    無法使用密度化參數(shù)構(gòu)建OpenVINO?二進(jìn)制,怎么處理?

    無法使用密度化參數(shù)構(gòu)建OpenVINO?二進(jìn)制
    發(fā)表于 03-06 06:51

    74LV4060-Q100二進(jìn)制紋波計(jì)數(shù)器規(guī)格書

    電子發(fā)燒友網(wǎng)站提供《74LV4060-Q100二進(jìn)制紋波計(jì)數(shù)器規(guī)格書.pdf》資料免費(fèi)下載
    發(fā)表于 02-10 14:19 ?0次下載
    74LV4060-Q100<b class='flag-5'>二進(jìn)制</b>紋波計(jì)數(shù)器規(guī)格書

    74LV4060二進(jìn)制紋波計(jì)數(shù)器規(guī)格書

    電子發(fā)燒友網(wǎng)站提供《74LV4060二進(jìn)制紋波計(jì)數(shù)器規(guī)格書.pdf》資料免費(fèi)下載
    發(fā)表于 02-10 14:14 ?0次下載
    74LV4060<b class='flag-5'>二進(jìn)制</b>紋波計(jì)數(shù)器規(guī)格書

    偏移二進(jìn)制二進(jìn)制補(bǔ)碼如何和實(shí)際數(shù)據(jù)對應(yīng),如何轉(zhuǎn)換?

    偏移二進(jìn)制二進(jìn)制補(bǔ)碼如何和實(shí)際數(shù)據(jù)對應(yīng),如何轉(zhuǎn)換,請哪位高手解惑
    發(fā)表于 01-16 06:01

    bcd編碼的應(yīng)用 bcd與二進(jìn)制的區(qū)別

    BCD(Binary-Coded Decimal)編碼是一種二進(jìn)制編碼形式,用于表示十進(jìn)制數(shù)字。它將每個(gè)十進(jìn)制數(shù)字(0-9)直接編碼為一個(gè)四位二進(jìn)制數(shù)。BCD編碼的主要優(yōu)點(diǎn)是易于閱讀和
    的頭像 發(fā)表于 12-20 17:11 ?4066次閱讀

    ADS5562的輸出偏移二進(jìn)制為多少?

    對于此芯片,假定設(shè)定增益為0,輸入差分信號幅值擺動范圍:VCOM±0.9V,VCOM=1.5V,輸入后,ADC對D+與D-分別采樣,當(dāng)采樣到D+為2.4V時(shí),D-為0.6V時(shí),理論上該ADC的輸出偏移二進(jìn)制為多少?
    發(fā)表于 11-27 07:10

    hex格式和二進(jìn)制的區(qū)別

    HEX格式和二進(jìn)制在多個(gè)方面存在顯著的區(qū)別。以下是對這兩者的對比: 一、定義與表示方式 HEX格式 : HEX,全稱為Intel HEX,是一種用于存儲和傳輸數(shù)據(jù)到嵌入式系統(tǒng)(如單片機(jī))的文件格式
    的頭像 發(fā)表于 11-18 15:24 ?2354次閱讀

    為什么Gain=1對應(yīng)的默認(rèn)值不是16位二進(jìn)制補(bǔ)碼的中間數(shù)而是最小數(shù)?

    根據(jù)Gain Calibration中的描述,滿量程校準(zhǔn)碼采用二進(jìn)制補(bǔ)碼;Gain=1對應(yīng)8000h;gain=2對應(yīng)7FFFh;gain=0對應(yīng)0000h。但是對于二進(jìn)制補(bǔ)碼而言,8000h為
    發(fā)表于 11-18 08:12

    在線二進(jìn)制編碼器:數(shù)據(jù)轉(zhuǎn)換的快捷通道

    在數(shù)字時(shí)代,數(shù)據(jù)的快速轉(zhuǎn)換與處理至關(guān)重要。二進(jìn)制編碼,作為計(jì)算機(jī)內(nèi)部數(shù)據(jù)表示的基礎(chǔ),將信息轉(zhuǎn)化為0和1的序列,為數(shù)字世界構(gòu)建了溝通的橋梁。然而,對于非專業(yè)用戶來說,手動進(jìn)行二進(jìn)制編碼既繁瑣又易出錯(cuò)
    的頭像 發(fā)表于 11-15 09:01 ?2571次閱讀

    base64字符串轉(zhuǎn)換為二進(jìn)制文件

    一些編程知識。以下是將Base64字符串轉(zhuǎn)換為二進(jìn)制文件的一般步驟,以及一個(gè)簡單的Python示例代碼。 步驟: 獲取Base64字符串 :首先,你需要有一個(gè)Base64編碼的字符串。 解碼Base64字符串 :使用編程語言提供的庫函數(shù)將Base64字符串解碼為
    的頭像 發(fā)表于 11-10 10:55 ?3502次閱讀

    ASCII碼和二進(jìn)制的轉(zhuǎn)換關(guān)系

    。ASCII碼使用7位二進(jìn)制數(shù)來表示128個(gè)不同的字符,包括大小寫英文字母、數(shù)字0-9以及一些控制字符和標(biāo)點(diǎn)符號。后來,ASCII碼被擴(kuò)展到了8位,即ASCII-8BIT,可以表示256個(gè)不同的字符。 二進(jìn)制
    的頭像 發(fā)表于 11-10 09:50 ?5172次閱讀