10907筆惡意程式資料

10907筆惡意程式資料

## 本次競賽中的每一筆惡意程式 (malware) 均有一組可獨立辨識的 md5 編碼,競賽者須透過人工智慧訓練、推論技術,對每一筆惡意程式進行類別 (class) 可能性的歸屬判定。 1. 本次競賽以 .zip 格式提供兩組資料集壓縮檔案供參賽者下載,一為訓練集 (train.zip),另一為測試集 (test.zip)。參賽者下載至本地端後進行解壓縮,將可在訓練集中獲得 5,907 筆惡意程式,以及在測試集中獲得 5,000 筆惡意程式,每筆惡意程式均為 .bytes 格式,且已經將檔頭 (header) 去除。 2. 訓練集解壓縮後除了 .bytes 惡意程式檔外亦附帶提供 train.csv 檔案,檔案內載明每一筆 md5 惡意程式的正確歸屬類別,即每一橫列的惡意程式 md5 欄均有對應的十類惡意程式類別欄位,欄位為 "1" 即歸屬於該類惡意程式,其餘九個欄位均為 "0"。 3. 參賽者推論的結果以 .csv 方式上傳,在此提供上傳範例檔案:ResultSample.csv
train.zip
Hash: MD5 - 3f6c2cf0b1d2dbfcd2c4a9f64ef85a1f

訓練資料集

test.zip
Hash: MD5 - 9a2b55fc4723c725593ae9411ea2ee38

測試資料集

ResultSample.csv
Hash: MD5 - b4f454abe2a12c478edce131d30c2edb

上傳範例檔案