@techreport{oai:ipsj.ixsq.nii.ac.jp:00224765, author = {伊藤, 愼崇 and 橋本, 正樹 and 大塚, 玲}, issue = {20}, month = {Feb}, note = {ソースコードが提供されないようなソフトウェアの脆弱性検出,バグ検出や盗用検出において,バイナリコードの類似性検出は有用な解析手法である.加えて,近年の IoT 機器普及により異なるアーキテクチャ間における類似性検出の需要は高まりつつある.一方,異なるアーキテクチャ間における基本ブロック単位の類似性検出にニューラル機械翻訳モデルを用いて特徴量を抽出する手法を適用した例は少ない.本研究では,既存のニューラル機械翻訳モデルによる基本ブロックの特徴量抽出手法に比べ,高速に特徴量を抽出し,高い精度で異なるアーキテクチャ間での類似性を検出する手法を提案する.また,先行研究において必要であった特徴量の線形変換を不要とする訓練方法を採用することで,学習データが少ない場合においても精度が低下しないことを示す.評価実験では,3 つの既存研究で提案された手法と同一データセットでの検索精度 (P@1) を比較した結果,我々の手法が最も高い 92% を達成している.}, title = {ニューラル機械翻訳モデルを用いたバイナリコード類似性検出のための特徴量抽出手法}, year = {2023} }