# 機械学習による経年劣化タイミング解析手法

# 辺 松1 新谷 道広1 廣本 正之1 佐藤 高史1

概要:半導体デバイスの微細化により,負バイアス温度不安定性(NBTI)に代表される経年劣化現象が 大規模集積回路の信頼性を脅かす主要因として顕在化している.回路の信頼性を保証するためには,設計 段階での正確な経年劣化見積りが重要である.本研究では,NBTIに起因する回路の劣化後遅延を,機械 学習を用いることで高精度に推定可能なタイミング解析手法を提案する.数値実験では,提案手法により ISCAS'89 ベンチマーク回路を用いて学習を行ったライブラリを使用し,プロセッサ回路のタイミング解 析を行った.その結果,SPICEによるタイミング解析と比べて誤差 3.42%以内で経年劣化後の遅延を推定 できることを示した.

# Aging-Aware Timing Analysis Based on Machine Learning

Song Bian<sup>1</sup> Michihiro Shintani<sup>1</sup> Masayuki Hiromoto<sup>1</sup> Takashi Sato<sup>1</sup>

**Abstract:** As the transistor process technology continues to scale, correlated dynamic on-chip variations (OCV) posits new challenges to the already complex static timing analysis (STA) process. In this paper, we first address the problems introduced by dynamic OCV. In particular, we focus on the negative bias temperature instability (NBTI) as the dnyamic variation mechanism. We then propose a learning-based static timing analysis (LSTA) library to "predict" the timing of gates by efficiently capturing the correlation between our designed correlated predictors. In the experiment, we used a ISCAS'89 benchmark circuit as a training sample to create the learning-based STA library, and then conducted STA on two processor-scale designs using the library, achieving an absolute maximum error of 3.42%.

## 1. はじめに

近年では 5 nm プロセスノードの研究開発も進められて いるなど [1],集積回路の微細化は物理的な限界に近づい てもなお継続され続けている.極めて微細なプロセス世代 では,デバイスレベルの様々なばらつきを考慮した設計が 求められる.ばらつきは,静的ばらつきと,動的ばらつき に大別される.静的ばらつきはチップの製造により決定さ れる時不変の成分であり,動的ばらつきはチップの動作に 伴って変動する成分をさす.回路中の動的ばらつきにおい ては,ばらつき変数間に相関があることが知られている. 静的タイミング解析 (STA) による解析では,相関を適切に 考慮しないと予測精度が著しく劣化する.

STA では、様々なオンチップばらつき (OCV) を考慮す るための工夫がなされてきているが、考慮可能なばらつき は主に静的ばらつきに限定されている.また、微細化の進 展とともに、その精度が不十分となりつつある. OCV を 考慮できるライブラリとして, Liberty Variation Format (LVF) [2] がある. このライブラリでは,遅延変動を互いに 独立なガウス分布に従うばらつきによるものと仮定する. 16 nm 以下のテクノロジーノードでは,非ガウス分布のば らつきを扱う必要があるとの報告があるように [3],分布 形状に関する強い仮定は徐々に成立しなくなりつつある.

LVF フォーマットで仮定されている変数間の独立性も成 立しない場合が多い.高次元の変数を扱う問題では一般に 変数間の相関を適切に考慮する必要があり,近年になって 学習ベースのタイミング解析が研究され始めている.例え ば、クロストーク等のシグナルインテグリティ (SI)を考慮 しないツールを用いて,SIを考慮したタイミング解析結果 を人工ニューラルネットワーク (ANN)やサポートベクタ マシン (SVM)により得る試みがある [4].また,SRAM 回 路のタイミング故障を予測する [5],複数ベンダのツールに よる解析結果を用いてタイミング予測精度を向上する [6] 等の使い方も検討されている.これらの手法では,通常の STA 実行後の追加のステップとして,学習に基づく補正を 行い解析精度を向上させる.

いま,動的ばらつきを考えると,状況はより複雑となる.

京都大学大学院情報学研究科通信情報システム専攻 606-8501京都府京都市左京区吉田本町 paper@easter.kuee.kyoto-u.ac.jp



 図 1 論理和ゲートの立下り入力信号におけるトランジスタのしき い値電圧変動と遅延時間変動 (ΔV<sub>th</sub>-ΔDelay)の関係

特に, 負バイアス温度不安定性 (NBTI) やホットキャリア 注入 (HCI) は、デバイス特性が時間とともに劣化する代 表的な経年劣化現象である [7-9]. タイミング解析フロー において,経年劣化を考慮することは新たな課題となって いる. タイミングライブラリにしきい値電圧 Vth を変数と して取り込むことが容易な解決策だが、これにより変数 の次元が高くなるとともに変数間の相関を扱う必要が生 じる.図1に複数トランジスタのしきい値間の典型的な 相関の例を示している.非反転論理ゲート(本例では OR ゲート:図2参照)中のトランジスタM1のしきい値電圧 変動 ΔV<sub>th</sub> による遅延変動は, 前後のゲートの論理相関の ため M2 と M3 のしきい値変動の関数となっている. すな わち,これら3つのトランジスタのしきい値電圧変動の組 合せにより遅延変動量が決まるが、例えば M1 による遅延 変動は図中の線上の値に限定される. 広く用いられている 表参照 (LUT) ベースのライブラリは、電流ソースモデル (CSM) [10] 等の最近のものを含め、基本的に内挿により遅 延値を計算する. このようなライブラリでは,相関を考慮 しなければテーブル作成時間とデータ量はトランジスタ数 に対し指数的に増大する.

効率よく正確な遅延計算を実現するために,機械学習に よる回帰に基づく STA を提案する.機械学習により高次 元の変数間の相関をモデル化し,従来よりもずっとコンパ クトなライブラリを実現できる.加えて,提案する機械学 習による STA (LSTA と略す)は,経年劣化以外にも適用 できる.本論文の貢献は,以下のようにまとめられる.

- 高変数次元 STA 実現における課題の明確化: NBTI 考慮解析に代表される動的ばらつき解析では、ロジッ クセル内のトランジスタのしきい値を変数とする高次 元のライブラリを扱う必要があることを示す。
- 学習ベースのSTAの提案: LUTによる内挿ではなく、
  学習による回帰で遅延計算を行うSTA手法を提案する.機械学習を用いることで高次元変数間の相関を効率よく見出すことが出来るため、提案手法は上記高変数次元STAに特に適する.
- 機械学習方式の比較評価:複数の機械学習アルゴリズムをLSTAに適用し、複数の回路でタイミング予測精度を評価する.大規模回路での最大絶対値誤差は3.42%、全テスト回路での誤差は4%であった.



図2 A入力が立下り遷移, B入力がLow 固定の場合の OR ゲート

#### 2. 既存研究

HCIや NBTI に起因するタイミング劣化を高精度に予 測することは,経年劣化の緩和手法にとって非常に重要 であり,近年複数の研究が行われている [11,12]. STA で NBTI のような動的ばらつきを計算する基本的な手法とし て、劣化による変動を STA ライブラリの次元を増やすこ とが考えられる. 文献 [12] では一般的な二次元 STA ライ ブラリを n 次元に拡張する手法を提案している. ここで, nはキャラクタライズの対象となるゲートに含まれるトラ ンジスタ数である.この手法には,複合ゲートをキャラク タライズする際にライブラリ規模が指数関数的に大きくな る課題がある. さらに, 内挿によるタイミング予測は高次 元の計算において精度が低い課題も存在する. 文献 [11] で は、STA ライブラリに劣化を表す一次元の変数だけを追加 することで NBTI 起因のタイミング劣化を考慮する手法を 提案している. 本手法ではライブラリ・キャラクタライズ 時のオーバヘッドを抑制し計算時間も短くなる利点がある が、トランジスタのステージ間に相関がある場合は精度が 低下する課題がある.

上述のように、既存手法としては、STA ライブラリに n次元の変数を追加することが主流であるが、その場合は変 数間の相関が複雑化し、不必要な変数空間でのキャラクタ ライズが行われる.これは、i) 縦積み効果、ii) トランジス タ間の相関、等に起因している.これらの課題について、 図 2 に示す論理和 (OR) ゲートを用いて具体的に説明す る.i) に関して、OR ゲートの初段の M1 のゲート端子が 立下り遷移した場合を考える。M2 は Low に固定されてい るが、M1 と M2 に流れるドレイン電流は M2 の  $V_{\rm th}$  にも 影響を与える [13].従って、M2 の  $V_{\rm th}$  が劣化することで、 遷移時間は M2 の  $\Delta V_{\rm th}$  に応じて増大する.同様に、ii) で M1 と M2 を通る信号遷移の遅延は次段の M3 の信号遷移 にも影響する。NBTI と HCI を考えた場合、M3 の劣化は M1 と M2 の結合確率と完全に相関する.

1章で示した図1は、図2に示すORゲートのシミュ レーション結果であり、実線は相関を考慮した場合、点線 はそれぞれの pMOSトランジスタの $\Delta V_{\text{th}}$ が無相関に劣 化した場合である.  $\Delta V_{M2}$ を0.0Vに固定した場合、遅延 劣化は $\Delta V_{M3}$ に左右されない(黒い実線).また前述のと おり、 $\Delta V_{M2}$ が劣化する場合(赤い実線)、 $\Delta V_{M3}$ は $\Delta V_{M1}$ に応じて劣化し、この場合の遅延劣化は $\Delta V_{M3}$ の関数とな る.各 pMOS の $\Delta V_{\text{th}}$ の劣化が独立に生じると仮定した場 合、黒と赤の点線もキャラクタライズされるが、実際には 起こり得ない事象であるため不要な計算である.また、こ れらの相関は非線形であることから実装は容易ではない.



図3 LSTA のためのタイミング・ライブラリ構築の流れ



図 4 LSTA によるタイミング解析の流れ

また,実装できたとしても,内挿に基づいた STA ライブ ラリでこのような複雑な相関を考慮する場合,すべての pMOS の $V_{\text{th}}$  ばらつきの組み合わせを高密度なグリッドで キャラクタライズする必要がある.この多次元グリッドに よるライブラリ空間の複雑さは $O(k^n)$ となり,実設計への 適用は容易ではない.ここでkは一つの入力次元に必要な 点の数で,nは pMOS の数(即ち次元の数)を表す.

## 3. 機械学習による静的タイミング解析

前章で述べた NBTI 起因の問題を解決するため,本論文 では機械学習を用いることにより,高次元変数に対応可能 なタイミング・ライブラリの構築手法を提案する.

本章ではまず STA に機械学習を適用する理由および適 用箇所について述べ,その後提案手法である LSTA の詳細 について述べる.

#### 3.1 機械学習の必要性および適用箇所

従来,高い精度が求められるタイミング解析において機 械学習が用いられることは少なかった.現在広く用いられ ている NLDM ライブラリや CSM [10] では,あらかじめ計 算しておいた遅延値のルックアップ・テーブル (LUT) を 保持し,その値を補間することにより高精度な STA を実 現している.これら一般的な STA では扱う変数の次元は 高々 2 次元程度であることが多く,現実的な規模の LUT を作成することが可能であった.

しかし、NBTIや HCI に起因する遅延劣化を考慮した STA を行うには、相関を持つ高次元の変数を扱う必要が ある. 高次元変数を入力とする LUT はその次元数の指数 オーダーで規模が増大するため、単純な LUT によりライ ブラリを構築することが困難となる. 従って, このような 問題に対しては単純な LUT ではなく, 機械学習によるコ ンパクトな回帰モデルを用いることにより, 効率良く劣化 後遅延を予測できると考えられる.

そこで本研究では、従来の LUT 補間による STA と、機 械学習による回帰モデルに基づく STA とを適材適所に組 み合わせた、新たな高効率 STA を提案する.具体的には、 劣化前の STA については従来と同じくテーブル補間によ る高精度な計算を行い、高次元の解析が必要となる劣化後 STA については機械学習による高効率な予測モデルを使用 する.以下、提案手法の詳細について説明する.

# 3.2 LSTA によるタイミング解析手法の流れ3.2.1 ライブラリの構築

提案手法によるタイミング・ライブラリ構築の流れを 図3に示す.まず,通常のSTAにより劣化前遅延の2次 元LUTを作成する(図3左側).その後,学習対象の回路 群(訓練データ)に対し,劣化前と劣化後の遅延解析をそ れぞれ行い,それらを用いて劣化後遅延のモデルを学習す る(図3右側).劣化前後の遅延解析は,数学モデルや実測 に基づく高精度な解析手法を使用する.劣化モデルの学習 においては,劣化前遅延およびその他のパラメータを予測 変数,劣化後遅延を目的変数とする回帰モデルを用いる. 学習された劣化モデルはSTA ライブラリとして統合され, タイミング解析の際に使用される.

#### 3.2.2 回帰による遅延劣化モデル

一般的な回帰モデルは、予測変数から目的変数への対応 付けを行う連続関数として表現される.本研究では各ゲー トの劣化モデルとして、劣化後遅延を目的変数、3.3節で議 論するパラメータ群を予測変数とする、回帰モデルを使用 する.つまり、劣化モデルは以下のように定式化される.

$$t_{\text{aged gate}} = \exists h g \mathfrak{B} \approx f(\mathfrak{F} | \mathfrak{I} \mathfrak{G} \mathfrak{B})$$
 (1)

ここで  $t_{aged gate}$  はある特定のゲートの劣化後遅延である. 高精度な劣化予測を実現するためには, i) 予測された劣化 後遅延  $t_{aged gate}$  と実際の劣化後遅延  $t_{aged gate}$  との誤差を 最小化する最良の回帰関数 f の決定,および ii) 劣化後遅 延  $t_{aged gate}$  を最も良く表現する予測変数のパラメータ群 の選択,の2点が重要となる.i), ii) についてはそれぞれ 3.3 節, 3.4 節にて詳しく議論する.

3.2.3 タイミング解析

提案ライブラリを用いたタイミング解析フローの概要を 図4に示す.基本的な流れは一般的なSTAと同様である が,劣化後遅延予測の際に機械学習アルゴリズムを使用す る点が大きな相違点である.そのために,次節で議論する パラメータ群を予測変数として用いている.

なお提案手法によるタイミング解析の精度は,機械学習 の性質上,ライブラリ構築時に使用する訓練データに依存 する.そのため,訓練データとして使用する回路群の選定 は重要な検討項目となる.

#### 3.3 予測変数として用いるパラメータの選択

回帰モデルの生成において,予測変数として使用するパ ラメータの選択は重要な問題である.本研究では機械学習 により遅延予測を行うことを目的とするが,正確な遅延値 は回路シミュレーションにより求めることができる.つま り,回路シミュレーションで使用されるものと同じパラ メータを用いることで,より正確な回帰モデルが学習でき ると考えられる.しかしそれは同時に学習に要する演算コ ストの増大にもつながるため,適切なパラメータ数に絞る 必要がある.具体的には,CSMのように波形そのものを パラメータとすることが考えられるが,演算コストの観点 から機械学習には不適切である.

そこで本研究では NLDM にならい,各ゲートに対する 入力スルーと負荷容量を予測変数として用いることにす る.これは遅延予測に必要なパラメータとしては最小限の ものであり,提案手法の下界性能を示すことにもなる.劣 化予測は以下のように定式化される.

$$\Delta t_{\text{gate}} = f(t_{\text{fresh}}, \Delta V_{\text{th}1}, \dots, \Delta V_{\text{th}n}, t_{\text{slew}}, C_{\text{load}}) \quad (2)$$
$$t_{\text{aged gate}} = t_{\text{fresh}} + \Delta t_{\text{gate}}, \qquad (3)$$

ここで, $t_{\text{fresh}}$  は通常の NLDM ライブラリから求められる 劣化前遅延, $\Delta V_{\text{th}i}$  は i 番目の pMOS のしきい値電圧変動 である. $t_{\text{slew}} \geq C_{\text{load}}$  はそれぞれ,通常の NLDM ライブ ラリ参照時に用いられる入力スルーと負荷容量である.劣 化を表わす要素として  $\Delta V_{\text{th}i}$ を用いる理由は以下の通りで ある.1つは,しきい値電圧と遅延時間との間には密接な 関係があること,もう1つは,しきい値電圧変動を引き起 こす HCI 等の他の様々な劣化現象にも拡張可能であること である.なお,劣化後遅延  $t_{\text{aged gate}}$  は式 (3) を経由せずに 回帰関数 f の出力として直接求めることも可能であるが, ここでは劣化による遅延の増分を学習していることを直観 的に表すため,式 (2),(3) の 2 式で表現している.

#### 3.4 学習アルゴリズム

機械学習には様々な手法が存在する.本研究では代表的 なアルゴリズムとして、線形回帰と決定木の2種類に焦 点を当てる.線形回帰モデルは広く用いられる手法である が、その性能はデータの分布に大きく依存する.本研究で は線形回帰モデルとして,放射基底関数(RBF)を用いたサ ポートベクタ回帰 (SVR) を採用する. 一方, 決定木 (DT) は非線形なデータに対して性能を発揮することが知られて いる [14]. しかし、単一の決定木を用いた場合、データに 内在する全ての非線形性を学習しようとしてしまい、過学 習に陥る可能性が高くなる.そのため本研究では、過学習 を回避する代表的な手法であるバギング [15] とブースティ ング [16] を採用する. バギングは, 複数の回帰モデル (こ こでは決定木に相当する)を使用し、その個々の出力の平 均を最終的な出力とする手法である. これにより過学習を 防ぎ性能を向上させることが可能となる.本研究ではバギ ングの一種として、ランダム・フォレスト (RF) [17] を採 用する.一方,ブースティングもバギングと同様に回帰モ デルの集合により出力を決定するが,個々の出力の重みを



図5 LSTA フレームワークを用いたパス遅延評価の流れ

訓練データから学習する点が異なる. ブースティングの代 表としては AdaBoost [18] を採用する.

なお、学習アルゴリズムによってはデータの正規化により精度が向上することが知られている [19]. しかし正規化の導入は演算コストの増加にもつながりタイミング解析時間の増大を招く.本研究では正規化の効果および解析時間への影響を検討するため、各学習アルゴリズムに対して、正規化  $\hat{x} = \frac{x}{||x||_0}$ の適用有無それぞれについて実験を行った.

#### 4. 数值実験

#### 4.1 実験条件

ISCAS'89 ベンチマーク回路 [20] および 2 種のプロセッ サ回路に対して経年劣化考慮タイミング解析を行った. プロセッサは, 商用プロセッサコンパイラから生成され た5段パイプラインプロセッサ [21] (以下, "Shino" と呼 ぶ)と、MIPS32命令セットを備えた5段パイプラインプ ロセッサ [22] (以下 "Kotori" と呼ぶ)を用いた. 論理合 成は, Nangate 45 nm Open Cell Library [23] と商用論理 合成ツール [24] を用いて行った.ゲートレベル回路であ る ISCAS'89 ベンチマーク回路は,6種のセル (NAND, NOR, AND, OR, INV, DFF) を用いて再マッピングを 行った. 市販 STA ツール [25] を用いて最大遅延パスを抽 出し, Shino と Kotori の評価対象パス数はそれぞれ 25,446, 24,978 であった. NBTI 劣化後のパス遅延値の計算は,温 度 400 K の環境で 10 年動作する条件下で行った. また, 経 年劣化ライブラリの生成における学習でも同様の条件下で 行われた.提案手法の計算時間評価は, Intel Xeon E5-2630 v2 2.60 GHz CPU を搭載した Linux PC 上で行った. ライ ブラリ・キャラクタライゼーションにおける LUT 生成は, SPICE シミュレータ [26] により得た.提案手法は Python で実装しており, Intel Xeon E5-2630 プロセッサ上で1ス レッドで実行した.

本実験の評価フローを図5に示す.まず,ISCAS'89ベン チマーク回路のs38584を用いて劣化遅延の学習により劣化 モデルを生成する.その後,劣化モデルを用いて,他回路へ のタイミング解析に適用する.ここでは,予測変数に関す るゲート遅延をサンプルとしており,訓練対象のs38584は 18,119サンプルを含む.訓練回路はテスト回路よりも多く のサンプルを含むが,s38584の最長パス遅延値は2.32 nsで 全パス数は11,052にすぎない.20kパスを有するプロセッ サ回路と比べて,訓練回路の回路規模は十分に小さいと言



図 6 Shino における LUT による劣化前パス遅延値と SPICE によ る劣化後パス遅延値の比較



図 7 Shino における LUT による劣化後パス遅延値 [11] と SPICE による劣化後パス遅延値の比較

える. 学習アルゴリズムにおける訓練と予測の過程は回路 の各ゲートを対象としているが、本実験における予測精度 の評価はパス単位で行うとし、提案手法によるパス遅延予 測と SPICE によるパス遅延計算結果を比較する. 予測精度 は、絶対最大誤差 (Absolute Maximum Error: AME)と正 規化最小二乗誤差 (Normalized Root Mean Square Error: NRMSE) により評価する. NRMSE は、次式により与え られる.

$$NRMSE = \frac{\sqrt{\sum_{i=1}^{n} (D_{\rm p} - D_{\rm t})^2}}{\sqrt{n}(D_{\rm t_{max}} - D_{\rm t_{min}})} \tag{4}$$

ここで、 $D_p$  は予測パス遅延値で、 $D_t$  は SPICE により計算された正解値である.n はパス数を表し、 $D_{t_{max}}$  と  $D_{t_{min}}$ は SPICE により得られた最大パス遅延値と最小パス遅延値である.

#### 4.2 実験結果:劣化後パス遅延値の予測

まず,図 6,7,8に,Shino について SPICE で計算した 劣化後パス遅延値との比較を示す.図 6は,劣化を考慮し ていない 2 次元 LUT を用いた場合との比較である.図 6 に示すように,NBTI によりパス遅延値が大きく劣化して いることが分かる.続いて,図 7 に,NBTI によるしきい 値電圧の劣化を追加した 3 次元 LUT [11] を用いた劣化後 パス遅延値との比較を示す.この図から,劣化後パス遅延 値の予測に過小見積りが生じており,手調整等により精度



- 図8 Shino における提案手法による劣化後パス遅延値と SPICE による劣化後パス遅延値の比較(青線と緑線はそれぞれ±3%の 誤差)
- 表 1 SPICE シミュレーションと提案タイミング解析によるパス遅 延予測の比較

| 回路     | サンプル数 | AME (%) | NRMSE (%) | 実行時間 (s) |
|--------|-------|---------|-----------|----------|
| Shino  | 5281  | 3.34    | 0.93      | 0.22     |
| Kotori | 5813  | 2.86    | 0.24      | 0.23     |
| s27    | 25    | 2.23    | 1.3       | 0.11     |
| s1494  | 378   | 1.58    | 2.1       | 0.12     |
| s5378  | 1383  | 4.06    | 1.3       | 0.11     |
| s13207 | 2262  | 3.53    | 1.3       | 0.24     |

表 2 RF と SVR による AME の比較

|               | 正規化あり   | 正規化なし   |
|---------------|---------|---------|
|               | AME (%) | AME (%) |
| $\mathbf{RF}$ | 3.42    | 3.42    |
| SVR           | 4.23    | 9.94    |

を改善する必要があることが分かる.最後に,図8に,提 案手法により機械学習を用いて予測した劣化後パス遅延値 との比較を示す.AMEは3.4%で,これらのパス遅延値の 相関係数は0.9991となっており,提案するLSTAフレー ムワークが精度良く劣化後パス遅延値を予測できている.

表1に、サンプル数,AME,NRMSE,提案手法の実行時間の比較を示す。全ての結果は、s38584を訓練データとして得られた劣化モデルを用いて劣化後パス遅延値を計算している。用いた機械学習アルゴリズムはRFで、決定木の数と木の高さはそれぞれ200と20とした。これらのハイパーパラメータは訓練データを用いた試行により実験的に求めた数値であるが、良好な結果を得ている。RFは決定木を用いており、決定木ベースの回帰モデルは実行時間はO(log(n))で制限されるため、プロセッサのような大規模回路に対しても非常に小さい実行時間で求めることができる。ここで、nは訓練サンプル数である。

#### 4.3 実験結果:機械学習アルゴリズム間の比較

続いて,機械学習アルゴリズム間の予測性能比較を行う.表2に,Shinoに対するRFによる回帰モデルとSVR ベースの線形回帰モデルによる比較を示す.SVRは正規 化を行わない場合は予測精度に劣化が見られるが,RFは 正規化の有無によるパス遅延の推定精度に変化はない.ま た,SVRよりもRFによるタイミング予測精度が優れてい る.図9に正方向(過大見積り)と負方向(過小見積り)



図 9 Shino におけるアルゴリズム毎の劣化後パス遅延予測性能に おける正方向および負方向の最大誤差の比較

の最大誤差について示す.単一決定木と比較して,RFと AdaBoost は設計間の学習により適していると言える.ま た,RF(バギング)とAdaBoost(ブースティング)は同 等に良く作用していることが分かる.

#### 5. まとめ

本稿では、NBTI 起因の遅延劣化を高精度に推定可能な 機械学習に基づくタイミング解析手法を提案した.提案手 法では、比較的小規模の回路を用いてゲート毎のNBTI 劣 化の遅延を"学習"し、より大規模な評価対象回路の経年 劣化後パス遅延を予測する.5段パイプラインプロセッサ を評価対象とした数値実験では、複数の学習アルゴリズ ムによるタイミング劣化の予測性能を評価した.その結 果、SPICE によるタイミング計算結果と比べて、最大誤差 3.42%の精度で経年劣化後のパス遅延を予測できることを 示した.

#### 謝辞

本研究の一部は JSPS 科研費基盤研究 (B) 26280014,若 手研究 (B) 15K15960 の助成を受けた.また本研究の一部 は,東京大学大規模集積システム設計教育研究センターを 通し,日本シノプシス合同会社の協力で行われた.

#### 参考文献

- Muralidhar, R., Lauer, I., Cai, J., Frank, D. J. and Oldiges, P.: Toward Ultimate Scaling of MOSFET, Vol. 63, No. 1, pp. 524–526 (2016).
- [2] Kahng, A. B.: New Game, New Goal Posts: A Recent History of Timing Closure, *Proceedings of IEEE/ACM Design Automation Conference*, pp. 1–6 (2015).
- [3] Ghanta, P. and Keller, I.: Importance of Modeling Non-Gaussianities in Static Timing Analysis in sub-16nm Technologies, Proceedings of International Workshop on Timing Issues in the Specification and Synthesis of Digital Systems (TAU), pp. 62–66 (2016).
- [4] Kahng, A. B., Luo, M. and Nath, S.: SI for free: machine learning of interconnect coupling delay and transition effects, *Proceedings of IEEE International Workshop on System Level Interconnect Prediction*, pp. 1–8 (2015).
- [5] Chan, W. T. J., Chung, K. Y., Kahng, A. B. et al.: Learning-based prediction of embedded memory timing failures during initial floorplan design, *Proceedings of IEEE/ACM Asia and South Pacific Design Automation Conference*, pp. 178–185 (2016).

[7] Alam, M. A. and Mahapatra, S.: A comprehensive model of PMOS NBTI degradation, *Microelectron. Reliab.*, Vol. 45, No. 1, pp. 71–81 (2005).

[6]

- [8] Mahapatra, S., Bharath Kumar, P. and Alam, M.: A new observation of enhanced bias temperature instability in thin gate oxide p-MOSFETs, *IEEE International Electron Devices Meeting Technical Digest*, pp. 337–340 (2003).
- Chaparala, P., Shibley, J. and Lim, P.: Threshold voltage drift in PMOSFETS due to NBTI and HCI, pp. 95–97 (2000).
- [10] Croix, J. F. and Wong, D.: Blade and razor: cell and interconnect delay analysis using current-based models, *Proceedings of IEEE/ACM Design Automation Conference*, pp. 386–389 (2003).
- [11] Bian, S., Shintani, M., Morita, S., Hiromoto, M. and Sato, T.: Nonlinear Delay-Table Approach for Full-Chip NBTI Degradation Prediction, *Proceedings of IEEE International Symposium on Quality Electronic Design*, pp. 307–312 (2016).
- [12] Firouzi, F., Kiamehr, S., Tahoori, M. and Nassif, S.: Incorporating the Impacts of Workload-dependent Runtime Variations into Timing Analysis, *Proceedings of IEEE Design Automation and Test in Europe*, pp. 1022–1025 (2013).
- [13] University of California, Berkeley: BSIM4v4.7, University of California, http://www-device.eecs. berkeley.edu/bsim/Files/BSIM4/BSIM470 (2011).
- [14] Pal, M. and Mather, P. M.: An assessment of the effectiveness of decision tree methods for land cover classification, *Remote sensing of environment*, Vol. 86, No. 4, pp. 554–565 (2003).
- [15] Breiman, L.: Bagging predictors, Machine learning, Vol. 24, No. 2, pp. 123–140 (1996).
- [16] Schapire, R. E., Freund, Y., Bartlett, P. and Lee, W. S.: Boosting the margin: A new explanation for the effectiveness of voting methods, *Annals of statistics*, pp. 1651–1686 (1998).
- Breiman, L.: Random forests, *Machine learning*, Vol. 45, No. 1, pp. 5–32 (2001).
- [18] Freund, Y. and Schapire, R. E.: A desicion-theoretic generalization of on-line learning and an application to boosting, *Proc. EuroCOLT*, Springer, pp. 23–37 (1995).
- [19] Ben-Hur, A. and Weston, J.: A user's guide to support vector machines, *Data mining techniques for the life sci*ences, pp. 223–239 (2010).
- [20] Brglez, F., Bryan, D. and Koiminski, K.: Combinational profiles of sequential benchmark circuits, *Proceedings of IEEE International Symposium on Circuits and Systems*, pp. 1929–1934 (1989).
- [21] Synopsys, Inc.: Processor Designer G-2012.09.
- [22] OpenCores.org: OpenCores, http://www.opencores. org.
- [23] Si2.org: Nangate 45nm Open Cell Library, http://www. si2.org.
- [24] Synopsys, Inc.: Design Compiler I-2013.06.
- [25] Synopsys, Inc.: PrimeTime Fundamental H-2013.06.
- [26] Synopsys, Inc.: *HSPICE I-2013.12*.