リケラボ論文検索は、全国の大学リポジトリにある学位論文・教授論文を一括検索できる論文検索サービスです。

リケラボ 全国の大学リポジトリにある学位論文・教授論文を一括検索するならリケラボ論文検索大学・研究所にある論文を検索できる

リケラボ 全国の大学リポジトリにある学位論文・教授論文を一括検索するならリケラボ論文検索大学・研究所にある論文を検索できる

大学・研究所にある論文を検索できる 「変数選択制約と楕円形判別面を考慮した信用リスク判別モデルの効率的解法と評価 (本文)」の論文概要。リケラボ論文検索は、全国の大学リポジトリにある学位論文・教授論文を一括検索できる論文検索サービスです。

コピーが完了しました

URLをコピーしました

論文の公開元へ論文の公開元へ
書き出し

変数選択制約と楕円形判別面を考慮した信用リスク判別モデルの効率的解法と評価 (本文)

田中, 克弘 慶應義塾大学

2023.09.05

概要

学位論文 博士 (工学)
 
変数選択制約と楕円形判別面を考慮した
信用リスク判別モデルの効率的解法と評価

2023 年度

慶應義塾大学大学院理工学研究科

田中 克弘

i

目次

第1章

序論

1

1.1

研究の背景 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1

1.2

統計型モデルの概観と問題点

. . . . . . . . . . . . . . . . . . . . . . .

2

1.3

統計型モデルの改良に関する先行研究 . . . . . . . . . . . . . . . . . . .

5

1.4

本論文の目的と貢献 . . . . . . . . . . . . . . . . . . . . . . . . . . . .

6

1.5

本論文の構成 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

8

第2章

統計型信用リスクモデルの概観

10

2.1

記号の定義 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

10

2.2

判別モデル . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

11

2.2.1

ロジスティック回帰モデル . . . . . . . . . . . . . . . . . . . . .

11

2.2.2

SVM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

12

2.2.3

エラスティックネット . . . . . . . . . . . . . . . . . . . . . . .

16

2.3

判別モデル評価指標 . . . . . . . . . . . . . . . . . . . . . . . . . . . .

17

第3章

楕円形判別面と変数選択制約による問題の拡張と MISDP 計算用アルゴ
リズム

3.1

3.2

定式化

19
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

19

3.1.1

楕円形への拡張

. . . . . . . . . . . . . . . . . . . . . . . . . .

19

3.1.2

変数選択制約の導入 . . . . . . . . . . . . . . . . . . . . . . . .

20

アルゴリズム . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

22

3.2.1

切除平面アルゴリズム . . . . . . . . . . . . . . . . . . . . . . .

23

3.2.2

MISDP の構造についての解釈 . . . . . . . . . . . . . . . . . .

24

3.2.3

ヒューリスティックアルゴリズム . . . . . . . . . . . . . . . . .

26

第4章

MISDP に拡張した CVaR 最小化モデルの評価

29

4.1

序論 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

29

4.2

モデルの定式化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

31

4.2.1

SVM ベースの CVaR 最小化モデル . . . . . . . . . . . . . . . .

31

4.2.2

楕円形の導入 . . . . . . . . . . . . . . . . . . . . . . . . . . . .

32

4.2.3

変数選択制約の導入 . . . . . . . . . . . . . . . . . . . . . . . .

33

MISDP の解法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

34

4.3.1

切除平面アルゴリズムへの実装 . . . . . . . . . . . . . . . . . .

34

4.3.2

ヒューリスティックアルゴリズムの実装

. . . . . . . . . . . . .

35

計算機実験 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

36

4.4.1

セットアップ . . . . . . . . . . . . . . . . . . . . . . . . . . . .

36

4.4.2

比較用の判別面モデル . . . . . . . . . . . . . . . . . . . . . . .

37

4.4.3

ヒューリスティックアルゴリズムの評価

. . . . . . . . . . . . .

38

4.4.4

汎化性能の評価

. . . . . . . . . . . . . . . . . . . . . . . . . .

40

結論 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

42

MISDP に拡張した bAUC 最大化モデルの評価

44

5.1

序論 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

44

5.2

bAUC 最大化モデル . . . . . . . . . . . . . . . . . . . . . . . . . . . .

46

5.2.1

AUC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

46

5.2.2

bAUC . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

47

5.2.3

bAUC の最大化 . . . . . . . . . . . . . . . . . . . . . . . . . .

49

5.2.4

定式化 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

50

MISDP への拡張 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

51

5.3.1

楕円分類器 . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

51

5.3.2

離散変数を用いた変数選択 . . . . . . . . . . . . . . . . . . . . .

52

5.3.3

混合整数半正定値計画モデル . . . . . . . . . . . . . . . . . . .

53

MISDP の解法 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

53

5.4.1

切除平面アルゴリズムへの実装 . . . . . . . . . . . . . . . . . .

54

5.4.2

分枝切除アルゴリズムへの実装 . . . . . . . . . . . . . . . . . .

54

5.4.3

ヒューリスティックアルゴリズム . . . . . . . . . . . . . . . . .

55

5.4.3.1

ヒューリスティックアルゴリズムのベース部分の実装 .

55

5.4.3.2

高速化のための離散変数の削減部分の実装 . . . . . . .

56

4.3

4.4

4.5
第5章

5.3

5.4

ii

5.5

計算機実験 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

57

5.5.1

比較用の分類器モデル . . . . . . . . . . . . . . . . . . . . . . .

58

5.5.2

セットアップ . . . . . . . . . . . . . . . . . . . . . . . . . . . .

58

5.5.2.1

データセット . . . . . . . . . . . . . . . . . . . . . .

58

5.5.2.2

基本設定 . . . . . . . . . . . . . . . . . . . . . . . . .

59

アルゴリズム性能評価 . . . . . . . . . . . . . . . . . . . . . . .

59

5.5.3.1

詳細設定 . . . . . . . . . . . . . . . . . . . . . . . . .

60

5.5.3.2

計算結果 . . . . . . . . . . . . . . . . . . . . . . . . .

61

判別性能評価 . . . . . . . . . . . . . . . . . . . . . . . . . . . .

65

5.5.4.1

シミュレートデータを用いての判別性能評価 . . . . . .

65

5.5.4.2

実データを用いての判別性能評価 . . . . . . . . . . . .

66

結論 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

73

結論と今後の課題

76

5.5.3

5.5.4

5.6
第6章
参考文献

78

謝辞

84

付録

86

付録 A 4 章で使用されている説明変数の一覧 . . . . . . . . . . . . . . . . . . .

86

付録 B HA+ 内の Step2 の詳細 . . . . . . . . . . . . . . . . . . . . . . . . . .

87

付録 C 5 章で使用されている説明変数の一覧 . . . . . . . . . . . . . . . . . . .

88

iii

iv

図目次

1.1

全体構成 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

8

2.1

最小幾何マージン最大化の例示 . . . . . . . . . . . . . . . . . . . . . .

13

2.2

CVaR 最小化モデルの例示 . . . . . . . . . . . . . . . . . . . . . . . . .

16

3.1

変数の候補数と選択上限数が大きく離れていないケースの解の違い . . .

24

3.2

変数の候補数と選択上限数がある程度離れているケースの解の違い . . .

25

5.1

POE (P (H(w) ≧ q˜)) と bPOE (pq˜(H(w)))����� . . . . . . . . . . . . .

48

5.2

実データの歪度と尖度 . . . . . . . . . . . . . . . . . . . . . . . . . . .

68

5.3

計算手順の概要図

. . . . . . . . . . . . . . . . . . . . . . . . . . . . .

69

5.4

各 bAUC 最大化モデルによるテストデータによる AUC 値 . . . . . . . .

71

5.5

(E) と (L) および機械学習モデルによるテストデータによる AUC 値 . .

73

v

表目次

1.1

CVaR 最小化モデルと bAUC 最大化モデルの違いおよび各検証内容一覧

7

4.1

各データセットの高格付と低格付の企業数 . . . . . . . . . . . . . . . .

37

4.2

パラメータの検証範囲 . . . . . . . . . . . . . . . . . . . . . . . . . . .

38

4.3

アルゴリズム別の計算時間 (単位: 分) . . . . . . . . . . . . . . . . . . .

39

4.4

P = 51 での二次係数の各絶対値の和 . . . . . . . . . . . . . . . . . . .

39

4.5

各アルゴリズムによる解の相対誤差 (単位: %) . . . . . . . . . . . . . .

40

4.6

P = 51,S = 10 における判別面毎の計算時間 (単位: 分) . . . . . . . . .

40

4.7

P = 51 での (ES) による解の AR 値 (単位: %)

. . . . . . . . . . . . .

41

4.8

S = 10 での判別面毎の AR 値 (単位: %) . . . . . . . . . . . . . . . . .

42

5.1

bAUC 最大化モデルに関する先行研究と本章の貢献箇所 . . . . . . . . .

46

5.2

各年度のデータセットの格付別の企業数 . . . . . . . . . . . . . . . . . .

59

5.3

ソフトウェアと計算環境 . . . . . . . . . . . . . . . . . . . . . . . . . .

60

5.4

パラメータの範囲

. . . . . . . . . . . . . . . . . . . . . . . . . . . . .

60

5.5

10800 秒以内に 10 個のインスタンスから求解できた数 . . . . . . . . . .

61

5.6

P = 20 での計算時間 (単位: 秒) . . . . . . . . . . . . . . . . . . . . . .

62

5.7

P = 50 での計算時間 (単位: 秒) . . . . . . . . . . . . . . . . . . . . . .

63

5.8

P = 20 でトレーニングデータから得られた bAUC (単位: %) . . . . . .

64

5.9

P = 50 でトレーニングデータから得られた bAUC (単位: %) . . . . . .

65

5.10

bAUC 最大化モデルおよび LR から得られる AUC 値 (単位: %) . . . .

67

5.11

(E)、(L)、(Q) の評価に用いる説明変数の個数 . . . . . . . . . . . . . .

69

5.12

各 bAUC 最大化モデルによる AUC 値 (単位: %)

70

5.13

モデル別のトレーニングとテストデータによる AUC 値 (単位: %)

. . .

72

5.14

モデル別のテストデータによる bAUC 値 (単位: %) . . . . . . . . . . .

74

. . . . . . . . . . . .

A.1

説明変数の一覧 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

86

C.2

説明変数の一覧 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

88

vi

1

第1章

序論
1 節では研究の背景について、主に個別企業の信用リスクの計測が求められるニーズや
その評価に用いるモデルを紹介し、2 節では本論文で焦点を当てる統計型モデルの説明と
その問題点について解説する。3 節ではそれらの問題点を改善するための方法について、
既存研究で提案されている手法を説明し、4 節で本論文の目的について説明する。5 節で
は論文の構成を述べる。

1.1 研究の背景
リスク管理の重要な領域の一つに信用リスクがある。信用リスクは、広く言えば、特定
の企業の信用力の低下、更に最悪の場合は倒産により被る損失を指す。この信用リスク管
理を行うべき場面が、金融機関には多くある。例えば、債券などの発行体のリスクを有す
る商品を保有している際は、その発行体の信用力の上下により保有する商品の時価の変動
を注視する必要がある。またスワップ取引のように取引先のリスクを有する商品を保有し
ている際は、その取引先の倒産で、相手先と結んでいる金融商品の清算が困難になること
に伴い、損失が発生する可能性がある。このようなリスクの管理を遂行するため、信用リ
スクを適正に評価する方法が必要になる。
信用リスクを評価するアプローチは大きく二つある。一つは、債券やクレジットデリバ
ティブといった信用リスクを含んだ商品の時価を評価するアプローチで、数理ファイナン
スの枠組みを用いる。もう一つは、様々な個別企業の信用リスクを示す倒産確率や格付の
ような指標を推計するアプローチ(統計型モデル)で、主に統計学の枠組みを用いる。本
論文では統計型モデルに焦点を当て、その判別性能の向上を目的として議論を行う。

1.2. 統計型モデルの概観と問題点

1.2 統計型モデルの概観と問題点
信用リスク評価に用いられる統計型モデルは様々なモデルが提案されている。統計型モ
デルの初期的研究の代表に、Altman (1968) が提案した、財務データを用いて、存続企業
と倒産企業を判別する線形回帰式がある。なお、これは Z-score と呼ばれている。これが
出発点となり、今日までに信用リスクを評価するための様々なモデルが提案されている。
その中で特に広く知られているモデルにロジスティック回帰モデル (LR) がある。LR
は、各企業が存続もしくは倒産のいずれかの状態に属する確率を、ロジスティック分布を
前提に定式化して、構築されている。その際、回帰分析の手法を基に、各企業の倒産の可
能性の大小を、Z-score 同様に線形回帰式で表現している。そして、その線形回帰式を入
力値に用いて、倒産確率を推計する。このモデルは、あるサンプルデータに占める倒産企
業の倒産確率および存続企業の存続確率の累積確率を最大化する最尤推定法によりパラメ
ータを推計することで、判別性能を高めることを目的としている。そして、このモデルが
広く知られている理由は、その構築方法がわかりやすいことに加え、パラメータの推計が
凹関数の最大化問題になるので大域的最適解が容易に得られることがある。このモデル
の実証例としてLaitinen and Laitinen (2000) などがあり、また 株式会社日本格付研究所

(2011) は、実際の格付付与の業務に、LR を使用していることを公表している。
他にも最近注目が集まっているモデルに、Zuo and Hastie (2005) が提案したエラス
ティックネットがある。エラスティックネットは、最小二乗法をべースに、Tibshirani

(1996) が提案したラッソ回帰およびHoerl and Kennard (1970) が提案したリッジ回帰の
二つを取り込んだモデルである。これら二つを簡単に説明する。
ラッソ回帰は係数の絶対値の合計値となる 1 ノルムの項と、最小二乗法を組み合わせ
てパラメータ推計を行う回帰モデルである。このモデルは、1 ノルムの項を小さくするこ
とで、求める係数の多くをゼロにする効果を持つので、余分な変数が除去され、変数選択
を促す。リッジ回帰は係数の二乗の合計値となる 2 ノルムの項と、最小二乗法を組み合わ
せてパラメータ推計を行う回帰モデルである。このモデルは、2 ノルムの項を小さくする
ことで、多重共線性の影響を抑制する効果があるので、相関の強い変数同士の選択を回避
できる。そして、これら二つのモデルの特性を導入したエラスティックネットの利点は、
ある程度の変数選択および多重共線性の回避を同時実行できることにある。更にパラメー
タ推計が凸型の二次計画問題の最小化モデルとなることから、大域的最適解が容易に得ら
れるという利便性もある。一方で、ラッソ回帰およびリッジ回帰のハイパーパラメータは

1 つだが、エラスティックネットのハイパーパラメータは 2 つなので、チューニングの
2

1.2. 統計型モデルの概観と問題点

負荷が増加する欠点もある。これらのモデルを用いた実証例として、Tian et al. (2015)
やSaito et al. (2021) はラッソ回帰により、Saito and Yamanaka (2021) はエラスティッ
クネットにより信用リスクの評価を念頭に入れた変数選択を行っている。
エラスティックネットは機械学習モデルに属するが、他にも同じ分野で判別性能の高
さから注目されているモデルに、Vapnik (1995) が提案したサポートベクターマシーン

(SVM) がある。ここでは前提として、倒産企業および存続企業の二つの判別を考える。
このとき、SVM は、その判別のための最適な超平面を、双方のグループ同士の中で最も
近いサンプルおよびその超平面の距離を最大化することで表現する。これはマージン最大
化もしくは幾何マージン最大化と呼ばれている。ただし、このように誤判別が一切なく、
綺麗に判別できるデータは稀であるため、誤判別したサンプルと超平面との距離を最小化
することも併せて実行する。これはソフトマージン最小化と呼ばれている。このソフトマ
ージン最小化により、SVM は、標準的な凸型の二次計画問題の最小化モデルとなるので、
大域的最適解が容易に得られる。
また、この SVM は、正しい判別を適切に実行するための最大化と、誤判別を可能な限
り抑制するための最小化と、二つの最適化を同時に実行するために、一つのハイパーパラ
メータを導入している。 ...

参考文献

謝辞

本研究は、著者が慶應義塾大学大学院理工学研究科後期博士課程在学中に、同大学理工

学部山本零教授の指導のもとに行ったものである。また副査を御担当いただいた同大学理

工学部枇々木規雄教授および今井潤一教授、また一橋大学大学院経営管理研究科中川秀敏

教授には、非常に多くの有益な助言をいただき、本論文を完成に向かって進めることがで

きた。改めて、この場を借りて、御礼申し上げます。

85

付録 A. 4 章で使用されている説明変数の一覧

付録 A

4 章で使用されている説明変数の一覧

表A.1 説明変数の一覧

営業利益 / 売上高

27

売上高 / 買入債務

経常利益 / 売上高

28

売上高 / 運転資本

税引後当期利益 / 売上高

29

売上高 / 流動資産

売上総利益 / 売上高

30

売上高 / 固定資産

販管費 / 売上高

31

営業外収益 / 売上高

経常利益 / 純資産

32

営業外費用 / 売上高

当座資産 / 流動負債

33

売上高 / 社員数

流動資産 / 流動負債

34

経常利益 / 社員数

自己資本 / 総資産

35

有形固定資産 / 社員数

10

留保利益 / 総資産

36

使用総資本

11

総借入 / 総資産

37

総資産

12

固定資産 / 純資産

38

売上高水準

13

現金等価物 / 売上高

39

税引後当期利益水準

14

売上高 / 総負債

40

フリーキャッシュフロー

15

売上高 / 流動負債

41

営業活動キャッシュフロー / 売上高

16

売上高 / 固定負債

42

財務活動キャッシュフロー / 売上高

17

経常収入 / 経常支出

43

営業活動キャッシュフロー / 総資産

18

支払利息 / 有利子負債

44

財務活動キャッシュフロー / 総資産

19

支払利息 / 売上高

45

フリーキャッシュフロー / 売上高

20

運転資本 / 総資産

46

フリーキャッシュフロー / 総資産

21

利払および税引前利益 / 支払利息

47

営業活動キャッシュフロー / 流動負債

22

有利子負債 / 営業キャッシュフロー

48

フリーキャッシュフロー / 流動負債

23

売上高 / 総資産

49

営業活動キャッシュフロー / 総負債

24

売上高 / 自己資本

50

フリーキャッシュフロー / 総負債

25

売上高 / 棚卸資産

51

売上高の増加額 / 売上高

26

売上高 / 売上債権

86

付録 B. HA+ 内の STEP2 の詳細

付録 B

HA+ 内の Step2 の詳細

HA+ の Step2 の具体的な計算手順は次の通り:

˙ k := B

ˆ とする.

Step 1 k ← 0. ϑk := 1.0e−12 、B

k+1

Step 2 次のとおり B

を計算する:

B˙ pk+1

:=

1 ,p2

0,

B˙ pk1 ,p2 ,

if | B˙ pk1 ,p2 |≦ ϑk

(p1 , p2 ∈ P).

otherwise

(2)

˙ k+1 の最小固有値 (Λk+1 ) を計算する。もし Λk+1 ≦ −ε であれば, ϑ := ϑk と

Step 3 B

して、終了する。そうならなければ、ϑk+1 := ϑk × 10、k ← k + 1 とし Step2 に

進む。

ここで ε(> 0) は B&C でも同じく使用されているパラメーターである。

87

付録 C. 5 章で使用されている説明変数の一覧

付録 C

5 章で使用されている説明変数の一覧

表C.2 説明変数の一覧

営業利益 / 売上高

26

売上高 / 売掛金

経常利益 / 売上高

27

売上高 / 買入債務

税引後当期利益 / 売上高

28

売上高 / 運転資本

売上総利益 / 売上高

29

売上高 / 流動資産

営業費用 / 売上高

30

売上高 / 固定資産

経常利益 / 純資産

31

営業外収益 / 売上高

当座資産 / 流動負債

32

営業外費用 / 売上高

流動資産 / 流動負債

33

売上高 / 社員数

純資産 / 総資産

34

経常利益 / 社員数

10

税引後当期利益 / 総資産

35

有形固定資産 / 社員数

11

総借入 / 総資産

36

現金等価物 / 総資産

12

固定資産 / 純資産

37

買掛金の増加額 / 買掛金

13

現金等価物 / 売上高

38

売掛金の減少額 / 売掛金

14

売上高 / 総負債

39

当座資産 / 棚卸資産

15

売上高 / 流動負債

40

長期借入金 / 売上高

16

売上高 / 固定負債

41

営業活動キャッシュフロー / 売上高

17

経常収入 / 経常支出

42

財務活動キャッシュフロー / 売上高

18

支払利息 / 有利子負債

43

営業活動キャッシュフロー / 総資産

19

支払利息 / 売上高

44

財務活動キャッシュフロー / 総資産

20

運転資本 / 総資産

45

フリーキャッシュフロー / 売上高

21

22

利払および税引前利益 /

支払利息

有利子負債 /

46

47

フリーキャッシュフロー /

総資産

営業活動キャッシュフロー /

営業活動キャッシュフロー

流動負債

23

売上高 / 総資産

48

フリーキャッシュフロー / 流動負債

24

売上高 / 純資産

49

営業活動キャッシュフロー / 総負債

25

売上高 / 棚卸資産

50

フリーキャッシュフロー / 総負債

88

...

参考文献をもっと見る

全国の大学の
卒論・修論・学位論文

一発検索!

この論文の関連論文を見る