リケラボ論文検索は、全国の大学リポジトリにある学位論文・教授論文を一括検索できる論文検索サービスです。

リケラボ 全国の大学リポジトリにある学位論文・教授論文を一括検索するならリケラボ論文検索大学・研究所にある論文を検索できる

リケラボ 全国の大学リポジトリにある学位論文・教授論文を一括検索するならリケラボ論文検索大学・研究所にある論文を検索できる

大学・研究所にある論文を検索できる 「Clustered lassoを用いたスパース共クラスタリング」の論文概要。リケラボ論文検索は、全国の大学リポジトリにある学位論文・教授論文を一括検索できる論文検索サービスです。

コピーが完了しました

URLをコピーしました

論文の公開元へ論文の公開元へ
書き出し

Clustered lassoを用いたスパース共クラスタリング

上田 朋矢 中央大学

2022.07.12

概要

近年, IoT やデータ収集蓄積技術の発展に伴い, SNS データや購買ログデータなどに代表される, 人と人, 人と物などの繋がりを表すデータが膨大に蓄積されている. そのようなデータに対する最も基本的な分析処理として, 類似したデータをグルーピングするクラスター分析がある. 購買ログデータが与えられたとき, 通常のクラスタリング手法であれば, 顧客のクラスタリングもしくは商品のクラスタリングを個別に行う.

一方, 本研究の主題である共クラスタリングは, 顧客と商品を同時にクラスタリングする技術である. これにより「もっとも売れる顧客層と商品群」のような有益な情報を持つ部分を発見することができる. 共クラスタリングにはベイズアプローチを用いた方法 (Nowicki and Snijders (2001)) や本研究が該当する k -means 法を拡張した方法がある. Nowicki and Snijders (2001) は, 非対称関係データにも適応可能な共クラスタリングとして確率的ブロックモデルを提案した. また, Kemp, Tenenbaum, Griffiths, Yamada and Ueda (2006) は, 確率的ブロックモデルを拡張し, 潜在するクラスター数を自動的に決定できる無限関係モデルを提案した.

共クラスタリングにおいて, 行のクラスター数を K, 列のクラスター数を R とすると, 合わせて KR 個という多数のクラスターができる. そこで Tan and Witten (2014) は, 中心化後のデータ行列 X におけるクラスター平均の L1 正則化推定として共クラスタリングをとらえ, いくつかのクラスターの平均が 0 であると推定する方法を提案した.

参考文献

[1] Kemp, C. Tenenbaum, J. B. Griffiths, T. L. Yamada, T. and Ueda, N. (2006). Leanig systems of concepts with an infinite relational model. In Proccedings of the 21st National Conference on Artificial Intelligence (AAAI), pp.381-388.

[2] Nowicki, K. and Snijders, T. A. B. (2001). Estimation and prediction for stochastic blockstructures. In Jounal of the American Statistical Association (JASA), 96(455), pp.1077-1087.

[3] She, Y. (2010). Sparse regression with exact clustering. Electronic Journal of Statistics, 4, 1055-1096.

[4] Tan, K. M. and Witten, D. M. (2014). Sparse Biclustering of Transposable Data. Journal of Computational and Graphical Statistics, 23(4):985–1008.

[5] Tibshirani, R. and Taylor, J. (2010). The solution path of the generalized lasso. Ann. Statist. 39, 1335–1371.

参考文献をもっと見る

全国の大学の
卒論・修論・学位論文

一発検索!

この論文の関連論文を見る