ゲノムネットサービス利用統計
概要
2022年度
ゲノムネットサービス利用統計
西川 和嗣(日本ヒューレット・パッカード合同会社)
KEGG 生命システム情報統合データベース
KEGG (Kyoto Encyclopedia of Genes and Genomes) はゲノムや分子レベルの情報から細胞、個体、エコシ
ステムといった生命システムの機能や有用性を理解するためのリソースです。生命システムのコンピュータ表現と
して、遺伝子やタンパク質(ゲノム情報)と化合物など(ケミカル情報)の分子部品の情報を、分子間の相互作
用・反応・関係ネットワーク(システム情報)の知識で統合した生命システム情報統合データベースです。さらに
生体システムのゆらぎとして疾患・医薬品情報(ヘルス情報)も統合されています。
カテゴリ
システム情報
ゲノム情報
ケミカル情報
ヘルス情報
データベース
内 容
KEGG PATHWAY
KEGG パスウェイマップ
KEGG BRITE
BRITE 機能階層・テーブル
KEGG MODULE
KEGG モジュール
KEGG ORTHOLOGY
機能オーソログ
KEGG GENOME
全ゲノム配列既知の KEGG 生物種
KEGG GENES
遺伝子・タンパク質
KEGG SSDB
GENES の配列類情報
KEGG COMPOUND
化合物
KEGG GLYCAN
糖鎖
KEGG REACTION
生体内化学反応
KEGG RCLASS
反応クラス
KEGG ENZYME
酵素
KEGG NETWORK
疾患関連のネットワーク要素
KEGG VARIANT
ヒト遺伝子バリアント
KEGG DISEASE
ヒト疾患
KEGG DRUG
医薬品
KEGG DGROUP
医薬品グループ
ゲノムネットデータベースリソース
内 容
サービス
KEGG OC
KEGG OC (KEGG Ortholog Cluster) へのインタフェース
Virus-Host DB ウィルスとその宿主のデータベース
Taxonomy
生物種分類の早見表および検索
varDB
抗原変異性遺伝子のデータベース
ゲノムネットの計算ツール
ゲノムネットでは以下の3つのカテゴリーで計算サービスを提供しています。配列解析の標準的なプログラム以
外はすべて京都大学化学研究所バイオインフォマティクスセンターで開発されたものです。
配列解析
サービス
内 容
- 117 -
BLAST
FASTA
MOTIF
配列類似性検索
配列モチーフ検索
CLUSTALW
MAFFT
PRRN
TREE
配列のマルチプルアライメントおよび進化系統樹解析
ゲノム情報解析
サービス
内 容
DiGAlign
ゲノムアラインメントビューアー
ViPTree
ウィルスゲノムのproteomic treeを生成
KAAS
ゲノムまたはESTコンティグの自動アノテーションとパスウェイマッピング
GENIES
カーネル法での多様なオミクスデータ統合による遺伝子ネットワーク予測
DINIES
医薬品ー標的ネットワーク予測
KofamKOALA
遺伝子機能予測とKEGGマッピング
ケミカル情報解析
サービス
内 容
SIMCOMP
化合物類似構造検索
SUBCOMP
化合物部分構造検索
KCaM
糖鎖類似構造検索
PathComp
化合物間の反応経路計算
PathSearch
類似反応経路検索
PathPred
分解・合成反応経路予測
E-zyme
化合物間の酵素反応と酵素遺伝子予測
DBGET/LinkDB: ゲノムネット統合データベース検索システム
DBGET は世界中に存在する分子生物学データベースを対象とした統合データベースシステムです。ゲノムネッ
トや KEGG のバックボーンシステムとして利用されています。DBGET でサポートする分子生物学データは、各デ
ータベースのエントリー(ページ)をノード、エントリー間の参照情報をエッジ(リンク)とした膨大なグラフと
して表現されます。各データベースエントリーはデータベース名とエントリー名(またはアクセッション番号)の
ペアで指定され、これは一般には対応するページのURLに変換することができます。このような名前空間を考え、
名前同士のつながりを蓄積したのが LinkDB データベースです。
DBGET/LinkDB システムでは多数のデータベースを統合するために、データベース利用条件の違い(ミラーリ
ング可、キーワードインデクシング可、リンクのみ)を考慮して、各データベースを以下の5つのカテゴリーに分
類しています。
カテゴリー
検索コマンド
bget bfind blink
備考
1. KEGGデータベース
yes
yes
yes
2. その他のDBGETデータベース
yes
yes
yes
3. Web上の検索可能データベース
no
yes
yes
4. Web上のリンクのみのデータベース
no
no
yes 各サイトのサービスを利用
5. PubMedデータベース
yes
no
yes
KEGGデータベース (カテゴリー1)
- 118 -
ゲノムネットでミラーリング
ゲノムネットが提供するKEGGデータベースは以下の通りで、多くのものは毎日更新されています。
データベース
内 容
備考
brite
機能階層・オントロジー
KEGG BRITE
pathway
パスウェイマップ
module
KEGGモジュール
orthology
オーソログ (KO) グループ
genome
KEGG生物種
mgenome
メタゲノム
genes
高精度ゲノム中の遺伝子カタログ
mgenes
メタゲノム中の遺伝子カタログ
compound
化合物
KEGG COMPOUND
glycan
糖鎖
KEGG GLYCAN
reaction
化学反応
rclass
反応クラス
enzyme
酵素分類
network
疾患関連のネットワーク要素
KEGG NETWORK
variant
ヒト遺伝子バリアント
KEGG VARIANT
disease
ヒト疾患
KEGG DISEASE
drug
医薬品
dgroup
医薬品グループ
expression
マイクロアレイ遺伝子発現プロフィール
KEGG PATHWAY
KEGG ORTHOLOGY
KEGG GENOME
KEGG GENES
KEGG REACTION
KEGG DRUG
著者による登録
その他のDBGETデータベース (カテゴリー2)
ゲノムネットがミラーリングしているデータベースは以下の通りです。
データベース
refseq
uniprot
内 容
refnuc
核酸塩基配列
refpep
タンパク質アミノ酸配列
swissprot
trembl
rg001
refgene rg002
rg003
元サイト
NCBI
タンパク質アミノ酸配列
SIB / EBI
海洋微生物メタゲノムのリファレンス遺伝子セット(OM-RGC) EMBL
ヒト腸内細菌メタゲノムのリファレンス遺伝子セット(IGC)
BGI/EMBL
海洋微生物メタゲノムのリファレンス遺伝子セット(MATOU) Tara Oceans
pdb
タンパク質立体構造
RCSB
pdbstr
PDBアミノ酸配列
京都大学
epd
真核生物プロモーター
ISREC
prosite
motifdic pfam
ExPASy
タンパク質配列モチーフ
EBI
ncbi-cdd
NCBI
pmd
変異タンパク質
国立遺伝学研究所
aaindex
アミノ酸指標
京都大学
carbbank
糖鎖構造 (更新なし)
帝京大学/ジョージア大学
prosdoc
PROSITE文献
ExPASy
- 119 -
Web上の検索可能データベース (カテゴリー3)
ゲノムネットでキーワード検索のみできるデータベースは以下の通りです。
データベース
内 容
genbank
insdc
ddbj
元サイト
NCBI
国立遺伝学研究所
核酸塩基配列
embl
EBI
ncbi-gene
Entrez 遺伝子データベース
NCBI
ensembl
真核ゲノムアノテーション
Ensembl
hgnc
ヒト遺伝子名
HGNC
brc-dna
ヒト完全長cDNAクローン
理研BRC
brc-epd
植物の完全長cDNAクローン
理研BRC
go
遺伝子オントロジー
GO
interpro
タンパク質ファミリー・ドメイン
EBI
pubchem
PubChem 化合物データベース
NCBI
chebi
ChEBI 化合物データベース
EBI
pdb-ccd
PDB リガンド辞書
PDB
lipidmaps
脂質代謝
LIPIDMAPS
lipidbank
脂質
LipidBank
knapsack
植物二次代謝産物
KNApSAcK
hmdb
ヒトメタボローム
HMDB
3dmet
天然化合物の立体構造
3DMET
drugbank
医薬品とターゲット
DrugBank
ligandbox
医薬品の立体構造
LigandBox
sider
医薬品の副作用
SIDER
LinkDB検索のみ可能なデータベース (カテゴリー4)
LinkDBで検索可能なデータベースは以下のとおりです。 ...