TogoVar収録データセット一覧

NBDCヒトデータベース群∗1へ個人毎のデータ∗2の利用申請が可能なバリアント頻度データ

データ利用申請するには「含まれる制限公開データセット」のリンクをクリックしてください。

頻度データセット名 解析手法 対象集団 健常者 罹患者 サンプル数 バリアント数
(座位数)
含まれる制限公開データセット
GEM Japan Whole Genome Aggregation (GEM-J WGA) Panel WGS 日本人 7,609 95,863,463
(90,280,248)
6データセット
JGA-NGS WES 日本人 125 4,679,025 7データセット
JGA-SNP SNP-Chip 日本人 183,884 1,249,724 3データセット

∗1:Japanese Genotype-phenotype Archive (JGA) / AMED Genome group sharing Database (AGD)
∗2:fastq/bam/celファイルやgenotype data一覧など

その他のバリアントデータ

データベース名 解析手法 対象集団 健常者 罹患者 サンプル数 バリアント数
(座位数)
作成者 バージョン/
最終更新日
ClinVar 複数 674,792 NCBI 2020/06/04
Exome Aggregation Consortium (ExAC) WES 複数 60,706 10,195,872
(9,362,319)
Broad Institute Release 1 (2017/02/27)
Human Genetic Variation Database (HGVD) WES 日本人 1,208 554,461
(501,556)
京都大学 Version 2.30
(2017/08/02)
ToMMo 4.7KJPN Allele Frequency Panel(4.7KJPN) WGS 日本人 4,773 74,494,394
(70,101,710)
東北メディカル・メガバンク機構 v20190826

注1:ClinVarはVCFファイルに含まれるGRCh37上の位置が決定しているバリアントのみを掲載しています。
注2:4.7KJPNの内訳は、SNV (Autosome、chrX(PAR1+PAR2+XTR)、chrMT)とINDEL (Autosome、chrX(PAR1+PAR2+XTR)) です。詳細はSummary of ToMMo 4.7KJPNをご覧ください。

バリアント以外のデータ

データベース名 バージョン/最終更新日 内容 作成者
Colil 2019/01/25 生命科学分野の文献間の引用関係の情報 DBCLS
GRCh37.p13 2013/06/28 ヒトゲノムリファレンス配列 GRC
HGNC symbol report 2020/03/30 遺伝子シンボルや関連リソースの情報 HGNC
LitVar APIで取得 バリアント名が出現する文献情報 NCBI
PubTatorCentral 2020/05/09 バリアント名が出現する文献情報 NCBI
TogoGenome ゲノムに関する包括的な情報 DBCLS

データ加工に利用したツール

ツール名 バージョン 内容 作成者
bcftools Indelの正規化とmultiallelicバリアントのbiallelicバリアントへの分割 Genome Research Ltd.
BioReT NGSデータからバリアントを特定するツール群を一括実行 アメリエフ
Variant Effect Predictor (VEP) Ensembl rel. 100 バリアントにアノテーション(遺伝子名、Consequence等)を付加 EMBL-EBI