TogoVar収録データセット一覧
NBDCヒトデータベース群∗1へ個人毎のデータ∗2の利用申請が可能なバリアント頻度データ
データ利用申請するには「含まれる制限公開データセット」のリンクをクリックしてください。
頻度データセット名 | 解析手法 | 対象集団 | 健常者 | 罹患者 | サンプル数 | バリアント数 (座位数) | 含まれる制限公開データセット |
---|---|---|---|---|---|---|---|
GEM Japan Whole Genome Aggregation (GEM-J WGA) Panel | WGS | 日本人 | ✔ | 7,609 | 95,863,463 (90,280,248) | 6データセット | |
JGA-NGS | WES | 日本人 | ✔ | ✔ | 125 | 4,679,025 | 7データセット |
JGA-SNP | SNP-Chip | 日本人 | ✔ | ✔ | 183,884 | 1,249,724 | 3データセット |
∗1:Japanese Genotype-phenotype Archive (JGA) / AMED Genome group sharing Database (AGD)
∗2:fastq/bam/celファイルやgenotype data一覧など
その他のバリアントデータ
データベース名 | 解析手法 | 対象集団 | 健常者 | 罹患者 | サンプル数 | バリアント数 (座位数) | 作成者 | バージョン/ 最終更新日 |
---|---|---|---|---|---|---|---|---|
ClinVar | — | 複数 | ✔ | — | 674,792 | NCBI | 2020/06/04 | |
Exome Aggregation Consortium (ExAC) | WES | 複数 | ✔ | ✔ | 60,706 | 10,195,872 (9,362,319) | Broad Institute | Release 1 (2017/02/27) |
Human Genetic Variation Database (HGVD) | WES | 日本人 | ✔ | 1,208 | 554,461 (501,556) | 京都大学 | Version 2.30 (2017/08/02) | |
ToMMo 4.7KJPN Allele Frequency Panel(4.7KJPN) | WGS | 日本人 | ✔ | 4,773 | 74,494,394 (70,101,710) | 東北メディカル・メガバンク機構 | v20190826 |
注1:ClinVarはVCFファイルに含まれるGRCh37上の位置が決定しているバリアントのみを掲載しています。
注2:4.7KJPNの内訳は、SNV (Autosome、chrX(PAR1+PAR2+XTR)、chrMT)とINDEL (Autosome、chrX(PAR1+PAR2+XTR))です。 詳細はSummary of ToMMo 4.7KJPNをご覧ください。
バリアント以外のデータ
データベース名 | バージョン/最終更新日 | 内容 | 作成者 |
---|---|---|---|
Colil | 2019/01/25 | 生命科学分野の文献間の引用関係の情報 | DBCLS |
GRCh37.p13 | 2013/06/28 | ヒトゲノムリファレンス配列 | GRC |
HGNC symbol report | 2020/03/30 | 遺伝子シンボルや関連リソースの情報 | HGNC |
LitVar | APIで取得 | バリアント名が出現する文献情報 | NCBI |
PubTatorCentral | 2020/05/09 | バリアント名が出現する文献情報 | NCBI |
TogoGenome | — | ゲノムに関する包括的な情報 | DBCLS |
データ加工に利用したツール
ツール名 | バージョン | 内容 | 作成者 |
---|---|---|---|
bcftools | — | Indelの正規化とmultiallelicバリアントのbiallelicバリアントへの分割 | Genome Research Ltd. |
BioReT | — | NGSデータからバリアントを特定するツール群を一括実行 | アメリエフ |
Variant Effect Predictor (VEP) | Ensembl rel. 100 | バリアントにアノテーション(遺伝子名、Consequence等)を付加 | EMBL-EBI |