DDBJ Annotated/Assembled Sequences
WGS
様々な生物においてホールゲノムショットガン配列決定法(whole genome shotgun: ゲノム全体を物理的に断片化し、シークエンサで各断片の塩基配列を決定した後、コンピューター・プログラムを用いて整理、アセンブルして完成させる手法)を用いて全ゲノム配列を決定するゲノムプロジェクトが進められています。
DDBJ/ENA/GenBank では、そのようなゲノムプロジェクトに由来する、整理が不十分な段階の大量の DNA 断片の配列を、WGS データとして受け付けています。
INSDC standards for genome assembly submissionもご参照ください。
WGSデータの登録は Mass Submission System (MSS) で受け付けております。
WGS データとして登録可能なデータ
原則、冗長な raw read sequences ではなく、ある程度 計算機処理を経た contigs (overlapping reads) の配列を受付けます。
冗長な raw read sequences を公表することが必要な場合は、DDBJ Sequence Read Archive (DRA) をご利用ください。
- 登録に先立ち、BioProject と BioSample の登録が必要です。
- 各 scaffold (assembled contigs separated by gaps) の配列を WGS entry として登録します。
- sequencing gap を連続した”n”として WGS 配列に含めて記載します。
DDBJ フォーマットの例
WGS エントリの特徴
LOCUS ZZZZ01000001 123456 bp DNA linear HUM 01-MAY-2003
DEFINITION Homo sapiens DNA, chromosome 7, A01234B01.
ACCESSION ZZZZ01000001 ZZZZ01000000
VERSION ZZZZ01000001.1
DBLINK BioProject:PRJDA12345
BioSample:SAMD01234567
Sequence Read Archive:DRR012345, DRR012346
KEYWORDS WGS; STANDARD_DRAFT.
SOURCE Homo sapiens
ORGANISM Homo sapiens
Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi;
Mammalia; Eutheria; Euarchontoglires; Primates; Haplorrhini;
Catarrhini; Hominidae; Homo.
REFERENCE 1 (bases 1 to 123456)
AUTHORS Mishima,H. and Shizuoka,T.
TITLE Direct Submission
JOURNAL Submitted (01-APR-2003) to the DDBJ/EMBL/GenBank databases.
Contact:Hanako Mishima
National Institute of Genetics, DNA Data Bank of Japan; Yata 1111,
Mishima, Shizuoka 411-8540, Japan
REFERENCE 2
AUTHORS Mishima,H., Shizuoka,T. and Fuji,I.
TITLE Human whole genome shotgun sequence
JOURNAL Unpublished (2003)
COMMENT Whole genome shotgun sequencing project.
FEATURES Location/Qualifiers
source 1..123456
/chromosome="7"
/collection_date="2007"
/db_xref="taxon:9606"
/geo_loc_name="Japan"
/mol_type="genomic DNA"
/organism="Homo sapiens"
/submitter_seqid="A01234B01"
-- The rest is snipped --
//