变异注释格式(MAF)

MAF 文件格式是打算用于说明测序结果检测到体细胞 DNA 突变制表符分隔的文本文件格式,并且是从所述多个对准格式文件类型,其目的是用于表示对齐的核苷酸序列是不同的。列标题和排序有时可能因不同来源的文件而异,但规范中定义的列的名称和顺序如下:

Hugo_Symbol
Entrez_Gene_Id
Center
NCBI_Build
Chromosome
Start_Position
End_Position
Strand
Variant_Classification
Variant_Type
Reference_Allele
Tumor_Seq_Allele1
Tumor_Seq_Allele2
dbSNP_RS
dbSNP_Val_Status
Tumor_Sample_Barcode
Matched_Norm_Sample_Barcode
Match_Norm_Seq_Allele1
Match_Norm_Seq_Allele2
Tumor_Validation_Allele1
Tumor_Validation_Allele2
Match_Norm_Validation_Allele1
Match_Norm_Validation_Allele2
Verification_Status4
Validation_Status4
Mutation_Status
Sequencing_Phase
Sequence_Source
Validation_Method
Score
BAM_File
Sequencer
Tumor_Sample_UUID
Matched_Norm_Sample_UUID

许多 MAF 文件(例如 TCGA 提供的文件)还包含扩展变体注释的其他列。这些列可包括相应基因的参考核苷酸转录物 ID,代表性密码子或氨基酸变化,QC 指标,群体统计等。