FAST

FASTA 文件格式用于将一个或多个核苷酸或氨基酸序列表示为连续的字符串。序列用注释行注释,注释行以 > 字符开头,在每个序列之前。注释行通常以统一的方式格式化,由序列的源数据库或生成软件决定。例如:

>gi|62241013|ref|NP_001014431.1| RAC-alpha serine/threonine-protein kinase [Homo sapiens]
MSDVAIVKEGWLHKRGEYIKTWRPRYFLLKNDGTFIGYKERPQDVDQREAPLNNFSVAQCQLMKTERPRP
NTFIIRCLQWTTVIERTFHVETPEEREEWTTAIQTVADGLKKQEEEEMDFRSGSPSDNSGAEEMEVSLAK
PKHRVTMNEFEYLKLLGKGTFGKVILVKEKATGRYYAMKILKKEVIVAKDEVAHTLTENRVLQNSRHPFL
TALKYSFQTHDRLCFVMEYANGGELFFHLSRERVFSEDRARFYGAEIVSALDYLHSEKNVVYRDLKLENL
MLDKDGHIKITDFGLCKEGIKDGATMKTFCGTPEYLAPEVLEDNDYGRAVDWWGLGVVMYEMMCGRLPFY
NQDHEKLFELILMEEIRFPRTLGPEAKSLLSGLLKKDPKQRLGGGSEDAKEIMQHRFFAGIVWQHVYEKK
LSPPFKPQVTSETDTRYFDEEFTAQMITITPPDQDDSMECVDSERRPHFPQFSYSASGTA

上述实施例说明了从 NCBI 蛋白质数据库中提取的人 AKT1 基因同种型的氨基酸序列。标题行指定可以用 GI ID 62241013 和蛋白质转录物 ID NP_001014431.1 鉴定该序列。这种蛋白质被命名为 RAC-alpha serine/threonine-protein kinase,来源于物种 Homo sapiens