和基因组序列,有四个题,需要熟悉许多软件,这对我非常重要,关乎前途!完成后必有重谢(除了分数之外)!!
1、从PDB数据库中找一个3D结构已知的蛋白,查询取得其蛋白质序列、mRNA序列(仅包含ORF/CDS)和基因组序列;
2、用Homologene或BlastP从蛋白质数据库中找出15种以上与其高度同源(Coverage>80%, 相似性>80%)的蛋白质序列,将序列下载并保存为一个FASTA格式的文件;
3、找到每个蛋白相应的mRNA序列,截取从起始密码子到终止密码子的开放阅读框/编码序列(ORF/CDS),将序列下载并保存为一个FASTA格式的文件;