高分跪求生命科学院同学帮助,需要学过生物信息学,我这里有期末考试题,熟悉PDB数据库、蛋白质序列、mRNA

和基因组序列,有四个题,需要熟悉许多软件,这对我非常重要,关乎前途!完成后必有重谢(除了分数之外)!!

1. 从PDB数据库中找一个3D结构已知的蛋白,查询取得其蛋白质序列、mRNA序列(仅包含ORF/CDS)和基因组序列(10分);

2. 用Homologene或BlastP从蛋白质数据库中找15种以上与其高度同源的蛋白质序列,将序列下载并保存为一个FASTA格式的文件(10分);

3. 找到每个蛋白相应的mRNA序列,截取从起始密码子到终止密码子的开放阅读框(ORF/CDS),将序列下载并保存为一个FASTA格式的文件(10分);

4. 对比基因组序列和mRNA序列,用SIM4和GENESCAN分别找出并图示其外显子和内含子(10分);

5. 用ClustalW、MUSCLE、MAFFT、T-coffee、PRANK和CAUSA等软件,分别对以上同源基因做多序列比对(10分);

6. 用MEGA、PHLIP或其他软件分别用NJ法和ML法对以上同源基因做系统发生分析,画出基因分子进化树,比较各种比对方法和算法所画出的进化树异同,并分析进化树是否和物种进化树一致、并说明其原因(10分);

7. 找出保守区间,在保守区间设计PCR简并引物(10分);

8. 在蛋白质分析网站(ExPaSy、PDB、Swiss model等)分析该基因所编码的蛋白质,并进行一、二、三级结构预测(10分);

9. 在DDD和GEO分析该基因的具体功能和表达情况(提供证据如检索到的文献目录和摘要(10分)。

10. 查找能够调控该基因表达的microRNA,预测其目标及功能(10分)。
温馨提示:答案为网友推荐,仅供参考
第1个回答  2012-06-08
题呢追问

1、从PDB数据库中找一个3D结构已知的蛋白,查询取得其蛋白质序列、mRNA序列(仅包含ORF/CDS)和基因组序列;
2、用Homologene或BlastP从蛋白质数据库中找出15种以上与其高度同源(Coverage>80%, 相似性>80%)的蛋白质序列,将序列下载并保存为一个FASTA格式的文件;
3、找到每个蛋白相应的mRNA序列,截取从起始密码子到终止密码子的开放阅读框/编码序列(ORF/CDS),将序列下载并保存为一个FASTA格式的文件;

本回答被提问者采纳
相似回答