2015-2016秋季学期期末考试
说明
- 本次考试需要用到承启生物云平台,考试账号已为大家设好,请点击这里查看。
- 考试为机考,纸质版试卷无需作答,只需要写好名字学号,考完上交即可。你可以将其作为草稿纸使用。不交纸质试卷者、或者纸质试卷上不写学号姓名者将没有成绩。
- 答案请写成简单的报告形式,并转为PDF文档。文档命名需以“学号-姓名.PDF”来命名,例如 2012051685-张三.PDF。不按此方式命名者将没有成绩,不转为PDF者也将没有成绩。不要说你不知道怎么转PDF,Word 2013以上版本、WPS Office 免费版、Open Office 等字处理软件均已全面支持直接存为PDF格式,网上也有许多PDF转换器和在线网站PDF转换器可供使用。
- 考试完毕,答卷报告请以email发送至 zhanggong@jnu.edu.cn,并在主题栏中注明期末考试。考试过程中以及考试结束后5分钟内收到的答卷有效,超过即为无效。以暨大邮件系统所收到的邮件时间戳为准。请大家尽量避免使用163和126邮箱发送(有时会收不到)
- 考试中需要联网,可以使用任何网络资源。
- 考试可以使用手机,但考试过程中切记关闭手机的一切声音。考试过程中手机发出任何声音均视作违规。同时,也不可以交头接耳。
- 虽然可以联网,但不可以相互讨论,也不可以使用即时通讯软件互传信息。历史上凡是机考互相讨论者几乎都不及格。因为每人数据集不同,所以雷同卷将作为作弊的证据提交教务处。
试题
【第一题】
为研究肝癌,研究者对4株人肝癌细胞系进行全转录组测序。其中有一株肝癌细胞来自黑人,其余三株来自于同一个中国人的不同病程时期。使用Illumina HiSeq-2000进行测序,测序设置为单端50. 得到H1, H2, H3, H4四个数据集。请使用承启生物云平台客户端登陆进入自己的账号,在相应模块下可看到已上传完毕的FASTQ文件。请分析这些测序数据,用分析的数据或图表回答以下问题:
- 样品有没有搞混? 如果有搞混,哪些样品是有问题的?
- 测序量是否足够?你以什么来评判?
- 哪个样品是来自黑人的?
- 来自中国人的细胞系,在基因表达水平上(合并剪切变体)哪两个之间差异最大?这两个细胞系之间显著上调和显著下调的基因,长度上有何差异?这种差异显著吗?
注意:
- 云平台分析需要时间,所以先提交分析的将先进行分析,手慢的话……自己看着办啰。我们测试过,所有人同时提交分析的话50分钟内将可以完成所有计算。在等待的时间,可以先做第二题。
- 不要全面复制粘贴云平台输出的报告。只摘录对解题有意义的图表和数据,并说明你论证推理的理由。否则扣分。
【第二题】
由于病毒种类繁多、变异快、外观相似,因此用传统方法对其进行准确的分类有时较为困难。用某个基因的序列进行分类则常受到相近病毒的高同源性的干扰而造成失准。因此近年来,依据全基因组信息进行分类就成为重要的方法。下面列表中有21种双链DNA病毒,请依据其全基因组信息进行分类,并看看你的分类结果与目前书上的分类是否一致。如果不一致,可能说明什么?
| Name | Abbreviation | Family | Genus | Genome size | Accession No. |
|---|---|---|---|---|---|
| Acidianus_filamentous_virus_7 | AFV-7 | Lipothrixviridae | Betalipothrixvirus | 36892 | NC_010153 |
| Sulfolobus_islandicus_filamentous_virus | SIFV | Lipothrixviridae | Betalipothrixvirus | 40900 | NC_003214 |
| Acidianus_filamentous_virus_9 | AFV-9 | Lipothrixviridae | Betalipothrixvirus | 41171 | NC_010537 |
| Acidianus_filamentous_virus_2 | AFV-2 | Lipothrixviridae | Deltalipothrixvirus | 31787 | NC_009884 |
| Acidianus_filamentous_virus_1 | AFV-1 | Lipothrixviridae | Gammalipothrixvirus | 20869 | NC_005830 |
| Acidianus_rod_shaped_virus_1 | ARSV-1 | Rudiviridae | Rudivirus | 24655 | NC_009965 |
| Sulfolobus_islandicus_rod_shaped_virus_2 | SIRV-1 | Rudiviridae | Rudivirus | 35450 | NC_004086 |
| Sulfolobus_islandicus_rod_shaped_virus_1 | SIRV-2 | Rudiviridae | Rudivirus | 32292 | NC_004087 |
| Duck_adenovirus_A | DAdV-A | Adenoviridae | Atadenovirus | 33213 | NC_001813 |
| Ovine_adenovirus_D | OAdV-D | Adenoviridae | Atadenovirus | 29576 | NC_004037 |
| Snake_adenovirus | SnAdV-1 | Adenoviridae | Atadenovirus | 27751 | NC_009989 |
| Bovine_adenovirus_D | BAdV-4 | Adenoviridae | Atadenovirus | 31301 | NC_002685 |
| Porcine_adenovirus_A | PAdV-A | Adenoviridae | Mastadenovirus | 34094 | NC_005869 |
| Simian_adenovirus_1 | SAdV-1 | Adenoviridae | Mastadenovirus | 34450 | NC_006879 |
| Canine_adenovirus | CAdV | Adenoviridae | Mastadenovirus | 30536 | NC_001734 |
| Tree_shrew_adenovirus | TSAdV | Adenoviridae | Mastadenovirus | 33501 | NC_004453 |
| Ovine_adenovirus_A | OAdV-A | Adenoviridae | Mastadenovirus | 33034 | NC_002513 |
| Murine_adenovirus_A | MAdV-A | Adenoviridae | Mastadenovirus | 30944 | NC_000942 |
| Human_adenovirus_F | HAdV-F | Adenoviridae | Mastadenovirus | 34214 | NC_001454 |
| Frog_adenovirus_1 | FrAdV | Adenoviridae | Siadenovirus | 26163 | NC_002501 |
| Turkey_adenovirus_A | TAdV-A | Adenoviridae | Siadenovirus | 26263 | NC_001958 |
注意:本题请预估你的算法的时间复杂度和空间复杂度,以免算死机。如果你使用网站来计算,请注意网站的计算速度和网速稳定性,以免到时无法完成。
