Head banner

2015-2016秋季学期期末考试

说明

试题

【第一题】

为研究肝癌,研究者对4株人肝癌细胞系进行全转录组测序。其中有一株肝癌细胞来自黑人,其余三株来自于同一个中国人的不同病程时期。使用Illumina HiSeq-2000进行测序,测序设置为单端50. 得到H1, H2, H3, H4四个数据集。请使用承启生物云平台客户端登陆进入自己的账号,在相应模块下可看到已上传完毕的FASTQ文件。请分析这些测序数据,用分析的数据或图表回答以下问题:

  1. 样品有没有搞混? 如果有搞混,哪些样品是有问题的?
  2. 测序量是否足够?你以什么来评判?
  3. 哪个样品是来自黑人的?
  4. 来自中国人的细胞系,在基因表达水平上(合并剪切变体)哪两个之间差异最大?这两个细胞系之间显著上调和显著下调的基因,长度上有何差异?这种差异显著吗?

注意:

 

【第二题】

由于病毒种类繁多、变异快、外观相似,因此用传统方法对其进行准确的分类有时较为困难。用某个基因的序列进行分类则常受到相近病毒的高同源性的干扰而造成失准。因此近年来,依据全基因组信息进行分类就成为重要的方法。下面列表中有21种双链DNA病毒,请依据其全基因组信息进行分类,并看看你的分类结果与目前书上的分类是否一致。如果不一致,可能说明什么?

Name Abbreviation Family Genus Genome size Accession No.
Acidianus_filamentous_virus_7 AFV-7 Lipothrixviridae Betalipothrixvirus 36892 NC_010153
Sulfolobus_islandicus_filamentous_virus SIFV Lipothrixviridae Betalipothrixvirus 40900 NC_003214
Acidianus_filamentous_virus_9 AFV-9 Lipothrixviridae Betalipothrixvirus 41171 NC_010537
Acidianus_filamentous_virus_2 AFV-2 Lipothrixviridae Deltalipothrixvirus 31787 NC_009884
Acidianus_filamentous_virus_1 AFV-1 Lipothrixviridae Gammalipothrixvirus 20869 NC_005830
Acidianus_rod_shaped_virus_1 ARSV-1 Rudiviridae Rudivirus 24655 NC_009965
Sulfolobus_islandicus_rod_shaped_virus_2 SIRV-1 Rudiviridae Rudivirus 35450 NC_004086
Sulfolobus_islandicus_rod_shaped_virus_1 SIRV-2 Rudiviridae Rudivirus 32292 NC_004087
Duck_adenovirus_A DAdV-A Adenoviridae Atadenovirus 33213 NC_001813
Ovine_adenovirus_D OAdV-D Adenoviridae Atadenovirus 29576 NC_004037
Snake_adenovirus SnAdV-1 Adenoviridae Atadenovirus 27751 NC_009989
Bovine_adenovirus_D BAdV-4 Adenoviridae Atadenovirus 31301 NC_002685
Porcine_adenovirus_A PAdV-A Adenoviridae Mastadenovirus 34094 NC_005869
Simian_adenovirus_1 SAdV-1 Adenoviridae Mastadenovirus 34450 NC_006879
Canine_adenovirus CAdV Adenoviridae Mastadenovirus 30536 NC_001734
Tree_shrew_adenovirus TSAdV Adenoviridae Mastadenovirus 33501 NC_004453
Ovine_adenovirus_A OAdV-A Adenoviridae Mastadenovirus 33034 NC_002513
Murine_adenovirus_A MAdV-A Adenoviridae Mastadenovirus 30944 NC_000942
Human_adenovirus_F HAdV-F Adenoviridae Mastadenovirus 34214 NC_001454
Frog_adenovirus_1 FrAdV Adenoviridae Siadenovirus 26163 NC_002501
Turkey_adenovirus_A TAdV-A Adenoviridae Siadenovirus 26263 NC_001958

 

注意:本题请预估你的算法的时间复杂度和空间复杂度,以免算死机。如果你使用网站来计算,请注意网站的计算速度和网速稳定性,以免到时无法完成。