首页  |  实验室概况  |  实验室新闻  |  研究队伍  |  科学研究  |  人才培养  |  科研成果  |  主要设备  |  研究生教育  |  导师团队  |  学习平台 
生物大数据

生物大数据方向

 人类基因组计划开启了生物学研究领域的新纪元,其积累的科研成果吸引越来越多的研究人员已将研究方向聚焦在生物大数据学领域。生物大数据是研究生命活动参数的信息特征的采集、存储、分析和解读等各方面的学科,也是随着生命科学和计算机科学的迅猛发展,生命科学和计算机科学相结合形成的一门新学科。它通过综合利用生物学,计算机科学和信息技术,来分析生命过程中大量而复杂的基因、蛋白质等数据,以揭示生命过程的重要特征和普遍规律。

实验室在该方向的研究以基因测序为基础,通过高通量测序获取包括DNARNA在内生物遗传密码信息,进行处理、分析、整合,从而对农业,医药和工业生产领域产生广泛辐射与有力推动。同时,从生物信息数据产生的源义、数据处理的各个环节和对复杂生物机理的解析等方面入手,研究一系列生物大数据的方法与工具。实验室的基因测序平台主要由新购置的MiSeq新一代高通量DNA测序仪、Biorupt-plus非接触式超声波破碎仪等设备组成,具有每月产生300G碱基序列能力;分析设备为一套高性能计算机,包括11T内存的高性能计算节点、一套16个节点的集群和一套可扩展到1P容量的存储系统,完全能胜任各类基因测序分析所需的计算和存储要求。

借助基因分析平台,与国内外著名高校、研究所和医院等机构建立合作关系,在农业,工业和医学等生命科学领域开展贵州省重要疾病遗传变异基础和遗传标记开发、重要应用生物资源遗传多样性、优良基因的挖掘、定位和应用等方面的研究,从而促进我校生物与信息学科的融合和发展,形成新的优势学科,进而提升贵州省种质资源保护、重要疾病遗传基础研究和筛查标记开发、优良等位基因挖掘和利用的水平。

本实验室根据基因序列质控、存储交换和分析的要求,基于大规模分布式的现代计算机技术方法,初步开发出基于GPU的二代测序序列的质量分析工具QAS,相比目前主流的fastqc等质量控制工具,分析效率提升10倍以上;正在开展基于参考序列的基因序列的专用压缩方法,初步设计出基于参考序列分块存储的分布式并行化的数据压缩/解压、检索策略;基于容器技术,研究基于云端应用的转录组和基因组的整合、分析探索工具。此外,通过修改、整合和优化目前成熟的分析工具,生成了一套完整的RNA-SEQ、基因组重测序分析系统。同时,依托重点实验室在生物大数据方面的积累,在国家海洋局的支持下,进行了南极植物光合适应多样性基因资源调查及其点云数据采集项目,谢晓尧教授领队亲赴南极科考,获取了南极地区植物不同光质、光强、温差、CO2浓度、湿度等极端环境下光合速率、蒸腾速率、气孔导度、胞间CO2浓度、暗呼吸速率以及气孔大小、叶绿体形态等生理生态数据,并完成该地区观测植物点云数据扫描采集、构建南极地区植物及生物资源大数据库,以期揭示南极地区植物光合作用形态适应、生理适应多样性及其基因资源现状。

主要研究与合作项目:

1.与美国布朗大学生物统计系吴志瑾副教授课题组在RNA-seq的数据统计分析上进行合作。

2.与美国华盛顿大学生物工程系主任陈树林教授课题组在利用RNA-seq数据优化重要能源微生物的能源物质产量上进行合作。

3.与中国农业科学院作物科学研究所王丽霞副研究员在绿豆抗虫、产量等重要农艺性状的QTL定位和克隆上进行合作。

4.与安徽农业大学文汉教授课题组在大肠杆菌环境应激的基因表达调控上开展合作。

5.与北京天一辉远生物科技有限公司在基因测序,测序数据分析、存储服务上进行合作。

 

          科研人员依据测序平台进行测序

 

 

 

 

3DMPP-主页

 

 

 

 

 

 

 

3DMPP 南极植物3D形态数据库