上医要闻

每天,海量数据在此汇聚!探访医学科研数据中心

作者:石柳 张欣驰摄影:来源:上海医学院党委宣传部、教师工作部发布时间:2023-09-05

在复旦大学2023年秋季工作会议上,AI4S成为新晋热词。AI4SAI for Science的简称,指通过科学多模态大模型等,对海量科学大数据进行建模、推理和分析。会议指出,要举全校之力抢抓机遇、用好AI4S“关键一招”,推动基础研究高质量发展。

在医学领域,随着人工智能与医学的深度融合,智能医学成为医学前沿发展方向之一。2019年,作为上海医学院公共技术平台的子平台之一,医学科研数据中心依托高水平地方高校建设项目立项申报获批,并于2020年正式启动建设。20226月,复旦大学智能医学研究院筹建成立,医学科研数据中心作为研究院的一项核心建设内容,在“双一流”和高水平地方高校建设项目的合力支持下继续推进,为医学学科和医学科研的发展持续不断地提供强劲的助推力。

在复旦上医图文信息楼11楼,“医学科研数据中心”的标牌赫然醒目。每天,海量数据在此汇聚交互,碰撞出科研成果的火花。

大数据与我们息息相关,但又显得神秘莫测。今天,小编带您走进医学科研数据中心一探究竟。


强大硬件保障算力

大数据、人工智能”已成当今社会的高频词,柴米油盐、吃穿住行……人们的传统生活模式正在被深刻影响。

同样,大数据也驱动着整个医学的发展,如今,医学研究所涉及的数据正呈现几何式增长,医学科研迫切需要高性能计算平台。

据医学科研数据中心负责人吴飞珍介绍,中心主要面向复旦上医(包括附属医院)师生提供高性能的科学计算服务,实现医学科研数据互联互通。可应对高密度、大数据的计算任务,对多模态、海量的生物医学数据进行深入挖掘和应用,为医学人才培养和科研项目实施提供基础性支撑服务。

海量数据究竟有多大?通过“双一流”和高水平地方高校建设项目的重点投入,目前,医学科研数据中心平台的裸存储容量为4PB1PB相当于1024TB,也就是说,中心平台的容量相当于4000多个1T的移动硬盘。今后,中心平台的存储容量还将根据需求进行扩容。与此同时,医学科研数据中心建立计算平台管理系统峰值计算能力1027万亿次/秒,其中GPU峰值算力达780万亿次/秒。

强大的计算能力,可以很好地支持科研人员的前沿研究需求。以生物信息学分析中常见的单细胞为例,一次作业要研究的单细胞数以万计,每个单细胞内含数以千计的基因,两者相乘后数据量逼近上亿!面对如此海量数据,一般的计算机“束手无策”,只有高性能计算平台才能轻松驾驭。

自上线运行至今,该平台累计完成作业33万个以上,用户将近1120名,科研团队30支以上,支撑了大量的科研项目,在全国医学院校大数据平台建设中走在前列。

基础医学院教授卫功宏团队在平台上线后即成为首批“铁杆”用户,“以前做相关研究可能要借助校外的各类技术平台,不少还有权限限制等问题,十分不方便。”卫功宏说。如今,团队依托平台的技术支持顺利完成多项研究,已先后在Nature CommunicationsCell and Bioscience等杂志上发表相关论文成果。卫功宏表示,中心为科研工作者搭建了一个很好的数据资源整合平台,如果在实际使用过程中遇到问题,团队的反馈响应也十分及时,让团队的科研之路更为顺畅。


适配多样科研需求



未来,大数据在医学科研领域潜力无限。

据吴飞珍介绍,目前,中心正在着手推进“隐私计算”项目。以往出于保护隐私的考量,临床病例数据在各个医院分散,其科研价值难以挖掘。而有了中心平台,相当于将分散的本地数据联网到一个“黑箱子”中,既保护个人隐私,又盘活数据资源。“黑箱子”会按照研究者设定的规则对大数据进行分析。整个过程结束后,清除数据痕迹,结论则共享给科研人员。

同时,该平台还在“AI制药”的道路上探索行进。药物研发要找到合适的小分子,好比从一堆杂乱的拼图中找到与靶点蛋白口袋正好契合的拼图,靠人工筛选耗时耗力。今后,中心平台将基于知识库和模型发掘潜在的药物靶点,预测靶点与潜在小分子之间的相互作用,提高药物研发成功率。

希望更多的医学数据实现资源共享、优势互补、科研落地。”吴飞珍表示。作为学校实体运行机构建设的智能医学研究院充分依托医学科研数据中心,融合大数据与云计算、人工智能等技术,挖掘疾病现象的本质及规律,探索智能化诊疗方法和临床应用,推进大数据驱动的知识发现及转化应用,引领新医科的发展。“科研来自临床,同时服务于临床。”吴飞珍同时表示,希望通过大数据的助力,推动更多疾病诊疗的快速发展,更好地服务人群。

据悉,复旦上医充分利用综合性大学办学优势,将智能医学确定为“十四五”时期领先布局推进的学科新增长点。依托智能医学研究院,未来复旦上医智能医学学科将继续扎根基础医学、临床医学与信息技术的交叉跨界与融合,以新学科和新平台为创新孵化载体,引育具有全球视野、创新精神和实践能力的医工复合型领军人才和医学拔尖创新人才,同时兼顾科学创新和技术服务,提升数据整合与转化利用能力,推进大数据驱动的知识发现及转化应用,引领新医科的发展。


实用信息


如有数据中心平台访问和使用需求,可访问网址:http://imi.fudan.edu.cn

联系人:林老师

联系电话:021-54237073

邮箱:imi_info@fudan.edu.cn


制图:实习编辑:责任编辑:

Baidu
map