“我们的工作就是让‘中国天眼’的数据传输得更快,计算得更有效,这样在发现科学目标时更加‘耳聪目明’!”近日,国家重大科技基础设施500米口径球面射电望远镜(简称FAST)顺利通过国家验收,正式开放运行。FAST目前探测到146颗优质的脉冲星候选体,其中102颗已得到证认。中科院上海高等研究院感知与计算实验室祝永新课题组为FAST海量数据的传输和计算“加速”做出了贡献。
据介绍,FAST突破了射电望远镜工程极限,接收面积相当于30个足球场大小,数据量大得惊人,每秒钟产生38GB的数据。如果这些海量数据不能被有效、快速地预处理,将对后续的传输、存储和信息处理带来很大的困扰。祝永新课题组通过预处理的初步研究,可以把数据无损压缩到三分之一,有效地减缓了从FAST天线向数据中心的数据传输和存储的压力。
在FAST的数据中心,国家天文台的科学家需要对原始信号进行大规模计算,把原始信号转换成可以观察的图谱。除了传输效率,能否再让FAST计算速度也变快呢?祝永新介绍,课题组使用异构加速部件,针对感知的数据进行定制化计算,使得部分关键算法的效率提高了5到10倍。
人工智能有望把观察图谱的科研人员解放出来。过去,FAST的天文学家每天需要看近万张图谱,寻找可能的脉冲星等天文目标。祝永新介绍,课题组在前期提出的基于深度神经网络的恒星/星系识别方法基础上,正在与FAST科研人员开发新的脉冲星等天文目标机器学习方法,将自动筛选掉无效的FAST图谱,让天文学家们每天只需要关注百张图谱。
“FAST只是定制计算的一种应用场景。”祝永新介绍,定制计算的方法已应用于国产大飞机试飞数据的异常处理。通过对大规模试飞数据进行实时分析,检测甚至预测会出现哪些异常情况,从而可以及时切换到备用部件。此外,对于国家电网的关键设备,以及无人值守的输电线路和变压器,也都可以通过定制计算的方法快速分析传感器的数据,来预测一个月甚至一年后会出现的问题,从而提前对设备进行检修或更换。