编辑: 学冬欧巴么么哒 | 2019-10-29 |
现面向在校学生招募实习生,欢迎感兴趣的 学生报名!经遴选录取的学生,将获得 上海天文台-华为 SKA 专项奖学金 ,用于其开展相关科研活动.本次拟招聘 的实习生将主要投入 SKA 数据中心原型机的测试、开发和调 试,可以使用上海天文台和华为技术有限公司以及国外合作 单位的计算和数据资源,并得到相关专家的指导. 【SKA 项目背景】 平方公里阵列射电望远镜(Square Kilometre Array, 以下简称 SKA)是国际天文学家们计划建造的世界最大综合 孔径射电望远镜,由全球十多个国家计划合资建造,是我国 参加的最大的国际天文大科学工程.SKA 由2500 面直径
15 米的碟形天线阵列(中频阵列)、250 个致密孔径阵列以及
130 万只对数周期天线阵列(低频阵列)组成,接收总面积 达一平方公里,接收频率覆盖 50MHz-20GHz.SKA 的台址位 于澳大利亚、南非及南部非洲八个国家的无线电宁静区域. SKA 第一阶段(占总规模的 10%)预计于
2020 年开建. 经多国科学家凝练形成 SKA 射电望远镜五大科学目标, 分别是:探测宇宙黎明和黑暗时期;
研究星系演化、宇宙学 与暗能量;
寻找地外文明;
利用脉冲星检验强引力场理论;
研究宇宙磁场的起源和演化.其中,宇宙起源、引力波、引 力本质、暗物质和暗能量等都是目前物理领域最前沿的问 题. 作为下一代担当引领作用的射电天文观测设施,SKA 不 仅承载孕育世界级科研成果的使命,还将产生世界上前所未 有的超大数据量, SKA 最大的挑战之一来自于大数据的运算、 存储和管理.据估计,仅按照全部规模 10%来建造的第一阶 段,其科学处理所需要的运算能力就相当于我国超级计算机 神威・太湖之光 的3倍.如此庞大的数据还需要深度分 析和加工后才能被科学家使用,这些工作是要由分布于几大 洲的区域数据中心合作完成. 在科技部国家重点研发计划大科学装置前沿研究专项 的支持下,上海天文台牵头开展 SKA 数据处理原型系统建设 和SKA 科学预研.在中国科学院国际合作重点专项支持下, 上海天文台与澳大利亚等国家的 SKA 核心研究机构一起推动 SKA 亚太区域中心的准备工作. 实习生招聘 项目 1:SKA 数据中心计算框架研究 项目描述:为了应对 SKA 大数据处理前所未有的挑战,在中国 SKA 数 据中心开始建设之前,首先建立原型系统,对关键技术进行详细的工 程验证,并研究计算架构的扩展性.本项目的主要目标是完成 SKA 计 算框架在 CPU-GPU-ARM 异构处理平台上的优化, 优化后的 SKA 应用运 行能效比、性价比应优于现有平台. 主要合作单位:澳大利亚 ICRAR 研究所、上海交通大学 申请人资质要求:本科三年级及以上. 基本要求: 计算机相关专业;
熟悉 C 语言开发, 掌握常见的数据结构、 算法,了解软件工程、敏捷开发等知识;
熟悉 hdfs/zfs/luster/ceph/glusterfs/moosefs/swift/sheepdog 等存储 技术,有分布式文件系统开发经验. 具备以下条件者可优先考虑: 有HPC/MTC 开发经验,有代码共享者 优先. 项目 2:SKA 数据中心并行文件系统设计 项目描述:并行文件系统是 HPC 实现资源调度和性能优化的关键模 块,平方公里阵列(SKA)的海量数据处理对并行文件系统提出了更 高的要求.本项目的主要目标是设计和实现 SKA 专用并行文件系统. 主要合作单位:澳大利亚 ICRAR 研究所、上海交通大学 申请人资质要求:本科三年级及以上. 基本要求: 计算机相关专业;
熟悉 C 语言开发, 掌握常见的数据结构、 算法,了解软件工程、敏捷开发等知识;
熟悉 hdfs/zfs/luster/ceph/glusterfs/moosefs/swift/sheepdog 等存储 技术,有分布式文件系统开发经验. 具备以下条件者可优先考虑: 有开源分布式文件系统开发,有代码 共享者优先. 项目 3:SKA 数据中心执行框架系统研发 项目描述:本项目将研究一款适用于 SKA 数据中心的分布式执行框 架,用于快速并准确的完成 SKA 数据中心科学数据的预处理.该执行 框架能够灵活的部署于任一机器包括本地机器和高性能计算机群, 将 具备数据实时处理、数据驱动、SKA 科学数据 pipeline 的分布式执 行、数据全生命周期管理等特点.最终完成中国 SKA 区域数据中心原 型系统执行框架的设计并实现原型,能够在不低于
1500 个节点上部 署与运行. 主要合作单位:澳大利亚 ICRAR 研究所、广州大学 申请人资质要求:本科三年级及以上. 基本要求:电子、通信、计算机相关专业;
熟悉 linux 操作系统及其 环境下 python/C/C++的程序开发与调试;
熟悉 GPU 编程;
了解如 TensorFlow 等数据流系统;
有一定的分布式与并行软件开发经验. 具备以下条件者可优先考虑: 有在大规模计算节点的集群上测试与开 发软件经验者优先. 项目 4:机器学习在射电天文中的应用 项目描述:随着SKA项?的不断推进,射电天?数据会呈现爆炸式增 长,SKA第一阶段预计会每天产?340TB的数据,这给传统的天文信号 的处理带来巨大的挑战. 近年机器学习特别是深度学习在信号处理和 识别领域取得了巨大的进步, 利?人工智能手段来完成天文信号的自 动化处理成为一个必然趋势.本项目主要研究内容如下: 脉冲星识别/分类:脉冲星是SKA主要科学方向之一.到目前为止,已 经发现了两千多颗脉冲星.但随着SKA的建成和运行,有望观测到银 河系内四千多颗脉冲星以及银河系以外的脉冲星.SKA数据量的急剧 增大,使得通过人力去成像分析的传统方法已经不可取了.本课题旨 在利用深度学习特别是卷积神经网络来分析天文图像, 在观测数据中 通过盲搜来寻找和确定脉冲星信号.在实际处理中,要充分考虑样本 量小,正负样本不均衡,原始样本噪声大等问题.通过充分挖掘脉冲 星数据的特点,构建特殊的针对射电暂现源的深度网络,为将来SKA 科学中的脉冲星盲搜提供一种切实可行的方案. 星系分类:天体分类是天文研究中的一个经典问题.本项目旨在利用 传统机器学习算法,通过信号滤波,特征提取,模型融合调优来完成 星系图像的自动提取和识别,也包括对算法做并行加速.该项目第一 阶段针对开源的数据库进行研究,通过集成多种学习模型,旨在达到 98%以上的验证正确率. 项目第二阶段旨在改进和应用机器学习算法, 在实际的观测生成图像上对星系进行标注. 射频干扰标记:在射电天文中,射频干扰对潜在的微弱天文信号的接 收造成了极大妨碍,通常会导致数据的丢失和数据质量的降低.该问 题也是目前各大射电望远镜和观测阵列的一个关键问题. 本项目旨在 将计算机视觉领域的图像分割算法应用到射频干扰信号的标记算法 中.对比现在广泛采用的基于统计或者基于阈值的经验算法,深度学 习算法被期待提供更广泛适用的方案.本项目可以提供来自SKA先导 项目的实测数据,通过对数据的清洗和预处理,期待能提高射频干扰 标注的准确性. 引力波信号的搜寻:引力波是天文界近几年最重要的发现,不仅验证 了广义相对论, 也使得人类获得了除了电磁波和高能粒子以外新的探 测工具,开启了多信使天文学的新时代.从信号中提取引力波源的信 息,也成为了近些年非常热门的研究课题.本项目旨在构建深度学习 框架,首先用模拟的引力波数据对其进行训练,对不同的算法进行测 试和评估, 然后利用优化后的深度学习方案对实测引力波数据进行分 析. 主要合作单位:西澳大学,科廷大学,澳大利亚CSIRO 申请人资质要求:本科三年级及以上. 基本要求:熟悉linux平台,熟练使用python/C++/Java等一种或多种 编程语言,熟练掌握常用算法和数据结构;
扎实的理论和算法基础, 深刻理解常用的传统机器学习模型(LR/SVM/RF/GBDT等);
熟悉 深度学习理论基础,特别要熟悉常用的CNN网络;
对数据敏感,分析 数据、抽象问题、理解并解决问题,对使用机器学习解决实际问题有 极强的热情;
动手实践能力强,熟悉scikit-learn, tensorflow, pytorch等主流框架. 具备以下条件者可优先考虑:天文学、信号处理、计算机专业;
有真 实脉冲星数据处理经验;
有处理引力波O1数据的经验;
参加过 Kaggle、KDD Cup等竞赛且排名靠前;
有计算机视觉等领域应用经验 或学术成果者. 项目5:VLBI仿真器研发 项目描述:为了推进甚长基线干涉测量(VLBI)网络的发展,设计研 发一套高度集成的VLBI仿真软件.它不仅支持常规的仿真功能,还集 成了如参数估计,图像性能评估,空间VLBI等功能.除此之外,还提 供了友好的GUI交互和数据库支持, 并具备扩展到其他望远镜 (如SKA) 的功能. 本项目的主要目标是对当前的仿真软件初步版本进行升级改 进,如并行优化、集成更多的天文数据处理算法等. 申请人资质要求:本科三年级及以上. 基本要求: 熟悉python编程, 熟悉git的使用, 能在Linux环境下开发、 布署;
熟悉数据库设计;
善于沟通和逻辑表达,良好的团队合作精神 和积极主动的沟通意识. 具备以下条件者可优先考虑:计算机软件相关专业优先;
有python 项目开发经验. 项目6:卫星的轨道仿真和约束研究 项目描述:本课题是针对空间VLBI项目而设计,旨在研发一套完备的 高可靠性的卫星仿真工具VNSIM, 提供空间VLBI仿真和观测性能估计. 其中一个关键问题是卫星轨道的仿真, 需要充分考虑地球进动章动等 修正问题.更重要的是,要对卫星的姿态,卫星的可见性问题充分建 模,比如日月的遮挡问题,地面遥测站的链接问题等等.本项目的研 发成果将会被集成到VNSIM软件包中,旨在为空间射电天文研究提供 实用的多方位支持的VLBI仿真平台. 申请人资质要求:本科三年级及以上. 基本要求:熟练python编程;
具有Linux/Unix下开发经验;
熟悉Git 的使用;
熟悉GPS原理或卫星相关知识;
具备良好的职业素养和团队 协作精神,以及较强的学习和交流能力. 具备以下条件者可优先考虑:航空航天相关专业;
有GPS、北斗项目 经验者;
热爱开源社区,有开源Python项目贡献者. 项目7:天文成像流水线(pipeline)系统研发 项目描述:SKA将颠覆射电天文领域内现有数据处理方法和技术,当 前使用的数据处理与分析软件都不能够完全适用于SKA大数据处理. 本项目拟在SKA建成前,基于当前各种数据处理与分析技术,进行改 进,为相关科学技术人员提供能够支持SKA规模的数据处理与成像流 水线(pipeline)系统以及图像分析功能,方便相关科学人员进行前 期的关键技术及算法验证. 申请人资质要求:本科三年级及以上. 基本要求:天文、电子信息、通信、计算机等相关专业;
具备一定的 编程功底(C/C++/python等);
熟悉linux操作系统(Ubuntu、Centos 等) 的使用及该系统下的软件开发和调试;
具备较高的英语读写能力. 具备以下条件者可优先考虑:有高性能计算环境开发、图像处理经验 优先. 申请方式
一、以邮件形式递交下述申请材料:提交扫描件或者电子版 即可,打包成一个压缩文件
二、本科成绩单(需所在学校或院系的教务部门盖章证明)
三、专业排名证明 (需所在学校或院系的教务部门盖章证明)
四、所在学校或院系的教务部门出具的外出实习同意函
五、个人简历
六、各类获奖证书、发表论文/专利等体现个人综合素质和学 术水平的材料 请于
2018 年11 月30 日前将上述申请材料发送至指定报名邮 箱[email protected] (伍老师), 邮件命名为 SKA 实习生- 申请人姓名-学校 . 根据申请者提交的材料, 综合考虑申请者的教育背景、 学业水平、 科研能力、 综合素质进行遴选, 通过选拔的学生将在
2018 年12 月15 日之前接到电子邮件通知.届时没有收到通知的学生即为 未入选者,不再另行通知.
................