云计算+大数据:如何助力天文学研究

简介:

战国时期,一本记载着800多颗恒星名字和位置的《石氏星经》,是祖辈们探索宇宙的秘笈,被誉为最古老的天文数据库。

2400年后,美国天文学家发现了一颗超高速星。有趣的是,这个发现并非由天文观测获得,而是利用中国虚拟天文台公布的数据“算”出来的星星。

事实上,除了科学家,普通百姓也能借助大数据、云计算等高科技来实现“天文突破”。此前,安徽合肥一名年仅10岁的小学生廖家铭,在没有任何观测设备的前提下,通过中国虚拟天文台的数据发现了一颗超新星,是迄今为止全球年龄最小的超新星发现者。

“打电脑”的天文学家

“由于我们观测的是宇宙中比较遥远的星体,到达地球的信号很弱,很容易被淹没在城市灯光里,因此天文望远镜一般都建在大山深处。”从北京市区驱车前往位于河北省的观测站,是中科院国家天文台郭守敬望远镜运行和发展中心常务副主任赵永恒的工作常态。

然而,从2017年4月份起,赵永恒把更多时间花在了另一项工作上:“打电脑”,因为他加入了一支特殊的“尖兵部队”——由国台联合阿里云成立的科技指导委员会,成了首批受聘专家之一。

毕业于河北师大的赵永恒,走出校园后就进入了中科院国家天文台工作,成为一名“追星人”,除了观星星,还有一大爱好就是玩电脑。

十几年前,作为国台最懂电脑的研究员,赵永恒用一台从中关村市场淘来的旧电脑鼓捣出了一个网站,这就是中国虚拟天文台的雏形。“我们的想法很简单:把国内外天文望远镜的观测数据放到这个平台上。”

“宇宙就像一片森林,有高大的乔木,低矮的灌木还有小草。我们今天能观测到的只是一些大的‘乔木’,远远不足以了解宇宙。”谈到探索宇宙,赵永恒总是滔滔不绝。

广袤的宇宙意味着海量的数据,这也是天文学不同于其他学科的重要特征。

以赵永恒负责的LAMOST郭守敬望远镜为例,它可以同时观测四千个天体,相当于同时启动四千台天文望远镜。到目前为止,已经观测了将近3000个天区,收集了超过600万条光谱数据。

“天文学已经进入大数据时代,两年数据就翻一番。一个团队或者一个国家,不可能及时的把所有数据都分析完,所以数据开放程度越高,被研究的机会就越多,产生的科学成果就会越多。”赵永恒说。

开放共享的天文数据

正是基于这样的思考,2016年,中科院国家天文台与阿里云达成了战略合作,引入最前沿的云计算、大数据技术,实现天文数据开放共享。

“今天不懂互联网几乎是寸步难行。”每次跟阿里云的技术团队开工作会,赵永恒都感觉收获良多,“15年前,我们只有一个简单的网站,如今中国虚拟天文台主节点迁移到云端后,成为一个集成超过500TB的科学数据、1.5PB的存储能力、700多Tflops计算能力和100多种软件的超级平台。”

赵永恒希望,未来的虚拟天文台能够承载全世界天文学者和爱好者获取天文数据、开展天文研究、进行科普教育的综合基地。

“科学离不开技术,技术也离不开科学”。正如赵永恒理解的,国家天文台联合阿里云成立的跨界“尖兵部队”,由最懂天文的技术专家和最懂技术的天文学家组成。

“我们从哪里来,时间有没有起点,宇宙是怎样诞生和演化的,要想回答这些终极问题,需要建立更加庞大的天文数据库,而技术则是通往未来的钥匙。”赵永恒表示。

将天文科普进行到底

为了给国内的天文爱好者提供一个稳定的展示自己才华和交流的平台,在中科院国家天文台-阿里云天文大数据联合研究中心主任崔辰州等的多方努力下,国家天文台 LAMOST大科学工程设立了一台专门无偿为天文爱好者和业余天文组织提供主页空间的服务器“宇宙驿站”,并于2002年3月12日对外开放。

2005年中国互联网协会大会上,“宇宙驿站”荣获组委会特别提名奖,理由是“走出了一条独特的网络科普道路”。

“宇宙驿站”是国内目前唯一一台专为天文科普服务的网络服务器。服务器在天文爱好者心中的地位日渐升高,国内许多爱好者和组织把自己的主页建立在或迁移到这台服务器上。

2017年1月,“国家天文台-阿里云天文大数据联合研究中心”成立。前不久,中国虚拟天文台主节点和郭守敬望远镜巡天数据成功上云,“宇宙驿站”天文科普网站群100多个天文科普网站同时上云,更好的服务广大天文爱好者。

崔辰州认为:“天文学是名副其实的“大数据”科学,每天由天文观测设备捕捉到的海量天文数据,不仅是科学研究的必需品,也是宝贵的科学普及和教育资源。”

“过去由于技术限制,这些数据无法得到充分的利用和分享,而在互联网+时代,云计算和大数据技术的成熟,加速了学科发展和大众科普。”崔辰州表示,“因此,天文科普教育工作必须由数据、由新技术来驱动,通过互联网把国际、国内的专家以及广大公众连接起来。”

本文转自d1net(转载)

相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
1月前
|
存储 大数据 数据挖掘
云计算与大数据:从基础设施到实际应用
云计算与大数据:从基础设施到实际应用
134 0
|
1月前
|
存储 大数据 数据挖掘
python数据分析——大数据和云计算
大数据和云计算作为当代信息技术的两大核心驱动力,正在以前所未有的速度改变着我们的生活、工作和思维方式。它们不仅为各行各业的创新提供了强大的技术支持,更是推动了整个社会的数字化转型。 从大数据的角度来看,它的核心价值在于通过对海量数据的收集、存储、分析和挖掘,发现其中的关联性和趋势,从而为决策提供更为科学、精准的依据。无论是商业领域的市场预测、消费者行为分析,还是公共服务领域的城市规划、交通管理,大数据都发挥着不可或缺的作用。同时,随着物联网、传感器等技术的普及,大数据的来源和种类也在不断扩展,这使得我们能够更全面地认识世界,把握规律。
47 0
|
2月前
|
监控 物联网 大数据
智慧工地管理平台系统源码基于物联网、云计算、大数据等技术
智慧工地平台APP通过对施工过程人机料法环的全面感知、互联互通、智能协同,提高施工现场的生产效率、管理水平和决策能力,实现施工管理的数字化、智能化、精益化。
56 0
|
4月前
|
SQL 分布式计算 Hadoop
[AIGC ~大数据] 深入理解Hadoop、HDFS、Hive和Spark:Java大师的大数据研究之旅
[AIGC ~大数据] 深入理解Hadoop、HDFS、Hive和Spark:Java大师的大数据研究之旅
|
4月前
|
资源调度 分布式计算 大数据
【云计算与大数据技术】资源管理、调度模型策略的讲解
【云计算与大数据技术】资源管理、调度模型策略的讲解
107 0
|
4月前
|
资源调度 大数据 调度
【云计算与大数据技术】集群资源统一管理系统YARN、Mesos、Omega讲解(图文解释 超详细)
【云计算与大数据技术】集群资源统一管理系统YARN、Mesos、Omega讲解(图文解释 超详细)
80 2
|
4月前
|
消息中间件 大数据 Apache
【云计算与大数据技术】流计算讲解及集群日志文件实时分析实战(附源码)
【云计算与大数据技术】流计算讲解及集群日志文件实时分析实战(附源码)
49 1
|
4月前
|
机器学习/深度学习 分布式计算 大数据
【云计算与大数据技术】Spark实战项目之判别西瓜好坏(附源码和数据集)
【云计算与大数据技术】Spark实战项目之判别西瓜好坏(附源码和数据集)
46 0
|
2月前
|
分布式计算 DataWorks IDE
MaxCompute数据问题之忽略脏数据如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
47 0
|
2月前
|
SQL 存储 分布式计算
MaxCompute问题之下载数据如何解决
MaxCompute数据包含存储在MaxCompute服务中的表、分区以及其他数据结构;本合集将提供MaxCompute数据的管理和优化指南,以及数据操作中的常见问题和解决策略。
38 0

热门文章

最新文章