• 机器学习博士论文 > 中国科学院研究生院博士学位论文
  • 中国科学院研究生院博士学位论文

    免费下载 下载该文档 文档格式:PDF   更新时间:2013-05-01   下载次数:0   点击次数:1
    分类号________________ UDC________________
    密级________________ 编号________________
    中国科学院研究生院 博 位论文
    多波段天体物理中的自动分类方法研究
    ---------------------------------------------------------------------张彦霞 ------------------指导教师 赵永恒 研究员______________ ____
    ___________中国科学院国家天文台_________ _ ___ 申请学位级别 论文提交日期 博 2003 年 7 月 学科专业名称 论文答辩日期 天体物理___ 2003 年 7 月_ ___ _ ____
    培养单位 _________中国科学院国家天文台__ 学位授予单位
    中国科学院研究生院____________ ____
    答辩委员会主席___何香涛_______
    中国科学院研究生院 博 位论文
    多波段天体物理中的自动分类方法研究
    ----------------------------------------------------------------------

    者______ 张 彦 霞____ 赵 永 恒
    ___
    指导教师
    研 究 员 ___
    申请专业_______天 体 物 理__
    研究方向_______天 体 物 理_______ 申请学位 博 士___________
    二 O O 三年七月
    National Astronomical Observatories Chinese Academy of Sciences
    Research on Automatic Classification Methods in the Multi-wavelength Astrophysics
    by Yan-xia Zhang Advisor: Prof. Yong-heng Zhao
    National Astronomical Observatories, Chinese Academy of Sciences Beijing 100012, P.R. China
    July, 2003


    随着地面和空间观测站的建立、探测器灵敏度的提高、望远镜 的增大和 网络技术的迅速发展, 天文学观测已渗透到全电磁波段, 从射电、 红外、 可见光、 紫外、X 射线和 γ 射线的各个电磁波段,形成了多波段、甚至全波段天文学,并 为探索各类天体和天文现象的物理本质提供了强有力的观测手段。 天文学已步入 革命化的信息时代,数据以 TB,甚至 PB 计量, “数据雪崩”“数据爆炸”已成 、 为时 最好概括。怎样记录、加工原始数据;怎样通过现代 机硬件和网络 系统存储、合并、获取数据;怎样快速有效地探索及分析数据并将这些数据可视 化,这是摆在各位天文学家面前的不得不面对的课题。在这种形势下,天文学界 认为有能力且有必要建立全球性的望远镜——虚拟天文台, 将全球的天文数据统 一到一个实体中,为任何地方和领域的人们所利用。而且,数据挖掘技术在虚拟 天文台中的成功应用,是虚拟天文台充分发挥作用的关键所在。 面对各学科、各领域的数据的冲击,数据挖掘和数据库中的知识发现从统计 学、机器学习、模式识别和人工智能等学科中分流成为一门新型学科。天文学的 海量数据只有借助数据挖掘技术,才能探索出隐藏在数据中的潜在的、有用的、 鲜为人知的价值和信息。 各学科的数据挖掘技术是天文学的数据挖掘得以发展和 完善的动力和养分。由于天文数据本身的特点,有的挖掘技术可以直接借用,有 的则需要调整方可使用,因而需要探索适合天文学特点的数据挖掘技术,本文正 是从这方面进行探讨和研究。 如何将来自各波段的星表和图像等数据联系起来,则需要位置交叉证认来提 取各种参数,从而可以研究天体在多维参数空间中的分布。基于不同天体的物理 特性如形态或能谱分布在各个波段的差异,即各类天体表现特征的不同,在多维 参数空间中将天体区分开是合理的、也是可行的。我们交叉证认了 ROSAT 弱源 表和亮源表、2MASS 近红外数据表、USNO-A2.0 可见光数据表,同时也与一些 已知天体种类的数据库 SIMBAD、VERON(2000)和 RC3 交叉证认,从而获得了 多波段数据。 本文中我们提出了两种方案用来研究天体在多维参数空间中的分布。 第一种 方案:利用多波段数据,用自动的分类方法支持矢量机(SVM)和学习矢量量 化(LVQ)对天体分类,对比了采用两个波段数据与三个波段数据的分类结果, 发现随着波段的增加,分类效果越好。可见提取的天体的信息越多,越有利于天 体的分类。第二种方案:针对未来天文数据维数过高的问题,我们探索了这两种 方法与主分量分析方法(PCA)的混合方法,即 PCA+SVM 和 PCA+LVQ。通过 主分量分析,可以知道各个参数对分类的 。由 结果可知, SVM/(PCA+SVM)和 LVQ/(PCA+LVQ)方法是有效的多波段数据的分类算法。

    下一页

  • 下载地址 (推荐使用迅雷下载地址,速度快,支持断点续传)
  • 免费下载 PDF格式下载
  • 您可能感兴趣的
  • 机器学习  机器学习实战  机器学习pdf  机器学习导论  机器学习实战pdf  神经网络与机器学习  机器学习算法  机器学习与数据挖掘  机器学习公开课  python机器学习