路英川,李 鹏,王 浩,张 翔,汤宇磊,谢 亘
路英川1,李 鹏1,王 浩1,张 翔1,汤宇磊1,谢 亘2
(1. 中国地质调查局地球物理调查中心,河北 廊坊 065000;2. 中国地质调查局廊坊自然资源综合调查中心,河北 廊坊 065000)
20世纪40年代以来,Warren McCulloch和Walter Pitts (1943) 便对人工智能进行了尝试性探索,第一次提出人工神经元的数学模型[2];此后,Donald Hebb (1949)、Rosenblatt (1958)、Minsky和Papert(1969)以及Rumelhar和Hinton (1986) 等学者为人工智能技术的发展奠定了基础[3-6]。Mayer-Schønhberger Viktor和Cukier Kenneth率先提出了互联网信息“大数据”的概念[7],并在2013年将《大数据时代》这一重要著作呈现到人们面前[8],初步阐述了利用“大数据”分析处理取代随机分析法,从而也可为矿床学的研究提供新的机遇。
探索成矿机制并建立成矿模式一直以来就是矿床学研究的首要任务,也是指导找矿勘查的理论基础[9, 21]。通过矿床和成矿带两种尺度均可建立相应的成矿模式:前者一般是通过对构造岩浆控矿、成矿流体演化、矿床地质特征等内容的研究来限定成矿动力、物质来源和成矿过程[9];后者则多集中于不同矿床地质和地球化学特征之间的对比,从而得出区域成矿模式并指导矿产勘查[9,21]。
图1 传统成矿模式建立流程
表1 矿床学研究阶段划分
图 2 矿床研究方法主客观因素直观图
表 2 典型传统成矿模式的研究特点
随着各种地球化学理论与方法在矿床学研究中的广泛应用,极大地提高了人们对矿床成因和成矿机制的认识,不断地丰富和完善成矿理论体系[9]。各类地质数据的采集和挖掘都与信息社会的“大数据”不谋而合[7];矿床学研究经过百余年的探索发展,尤其是20世纪70年代以来,元素地球化学[65-70]、同位素地球化学[71-74]、流体包裹体研究[75-78]、成矿年代学[79-81]、矿田构造解析[82]以及成矿实验方法[52, 83]等技术手段的广泛应用,使得矿床学研究方法不断成熟和丰富,形成了庞大的数据集合。
近年来,人工智能各类算法已日趋成熟,深度学习(Deep Learning,DL)已经在图像分析[85]和语音识别[86]领域得到广泛应用,在自然语言处理[87]乃至视频分类[88]等方面取得了令人瞩目的成绩。
机器学习(Machine Learning)是指用某些算法指导计算机利用已知数据得出适当的模型,并利用此模型对新的情境给出判断的过程[64],通常分为有监督学习(Supervised Learning)和无监督学习(Unsupervised Learning)。有监督学习又可分为分类(Classification)和回归(Regression)两类。其中分类算法包括:朴素贝叶斯算法、决策树算法、Logistics回归、临近算法和支持向量机算法等;回归算法包括:线性回归和多项式回归等。无监督学习通常可分为聚类(Clustering)、降维(Dimensionality Reduction)和关联规则学习(Association rule learning)等算法。其中均值聚类、Mean-Shift、DBSCAN、支持向量机等属于聚类算法范畴;主成分分析、奇异值分解、潜在狄里克雷特分配、潜在语义分析以及t-SEN等属于降维算法范畴;Apriori、Euclat、EP-growth属于关联规则学习的范畴。神经网络学习是机器学习的子集,深度学习(多层神经网络)又是神经网络学习的子集(图 3)。
图 3 人工智能算法关系示意图
图4 深度学习的学习过程示意图(图片引自网络:https://www.tooopen.com/view/179052.html和https://www.zhihu.com/question/264417928,有改动)
Mnih,等(2013)提出的深度Q学习网络(Deep Q-network,DQN)算法,将卷积神经网络(Convolutional Neural Network,CNN)与强化学习(Reinforcement Learning,RL)中的经典算法Q学习算法结合起来[90-91],是目前最为常用的一种深度学习算法。在基于价值的深度强化学习方法中,深度神经网络被用来当作价值函数的逼近器,利用深度神经网络构成策略网络。将策略参数化表示拥有更好的收敛性,可以弥补在动作空间很大或动作为连续集的情况下DQN方法在解决机器人学问题时的局限性,更适用于高维连续空间的策略求解;多种结构的深度强化学习算法可以使算法在计算效率、样本利用率、计算资源上都有所提高[90]。如今卷积神经网络、深度Q学习网络、多种结构的深度强化学习、PILCO算法等,对人类社会的巨大影响已经在多个行业有明显的展现[92-97](表3)。
大数据挖掘特别适合于窥探具有多维性和全面性的现实世界,而高维数据处理是大数据深部挖掘的基础,它善于从支离破碎的信息中复原事物全貌[105]。图5表示利用数据挖掘领域中拓扑数据分析(Topological Data Analysis,TDA)不仅可以有效地捕捉高维数据空间的拓扑信息,还能够在不丢失高维的信息的前提下有效降低大规模数据处理的维度[106]。
表 3 强化学习和深度强化学习部分算法列举表
图5 拓扑数据分析示例(据参考文献[106])
大数据分析和机器学习等正逐步被应用到地学领域中来[107],并取得一些具有启发性的理论创新成果[108],如应用关联规则算法对与金矿相关的侵入岩、火山岩、变质岩建造及区域构造地质大数据的关联性的探索发现地质要素之间的共生关系[109];利用贝叶斯网络(Bayesian Network)揭示矿床的成因机制并构建大数据-智能矿床成矿与找矿模型等[110];利用大数据手段对特提斯斑岩成矿带、中亚斑岩成矿带和环太平洋斑岩成矿带进行地质地球化学对比分析,进而揭示地壳性质对斑岩铜矿控制作用等[111]。
A review on the development of mineral deposit science in the era of big data
LU Yingchuan1,LI Peng1,WANG Hao1,ZHANG Xiang1,TANG Yulei1,XIE Gen2
(1. Center of Geophysics Survey,CGS,Langfang,Hebei 065000,China;2. Langfang Center for Integrated Natural Resources Survey,China Geological Survey,Langfang,Hebei 065000,China)
In recent years, there have been some bottlenecks in the study of mineral deposits,such as. the innovation deficienciences of metallogenic model and the monotorous perspective of metallogenic series and metallogeny. This paper reviewed the development history of ore deposit science and pointed out that every breakthrough and leap in ore deposit science is closely related to the development of new science and technology. With the continuous improvement of scientific progress, especially the coming of the ‘big data’ and ‘intelligent’ era, new technologies such as deep learning of big data in artificial intelligence are developing vigorously. Geological big data has the characteristics of ‘4V’ of ‘big data’, such as ‘volume’,‘velocity’,‘variety’ and ‘value’,as well as the characteristics of pluralism, multi-dimension, multi-source, heterogeneity and space- time. Based on the statistical comparison and analysis of relevant domestic and foreign literatures in the past decade, this paper expounded the subordinate relationship and main characteristics among artificial intelligence, machine learning and deep learning, and the examples of random forest algorithm, convolutional neural network, decision tree algorithm, Naive Bayes algorithm and support vector machine and other algorithms in ore deposit research were also sorted out. In this paper, it was considered that the study of intelligent exploration of global mineral resources that lead by the artificial intelligence technology will become the inevitable direction of the future development of ore deposit science.
mineralogy;metallogenic model;big data;machine learning;artificial intelligence
1672-0636 (2021) 03-0295-16
路英川(1986— ),男,河北邯郸人,博士,从事矿物学、岩石学、矿床学研究工作。E-mail:luyingchuan2008@163.com
Supported by the China Geological Survey project (No. DD20191023).
LU Yingchuan,born in 1986,doctor, mainly engages in research on mineral deposits.
