当前位置:首页 期刊杂志

牛熊市视角下股票关联网络动态拓扑结构研究——以上证50指数为例

时间:2024-07-28

谢 赤,边慧东,王纲金

(湖南大学工商管理学院,长沙 410082)

牛熊市视角下股票关联网络动态拓扑结构研究
——以上证50指数为例

谢 赤,边慧东,王纲金

(湖南大学工商管理学院,长沙 410082)

以2005-01-04至2008-12-31上证50指数成分股数据为样本,将其划分为熊市I、牛市和熊市II等3个阶段,运用最小生成树、分层结构树以及主要拓扑指标研究股票市场处于不同阶段下的关联网络动态拓扑结构。实证结果表明:股票市场间存在行业聚集效应,并且这种效应随着时间的推移越来越显著;在股票市场关联网络拓扑结构中,制造业在牛市时处于绝对的中心地位,并会持续到熊市;金融保险业和制造业中的钢铁制造业的内部股票始终保持着很高的关联度,一些子母公司和交叉控股的股票间也关系密切。此外,主要关联网络指标显示,股票市场所形成的关联网络结构在牛市时更紧密,但是牛市的市场结构要比熊市差。

股票市场;牛市;熊市;复杂网络;最小生成树

0 引言

在此基础上,许多学者也对中国股票市场关联网络进行了大量理论和实证研究。黄飞雪,赵昕和侯铁珊[9]基于股票价格的相关系数,以2004年至2007年上证50指数成分股为样本,构造分层结构树,证明了各股票的行业分类风格明显,尤其在经历2005年到2006年的股改之后,各股票行业分类风格更显著。Huang,Zhuang和Yao[10]选取沪市和深市的1 080只股票,利用最大平面过滤算法构造股市的关联网络,研究其关联网络的特性,结果表明股市关联网络服从幂律分布,各股票之间有明显行业聚集现象,并且股市对于随机顶点失效具有拓扑鲁棒性,然而在受到恶意攻击时很脆弱。尹群耀,何建敏和卞曰瑭[11]等引入符号时间序列分析法,以上证50指数为例探究中国股市聚类效应,同样发现股市有显著的行业聚集效应。Mai,Chen和Meng[12]对2009年至2012年沪深300指数成分股的关联网络结构进行研究,实证结果显示该关联网络属于幂律指数较小的无标度网络,工业作为中国股市中的中坚力量,对其它行业的股票影响深远,并且各行业的股票呈现季度稳定的特征。Chen[13]同样选取沪深300指数成分股,进一步证实股市是个无标度网络,金融行业股票之间具有极强的关联。Yang,Li和Zhang[14]选取2006年至2013年的中信行业指数,采用最小生成树和分层结构树方法,发现耐用消费品、工业品、信息技术、快速消费品和金融业是股票关联网络中的核心节点。Chen,Mai和Li[15]用随机矩阵理论和相关矩阵的分解方法,分析了中国股票市场各股票间的相互作用,结果表明房地产、商业银行、医药、酒精饮料和钢铁行业内部股票均存在行业聚集现象,同时房地产行业和商业银行股票反相关。吴翎燕,韩华和宋宁宁[16]以沪深两市日收盘价为研究对象,基于相关系数和最佳阀值构建沪深两市的网络模型,研究结果显示用这种方法构造的股票网络具有稳定的拓扑结构。

然而,上述有关中国股市的研究大多是从静态的角度来考察股票市场的拓扑结构[10-16],或者只是按照股市的某一事件划分时间,放大了外部政策对股市的影响。例如,黄飞雪等[9]认为,2005年至2006年实行的股权分置改革是中国证券市场的一个重大事件,因此构建了2004年上半年和2007年下半年的分层结构树,以此作为股权分置改革前后的两种状态。而股市是有牛市和熊市之分的,学者们认为这两种状态是股市预期和股市基础价值共识变化的反映[17]。不言而喻,牛、熊市对于投资者而言是十分重要的。在此研究背景下,本文从牛、熊市视角出发,将样本数据划分为牛市和熊市两种市场状态,进而探究股票市场在牛、熊市背景下的关联网络特征及演化过程,以期为政府部门制定监管政策和投资者制定投资策略提供依据。

因此,本文旨在牛、熊市视角下运用最小生成树、分层结构树构造各时期的股票关联网络,并测算其主要拓扑指标,从而研究股票市场处于不同阶段下的关联网络动态拓扑结构。

1 数据和方法

1.1 数据处理

为了分析中国证券市场上一些主要公司在牛熊市中的股票关联性,本文选取上证50指数成分股票的相关数据构建相应的股票关联网络的最小生成树和分层树。上证50指数由上海证券交易所编制,其样本股是在所有A股股票中抽取最具市场代表性的50只股票组成,用以综合反映上海证券市场最具市场影响力的一批优质大盘企业的整体状况。该指数样本股净利润和利润总额均占同期全部A股市场总量的50%左右,具有良好的市场代表性和可投资性。它们规模大、流动性好,能够准确反映优质大盘蓝筹股的市场表现,其价格能较为客观地反映股票之间的内在相关性。因此可以说,通过研究上证50指数成分股票关联网络的内在性质可以了解中国证券市场股票价格在经历牛熊市变动过程中的内在联系。

本文之所以选取2005年至2008年上证50指数成分股数据主要基于以下考虑:1) 中国股市最近的一次牛市出现在2006年至2007年末,2009年虽然也出现过牛市,但是时间过短,所以将终止时间设为2008年末;2) 上证50指数成分股自2004年开始编制,为保证数据的完整性和稳定性,选取较为成熟的2005年上半年公布的50只成分股(上证50指数的50只股票会每半年调整1次),因而起始时间设为2005年。同时,本文采用市场平均收益判定法,将2005年至2008年划分为3个时期:2005年1月4日至2005年12月31日为熊市I,2006年1月4日至2007年12月28日为牛市,2008年1月2日至2008年12月31日为熊市II[18]。

因此,本文采集2005年1月4日至2008年12月31日的股票每日收盘价数据计算其日收益率,研究期间内日收益率序列共包含971个观测值。其中,剔除受停牌、上市日期影响的个别股票,因短暂停牌而缺少数据的则采用前日收盘价补齐。经此处理后,本文实际以上证50指数成分股中的41只股票作为研究对象。相关数据来源于国泰安数据库和上海证券交易所网站。为方便分析,对上述成分股按行业分类排布,并进行统一标号,具体见表1。

表1 上证50指数41只成分股及其标号Tab.1 41 constituent stocks and respective labels of Shanghai 50 Index

本文参照Mantregna[1]的研究方法,选取上证50指数成分股的日收盘价来研究主要的中国公司之间的关联性。上证50指数的41家上市公司的股票价格收益率定义为价格对数的一阶差分:

ri(t)=lnpi(t)-lnpi(t-1)

(1)

其中,pi(t)为股票i在第t日的收盘价,ri(t)为股票i在第t日的收益率。

任意两只股票i和j在观测区间内股票价格波动的相关系数为

(2)

其中,ri为股票i的收益率序列,rj为股票j的收益率序列,ρi,j∈[-1,1]。

由相关系数可以得到各股票之间的度量距离[1]为

(3)

从而可以得到距离矩阵D。D是一个对称矩阵,且矩阵主对角线元素均为0,矩阵中有N(N-1)/2个可用元素(N为所选样本个数),利用距离矩阵D就可以得到最小生成树。

1.2 最小生成树

常用的建立最小生成树的算法是Kruskal和Prim,这两个算法都是基于贪心法,即在建立最小生成树时先连接距离最短的节点,与Mantregna[1]的研究类似,本文采用Kruskal算法,具体计算步骤为

第1步,首先将这N(N-1)/2个元素按照从小到大的顺序排列,选择距离最短的两个节点,将两个节点以线段连接起来。

第2步,从剩余的数据中选择最小的距离,找到与之相应的两个节点并连接。

第3步,继续选择剩余中距离最小的节点,用线段连接,连接过程中不能成环。

第4步,重复第3步直至所选择的边数比顶点数少1,这样就会得到有N个节点,N-1条边的一个连通图,即最小生成树。

1.3 分层结构树

最小生成树和分层树从不同侧面反映集合中的元素间的关联性:最小生成树的拓扑图揭示各元素间的相互关联的几何特征,而分层结构树图则体现各元素间相关分类信息。

1.4 关联网络拓扑性质

为考察股票市场从熊市到牛市,再到熊市的动态演化过程,这里首先对衡量关联网络性质的各类方法作一些简单讨论。

1) 度(Degree Centrality)。表示与该节点直接相连的节点数。度指标基本上可以刻画节点在网络中的中心化程度,度越大,中心化程度越高[19]。

2) 平均相似性度量(Mean Similarity Measure,MSM)。用来衡量整个关联网络两两节点之间的稀疏程度。该值越大,关联网络就越稀疏[20]:

(4)

其中,di,j为股票i与股票j之间的距离。

3) 标准化树长度(Normalized Tree Length,NTL)。表示最小生成树N-1条边的平均距离,用来度量最小生成树关联网络图稀疏程度。同样,该值越大,对应的最小生成树关联网络越稀疏[20-21]:

(5)

其中,Θ为最小生成树各边的集合。

4) 特征路径长度(Characteristic Path Length,CPL)。表示关联网络中所有节点对的路径长度的平均值,用来度量整个关联网络的稀疏程度[20,22]:

(6)

其中,li,j即连接i和j两个节点的路径长度,在关联网络中,任选两个节点,连接两个节点的最少边数,定义为两个节点的路径长度。

5) 平均占有层(Mean Occupation Layer,MOL)。表示对应中心节点的各等级之和的平均值,描述关联网络图中节点的分布,度量最小生成树的密度变化[20,23]:

(7)

其中,vc为中心节点(可能不同阶段的中心节点不一致),它的层级设为0,lev(vi)表示vi节点对应中心节点vc的层级。

6) 非叶子节点(Number of Non-Leaf Nodes,NLN)。表示有子节点的节点数,用来描述关联网络的松散程度,值越大,关联网络越松散[20]。

2 实证结果

2.1 最小生成树和分层结构树结果

根据上述算法可以得到下列最小生成树图,图1、图2和图3分别表示上证50指数41只成份股在熊市I、牛市和熊市II环境下的最小生成树图。

由图1可以发现,大多数股票都具有行业聚集倾向,尤其是金融保险业和制造业中的钢铁制造。其中,在金融保险业中,中信证券、华夏银行、民生银行、浦发银行和招商银行连成一线,没有成团聚集产生中心节点;除武钢股份外,宝钢股份、包钢股份和邯郸钢铁3只制造业中的钢铁制造业股票也连在一起,也没有产生中心节点。这可能是由于金融保险业和制造业中的钢铁制造业虽然行业特征明显,却没形成一家独大的局面。另外,张江高科和原水股份,国电电力和华能国际,上海机场和天津港都是两两互相连接,实际上分别属于同一行业。从各股票之间的连接距离来看,最短距离出现在华夏银行与民生银行(0.64),民生银行与浦发银行(0.66)以及招商银行与浦发银行(0.68)紧随其后。有趣的是,S上石化和中国石化(0.76)连接距离也较小,但是不属于同一行业,这可能是由于S上石化属于中国石化的控股子公司。

图1 上证50指数成份股在熊市I的最小生成树(2005-01-04~2005-12-31)Fig.1 MST with weighted edges in bear I (from January 4,2005 to December 31,2005)

将图1和图2进行对比可以看出,图2较之图1最大的变化是形成江淮汽车、宝钢股份和上海汽车3个大的中心节点,度数都很大,且都属于制造业,这可能是由于制造业在牛市环境下具有主导作用。同时,行业聚集效应更加明显,武钢股份、宝钢股份、宝钢股份和邯郸钢铁全部4只制造业中的钢铁制造业股票连成一线,电力、煤气及水的生产和供应业较之图1增加了申能股份的连接。另外,各股票间距离也有变化,金融保险行业和制造业中的钢铁制造业各自股票间的股票距离变小,有可能是在牛市下这两个行业内部的上市公司关系变得更加紧密。有趣的是,中信证券与雅戈尔(0.58)属于不同行业,但是两只股票的距离很近,可能是由于雅戈尔是中信证券的大股东。

图3中,中海发展、江淮汽车和申能股份是3个中心节点。较之图2,关联网络变得松散,最大的节点度数都没有超过7。同时,行业聚集现象较之图2更加明显:除金融保险行业全部5只股票和制造业中的钢铁制造业全部4只股票各自聚集;申能股份、华能国际、长江电力和国电电力等4只电力、煤气及水的生成和供应业股票也都尽数聚集;S南航、中海发展、上海机场等3只交通运输仓储业股票也都聚集;方正科技和同方股份2只信息与技术业股票首次聚集。另外,股票间最短距离还是出现在制造业中的钢铁制造业和金融保险业。

图4、图5和图6分别是熊市I、牛市和熊市II 3个时期的分层结构树。华夏银行(2)与民生银行(3)、邯郸钢铁(6)与包钢钢铁(8)以及方正科技(37)与东方明珠(39)在图4和图5中都是股票距离最近的组合,其中华夏银行(2)与民生银行(3)作为图4中距离最近的组合同属于金融保险行业。虽然图6中浦发银行(1)与招商银行(5)为距离最近的组合,但浦发银行(1)、华夏银行(2)、民生银行(3)和招商银行(5)等4家银行始终是图中分层树距离最近的一个分支。武钢股份(7)与宝钢股份(9)以及中信证券(4)与雅戈尔(11)在图5和图6中都出现,尤其是在牛市的时候,武钢股份(7)与宝钢股份(9)是距离最近的组合,与金融保险业类似,邯郸钢铁(6)、武钢股份(7)、包钢钢铁(8)和宝钢股份(9)这4只股票也一直是图中分层结构树距离最近的分支。另外,华能国际(28)与国电电力(30)在图4和图6也都出现。这些组合的出现在图1、图2和图3都有所反映。

图2 上证50指数成份股在牛市的最小生成树(2006-01-04~2007-12-28)Fig.2 MST with weighted edges in bull market (from January 4,2006 to December 28,2007)

图3 上证50指数成份股在熊市II的最小生成树(2008-01-02~2008-12-31)Fig.3 MST with weighted edges in bear II (from January 2,2008 to December 31,2008)

图4 上证50指数成份股在熊市I的分层结构树(2005-01-04~2005-12-31)Fig.4 Hierarchical tree in bear I (from January 4,2005 to December 31,2005)

图5 上证50指数成份股在牛市的分层结构树(2006-01-04~2007-12-28)Fig.5 Hierarchical tree in bull market (from January 4,2006 to December 28,2007)

图6 上证50指数成份股在熊市II的分层结构树(2008-01-02~2008-12-31)Fig.6 Hierarchical tree in bear II (from January 2,2008 to December 31,2008)

综合图4~6的结果,可以得到与最小生成树类似的结论:一方面,股票市场具有显著的行业聚类现象,尤其是浦发银行(1)、华夏银行(2)、民生银行(3)、和招商银行(5)等4只金融保险业股票以及邯郸钢铁(6)、武钢股份(7)、包钢钢铁(8)和宝钢股份(9)等4只制造业中的钢铁制造业股票,可能与其行业具有极高收益协同性有关,同时还有华能国际(28)和国电电力(30)两只电力、煤气及水的生产和供应业股票。另一方面,股票市场还出现交叉持股,比如中信证券(4)和雅戈尔(11)组合,雅戈尔作为中信证券的大股东,两只股票在牛市中一荣俱荣。

2.2 拓扑指标比较

表2是所选取的41只股票在熊市I、牛市和熊市II 3个阶段分别形成的最小生成树关联网络的各指标比较,选取5个关联网络特性的指标:平均相似性度量(MSM)、标准化树长度(NTL)、特征路径长度(CPL)、平均占有层(MOL)和非叶子结点(NLN)。在计算MOL时,按照文献[23]的定义,选择度数最大的节点作为中心节点,其中在熊市I时选取原水股份为中心节点,在牛市和熊市II时都选取江淮汽车为中心节点。

表2 41只股票在熊市I、牛市和熊市II 3个阶段分别形成的最小生成树的各指标比较Tab.2 MSM,NTL,CPL,MOL,NLN of MSTs in markets of bear I,bull,and bear II.

表2中,平均相似性度量(MSM)和标准化树长度(NTL)都是在牛市时最大,且特征路径长度(CPL)是在牛市时最小,说明最小生成树关联网络在牛市时更紧密。在平均占有层(MOL)指标方面,熊市I测算出的MOL值最大,熊市II次之,牛市得到的值最小,而根据Onnela等[17]的研究结论:平均占有层(MOL)的值越大,越不容易发生暴跌,关联网络结构越好,可知牛市的市场结构要比熊市I和熊市II差。

3 结论与展望

本文选取2005年初至2008年末上证50指数中41只成分股作为研究样本,根据市场平均收益判定法将其划分为熊市I、牛市和熊市II 3个阶段,运用最小生成树、分层结构树及主要拓扑指标考察了股票市场动态关联网络结构。通过实证研究得到下列结论:

1) 最小生成树和分层结构树的结果显示,股票市场间存在行业聚集效应,并且这种效应随时间推移越来越明显,且行业聚集最显著的是金融保险业和制造业中的钢铁制造业;控股母公司与子公司以及交叉持股公司的股票价格收益具有同样的变化趋势;制造业在牛市环境下是整个股市的中心。

2) 5个主要关联网络特性指标表明,股票市场所形成的关联网络结构在牛市时更紧密,但是牛市的市场结构要比熊市I和熊市II差。

本文的贡献主要是,一方面验证了学者们关于股票市场间存在行业聚集效应的结论;另一方面深化了该结论,通过区分股市的牛、熊市状态,得到行业聚集效应越来越显著的变化规律,同时考察股票市场关联网络的各拓扑结构指标,发现最小生成树关联网络在牛市时更紧密,并且牛市的市场结构要比熊市I和熊市II差。

以上发现可为股票投资和风险监管提供有益参考和借鉴。面对不同股市行情,投资者可以选择合适的投资组合策略获取高收益,而监管者要注意防范牛市的股价暴跌风险,尤其是对核心行业节点的监测。但是,由于本文只选取了上证50指数41只成分股,样本数目少,若考察更多的股票样本应该能够得到更多的规律。另外,只选择一个牛市环境下的股市表现说服力不够,可以将其拓展到更多个牛市和熊市,在纵向比较中得到相互验证。

[1]Mantegna R N.Hierarchical structure in financial markets[J].The European Physical Journal B,1999,11(1):193-197.

[2]Tabak B M,Serra T R,Cajueiro D O.Topological properties of stock market networks:the case of Brazil[J].Physica A,2010,389(16):3240-3249.

[4]Tabak B M,Serra T R,Cajueiro D O.The expectation hypothesis of interest rates and network theory:the case of Brazil[J].Physica A,2009,388(7):1137-1149.

[5]Tabak B M,Serra T R,Cajueiro D O.Topological properties of commodities networks[J].The European Physical Journal B,2010,74(2):243-249.

[6]Wang G J,Xie C.Correlation structure and dynamics of international real estate securities markets:a network perspective[J].Physica A,2015,424(8):176-193.

[7]Matesanz D,Ortega G J.Sovereign public debt crisis in Europe.a network analysis[J].Physica A,2015,436(20):756-766.

[8]Zhong T,Peng Q,Wang X,et al.Novel indexes based on network structure to indicate financial market[J].Physica A:Statistical Mechanics & Its Applications,2015,443:583-594.

[9]黄飞雪,赵昕,侯铁珊.基于最小生成树的上证50指数分层结构[J].系统工程,2009,27(1):71-76.Huang FeiXue,Zhao Xin,Hou TieShan.Index hierarchical structure of Shanghai 50 stock based on minimum spanning tree[J].Systems Engineering,2009,27(1):71-76.

[10] Huang W Q,Zhuang X T,Yao S.A network analysis of the Chinese stock market[J].Physica A,2009,388(14):2956-2964.

[11] 尹群耀,何建敏,卞曰瑭,等.基于STSA的中国股市的聚集效应研究——以上证50指数为例[J].系统工程,2013,31(1):10-17.Yin QunYao,He JianMin,Bian YueTang,et al.Aggregation effect of the China stock market based on STAT method:Take SSE 50 Index as an example[J].Systems Engineering,2013,31(1):10-17.

[12] Mai Y,Chen H,Meng L.An analysis of the sectorial influence of CSI300 stocks within the directed network[J].Physica A,2014,396(2):235-241.

[13] Tu C.Cointegration-based financial networks study in Chinese stock market[J].Physica A,2014,402(10):245-254.

[14] Yang R,Li X,Zhang T.Analysis of linkage effects among industry sectors in China’s stock market before and after the financial crisis[J].Physica A,2014,411(19):12-20.

[15] Chen H,Mai Y,Li S P.Analysis of network clustering behavior of the Chinese stock market[J].Physica A,2014,414(22):360-367.

[16] 吴翎燕,韩华,宋宁宁.基于相关系数和最佳阈值的股票网络模型构建[J].复杂系统与复杂性科学,2013,10(4):49-55.Wu LingYan,Han Hua,Song NingNing.The construction of stock network model based on correlation coefficient and optimal threshold[J].Complex Systems and Complexity Science,2013,10(4):49-55.

[17] John Y C.The new palgrave dictionary of money and finance[J].Journal of Economic Literature,1994,32(2):667-673.

[18] Lindahl-Stevens M.Redefining bull and bear markets[J].Financial Analysts Journal,1980,36(6):76-77.

[19] 王林,张婧婧.复杂网络的中心化[J].复杂系统与复杂性科学,2006,3(1):13-20.Wang Lin,Zhang JingJing.Centralization of complex networks[J].Complex Systems and Complexity Science,2006,3(1):13-20.

[20] Wang G J,Xie C,Han F,et al.Similarity measure and topology evolution of foreign exchange markets using dynamic time warping method:Evidence from minimal spanning tree[J].Physica A,2012,391(16):4136-4146.

[21] Onnela J P,Chakraborti A,Kaski K,et al.Dynamics of market correlations:taxonomy and portfolio analysis[J].Physical Review E,2003,68(5):056110.

[22] Kwapien J,Gworek S,Drozdz S.Structure and evolution of the foreign exchange networks[J].Acta Physica Polonica B,2009,40(1):175-194.

[23] Onnela J P,Chakraborti A,Kaski K,et al.Dynamic asset trees and portfolio analysis[J].The European Physical Journal B,2002,30(3):285-288.

(责任编辑 耿金花)

Dynamic Topology of Stock Correlation Networks from the Bull and Bear Perspective:a Case of Shanghai 50 Index

XIE Chi,BIAN Huidong,WANG Gangjin

(College of Business Administration of Hunan University,Changsha 410082,China)

Daily data collected from Shanghai 50 Index constituent stocks from January 4,2005 to December 31,2008 is divided into three stages:bear I,bull and bear II.We study dynamic topology of stock correlation networks in each stage by using the minimal spannin tree (MST),hierarchical tree (HT) and main network property measures.The results show that:Industrial clustering exists and becomes more and more obvious in stock market; Manufacturing industry turns into the absolute center in bull market,which lasts until bear II market; Internal stocks of finance & insurance industry and steelmaking industry always maintain a high correlation,and the stocks of parent company and subsidiary and the stocks of the cross holdings companies are also close to each other; In addition,the main network property measures reveal that the structure of the stock market’s correlation network is closer but worse in bull market than in bear markets.

stock market; bull market; bear market; complex network; minimal spanning tree

1672-3813(2017)01-0066-09;

10.13306/j.1672-3813.2017.01.010

2015-04-27;

2015-10-24

国家自然科学基金(71373072);国家自然科学基金创新研究群体科学基金(71221001);高等学校博士学科点专项科研基金(20130161110031)

谢赤(1963-),男,湖南株洲人,博士,教授,主要研究方向为金融工程与风险管理、复杂金融网络、金融物理学、金融复杂性。

N94; F832

A

免责声明

我们致力于保护作者版权,注重分享,被刊用文章因无法核实真实出处,未能及时与作者取得联系,或有版权异议的,请联系管理员,我们会立即处理! 部分文章是来自各大过期杂志,内容仅供学习参考,不准确地方联系删除处理!