1.百度指数介绍
随着互联网的普及,特别是微信、微博、抖音等网络社交平台的完 善,公众越来越倾向于通过互联网新媒体了解社会信息和实时热点,并且在社交平台表达自 己的看法。近年来,国内外的一些学者在研究中开始使用互联网搜索指数构造指标度量公众 对社会经济活动的需求和关注程度。在国内文献中,百度指数已经成为实证研究的热门数据 来源。比如最近很火的数字经济、金融科技等,都可以通过百度指数进行度量。
不仅如此,百度指数还可被用来度量公众/普通投资者对上市公司的关注度:
张 继德等(2014,会计研究)首次以百度指数衡量普通投资者关注度,揭示普通投资者关 注对股票流动性及股票收益的影响机制;吕敏康和刘拯(2015,审计研究)运用200 7~2012年A股上市公司的百度指数数据,研究了投资者关注与审计意见发表概率之间 的关系以及媒体态度对上述关系的影响;胡玮佳和张开元(2019,经济管理)以20 15—2017年超额百度搜索指数为投资者关注的衡量变量,对投资者关注对问询函公告 日市场反应的影响进行检验;瞿慧和沈微(2021,中国管理科学)用百度指数衡量中国 市场个体投资者关注,同时区分电脑端和移动端百度指数对协方差预测的不同贡献,研究了 投资者关注与审计意见发表概率之间的关系以及媒体态度对上述关系的影响
可见 ,百度指数无论对宏观经济还是微观公司的实证研究的独特变量构造均有裨益。
2.本数据介绍
2.1指标用途
可用于上市公司层面的投资者关注度、网 络关注度、网络治理、散户积极主义等指标度量。
2.2数据来源
因为数据爬取难度大,大家可以看到现有研究一般都是3年左右,包含的公司数量也极少。
因自己论文需要,参考张继德等(2014,会计研究),通过查询资料,调试 代码,耗费了大量时间与精力爬取公司简称所对应的百度指数进行汇总整理,所以可以说是 全网独一份。
经抽检与官网校对,数据均无误。
2.3时间期 间
2011年1月1日-2022年5月15日(百度指数最早自2011年起收录)
2.4样本范围
中国全部A股上市公司(不包含未被百度指数收录的上市公司 )
[td]
Year
PC端
Wise(移动端)
ALL(PC+移动端)
观测值
2011
3,405
3,405
3,405
10,215
2012
3,405
3,40 5
3,405
10,215
2013
3,405
3,405
3,405
10,215
2014
3,405
3,40 5
3,405
10,215
2015
3,405
3,405
3,405
10,215
2016
3,405
3,40 5
3,405
10,215
2017
3,405
3,405
3,405
10,215
2018
3,405
3,40 5
3,405
10,215
2019
3,405
3,405
3,405
10,215
2020
3,405
3,40 5
3,405
10,215
2021
3,405
3,405
3,405
10,215
Total
37,455
37 ,455
37,455
112,365
具体名单 以CSMAR数据库的上市公司基本情况表为准
2.5数据包含
提供移 动端、PC端、移动+PC端的百度指数的原始数据、Stata代码、以及整理好可直接 使用的公司-年度面板数据(excel和dta两种格式)。
大家根据研究目 的选择所需数据即可。
4.数据获取
数据示例+定制服务 (76Bytes)
5.定制服务:分关键词、地区的 百度指数爬取
如有其他百度指数的需求,如金融科技、数字经济等热点问题的研 究,我可提供有偿代爬服务。
6.参考资料
[1]张继德、廖微 和张荣武.普通投资者关注对股市交易的量价影响——基于百度指数的实证研究[J]. 会计研究,2014,(8):52-59+9 7.
[2]吕敏康、刘拯和 媒体态度、投资者关注与审计意见[J].审计研究,2015(03):64-7 2.