【更新】2025-2000年上市公司企业年报文本数据、年报文本分析数据(计算代码+最终数据)
2025-05-08
️1.资料名称:2024-2000年上市公司企业年报文本数据
️2.计算方式:使用python将巨潮网上市公司年报进行爬取,下载的pdf文件已经转化为txt格式,方便后续文本分析处理;pdf批量下载过程中存在年报更新的情况,已经对年报进行了筛选,剔除了非年报文件并保留了最新更新或更正的年报;原始地址的文件名称并不统一,本人已经将年报文件名称进行了统一,统一格式为“股票代码_公司名称_****年年度报告.txt”,例如,“000002_公司名称_2023年年度报告.txt”,方便大家导入和查看
️3.数据来源:巨潮网
️4.资料范围:5.7万多个年报,近6个G的数据量,2024年有5400多份是全的,数据格式为.txt 格式(记事本)和pdf格式,两者均有计量软件可以直接导入,提供详细的Python爬虫代码(代码仅供参考,因为需要安装一些运行包),爬取后经过人工逐步核对,学校课题组自用,确保准确性!
此数据确保百分百真实数据,大家可以核对确保准确性,真正原创数据认真整理!此数据为科研老师一手认真整理,非为了结果或者引流牟利而任意编造数据,2024年数据已经更新,我们是专业老师整理,多年更新无售后问题百分百准确,个人整理无经验易出错,资料准确能用最关键!
出处:草莓科研