2026-03-10 17:02:17 
实验室建设了多源异构的非结构化文本数据资源库,涵盖新闻资讯、新闻评论、网络论坛及论坛评论等多类文本数据,为开展宏观经济治理、舆情监测等研究需求提供数据支撑。
1.新闻文本数据
数据来源包括网易新闻、新浪新闻、腾讯新闻等1000余家新闻网站,覆盖2002—2023年期间发布的新闻文本信息。数据频率为日度,总规模约2100万条,数据容量约60GB。
2.新闻评论文本数据
数据来源于网易新闻、新浪新闻等具备评论功能的新闻网站,覆盖2015—2023年期间的新闻评论文本。数据字段包括评论时间、评论正文、所评论新闻ID等。数据频率为日度,总规模约370万条,数据容量约720MB。
以上数据资源可为科学研究提供重要支撑。以上数据资源可为科学研究提供重要支撑。详情介绍请访问网站:https://macroeco.jxufe.edu.cn/data-warehouse/unstructed-data-dashboard,并向实验室申请访问账号。
