PDF(3095 KB)
PDF(3095 KB)
PDF(3095 KB)
基于BERTopic主题模型的数据要素价值化热点主题及演化分析
Hot Topics and Evolution Analysis of Data Element Valorization Based on the BERTopic Model
【目的/意义】运用BERTopic主题模型分析我国数据要素价值化领域的核心主题、演化路径与前沿动态,为深化理论探索和指导实践应用提供宏观视角与客观依据。【方法/过程】以中国知网(CNKI)2019年至今收录的1 735篇文献为样本,采用BERTopic主题建模方法展开研究。首先通过预训练语言模型构建语义嵌入空间,并结合UMAP降维与HDBSCAN密度聚类算法,初步生成语义相近的主题簇。在此基础上,采用c-TF-IDF进行关键词加权,继而引入时序分析方法,追踪研究主题的动态演变规律。【结果/结论】研究发现:①当前研究主题聚焦于“企业创新与数据要素市场培育”“数据基础制度与产业数字化转型”“要素市场化配置与体制改革”“数据交易制度与市场竞争机制”和“数据赋能生产率提升与监管平衡”五大主题;②数据要素价值化呈现多维度协同特征,并形成动态演进机制。
[Purpose/Significance] This study employs the BERTopic model to analyze the core themes, evolutionary pathways, and frontier dynamics of data element valorization in China, providing a macro perspective and objective foundation for advancing theoretical exploration and guiding practical applications. [Method/Process] Having used 1735 articles published in CNKI from 2019 to the present as the dataset, this research had applied the BERTopic topic modeling approach. First, a semantic embedding space had been constructed using a pre-trained language model, and UMAP had been applied for dimensionality reduction, combined with HDBSCAN for density-based clustering, to have initially generated the incorporation of a temporal analysis method to trace the dynamic evolution of research topics. [Result/Conclusion] The findings reveal that: ① Current research themes focus on five key areas: "Enterprise Innovation and Data Element Market Cultivation", "Data Infrastructure Systems and Industrial Digital Transformation", "Element Marketization Allocation and Institutional Reform", "Data Transaction Systems and Market Competition Mechanisms", and "Data Empowerment for Productivity Improvement and Regulatory Balance". ② Data element valorization exhibits multidimensional collaborative characteristics and forms a dynamic evolutionary mechanism.
数据要素价值化 / BERTopic模型 / 热点主题 / 演化分析
data element valorization / BERTopic model / hot topics / evolutionary analysis
| [1] |
吴江, 陶成煦. 激活数据要素赋能千行万业——《“数据要素×”三年行动计划(2024—2026年)》政策解读[J]. 情报理论与实践, 2024, 47(3): 16-19.
|
| [2] |
李海舰, 赵丽. 数据成为生产要素: 特征、机制与价值形态演进[J]. 上海经济研究, 2021(8): 48-59.
|
| [3] |
张继栋. 地方国有企业数字化转型路径探讨[J]. 现代管理科学, 2021(3): 96-102.
|
| [4] |
刘尚希, 邢丽, 樊轶侠, 等. 以数字化引领数实融合的内在机理与现实思考[J]. 财政研究, 2023, (12): 3-15.
|
| [5] |
俞伯阳, 丛屹. 数字经济、人力资本红利与产业结构高级化[J]. 财经理论与实践, 2021, 42(3): 124-131.
|
| [6] |
尹西明, 林镇阳, 陈劲, 等. 数据要素价值化动态过程机制研究[J]. 科学学研究, 2022, 40(2): 220-229.
|
| [7] |
柳卸林, 董彩婷, 丁雪辰. 数字创新时代:中国的机遇与挑战[J]. 科学学与科学技术管理, 2020, 41(6): 3-15.
|
| [8] |
刘业政, 孙见山, 姜元春, 等. 大数据的价值发现:4C模型[J]. 管理世界, 2020, 36(2): 129-138.
|
| [9] |
何伟. 激发数据要素价值的机制、问题和对策[J]. 信息通信技术与政策, 2020(6): 4-7.
|
| [10] |
杨思洛, 吴丽娟. 基于BERTopic模型的国外信息资源管理研究进展分析[J]. 情报理论与实践, 2024, 47(2): 189-197.
|
| [11] |
苏会灵. 档案数据要素流通的关键问题与对策研究[J]. 山西档案, 2024(2): 62-64.
|
| [12] |
|
| [13] |
|
| [14] |
|
| [15] |
黄科满, 杜小勇. 数据治理价值链模型与数据基础制度分析[J]. 大数据, 2022, 8(4): 3-16.
|
| [16] |
徐蔼婷, 宋妙缘. 基于“价值创造—实现”路径的数据要素核算问题研究[J]. 现代经济探讨, 2024(4): 13-21.
|
| [17] |
金骋路, 陈荣达. 数据要素价值化及其衍生的金融属性:形成逻辑与未来挑战[J]. 数量经济技术经济研究, 2022, 39(7): 69-89.
|
| [18] |
刘桂锋, 吴雅琪, 韩牧哲, 等. 面向数据要素价值化的数据资源应用场景创新研究[J]. 情报理论与实践, 2025, 48(1): 53-62.
|
| [19] |
|
| [20] |
张敏, 沈嘉裕. 突发公共卫生事件中政务短视频主题与用户行为的关联演化研究[J]. 情报杂志, 2023, 42(3): 181-189.
|
| [21] |
|
| [22] |
|
| [23] |
|
| [24] |
|
| [25] |
张清慧, 陈谊, 武彩霞. 基于词表示模型的领域文献数据可视分析方法[J]. 图学学报, 2022, 43(4): 685-694.
|
| [26] |
刘洋, 柳卓心, 金昊, 等. 基于BERTopic模型的用户层次化需求及动机分析——以抖音平台为例[J]. 情报杂志, 2023, 42(12): 159-167.
|
陈婉铭:数据收集与分析,论文撰写;
刘媛华:论文结构设计,论文修改与定稿。
/
| 〈 |
|
〉 |