全部(25) 按分类查看
国内外公共政策文本分析中主题模型应用研究进展
作者:龙艺璇,伊惠芳
单位:中科院文献情报中心
关键词:主题模型;公共政策;文本分析;LDA
doi:10.13266/j.issn.2095-5472.2020.029
2020年,第5期 | PDF
学术探索
出版日期: 2020年10月23日
浏览次数:63
摘要: [目的/意义] 梳理主题模型在公共政策文本中的国内外应用现状有助于学习已有研究成果,为未来发展提供理论与实践支持。[方法/过程]采用文献计量分析法从时间趋势、机构分布、期刊分布等角度进行量化分析,详细归纳阐述应用现状;其次,通过关键词共现识别国内外主要研究方向并展开对比分析,总结主题模型应用在公共政策文本中...
影响电影微博互动效果的隐藏主题探究方法及应用
作者:张新香,赵彩霞
单位:中南财经政法大学信息与安全工程学院
关键词:电影微博;互动效果;主题模型;LDA
doi:10.13266/j.issn.2095-5472.2020.027
2020年,第5期 | PDF
学术探索
出版日期: 2020年10月20日
浏览次数:106
摘要: [目的/意义]探究影响电影微博互动效果的隐藏主题能发掘用户关注的热点问题,为企业提供有效的营销策略。 [方法/过程]从新浪微博上爬取2017年上映的123部电影的热门微博,采用主题建模方法挖掘电影微博文本中的隐藏主题,利用回归方法分析隐藏主题对电影微博互动效果的影响。 [结果/结论]结果发现6个可解释主题:电影人物、电影宣传、互动营销、电影内容、电影评价和线下活动,其中电影宣传、互动营销、电...
突发性公共事件微博舆情中热点网民关注偏好研究
作者:王琳炜
单位:广西大学新闻与传播学院
关键词:突发性公共事件;微博舆情;热点网民;关注偏好
doi:10.13266/j.issn.2095-5472.2020.026
2020年,第5期:271-282 | PDF
学术探索
出版日期: 2020年10月19日
浏览次数:72
摘要: [目的/意义]旨在通过对热点网民微博词汇频率进行量化处理,总结其在突发性公共事件中的关注点,以实现在舆情防控与治理方面找到新的突破口。[方法/过程]通过爬取微博热点网民的微博数据,利用Word2vec向量模型和TF-IDF权值算法得到热点网民微博词云图中的词类、词性占比和词汇相似比等指标,最后对自然灾害、事故灾难、公共卫生事件和社会安全事件的指标进行汇总分析。[结果/结论]在突发事件舆情中,...
基于用户特征的电费回收分析及策略——电力知识化转型工程实践
作者:江元,杨波,王麒,等
单位:国网甘肃省电力有限公司
关键词:电力系统知识化;数据智能;电力营销;用户特征
doi:10.13266/j.issn.2095-5472.2020.018
2020年,第3期:200-208 | PDF
最佳实践
出版日期: 2020年6月30日
浏览次数:403
摘要: [目的/意义]随着知识管理相关理论的发展,各相关工业部门特别是完成了信息化的工业部门也面临着越来越紧迫的知识化转型。在知识化转型过程中除知识管理的相关理论外,也需要提炼出知识管理相关工具体系。[方法/过程]主要研究知识管理相关工具在电力行业市场营销领域中的应用,从电力业务人员日常接触的数据中萃取影响缴费用户的特征因素,并形成与用户缴费欠费习惯相关的关键知识,为业务人员未来工作进行指导。首先,...
产业链视角下结合K-meansLDA的专利技术主题挖掘与趋势分析——以虚拟现实技术为例
作者:陈玲,林平,段尧清
单位:华中师范大学信息管理学院
关键词:K-means聚类算法;LDA主题模型;技术主题演化;文本挖掘;VR(虚拟现实)
doi:10.13266/j.issn.2095-5472.2020.013
2020年,第3期:135-146 | PDF
专稿
出版日期: 2020年6月5日
浏览次数:434
摘要: [目的/意义] 在产业链视角下,以虚拟现实技术为例,构建VR专利产业链语料库,挖掘中国VR专利的技术主题、研发热点和未来发展趋势。[方法/过程] 首先,利用Python爬取VR领域的专利文本,通过数据清洗得到有效语料库;然后,结合IPC分类号和K-means聚类算法,构建并验证VR专利产业链;最后,基于TF-IDF算法和LDA主题模型,识别出产业链视角下中国VR专利的核心技术主题及其综合强度...
网络谣言敏感词库的构建研究——以新浪微博谣言为例
作者:夏松,林荣蓉,刘勘
单位:中南财经政法大学
关键词:敏感词库;词向量;特征空间;网络谣言
doi:10.13266/j.issn.2095-5472.2019.028
2019年,第5期:267-275 | PDF
专稿
出版日期: 2019年9月11日
浏览次数:2278
摘要: [目的/意义]网络谣言严重影响网络正常信息的传播,对网络谣言进行识别有着重要的现实意义。笔者构建一个基于微博的网络谣言敏感词库,以提高网络谣言的识别精度。[方法/过程]针对微博类社交平台短文本的特点,首先舍弃传统的分词算法,设计LBCP抽词算法,并结合位置信息和改进的TF-IDF权重来提取敏感词库的种子词集,然后通过聚类算法将种子词的近义词补充到词库中,再将常用的替代词也加入到词库中,从而得...
2000-2018年国内机构知识库研究可视化分析
作者:陈和,林静
单位:厦门大学图书馆
关键词:机构知识库;IR;数据可视化;知识图谱;文献计量;研究热点
doi:10.13266/j.issn.2095-5472.2019.027
2019年,第5期:276-286 | PDF
学术探索
出版日期: 2019年9月4日
浏览次数:1128
摘要: [目的/意义]目前IR发展到相对成熟阶段,对国内IR发展情况进行梳理、分析和总结,可为下一阶段IR发展提供参考建议。[方法/过程]利用Excel、VOSviewer、CiteSpace等软件和编程处理数据方法,对2000-2018年CNKI收录的1 362篇IR期刊论文进行可视化分析。[结果/结论]国内IR发文经历了迅速增长期、相对平稳期以及快速下滑期,预示目前国内IR研究进入新阶段,出现新...
社会媒体情境下跨区域突发事件应急决策支持体系研究
作者:陆文婷
单位:首都经济贸易大学
关键词:社会媒体;突发事件;应急决策支持;多源信息融合
doi:10.13266/j.issn.2095-5472.2019.026
2019年,第4期:246-255 | PDF
学术探索
出版日期: 2019年8月28日
浏览次数:739
摘要: [目的/意义]社交网络、微博等社会媒体的出现和快速发展给突发事件应急管理带来了全新的机遇与挑战。社会媒体情境下跨区域突发事件应急决策支持体系的构建与研究,不仅能够丰富和发展突发事件应急管理理论,而且能为跨区域突发事件应急决策提供科学依据和实践指导。[方法/过程]针对跨区域突发事件应急决策所面临的数据多源而信息挖掘利用不充分的问题,结合社会媒体数据的特点, 从多源信息融合的视角充分考虑多种信息...
基于藏书印记信息的特藏信息挖掘初探:以复旦大学图书馆为例
作者:李彦霖
单位:复旦大学图书馆
关键词:特藏建设;回溯;鉴藏章;馆藏章;数据分析
doi:10.13266/j.issn.2095-5472.2019.025
2019年,第4期:232-245 | PDF
学术探索
出版日期: 2019年8月19日
浏览次数:1466
摘要: [目的/意义]借鉴书画、古籍的做法,利用中国特有的鉴藏章文化追溯中文特藏单册流传的历史信息,重建特藏馆藏流传历史。[方法/过程]除介绍复旦大学图书馆现行单册鉴藏章、馆藏书籍签章信息的收集、分析和利用的案例外,针对解决无档案记载可寻的印章进行数据挖掘尝试。[结果/结论]经小样本收集数据分析实验,论证该方法的可行性,明确所需元数据字段,制定大规模回溯需要...
基于ESI数据库研究前沿的国家竞争力分析——以营养学学科为例
作者:史继红,魏巍,肖丹卉,等
单位:哈尔滨医科大学图书馆
关键词:ESI研究前沿;共被引;营养学;文献计量学分析;核心论文;国家竞争力
doi:10.13266/j.issn.2095-5472.2019.013
2019年,第2期:121-131 | PDF
学术探索
出版日期: 2019年4月26日
浏览次数:17223
摘要: [目的/意义] 基于ESI数据库中的研究前沿模块,结合专家研判对营养学领域的研究前沿进行遴选,并运用文献计量学方法分析主要国家在营养学前沿研究中竞的争力结构,揭示中国在全球营养学前沿中的贡献度和影响力。[方法/过程] 以ESI数据库中9256个研究前沿为基础,通过文献检索、专家遴选等方法筛选出营养学领域研究前沿129个,经过系统性分类形成6个研究方向,对各研究方向的核心论文、施引文献进行分析...