JOURNAL OF LIGHT INDUSTRY

CN 41-1437/TS  ISSN 2096-1553

微博话题检测SP&HC聚类算法分析

甘勇,姜森,杨佳佳

downloadPDF
甘勇, 姜森, 杨佳佳. 微博话题检测SP&HC聚类算法分析[J]. 轻工学报, 2014, 29(2): 58-61. doi: 10.3969/j.issn.2095-476X.2014.02.015
引用本文:甘勇, 姜森, 杨佳佳. 微博话题检测SP&HC聚类算法分析[J]. 轻工学报, 2014, 29(2): 58-61.doi:10.3969/j.issn.2095-476X.2014.02.015
GAN Yong, JIANG Sen and YANG Jia-jia. The SP&HC clustering algorithm analysis of micro-blog topic detection[J]. Journal of Light Industry, 2014, 29(2): 58-61. doi: 10.3969/j.issn.2095-476X.2014.02.015
Citation:GAN Yong, JIANG Sen and YANG Jia-jia. The SP&HC clustering algorithm analysis of micro-blog topic detection[J]. Journal of Light Industry, 2014, 29(2): 58-61.doi:10.3969/j.issn.2095-476X.2014.02.015

微博话题检测SP&HC聚类算法分析

  • 基金项目:国家自然科学基金项目(61272038)

  • 中图分类号:TP18;TP393.092

The SP&HC clustering algorithm analysis of micro-blog topic detection

  • Received Date:2013-12-05
    Available Online:2014-03-15

    CLC number:TP18;TP393.092

  • 摘要:针对微博网站中具有较大的文本信息量、采用凝聚层次聚类算法不适合、Single-Pass聚类算法检测结果不准确等问题,提出一种将这2种算法相结合的SP&HC聚类算法:利用Single-Pass聚类算法进行大量微博文本的简单聚类,收集一些小幅度、高凝聚力的主题话题,使得形成的主题话题在内容上和数量上得到极大的精简,直到使得主题话题能达到层次聚类算法的要求;运用层次聚类算法对主题话题进行相似话题聚类,直到符合预设值的条件.实验结果证实了SP&HC聚类算法在召回率和准确率上的综合性能优于前2种算法.
    1. [1]

      张旭洁,刘宗田.事件本体构建中几个关键问题的研究[D].上海:上海大学,2013.

    2. [2]

      王娜,李明.Web文本挖掘的研究[D].兰州:兰州理工大学,2005.

    3. [3]

      关冕,马军.Web论坛结构化数据抽取技术研究[D].济南:山东大学,2010.

    4. [4]

      洪宇.基于语义结构和时序特征的话题检测与跟踪技术研究[D].哈尔滨:哈尔滨工业大学,2009.

    5. [5]

      孙胜平,张真继.中文微博客热点话题检测与跟踪技术研究[D].北京:北京交通大学,2011.

    6. [6]

      任姚鹏,陈立潮,张英俊,等.结合语义的特征权重计算方法研究[J].计算机工程与设计,2010,31(10):2381.

    1. [1]

      苏晓珂,王秉政. 基于聚类融合的异常检测算法. 轻工学报, 2011, 26(3): 8-11.doi: 10.3969/j.issn.1004-1478.2011.03.003

    2. [2]

      过金超,杨继纲. 基于改进的SVD算法和二分K-均值聚类算法的协同过滤算法. 轻工学报, 2020, 35(4): 88-95.doi: 10.12187/2020.04.012

    3. [3]

      张建伟,王玲艳,姚云磊. 一种基于OPTICS聚类的流量分类算法. 轻工学报, 2013, 28(2): 83-86.doi: 10.3969/j.issn.2095-476X.2013.02.019

    4. [4]

      许颖梅. 基于动态滑动窗口的改进数据流聚类算法. 轻工学报, 2014, 29(1): 98-102.doi: 10.3969/j.issn.2095-476X.2014.01.021

    5. [5]

      肖艳秋,杨先超,崔光珍,夏琼佩,周坤,张福东,夏苑菲. 基于谱聚类算法的复杂机械产品模块划分方法. 轻工学报, 2021, 36(1): 73-81.doi: 10.12187/2021.01.010

    6. [6]

      郑舒琳,白清源. 基于聚类克隆技术的Markov预测算法的改进. 轻工学报, 2011, 26(4): 72-75.doi: 10.3969/j.issn.1004-1478.2011.04.016

    7. [7]

      曲双红,汪远征,徐雅静. 全局集成聚类法的应用研究. 轻工学报, 2012, 27(2): 105-108.doi: 10.3969/j.issn.1004-1478.2012.02.027

    8. [8]

      董航,李姝湲,郭红霞. 基于谱聚类的SHIBOR非对称波动研究. 轻工学报, 2016, 31(5): 98-104.doi: 10.3969/j.issn.2096-1553.2016.5.017

    9. [9]

      汪万紫,裘国永,张兵权. 基于线性判别分析和二分K均值的高维数据自适应聚类方法. 轻工学报, 2011, 26(2): 106-110.doi: 10.3969/j.issn.1004-1478.2011.02.027

    10. [10]

      黄守佳,黄海洋,李刚. 基于遗传算法的毕业设计评优层次分析模型. 轻工学报, 2011, 26(5): 117-120.doi: 10.3969/j.issn.1004-1478.2011.05.029

    11. [11]

      朱颢东,李雯琦. 基于语义规则和表情加权的中文微博情感分析方法. 轻工学报, 2020, 35(2): 74-82.doi: 10.12187/2020.02.010

    12. [12]

      李亚东,苏海丽,白宝丰,高丽君. 聚甲基乙撑碳酸酯加工性能研究. 轻工学报, 2013, 28(6): 44-47.doi: 10.3969/j.issn.2095-476X.2013.06.011

    13. [13]

      秦建国,谢栋梁,王静娜. 一类可以对角化的矩阵. 轻工学报, 2013, 28(2): 106-108.doi: 10.3969/j.issn.2095-476X.2013.02.025

    14. [14]

      过金超,楚东月,崔光照. 基于电极阵列优化的类真空静电吸附技术. 轻工学报, 2015, 30(1): 85-89.doi: 10.3969/j.issn.2095-476X.2015.01.018

    15. [15]

      王志涛,张林森,金恺,白庆玲,司延举,董会超,王力臻. 聚偏氟乙烯准固态电解质薄膜的制备及性能研究. 轻工学报, 2014, 29(5): 6-11.doi: 10.3969/j.issn.2095-476X.2014.05.002

    16. [16]

      周慧,易翠平. 大米低聚异麦芽糖的润肠通便研究. 轻工学报, 2014, 29(6): 28-32.doi: 10.3969/j.issn.2095-476X.2014.06.008

    17. [17]

      王明花,杨光,张园厂,康萌萌,何领好,冯孝中,彭东来,张治红. DNA在石墨烯/金纳米/聚吡咯复合材料上的固定及杂交. 轻工学报, 2014, 29(4): 6-11.doi: 10.3969/j.issn.2095-476X.2014.04.002

    18. [18]

      刘瑞雪,陈纪超,李迎博,周腾,王亚玲. 明胶/聚甲基丙烯酸复合水凝胶的制备及其性能研究. 轻工学报, 2020, 35(6): 50-59.doi: 10.12187/2020.06.007

    19. [19]

      赵晓行,沈亚鹏,刘培洋,姬晓月,张世敏,徐淑霞,吴坤. 解淀粉芽孢杆菌YP-2生产γ-聚谷氨酸的变温发酵条件研究. 轻工学报, 2017, 32(4): 30-36.doi: 10.3969/j.issn.2096-1553.2017.4.005

    20. [20]

      闫福丰,张园厂,董晓东,张治红,何领好. MnO2/石墨烯/聚噻吩复合材料的制备与充放电性能研究. 轻工学报, 2014, 29(4): 1-5.doi: 10.3969/j.issn.2095-476X.2014.04.001

  • 加载中
计量
  • PDF下载量:184
  • 文章访问数:8459
  • 引证文献数:0
文章相关
  • 收稿日期:2013-12-05
  • 刊出日期:2014-03-15
    通讯作者:陈斌, bchen63@163.com
    • 1.

      沈阳化工大学材料科学与工程学院 沈阳 110142

    1. 本站搜索
    2. 百度学术搜索
    3. 万方数据库搜索
    4. CNKI搜索
    甘勇, 姜森, 杨佳佳. 微博话题检测SP&HC聚类算法分析[J]. 轻工学报, 2014, 29(2): 58-61. doi: 10.3969/j.issn.2095-476X.2014.02.015
    引用本文:甘勇, 姜森, 杨佳佳. 微博话题检测SP&HC聚类算法分析[J]. 轻工学报, 2014, 29(2): 58-61.doi:10.3969/j.issn.2095-476X.2014.02.015
    GAN Yong, JIANG Sen and YANG Jia-jia. The SP&HC clustering algorithm analysis of micro-blog topic detection[J]. Journal of Light Industry, 2014, 29(2): 58-61. doi: 10.3969/j.issn.2095-476X.2014.02.015
    Citation:GAN Yong, JIANG Sen and YANG Jia-jia. The SP&HC clustering algorithm analysis of micro-blog topic detection[J]. Journal of Light Industry, 2014, 29(2): 58-61.doi:10.3969/j.issn.2095-476X.2014.02.015

    微博话题检测SP&HC聚类算法分析

    • 郑州轻工业学院 计算机与通信工程学院, 河南 郑州 450001
    基金项目:国家自然科学基金项目(61272038)

    摘要:针对微博网站中具有较大的文本信息量、采用凝聚层次聚类算法不适合、Single-Pass聚类算法检测结果不准确等问题,提出一种将这2种算法相结合的SP&HC聚类算法:利用Single-Pass聚类算法进行大量微博文本的简单聚类,收集一些小幅度、高凝聚力的主题话题,使得形成的主题话题在内容上和数量上得到极大的精简,直到使得主题话题能达到层次聚类算法的要求;运用层次聚类算法对主题话题进行相似话题聚类,直到符合预设值的条件.实验结果证实了SP&HC聚类算法在召回率和准确率上的综合性能优于前2种算法.

    English Abstract

    参考文献 (6) 相关文章 (20)

    目录

    /

      返回文章