[WARNING] 没有找到 SnippetKey 为 nav-bottom-alert 的项目

基于统计显著性检验的高效用项集挖掘算法

Mining high utility itemsets based on statistical significance testing
吴军
魏丹丹
欧阳艾嘉
王亚
遵义师范学院 信息工程学院, 贵州 遵义 563000

摘要

针对传统高效用项集挖掘算法在具有不同类型标签事务中报告假阳性高效用项集的问题,提出两个基于统计显著性检验的高效用项集挖掘算法——FHUI和PHUI算法。这两个算法首先找到所有待检验高效用项集并依据项集长度进行分组;然后,FHUI算法根据项集自身的频率分布生成零分布,PHUI算法根据事务内置换策略或事务间置换策略构造置换事务集合来生成零分布。最后,FHUI和PHUI算法从零分布中计算出p值并运用错误发现率剔除假阳性高效用项集。基准事务集合实验结果显示FHUI和PHUI算法能够剔除大量的假阳性高效用项集,在后续分类任务中取得了更高的正确率;仿真事务集合实验结果显示FHUI和PHUI算法报告的项集中假阳性高效用项集数量占比低于4.8%且平均效用高于39 000。实验结果证明,在具有不同类型的标签事务中,FHUI和PHUI算法报告的统计显著高效用项集可靠性和实用性更强。

基金项目

国家自然科学基金资助项目(62066049)
贵州省教育厅高等学校青年资助项目(黔教技[2022]313,黔教合KY[2022]015)
贵州省科技厅科技支撑计划资助项目(黔科合支撑[2023]257)
遵义市科技合作资助项目(遵市科合HZ字(2022)123)

出版信息

DOI: 10.19734/j.issn.1001-3695.2024.01.0027
出版期卷: 《计算机应用研究》 印刷出版, 2024年第41卷 第10期
所属栏目: 算法研究探讨
出版页码: 2970-2977
文章编号: 1001-3695(2024)10-013-2970-08

发布历史

[2024-04-18] 优先出版
[2024-10-05] 印刷出版

引用本文

吴军, 魏丹丹, 欧阳艾嘉, 等. 基于统计显著性检验的高效用项集挖掘算法 [J]. 计算机应用研究, 2024, 41 (10): 2970-2977. (Wu Jun, Wei Dandan, Ouyang Aijia, et al. Mining high utility itemsets based on statistical significance testing [J]. Application Research of Computers, 2024, 41 (10): 2970-2977. )

[WARNING] 没有找到 SnippetKey 为 default-intro-about 的项目

  • [WARNING] 没有找到 SnippetKey 为 default-intro-journalname 的项目 [WARNING] 没有找到 SnippetKey 为 journal-periodicals 的项目
  • [WARNING] 没有找到 SnippetKey 为 journal-name-en 的项目
  • [WARNING] 没有找到 SnippetKey 为 common-kh 的项目 [WARNING] 没有找到 SnippetKey 为 journal-issn 的项目
    [WARNING] 没有找到 SnippetKey 为 journal-cn 的项目
[WARNING] 没有找到 SnippetKey 为 default-intro-about-content 的项目

[WARNING] 没有找到 SnippetKey 为 default-intro-index 的项目

    [WARNING] 没有找到 SnippetKey 为 default-intro-index-content 的项目