【B394】基于Python朴素贝叶斯的垃圾邮件分类

2021-11-03 10:56:22      索炜达电子      885     

项目编号:B394

文件大小:185K

源码说明:带中文注释

开发环境:Python3.8

简要概述:

朴素贝叶斯算法实战

email邮件数据集,SogouC新闻数据集

Email_NB.py垃圾邮件过滤实现(Python3实现)

Naive_Bay.py 朴素贝叶斯算法实现(Python3实现)

样本比较小,成功率大概为90%

运行结果:

【B394】基于Python朴素贝叶斯的垃圾邮件分类

目录│文件列表:

 └ Naive_Bayes

    │ Email_NB.py

    │ Naive_Bay.py

    │ stopwords_cn.txt

    ├ .idea

    │  │ .gitignore

    │  │ .name

    │  │ misc.xml

    │  │ modules.xml

    │  │ Naive_Bayes-master.iml

    │  │ workspace.xml

    │  └ inspectionProfiles

    │     └ profiles_settings.xml

    ├ email

    │  ├ ham

    │  │  │ 1.txt

    │  │  │ 10.txt

    │  │  │ 11.txt

    │  │  │ 12.txt

    │  │  │ 13.txt

    │  │  │ 14.txt

    │  │  │ 15.txt

    │  │  │ 16.txt

    │  │  │ 17.txt

    │  │  │ 18.txt

    │  │  │ 19.txt

    │  │  │ 2.txt

    │  │  │ 20.txt

    │  │  │ 21.txt

    │  │  │ 22.txt

    │  │  │ 23.txt

    │  │  │ 24.txt

    │  │  │ 25.txt

    │  │  │ 3.txt

    │  │  │ 4.txt

    │  │  │ 5.txt

    │  │  │ 6.txt

    │  │  │ 7.txt

    │  │  │ 8.txt

    │  │  └ 9.txt

    │  └ spam

    │     │ 1.txt

    │     │ 10.txt

    │     │ 11.txt

    │     │ 12.txt

    │     │ 13.txt

    │     │ 14.txt

    │     │ 15.txt

    │     │ 16.txt

    │     │ 17.txt

    │     │ 18.txt

    │     │ 19.txt

    │     │ 2.txt

    │     │ 20.txt

    │     │ 21.txt

    │     │ 22.txt

    │     │ 23.txt

    │     │ 24.txt

    │     │ 25.txt

    │     │ 3.txt

    │     │ 4.txt

    │     │ 5.txt

    │     │ 6.txt

    │     │ 7.txt

    │     │ 8.txt

    │     └ 9.txt

    └ SogouC

       │ ClassList.txt

       └ Sample

          ├ C000008

          │  │ 10.txt

          │  │ 11.txt

          │  │ 12.txt

          │  │ 13.txt

          │  │ 14.txt

          │  │ 15.txt

          │  │ 16.txt

          │  │ 17.txt

          │  │ 18.txt

          │  └ 19.txt

          ├ C000010

          │  │ 10.txt

          │  │ 11.txt

          │  │ 12.txt

          │  │ 13.txt

          │  │ 14.txt

          │  │ 15.txt

          │  │ 16.txt

          │  │ 17.txt

          │  │ 18.txt

          │  └ 19.txt

          ├ C000013

          │  │ 10.txt

          │  │ 11.txt

          │  │ 12.txt

          │  │ 13.txt

          │  │ 14.txt

          │  │ 15.txt

          │  │ 16.txt

          │  │ 17.txt

          │  │ 18.txt

          │  └ 19.txt

          ├ C000014

          │  │ 10.txt

          │  │ 11.txt

          │  │ 12.txt

          │  │ 13.txt

          │  │ 14.txt

          │  │ 15.txt

          │  │ 16.txt

          │  │ 17.txt

          │  │ 18.txt

          │  └ 19.txt

          ├ C000016

          │  │ 10.txt

          │  │ 11.txt

          │  │ 12.txt

          │  │ 13.txt

          │  │ 14.txt

          │  │ 15.txt

          │  │ 16.txt

          │  │ 17.txt

          │  │ 18.txt

          │  └ 19.txt

          ├ C000020

          │  │ 10.txt

          │  │ 11.txt

          │  │ 12.txt

          │  │ 13.txt

          │  │ 14.txt

          │  │ 15.txt

          │  │ 16.txt

          │  │ 17.txt

          │  │ 18.txt

          │  └ 19.txt

          ├ C000022

          │  │ 10.txt

          │  │ 11.txt

          │  │ 12.txt

          │  │ 13.txt

          │  │ 14.txt

          │  │ 15.txt

          │  │ 16.txt

          │  │ 17.txt

          │  │ 18.txt

          │  └ 19.txt

          ├ C000023

          │  │ 10.txt

          │  │ 11.txt

          │  │ 12.txt

          │  │ 13.txt

          │  │ 14.txt

          │  │ 15.txt

          │  │ 16.txt

          │  │ 17.txt

          │  │ 18.txt

          │  └ 19.txt

          └ C000024

             │ 10.txt

             │ 11.txt

             │ 12.txt

             │ 13.txt

             │ 14.txt

             │ 15.txt

             │ 16.txt

             │ 17.txt

             │ 18.txt

             └ 19.txt

TAG垃圾邮件
  • 6 次
  • 10 分