【B404】使用决策树对Iris数据集进行分类

2021-11-18 21:54:12      索炜达电子      627     

项目编号:B403

文件大小:1.06M

操作系统:Windows10旗舰版

源码说明:带中文注释

开发工具:Python

开发语言:.py

本文使用决策树算法实现了对 Iris 数据集 [1] 进行分类的任务,在随机输入的不同训练集和测试集下可以获得 90%以上的准确率,最高的准确率达到了 97.10%。在任务中还对连续数据的离散化方法、决策树的尺寸以及剪枝、决策树和朴素贝叶斯算法的对比以及软决策等方法进行了一定程度的探究。为提高决策树的稳定性和防止过拟合提供了一定的帮助。

使用Python3.7运行
需要调用的python库有numpy,random,math,operator,collections和matplotlib
——decision_tree.py 决策树程序,可修改数据集比例和随机数种子以及阈值Threshold
——treePlotter.py 绘制决策树程序,为现有的python库文件
——naive_beyes.py 用于计算朴素贝叶斯分类的准确率

字典结构

【B404】使用决策树对Iris数据集进行分类

决策树——主程序

【B404】使用决策树对Iris数据集进行分类

决策树——生成

【B404】使用决策树对Iris数据集进行分类

【B404】使用决策树对Iris数据集进行分类

【B404】使用决策树对Iris数据集进行分类

目录│文件列表:

 └ decision_tree-homework

    │ 0.6_12_0.png

    │ 0.6_12_1.png

    │ 0.6_12_2.png

    │ 0.6_12_3.png

    │ 0.6_1824_0.png

    │ -决策树(DT).pdf

    │ decision_tree.py

    │ Homework - Decision Tree Learning for Classification.pdf

    │ naive_beyes.py

    │ treePlotter.py

    │ 决策树——主程序.png

    │ 决策树——生成.png

    │ 字典结构.png

    ├ .idea

    │  │ .gitignore

    │  │ deployment.xml

    │  │ H1.iml

    │  │ misc.xml

    │  │ modules.xml

    │  │ vcs.xml

    │  └ inspectionProfiles

    │     │ profiles_settings.xml

    │     └ Project_Default.xml

    ├ dataset

    │  │ bezdekIris.data

    │  │ Index

    │  │ iris.data

    │  └ iris.names

    └ __pycache__

       └ treePlotter.cpython-37.pyc

TAG决策树
  • 2 次
  • 100 分