2021-11-18 21:54:12 索炜达电子 627
项目编号:B403
文件大小:1.06M
操作系统:Windows10旗舰版
源码说明:带中文注释
开发工具:Python
开发语言:.py
本文使用决策树算法实现了对 Iris 数据集 [1] 进行分类的任务,在随机输入的不同训练集和测试集下可以获得 90%以上的准确率,最高的准确率达到了 97.10%。在任务中还对连续数据的离散化方法、决策树的尺寸以及剪枝、决策树和朴素贝叶斯算法的对比以及软决策等方法进行了一定程度的探究。为提高决策树的稳定性和防止过拟合提供了一定的帮助。
使用Python3.7运行
需要调用的python库有numpy,random,math,operator,collections和matplotlib
——decision_tree.py 决策树程序,可修改数据集比例和随机数种子以及阈值Threshold
——treePlotter.py 绘制决策树程序,为现有的python库文件
——naive_beyes.py 用于计算朴素贝叶斯分类的准确率
字典结构
决策树——主程序
决策树——生成
目录│文件列表:
└ decision_tree-homework
│ 0.6_12_0.png
│ 0.6_12_1.png
│ 0.6_12_2.png
│ 0.6_12_3.png
│ 0.6_1824_0.png
│ -决策树(DT).pdf
│ decision_tree.py
│ Homework - Decision Tree Learning for Classification.pdf
│ naive_beyes.py
│ treePlotter.py
│ 决策树——主程序.png
│ 决策树——生成.png
│ 字典结构.png
├ .idea
│ │ .gitignore
│ │ deployment.xml
│ │ H1.iml
│ │ misc.xml
│ │ modules.xml
│ │ vcs.xml
│ └ inspectionProfiles
│ │ profiles_settings.xml
│ └ Project_Default.xml
├ dataset
│ │ bezdekIris.data
│ │ Index
│ │ iris.data
│ └ iris.names
└ __pycache__
└ treePlotter.cpython-37.pyc