亚洲免费在线-亚洲免费在线播放-亚洲免费在线观看-亚洲免费在线观看视频-亚洲免费在线看-亚洲免费在线视频

PYthon iris KNN,SVM,NB 數(shù)據(jù)分析 + 可視化

系統(tǒng) 2065 0

這學期選修了一門Python在大數(shù)據(jù)中的應(yīng)用這門課,是方老師教的,了解了一些數(shù)據(jù)分析常用的庫,Numpy,plt,sklearn等

印象比較深的庫有
1.plt 可以對數(shù)據(jù)進行可視化,利于直觀的進行數(shù)據(jù)分析
2.sklearn 有許多機器學習算法,可以直接用,十分方便

老師留了幾道python題,我這次直接拿來做總結(jié)

//題目描述:
用scikit-learn加載iris數(shù)據(jù)集,采用KNN、SVM和樸素貝葉斯算法進行分類,最后比較這三種方法的優(yōu)缺點。

代碼:

            
              
                # -*- coding: utf-8 -*-
              
              
                """
Created on Sat Jun  1 18:24:09 2019

@author: Administrator
"""
              
              
                # =============================================================================
              
              
                # 作業(yè)要求
              
              
                # 用scikit-learn加載iris數(shù)據(jù)集,
              
              
                # 采用KNN、SVM和樸素貝葉斯算法進行分類,最后比較這三種方法的優(yōu)缺點。
              
              
                # =============================================================================
              
              
                # =============================================================================
              
              
                # #Iris也稱鳶尾花卉數(shù)據(jù)集,是一類多重變量分析的數(shù)據(jù)集。
              
              
                # #可通過花萼長度,花萼寬度,花瓣長度,花瓣寬度4個屬性
              
              
                # #預(yù)測鳶尾花卉屬于(Setosa,Versicolour,Virginica)三個種類中的哪一類。
              
              
                # =============================================================================
              
              
                #導(dǎo)入必要的包
              
              
                import
              
               numpy 
              
                as
              
               np

              
                import
              
               pylab 
              
                as
              
               plt

              
                from
              
               sklearn
              
                .
              
              datasets 
              
                import
              
               load_iris 

              
                from
              
               sklearn
              
                .
              
              model_selection 
              
                import
              
               train_test_split 
              
                #引入train_test_split函數(shù)
              
              
                from
              
               sklearn
              
                .
              
              neighbors 
              
                import
              
               KNeighborsClassifier   
              
                #引入KNN分類器
              
              
                from
              
               sklearn
              
                .
              
              svm 
              
                import
              
               SVC
              
                #引入SVM分類器
              
              
                from
              
               sklearn
              
                .
              
              naive_bayes 
              
                import
              
               GaussianNB
              
                #使用高斯貝葉斯模型
              
              

iris
              
                =
              
              load_iris
              
                (
              
              
                )
              
              
                #加載iris信息
              
              
data
              
                =
              
              iris
              
                .
              
              data
              
                #iris的數(shù)據(jù)集
              
              
target
              
                =
              
              iris
              
                .
              
              target
              
                #iris的種類
              
              
                #使用train_test_split()函數(shù)將數(shù)據(jù)集分成用于訓練的data和用于測試的data
              
              
data_train
              
                ,
              
              data_test
              
                ,
              
              target_train
              
                ,
              
              target_test
              
                =
              
              train_test_split
              
                (
              
              data
              
                ,
              
              target
              
                ,
              
              test_size
              
                =
              
              
                0.3
              
              
                ,
              
              random_state
              
                =
              
              
                0
              
              
                )
              
              
                #1.kNN算法分類
              
              
knn
              
                =
              
              KNeighborsClassifier
              
                (
              
              
                )
              
              
                #調(diào)用knn分類器
              
              
knn
              
                .
              
              fit
              
                (
              
              data_train
              
                ,
              
              target_train
              
                )
              
              
                #訓練knn分類器
              
              
accurate_Knn
              
                =
              
              knn
              
                .
              
              score
              
                (
              
              data_test
              
                ,
              
              target_test
              
                ,
              
              sample_weight
              
                =
              
              
                None
              
              
                )
              
              
                #調(diào)用該對象的打分方法,計算出準確率
              
              
                print
              
              
                'KNN預(yù)測值:'
              
              
                ,
              
              
                (
              
              knn
              
                .
              
              predict
              
                (
              
              data_test
              
                )
              
              
                )
              
              
                #預(yù)測值
              
              
                print
              
              
                '真實值:'
              
              
                ,
              
              
                (
              
              target_test
              
                )
              
              
                #真實值
              
              
                print
              
              
                'KNN輸出訓練集的準確率為:'
              
              
                ,
              
              accurate_Knn

              
                for
              
               i 
              
                in
              
              
                range
              
              
                (
              
              
                len
              
              
                (
              
              target_test
              
                )
              
              
                )
              
              
                :
              
              
                #因為數(shù)據(jù)是二維數(shù)組,所以要用for循環(huán),也可以用reshape對二位數(shù)組進行變形
              
              
                if
              
               target_test
              
                [
              
              i
              
                ]
              
              
                ==
              
              
                0
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'r'
              
              
                )
              
              
                #畫散點圖
              
              
                elif
              
               target_test
              
                [
              
              i
              
                ]
              
              
                ==
              
              
                1
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'g'
              
              
                )
              
              
                else
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'b'
              
              
                )
              
              
plt
              
                .
              
              title
              
                (
              
              
                "iris"
              
              
                )
              
              
plt
              
                .
              
              xlabel
              
                (
              
              
                "ewidth"
              
              
                )
              
              
plt
              
                .
              
              ylabel
              
                (
              
              
                "elength"
              
              
                )
              
              
plt
              
                .
              
              show
              
                (
              
              
                )
              
              

pr
              
                =
              
              knn
              
                .
              
              predict
              
                (
              
              data_test
              
                )
              
              
                for
              
               i 
              
                in
              
              
                range
              
              
                (
              
              
                len
              
              
                (
              
              pr
              
                )
              
              
                )
              
              
                :
              
              
                if
              
               pr
              
                [
              
              i
              
                ]
              
              
                ==
              
              
                0
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'r'
              
              
                )
              
              
                elif
              
               pr
              
                [
              
              i
              
                ]
              
              
                ==
              
              
                1
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'g'
              
              
                )
              
              
                else
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'b'
              
              
                )
              
              
plt
              
                .
              
              title
              
                (
              
              
                "iris-KNN"
              
              
                )
              
              
plt
              
                .
              
              xlabel
              
                (
              
              
                "ewidth"
              
              
                )
              
              
plt
              
                .
              
              ylabel
              
                (
              
              
                "elength"
              
              
                )
              
              
plt
              
                .
              
              show
              
                (
              
              
                )
              
              
                print
              
              
                (
              
              
                "\n\n"
              
              
                )
              
              
                #2.SVM算法分類
              
              
svm
              
                =
              
              SVC
              
                (
              
              kernel
              
                =
              
              
                'rbf'
              
              
                ,
              
              gamma
              
                =
              
              
                0.1
              
              
                ,
              
              decision_function_shape
              
                =
              
              
                'ovo'
              
              
                ,
              
              C
              
                =
              
              
                0.8
              
              
                )
              
              
                #搭建模型,訓練SVM分類器
              
              
svm
              
                .
              
              fit
              
                (
              
              data_train
              
                ,
              
              target_train
              
                )
              
              
                #訓練SVC
              
              
accurate_Svm
              
                =
              
              svm
              
                .
              
              score
              
                (
              
              data_train
              
                ,
              
              target_train
              
                )
              
              
                print
              
              
                'SVM預(yù)測值:'
              
              
                ,
              
              
                (
              
              svm
              
                .
              
              predict
              
                (
              
              data_test
              
                )
              
              
                )
              
              
                #預(yù)測值
              
              
                print
              
              
                '真實值:'
              
              
                ,
              
              
                (
              
              target_test
              
                )
              
              
                #真實值
              
              
                print
              
              
                'SVM-輸出訓練集的準確率為:'
              
              
                ,
              
              accurate_Svm

              
                for
              
               i 
              
                in
              
              
                range
              
              
                (
              
              
                len
              
              
                (
              
              target_test
              
                )
              
              
                )
              
              
                :
              
              
                if
              
               target_test
              
                [
              
              i
              
                ]
              
              
                ==
              
              
                0
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'r'
              
              
                )
              
              
                elif
              
               target_test
              
                [
              
              i
              
                ]
              
              
                ==
              
              
                1
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'g'
              
              
                )
              
              
                else
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'b'
              
              
                )
              
              
plt
              
                .
              
              title
              
                (
              
              
                "iris"
              
              
                )
              
              
plt
              
                .
              
              xlabel
              
                (
              
              
                "ewidth"
              
              
                )
              
              
plt
              
                .
              
              ylabel
              
                (
              
              
                "elength"
              
              
                )
              
              
plt
              
                .
              
              show
              
                (
              
              
                )
              
              

pr
              
                =
              
              svm
              
                .
              
              predict
              
                (
              
              data_test
              
                )
              
              
                for
              
               i 
              
                in
              
              
                range
              
              
                (
              
              
                len
              
              
                (
              
              pr
              
                )
              
              
                )
              
              
                :
              
              
                if
              
               pr
              
                [
              
              i
              
                ]
              
              
                ==
              
              
                0
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'r'
              
              
                )
              
              
                elif
              
               pr
              
                [
              
              i
              
                ]
              
              
                ==
              
              
                1
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'g'
              
              
                )
              
              
                else
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'b'
              
              
                )
              
              
plt
              
                .
              
              title
              
                (
              
              
                "iris-SVM"
              
              
                )
              
              
plt
              
                .
              
              xlabel
              
                (
              
              
                "ewidth"
              
              
                )
              
              
plt
              
                .
              
              ylabel
              
                (
              
              
                "elength"
              
              
                )
              
              
plt
              
                .
              
              show
              
                (
              
              
                )
              
              
                print
              
              
                (
              
              
                "\n\n"
              
              
                )
              
              
                #3.樸素貝葉斯算法分類
              
              
nb
              
                =
              
              GaussianNB
              
                (
              
              
                )
              
              
                #設(shè)置分類器
              
              
nb
              
                .
              
              fit
              
                (
              
              data_train
              
                ,
              
              target_train
              
                )
              
              
accurate_Nb
              
                =
              
              nb
              
                .
              
              score
              
                (
              
              data_train
              
                ,
              
              target_train
              
                )
              
              
                print
              
              
                'NB預(yù)測值:'
              
              
                ,
              
              
                (
              
              nb
              
                .
              
              predict
              
                (
              
              data_test
              
                )
              
              
                )
              
              
                #預(yù)測值
              
              
                print
              
              
                '真實值:'
              
              
                ,
              
              
                (
              
              target_test
              
                )
              
              
                #真實值
              
              
                print
              
              
                'NB-輸出訓練集的準確率為:'
              
              
                ,
              
              accurate_Nb

              
                for
              
               i 
              
                in
              
              
                range
              
              
                (
              
              
                len
              
              
                (
              
              target_test
              
                )
              
              
                )
              
              
                :
              
              
                if
              
               target_test
              
                [
              
              i
              
                ]
              
              
                ==
              
              
                0
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'r'
              
              
                )
              
              
                elif
              
               target_test
              
                [
              
              i
              
                ]
              
              
                ==
              
              
                1
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'g'
              
              
                )
              
              
                else
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'b'
              
              
                )
              
              
plt
              
                .
              
              title
              
                (
              
              
                "iris"
              
              
                )
              
              
plt
              
                .
              
              xlabel
              
                (
              
              
                "ewidth"
              
              
                )
              
              
plt
              
                .
              
              ylabel
              
                (
              
              
                "elength"
              
              
                )
              
              
plt
              
                .
              
              show
              
                (
              
              
                )
              
              

pr
              
                =
              
              nb
              
                .
              
              predict
              
                (
              
              data_test
              
                )
              
              
                for
              
               i 
              
                in
              
              
                range
              
              
                (
              
              
                len
              
              
                (
              
              pr
              
                )
              
              
                )
              
              
                :
              
              
                if
              
               pr
              
                [
              
              i
              
                ]
              
              
                ==
              
              
                0
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'r'
              
              
                )
              
              
                elif
              
               pr
              
                [
              
              i
              
                ]
              
              
                ==
              
              
                1
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'g'
              
              
                )
              
              
                else
              
              
                :
              
              
        plt
              
                .
              
              scatter
              
                (
              
              data_test
              
                [
              
              i
              
                ,
              
              
                0
              
              
                ]
              
              
                ,
              
              data_test
              
                [
              
              i
              
                ,
              
              
                1
              
              
                ]
              
              
                ,
              
              c
              
                =
              
              
                'b'
              
              
                )
              
              

plt
              
                .
              
              title
              
                (
              
              
                "iris-NB"
              
              
                )
              
              
plt
              
                .
              
              xlabel
              
                (
              
              
                "ewidth"
              
              
                )
              
              
plt
              
                .
              
              ylabel
              
                (
              
              
                "elength"
              
              
                )
              
              
plt
              
                .
              
              show
              
                (
              
              
                )
              
            
          

運行結(jié)果
PYthon iris KNN,SVM,NB 數(shù)據(jù)分析 + 可視化_第1張圖片

偷個懶,其他的運行結(jié)果就不貼了,都差不多。

結(jié)果分析:
對比三種算法的準確率我發(fā)現(xiàn)knn=0.97,svm=0.96,樸素貝葉斯=0.94
即在較少數(shù)據(jù)時knn>svm>樸素貝葉斯,進一步得出結(jié)論,較少數(shù)據(jù)時KNN和svm的分類效率較高,樸素貝葉斯的效率較低。

本人水平有限,如有問題歡迎大家不吝指正。


更多文章、技術(shù)交流、商務(wù)合作、聯(lián)系博主

微信掃碼或搜索:z360901061

微信掃一掃加我為好友

QQ號聯(lián)系: 360901061

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描下面二維碼支持博主2元、5元、10元、20元等您想捐的金額吧,狠狠點擊下面給點支持吧,站長非常感激您!手機微信長按不能支付解決辦法:請將微信支付二維碼保存到相冊,切換到微信,然后點擊微信右上角掃一掃功能,選擇支付二維碼完成支付。

【本文對您有幫助就好】

您的支持是博主寫作最大的動力,如果您喜歡我的文章,感覺我的文章對您有幫助,請用微信掃描上面二維碼支持博主2元、5元、10元、自定義金額等您想捐的金額吧,站長會非常 感謝您的哦!!!

發(fā)表我的評論
最新評論 總共0條評論
主站蜘蛛池模板: 国产精品成人麻豆专区 | 在线视频不卡国产在线视频不卡 | 老子影院午夜伦手机不四虎 | 欧美性www| 一级免费毛片 | 国产日日干 | 日本囗交做爰视频欧美 | 久久99国产精品久久99小说 | 最新日韩在线 | 久久不射网站 | 成人国产亚洲欧美成人综合网 | 99久久免费国产精品 | 大香线一本 | 中文字幕亚洲欧美日韩高清 | 国产成人毛片视频不卡在线 | 2019最新四虎免费8848 | 亚洲精品一区二区手机在线 | 日日摸夜夜爽久久综合 | 国产一及毛片 | 奇米网7777 | 日本精品高清一区二区不卡 | 午夜三级做爰视频在线看 | 成人国产在线视频 | 欧美日韩一区二区视频免费看 | 九九热在线视频观看 | 日本黄页免费 | 依人综合网 | 最新国产福利片在线观看 | 久久久91精品国产一区二区 | 亚洲激情在线 | 成人永久福利在线观看不卡 | 日韩新片王 | 精品一区二区三区亚洲 | 亚洲精品久久片久久 | 狠狠操天天爱 | 亚洲黄色在线看 | 亚洲精品欧洲精品 | 日韩一区二区在线观看 | 伊人首页 | 欧美专区在线播放 | 国产午夜精品久久理论片 |