当前位置：移动技术网 > IT编程>脚本编程>Python > Python代码实现KNN算法

Python代码实现KNN算法

2018年02月17日 | 移动技术网IT编程 | 我要评论

kNN算法是k-近邻算法的简称，主要用来进行分类实践，主要思路如下：

1.存在一个训练数据集，每个数据都有对应的标签，也就是说，我们知道样本集中每一数据和他对应的类别。
2.当输入一个新数据进行类别或标签判定时，将新数据的每个特征值与训练数据集中的每个数据进行比较，计算其到训练数据集中每个点的距离（下列代码实现使用的是欧式距离）。
3.然后提取k个与新数据最接近的训练数据点所对应的标签或类别。
4.出现次数最多的标签或类别，记为当前预测新数据的标签或类别。

欧式距离公式为：

distance= sqrt（(xA0-XB0）^2+(xA1-XB1）^2+...+(xAn-XBn）^2)(若数据有n个特征项）

以下为代码实现：

#! /usr/bin/python 
#coding=utf-8 
from numpy import * 
import operator 
def createDataSet(): 
  group = array([[1.0,1.1],[1.0,1.0],[0,0],[0,0.1]])#训练数据样本集合 
  labels = ['A','A','B','B']#训练数据对应的类别 
  return group,labels 
''''' 
inX:用于分类的输入向量 
dataSet：训练样本集合 
labels：标签向量 
k：k-近邻算法中的k 
''' 
def classify0(inX,dataSet,labels,k): 
  dataSetSize = dataSet.shape[0] #获取数组的维度，也就是获取训练样本的行数（样本数），若获取列数，则为shape[1] 
  diffMat = tile(inX,(dataSetSize,1)) - dataSet # tile 表示inX在重复dataSetSize行，重复1列。为输入向量与各个样本求取欧式距离做准备。 
  sqDiddMat = diffMat**2 #diffMat是输入向量与我们训练样本每个点相减得到的，**2表示值的结果取平方。 
  sqDistances = sqDiddMat.sum(axis=1)#默认为axis=0，axis=1以后就是将一个矩阵的每一行向量相加 
  distances = sqDistances**0.5 #对结果进行开平方，得到输入向量与每个训练样本中点的欧式距离 
  sorteDistIndicies = distances.argsort()#将距离结果按照从小到大排序获得索引值 
  classcount={} #这是一个字典，key为类别，value为距离最小的前k个样本点里面为该类别的个数。 
  for i in range(k): 
    voteIlabel = labels[sorteDistIndicies[i]]#获取距离最小的前k个样本点对应的label值 
    classcount[voteIlabel] = classcount.get(voteIlabel,0)+1 #如果之前的样本点label值与与现在的相同，则累计加1，否则，此次加1 
  sorteClassCount = sorted(classcount.iteritems(),key=operator.itemgetter(1),reverse=True) #针对calsscount获取对象的第1个域的值进行降序排序。也就是说根据类别的个数从大到小排序。 
  return sorteClassCount[0][0] #返回排序的字典的第一个元素的key，即分类后的类别 
 
createDataSet() 
print classify0([0.9,0.9],group,labels,3)

结果为：A

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持移动技术网。

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

第二章如何利用Python读取Oracle表数据和表头转化为字典类型

第一章跟大家说了如何链接Oracle，这边就不多说了，那就开始接下来的操作目的: 把表头与字段值转化为字典的形式... [阅读全文]
python爱的魔力绕绕圈--条件和循环

概要情况python前置基础再复习，内容包括条件语句、循环语句、异常处理等具体代码及要点见下方：（另：pytho... [阅读全文]
荐 Python基础知识（一）：变量与赋值、运算符、数据类型及位运算

学习目标了解python中基本的变量类型，运算符，及数据类型。了解python的位运算1 注释在 Python ... [阅读全文]
荐数据可视化与文本分类_CodingPark编程公园

@Python [阅读全文]
python漫画爬虫:我不做人了，b站！爬取辉夜大小姐等漫画

今天我们要爬取这个网站的《辉夜大小姐想让我告白》漫画（穷人靠科技，富人靠硬币，懂，不多说）首先我们找到了每一话的... [阅读全文]
SlugRelatedField自动创建关联表对象

SlugRelatedField自动创建关联表对象例如有以下模型类,此处外键设置时blank和null约束条件必... [阅读全文]
使用python turtle库13行代码实现奥运五环

网上看到很多关于画奥运五环的python代码，但大多是采用一个个地画地方式，整体代码显得很累赘，故此我使用for... [阅读全文]
手把手教物体检测——YOLOV4（pytorch）

摘要 YOLOV4在coco上面达到了43.5%AP ，在Tesla V100 上达到了65FPS。相比今年的其... [阅读全文]
新手入住python该如何编程6

6.1鼠标点击事件我们可以使用【when_sprite_clicked】语句来处理角色的点击事件。这个语句需要两... [阅读全文]
【LeeCode 中等数学 python3】剑指 Offer 43. 1～n整数中1出现的次数

想要看更加舒服的排版、更加准时的推送关注公众号“不太灵光的程序员”每日八点有干货推送，微信随时解答你的疑问剑指 ... [阅读全文]

网友评论


验证码：

Python代码实现KNN算法

2018年02月17日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论