当前位置：移动技术网 > IT编程>脚本编程>Python > python实现SOM算法

python实现SOM算法

2019年06月18日 | 移动技术网IT编程 | 我要评论

海涛敷面膜吓网友,宝来1.4t运动版,123网址之家

算法简介

som网络是一种竞争学习型的无监督神经网络，将高维空间中相似的样本点映射到网络输出层中的邻近神经元。

训练过程简述：在接收到训练样本后，每个输出层神经元会计算该样本与自身携带的权向量之间的距离，距离最近的神经元成为竞争获胜者，称为最佳匹配单元。然后最佳匹配单元及其邻近的神经元的权向量将被调整，以使得这些权向量与当前输入样本的距离缩小。这个过程不断迭代，直至收敛。

网络结构：输入层和输出层（或竞争层），如下图所示。
输入层：假设一个输入样本为x=[x1,x2,x3,…,xn]，是一个n维向量，则输入层神经元个数为n个。
输出层（竞争层）：通常输出层的神经元以矩阵方式排列在二维空间中，每个神经元都有一个权值向量。
假设输出层有m个神经元，则有m个权值向量，wi = [wi1,wi2,....,win], 1<=i<=m。

算法流程：

1. 初始化:权值使用较小的随机值进行初始化，并对输入向量和权值做归一化处理
          x' = x/||x||
          ω'i= ωi/||ωi||， 1<=i<=m
          ||x||和||ωi||分别为输入的样本向量和权值向量的欧几里得范数。

2.将样本输入网络:样本与权值向量做点积，点积值最大的输出神经元赢得竞争，
（或者计算样本与权值向量的欧几里得距离，距离最小的神经元赢得竞争）记为获胜神经元。

3.更新权值:对获胜的神经元拓扑邻域内的神经元进行更新,并对学习后的权值重新归一化。
        ω(t+1)= ω(t)+ η(t，n) * (x-ω(t))
        η(t，n):η为学习率是关于训练时间t和与获胜神经元的拓扑距离n的函数。
        η(t，n)=η(t)e^(-n)
        η(t)的几种函数图像如下图所示。

4.更新学习速率η及拓扑邻域n,n随时间增大距离变小，如下图所示。

5.判断是否收敛。如果学习率η<=ηmin或达到预设的迭代次数，结束算法。

python代码实现som

import numpy as np
import pylab as pl

class som(object):
  def __init__(self, x, output, iteration, batch_size):
    """
    :param x: 形状是n*d， 输入样本有n个,每个d维
    :param output: (n,m)一个元组，为输出层的形状是一个n*m的二维矩阵
    :param iteration:迭代次数
    :param batch_size:每次迭代时的样本数量
    初始化一个权值矩阵，形状为d*(n*m)，即有n*m权值向量，每个d维
    """
    self.x = x
    self.output = output
    self.iteration = iteration
    self.batch_size = batch_size
    self.w = np.random.rand(x.shape[1], output[0] * output[1])
    print (self.w.shape)

  def getn(self, t):
    """
    :param t:时间t, 这里用迭代次数来表示时间
    :return: 返回一个整数，表示拓扑距离，时间越大，拓扑邻域越小
    """
    a = min(self.output)
    return int(a-float(a)*t/self.iteration)

  def geteta(self, t, n):
    """
    :param t: 时间t, 这里用迭代次数来表示时间
    :param n: 拓扑距离
    :return: 返回学习率，
    """
    return np.power(np.e, -n)/(t+2)

  def updata_w(self, x, t, winner):
    n = self.getn(t)
    for x, i in enumerate(winner):
      to_update = self.getneighbor(i[0], n)
      for j in range(n+1):
        e = self.geteta(t, j)
        for w in to_update[j]:
          self.w[:, w] = np.add(self.w[:,w], e*(x[x,:] - self.w[:,w]))

  def getneighbor(self, index, n):
    """
    :param index:获胜神经元的下标
    :param n: 邻域半径
    :return ans: 返回一个集合列表，分别是不同邻域半径内需要更新的神经元坐标
    """
    a, b = self.output
    length = a*b
    def distence(index1, index2):
      i1_a, i1_b = index1 // a, index1 % b
      i2_a, i2_b = index2 // a, index2 % b
      return np.abs(i1_a - i2_a), np.abs(i1_b - i2_b)

    ans = [set() for i in range(n+1)]
    for i in range(length):
      dist_a, dist_b = distence(i, index)
      if dist_a <= n and dist_b <= n: ans[max(dist_a, dist_b)].add(i)
    return ans



  def train(self):
    """
    train_y:训练样本与形状为batch_size*(n*m)
    winner:一个一维向量，batch_size个获胜神经元的下标
    :return:返回值是调整后的w
    """
    count = 0
    while self.iteration > count:
      train_x = self.x[np.random.choice(self.x.shape[0], self.batch_size)]
      normal_w(self.w)
      normal_x(train_x)
      train_y = train_x.dot(self.w)
      winner = np.argmax(train_y, axis=1).tolist()
      self.updata_w(train_x, count, winner)
      count += 1
    return self.w

  def train_result(self):
    normal_x(self.x)
    train_y = self.x.dot(self.w)
    winner = np.argmax(train_y, axis=1).tolist()
    print (winner)
    return winner

def normal_x(x):
  """
  :param x:二维矩阵，n*d，n个d维的数据
  :return: 将x归一化的结果
  """
  n, d = x.shape
  for i in range(n):
    temp = np.sum(np.multiply(x[i], x[i]))
    x[i] /= np.sqrt(temp)
  return x
def normal_w(w):
  """
  :param w:二维矩阵，d*(n*m)，d个n*m维的数据
  :return: 将w归一化的结果
  """
  for i in range(w.shape[1]):
    temp = np.sum(np.multiply(w[:,i], w[:,i]))
    w[:, i] /= np.sqrt(temp)
  return w

#画图
def draw(c):
  colvalue = ['r', 'y', 'g', 'b', 'c', 'k', 'm']
  for i in range(len(c)):
    coo_x = []  #x坐标列表
    coo_y = []  #y坐标列表
    for j in range(len(c[i])):
      coo_x.append(c[i][j][0])
      coo_y.append(c[i][j][1])
    pl.scatter(coo_x, coo_y, marker='x', color=colvalue[i%len(colvalue)], label=i)

  pl.legend(loc='upper right')
  pl.show()

#数据集：每三个是一组分别是西瓜的编号，密度，含糖量
data = """
1,0.697,0.46,2,0.774,0.376,3,0.634,0.264,4,0.608,0.318,5,0.556,0.215,
6,0.403,0.237,7,0.481,0.149,8,0.437,0.211,9,0.666,0.091,10,0.243,0.267,
11,0.245,0.057,12,0.343,0.099,13,0.639,0.161,14,0.657,0.198,15,0.36,0.37,
16,0.593,0.042,17,0.719,0.103,18,0.359,0.188,19,0.339,0.241,20,0.282,0.257,
21,0.748,0.232,22,0.714,0.346,23,0.483,0.312,24,0.478,0.437,25,0.525,0.369,
26,0.751,0.489,27,0.532,0.472,28,0.473,0.376,29,0.725,0.445,30,0.446,0.459"""

a = data.split(',')
dataset = np.mat([[float(a[i]), float(a[i+1])] for i in range(1, len(a)-1, 3)])
dataset_old = dataset.copy()

som = som(dataset, (5, 5), 1, 30)
som.train()
res = som.train_result()
classify = {}
for i, win in enumerate(res):
  if not classify.get(win[0]):
    classify.setdefault(win[0], [i])
  else:
    classify[win[0]].append(i)
c = []#未归一化的数据分类结果
d = []#归一化的数据分类结果
for i in classify.values():
  c.append(dataset_old[i].tolist())
  d.append(dataset[i].tolist())
draw(c)
draw(d)

由于数据比较少，就直接用的训练集做测试了，运行结果图如下，分别是对未归一化的数据和归一化的数据进行的展示。

参考内容：

1.《机器学习》周志华
2.自组织竞争神经网络som

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持移动技术网。

您可能感兴趣的文章:

如对本文有疑问，请在下面进行留言讨论，广大热心网友会与你互动！！点击进行留言回复

Python爬虫:Request Payload和Form Data的简单区别说明

request payload 和 form data 请求头上的参数差别在于：content-typeform datapost表单请求代码示例headers... [阅读全文]
如何基于python实现不邻接植花

有 n 个花园，按从 1 到 n 标记。在每个花园中，你打算种下四种花之一。paths[i] = [x, y] 描述了花园 x 到花园 y 的双向路径。另外，没... [阅读全文]
构建高效的python requests长连接池详解

前文：最近在搞全网的cdn刷新系统，在性能调优时遇到了requests长连接的一个问题，以前关注过长连接太多造成浪费的问题，但因为系统都是分布式扩展的，针对这种... [阅读全文]
python中threading开启关闭线程操作

在python中启动和关闭线程：首先导入threadingimport threading然后定义一个方法def serial_read():......然后定... [阅读全文]
浅谈Python中threading join和setDaemon用法及区别说明

python多线程编程时，经常会用到join()和setdaemon()方法，今天特地研究了一下两者的区别。1、join ()方法：主线程a中，创建了子线程b，... [阅读全文]
Python3-异步进程回调函数(callback())介绍

废话不多说，大家之家看代码吧！#异步'''举例：你喊你朋友吃饭，你朋友正忙，如果你一直在那等他，等你朋友忙完了，你们一块去。--同步调用你喊你朋友吃饭，你朋友正... [阅读全文]
python继承threading.Thread实现有返回值的子类实例

继承与threading.thread实现有返回值的子类mythread，废话不多说，大家直接看代码import threadingclass mythread... [阅读全文]
浅谈Python3多线程之间的执行顺序问题

一个多线程的题：定义三个线程id分别为abc，每个线程打印10遍自己的线程id，按abcabc……的顺序进行打印输出。我的解法：from threading i... [阅读全文]
Python中使用threading.Event协调线程的运行详解

threading.event机制类似于一个线程向其它多个线程发号施令的模式，其它线程都会持有一个threading.event的对象，这些线程都会等待这个事件... [阅读全文]
python 实现两个线程交替执行

我就废话不多说，直接看代码吧！import threadingimport timedef a(): while true: lockb.acquire... [阅读全文]

网友评论


验证码：

python实现SOM算法

2019年06月18日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论