当前位置：移动技术网 > IT编程>开发语言>c# > C#实现基于ffmpeg加虹软的人脸识别的示例

C#实现基于ffmpeg加虹软的人脸识别的示例

2019年07月18日 | 移动技术网IT编程 | 我要评论

关于人脸识别

目前的人脸识别已经相对成熟，有各种收费免费的商业方案和开源方案，其中opencv很早就支持了人脸识别，在我选择人脸识别开发库时，也横向对比了三种库，包括在线识别的百度、开源的opencv和商业库虹软（中小型规模免费）。

百度的人脸识别，才上线不久，文档不太完善，之前联系百度，官方也给了我基于android的example，但是不太符合我的需求，一是照片需要上传至百度服务器（这个是最大的问题），其次，人脸的定位需要自行去实现（捕获到人脸后上传进行识别）。

opencv很早以前就用过，当时做人脸+车牌识别时，最先考虑的就是opencv，但是识别率在当时不算很高，后来是采用了一个电子科大的老师自行开发的识别库（相对易用，识别率也还不错），所以这次准备做时，没有选择opencv。

虹软其实在无意间发现的，当时正在寻找开发库，正在测试python的一个方案，就发现有新闻说虹软的识别库全面开放并且可以免费使用，而且是离线识别，所以就下载尝试了一下，发现识别率还不错，所以就暂定了采用虹软的识别方案。这里主要就给大家分享一下开发过程当中的一些坑和使用心得，顺便开源识别库的c# wrapper。

sdk的c# wrapper

由于虹软的库是采用c++开发的，而我的应用程序采用的是c#，所以，需要对库进行包装，便于c#的调用，包装的主要需求是可以在c#中快速方便的调用，无需考虑内存、指针等问题，并且具备一定的容错性。wrapper库目前已经开源，大家可以到github上进行下载，地址点击这里。wrapper库基本上没有什么可以说的，无非是对pinvoke的包装，只是里面做了比较多的细节处理，屏蔽了调用细节，提供了相对高层的函数。有兴趣的可以看看源代码。

wrapper库的使用例子

基本使用

人脸检测（静态图片）：

using (var detection = locatorfactory.getdetectionlocator("appid", "sdkkey"))
{
  var image = image.fromfile("test.jpg");
  var bitmap = new bitmap(image);

  var result = detection.detect(bitmap, out var locateresult);
  //检测到位置信息在使用完毕后，需要释放资源，避免内存泄露
  using (locateresult)
  {
    if (result == errorcode.ok && locateresult.facecount > 0)
    {
      using (var g = graphics.fromimage(bitmap))
      {
        var face = locateresult.faces[0].torectangle();
        g.drawrectangle(new pen(color.chartreuse), face.x, face.y, face.width, face.height);
      }

      bitmap.save("output.jpg", imageformat.jpeg);
    }
  }
}

人脸跟踪（人脸跟踪一般用于视频的连续帧识别，相较于检测，又更高的执行效率，这里用静态图片做例子，实际使用和检测没啥区别）：

using (var detection = locatorfactory.gettrackinglocator("appid", "sdkkey"))
{
  var image = image.fromfile("test.jpg");
  var bitmap = new bitmap(image);

  var result = detection.detect(bitmap, out var locateresult);
  using (locateresult)
  {
    if (result == errorcode.ok && locateresult.facecount > 0)
    {
      using (var g = graphics.fromimage(bitmap))
      {
        var face = locateresult.faces[0].torectangle();
        g.drawrectangle(new pen(color.chartreuse), face.x, face.y, face.width, face.height);
      }

      bitmap.save("output.jpg", imageformat.jpeg);
    }
  }
}

人脸对比：

using (var proccesor = new faceprocessor("appid",
        "locatorkey", "recognizekey", true))
{
  var image1 = image.fromfile("test2.jpg");
  var image2 = image.fromfile("test.jpg");

  var result1 = proccesor.locateextract(new bitmap(image1));
  var result2 = proccesor.locateextract(new bitmap(image2));
  
  //faceprocessor是个整合包装类，集成了检测和识别，如果要单独使用识别，可以使用facerecognize类
  //这里做演示，假设图片都只有一张脸
  //可以将featuredata持久化保存，这个即是人脸特征数据，用于后续的人脸匹配
  //file.writeallbytes("xxx.data", feature.featuredata);featuredata会自动转型为byte数组

  if ((result1 != null) & (result2 != null))
    console.writeline(proccesor.match(result1[0].featuredata, result2[0].featuredata, true));
}

使用注意事项

locateresult（检测结果）和feature（人脸特征）都包含需要释放的内存资源，在使用完毕后，记得需要释放，否则会引起内存泄露。faceprocessor和facerecognize的match函数，在完成比较后，可以自动释放，只需要最后两个参数指定为true即可，如果是用于人脸匹配（1:n），则可以采用默认参数，这种情况下，第一个参数指定的特征数据不会自动释放，用于循环和特征库的特征进行比对。

整合的完整例子

在github上，有完整的facedemo例子，里面主要实现了通过ffmpeg采集rtsp协议的图像（使用海康的摄像机），然后进行人脸匹配。在开发过程中遇到不少的坑。

人脸识别的首要工作就是捕获摄像机视频帧，这一块上是坑的最久的，因为最开始采用的是opencv的包装库，emgu.cv，在开发过程中，捕获usb摄像头时，倒是问题不大，没有出现过异常。在捕获rtsp视频流时，会不定时的出现accessviolationexception异常，短则几十分钟，长则几个小时，总之就是不稳定。在官方github地址上，也提了issue，他们给出的答复是屏蔽的我业务逻辑，仅捕获视频流试试，结果问题依然，所以，我基本坑定了试emgu.cv上面的问题。后来经过反复的实验，最终确定了选择ffmpeg。

ffmepg主要采用processstartinfo进行调用，我采用的是nreco.videoconverter（一个ffmpeg调用的包装，可以通过nuget搜索安装），虽然ffmpeg解决了稳定性问题，但是实际开发时，也遇到了不少坑，其中，最主要的是nreco.videoconverter没有任何文档和例子（实际有，需要75刀购买），所以，自己研究了半天，如何捕获视频流并转换为bitmap对象。只要实现这一步，后续就是调用wrapper就行了。

facedemo详解

上面说到了，通过ffmpeg捕获视频流并转换bitmap是重点，所以，这里也主要介绍这一块。

首先是ffmpeg的调用参数：

var setting =
new convertsettings
{
  customoutputargs = "-an -r 15 -pix_fmt bgr24 -updatefirst 1"
}; //-s 1920x1080 -q:v 2 -b:v 64k

task = ffmpeg.convertlivemedia("rtsp://admin:12qwaszxa@192.168.1.64:554/h264/ch1/main/av_stream", null,
outputstream, format.raw_video, setting);
task.outputdatareceived += datareceived;
task.start();

-an表示不捕获音频流，-r表示帧率，根据需求和实际设备调整此参数，-pix_fmt比较重要，一般情况下，指定为bgr24不会有太大问题（还是看具体设备），之前就是用成了rgb24，结果捕获出来的图像，人都变成阿凡达了，颜色是反的。最后一个参数，坑的我差点放弃这个方案。本身，ffmpeg在调用时，需要指定一个文件名模板，捕获到的输出会按照模板生成文件，如果要将数据输出到控制台，则最后传入一个-即可，最开始没有指定updatefirst，ffmpeg在捕获了第一帧后就抛出了异常，最后查了半天ffmpeg说明（完整参数说明非常多，输出到文本有1319kb），发现了这个参数，表示持续更新第一个文件。最后，在调用视频捕获是，需要指定输出格式，必须指定为format.raw_video，实际上这个格式名称有些误导人，按道理将应该叫做raw_image，因为最终输出的是每帧原始的位图数据。

到此为止，还并没有解决视频流数据的捕获，因为又来一个坑，processstartinfo的控制台缓冲区大小只有32768 bytes，即，每一次的输出，实际上并不是一个完整的位图数据。

//完整代码参加github源代码
//代码片段1
private bitmap _image;
private intptr _pimage;

{
  _pimage = marshal.allochglobal(1920 * 1080 * 3);
  _image = new bitmap(1920, 1080, 1920 * 3, pixelformat.format24bpprgb, _pimage);
}

//代码片段2
private memorystream outputstream;

private void datareceived(object sender, eventargs e)
{
  if (outputstream.position == 6220800)
    lock (_imagelock)
    {
      var data = outputstream.toarray();

      marshal.copy(data, 0, _pimage, data.length);

      outputstream.seek(0, seekorigin.begin);
    }
}

花了不少时间摸索（不要看只有几行，人都整崩溃了），得出了上述代码。首先，我捕获的图像数据是24位的，并且图像大小是1080p的，所以，实际上，一个原始位图数据的大小为stride * height，即width * 3 * height，大小为6220800 bytes。所以，在判断了捕获数据到达这个大小后，就进行bitmap转换处理，然后将memorystream的位置移动到最开始。需要注意的时，由于捕获到的是原始数据（不包含bmp的headerinfo），所以注意看bitmap的构造方式，是通过一个指向原始数据位置的指针就行构造的，更新该图像时，也仅需要更新指针指向的位置数据即可，无需在建立新的bitmap实例。

位图数据获取到了，就可以进行识别处理了，高高兴兴的加上了识别逻辑，但是现实总是充满了意外和惊喜，没错，坑又来了。没有加入识别逻辑的时候，捕获到的图像在picturebox上显示非常正常，清晰、流畅，加上识别逻辑后，开始出现花屏（捕获到的图像花屏）、拖影、显示延迟（至少会延迟10-20秒以上）、程序卡顿，总之就是各种问题。最开始，我的识别逻辑写到datareceived方法里面的，这个方法是运行于主线程外的另一个线程中的，其实按道理将，捕获、识别、显示位于一个线程中，应该是不会出现问题，我估计（不确定，没有去深入研究，如果谁知道实际原因，可以留言告诉我），是因为ffmpeg的原因，因为ffmpeg是单独的一个进程在跑，他的数据捕获是持续在进行的，而识别模块的处理时间大于每一帧的采集时间，所以，缓冲区中的数据没有得到及时处理，ffmpeg接收到的部分图像数据（大于32768的数据）被丢弃了，然后就出现了各种问题。最后，又是一次耗时不短的探索之旅。

private void render()
{
  while (_renderrunning)
  {
    if (_image == null)
      continue;

    bitmap image;

    lock (_imagelock)
    {
      image = (bitmap) _image.clone();
    }

    if (_shouldshot){
      writefeature(image);
      _shouldshot = false;
    }

    verify(image);

    if (videoimage.invokerequired)
      videoimage.invoke(new action(() => { videoimage.image = image; }));
    else
      videoimage.image = image;
  }
}

如上代码所述，我单独开了一个线程，用于图像的识别处理和显示，每次都从已捕获到的图像中克隆出新的bitmap实例进行处理。这种方式的缺点在于，有可能会导致丢帧的现象，因为上面说到了，识别时间（如果检测到新的人脸，那么加上匹配，大约需要130ms左右）大于每帧时间，但是并不影响识别效果和需求的实现，基本丢弃的帧可以忽律。最后，运行，稳定了、完美了，实际也感觉不到丢帧。

demo程序，我运行了大约4天左右，中间没有出现过任何异常和识别错误。

写在最后

虽然虹软官方表示，免费识别库适用于1000人脸库以下的识别，实际上，做一定的工作（工作量其实也不小），也是可以实现较大规模的人脸搜索滴。例如，采用多线程进行匹配，如果人脸库人脸数量大于1000，则可以考虑每个线程分别进行处理，人脸特征数据做缓存（一个人脸的特征数据是22kb，对内存要求较高），以提升程序的识别搜索效率。或者人脸库特别大的情况下，可以采用分布式处理，人脸特征加载到redis数据库当中，多个进程多个线程读取处理，每个线程上传自己的识别结果，然后主进程做结果合并判断工作，主要的挑战就在于多线程的工作分配一致性和对单点故障的容错性。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持移动技术网。

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

C#实现猜数字游戏

本文实例为大家分享了c#实现猜数字游戏具体代码，供大家参考，具体内容如下给定一个0-100的随机数字猜其大小题目样式：电脑产生一个0到100之间的随机数字，并且... [阅读全文]
使用Visual Studio2019创建C#项目(窗体应用程序、控制台应用程序、Web应用程序)

一、vs的开发环境首先你得安装了vs2019，然后确认下下面三个组件是否存在，如果没有要下载一下。vs2019的安装可参考。二、创建c#窗体应用程序打开vs可以... [阅读全文]
C# 可空类型的具体使用

在项目中我们经常会遇到可为空类型，那么到底什么是可为空类型呢？下面我们将从4个方面为大家剖析。1、可空类型基础知识顾名思义，可空类型指的就是某个对象类型可以为空... [阅读全文]
C#存储相同键多个值的Dictionary实例详解

涉及到两个问题：一、访问磁盘中文件夹、文件夹下面的文件夹先看一下磁盘文件夹结构c盘下面有个根文件夹savefile，savefile下面有两个子文件夹分别为，2... [阅读全文]
vs2019安装和使用详细图文教程

vs2019已经在4月2日正式发布，vs2019发布会请看这个链接：vs2019发布活动vs2019和vs2017一样强大，项目兼容，不用互相删除，而且c/c+... [阅读全文]
C#实现猜数字小游戏

本文实例为大家分享了c#实现猜数字小游戏的具体代码，供大家参考，具体内容如下效果如图：代码：using system;using system.collecti... [阅读全文]
Visual Studio 中自定义代码片段的方法

第一步、打开 visual studio code，按ctrl + shift + p，输入：configure user snippets，选择 prefer... [阅读全文]
C#实现简单俄罗斯方块

最近在看《.net游戏编程入门经典 c#篇》第一章介绍了如何制作俄罗斯方块，自己试了试按照书上的步骤，可算是完成了。于是写下这篇文章留作纪念。1.类的设计在充... [阅读全文]
C#实现获取本地内网(局域网)和外网(公网)IP地址的方法分析

本文实例讲述了c#实现获取本地内网(局域网)和外网(公网)ip地址的方法。分享给大家供大家参考，具体如下：1、获取本机的ip地址集合：/// <summa... [阅读全文]
asp.net实现遍历Request的信息操作示例

本文实例讲述了asp.net实现遍历request的信息操作。分享给大家供大家参考，具体如下：#需求：在服务端获取从客户端发送过来的所有数据信息；#方案：1、服... [阅读全文]

网友评论


验证码：

C#实现基于ffmpeg加虹软的人脸识别的示例

2019年07月18日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论