当前位置：移动技术网 > IT编程>开发语言>.net > 微信小程序代办清单任务之语言识别功能

微信小程序代办清单任务之语言识别功能

2019年04月08日 | 移动技术网IT编程 | 我要评论

555me,泉此方表情包,喔看小说网

　　最近想给自己的代办清单任务微信小程序想加个语音识别识别功能，废话不多说，直接说重点，语音识别使用的是百度语音识别api，因为微信小程序的录音输入文件目前只能是mp3或aac 但是百度语音识别不支持这两种（百度api接口文档上有说明），所以需要把音频格式转换一下，我这边使用的是alvas.audio.dll转换的，目前没发现什么问题。

百度云账号地址：

alvas.audio下载地址：

1、登录百度云账号后打开百度语音页面

创建一个语音识别的应用，记录应用的相关信息，如果api key、secret key ....下载sdk......这里废话就不多说了api文档上面都有 https://ai.baidu.com/docs#/asr-online-csharp-sdk/top。

（这是需要注意的是百度提供的sdk引用的newtonsoft.json 10.0.0.0 以上的版本，所以如果您项目中使用的是低版本的，必须升级newtonsoft.json）

2、下载 alvas.audio.dll 引用到项目中，

直接上代码

    public class audiohelper
    {

        /// <summary>
        /// mp3 to pcm
        /// </summary>
        /// <param name="stream"></param>
        /// <returns></returns>
        public static byte[] mp3topcm(stream stream)
        {
            try
            {
                //mp3 -> mp3 mono 48000 samples per second example
                //int sps = 48000;

                mp3reader mr = new mp3reader(stream);
                intptr formatmp3 = mr.readformat();
                byte[] datamp3 = mr.readdata();
                mr.close();
                intptr formatpcm = audiocompressionmanager.getcompatibleformat(formatmp3, audiocompressionmanager.pcmformattag);
                //mp3 -> pcm
                byte[] datapcm = audiocompressionmanager.convert(formatmp3, formatpcm, datamp3, false);

                return datapcm;
            }
            catch (system.exception ex)
            {
                logmanager.defaultlogger.errorformat("mp3 to pcm 出错：{0}", ex.tostring());
                return null;
            }
        }
    }

上传语音到百度云平台上识别语音

    /// <summary>
    /// 百度语音识别帮助
    /// </summary>
    public class baiduhelper
    {

        private readonly static asr client = new baidu.aip.speech.asr("你的 api key", "你的 secret key");

        /// <summary>
        /// 语音识别
        /// </summary>
        /// <param name="data">语音内容</param>
        /// <param name="text">文本内容</param>
        /// <param name="format">语音文件的格式，pcm 或者 wav 或者 amr。不区分大小写。推荐pcm文件,</param>
        /// <param name="rate">采样率，16000，固定值</param>
        /// <param name="devpid">默认1537（普通话 输入法模型）。dev_pid 必须为整数类型。参数可选值见rest api文档说明</param>
        /// <returns></returns>
        public static bool recognize(byte[] data, out string text, string format = "pcm", int rate = 16000, int devpid = 1536)
        {
            text = "";
            client.timeout = 120000;

            var options = new dictionary<string, object>
             {
                {"dev_pid", devpid}
             };

            var jobject = client.recognize(data, format, rate, options);

            if ((int)jobject.getvalue("err_no") == 0)
            {
                text = jobject["result"][0].tostring();
                return true;
            }
            else
            {
                return false;
            }
        }
    }

微信小程序录音上传的代码我就就不贴了，网上很多。官方文档介绍的也很详细，整个流程就是微信小程序录音上传到后台，后台转码后通过百度语音识别api上传到百度云平台，返回结果后台返回给前端。

下面也是比较坑的地方，截止到这里，语音识别基本完成了，我做到这里的时候发现将将程序发到服务器上，语音转码总是报错，语音转码不成功，最后查找alvas.audio的官方文档中给出了解决方案，

要么安装桌面体验，要么安装库文件，我选择了安装桌面体验，具体怎么安装桌面体验，可以百度一下，（就像安装iis一样）

安装桌面体验参考地址：

这个时候你发布到服务器上的程序，音频就会正常转换了

下面恭请大家同行们体验一下我的微信小程序，体验一下我实现的语音识别功能，

简单介绍一下我的微信小程序：

这个是个代办清单任务的小程序，和备忘录相似，主要是自己用方便，简单方便，没有复杂的设置，记录自己的规划，让自己的工作生活变的有计划。简单而实用。发现用的人还挺多，为了更简单，就加上了语音识别功能，在编辑任务的时候可以不用手打字，只要说话就能识别成文字，

使用语音识别的正确姿势

长按输入框上按钮，最长可一次性转换10秒语音，

做个广告,希望同行们的支持，小的拖家带口感谢您的支持，感谢您的赏了.........

您可能感兴趣的文章:

如对本文有疑问，请在下面进行留言讨论，广大热心网友会与你互动！！点击进行留言回复

微信退款（在.net core 用http方式请求）

微信JSAPI支付申请退款接口地址接口链接：https://api.mch.weixin.qq.com/secapi/pay/refund 是否需... [阅读全文]
Owin Katana 的底层源码分析

最近看了一下开源项目asp.net katana，感觉公开的接口非常的简洁优雅，channel 9 说是受到node.js的启发设计的，Katana是一... [阅读全文]
jenkins发布application且并运行

一、发布配置差异配置：编译内容编译目标NetWorkClient/KJ90NetClient.csproj编译命令/t:build/p:Configur... [阅读全文]
WPF 简易日期控件魔改ListBox

先上截图修正：应该将SetTime方法修改为，行号为207行开始修改 var nk = Day_of_week(year, month, 1); i... [阅读全文]
DevExpress+Winform（二）

无敌模糊学习视频：https://www.bilibili.com/video/BV15x411x7WN?p=3 第三集：实现一个页面，新建devexp... [阅读全文]
DevExpress+Winform（三）

第四讲：添加GridControl，一个GridControl可以对应多个展示数据View，默认会有一个GridView。设置ShowGroupPan... [阅读全文]
docker部署netcore项目 nginx负载均衡

前言：本文主要内容是docker部署netcore应用以及docker运行nginx实现负载均衡。到目前为止感觉微软在跨平台的方面虽然有较大的进步，但... [阅读全文]
基于微信个人收款码的支付接口的实现与源码

前言如果我们希望为自己的网站增添微信扫码收款功能，用于收取一些服务费用，为个人网站提供自动化有偿服务的话，那我们有哪些方案呢？首先，我们先看下效果... [阅读全文]
asp.net搭建博客，使用BlogEngine.NET+MySql搭建博客

起因：github日推邮件中来了个BlogEngine.NET，出于好奇然后就点击链接进去查看了下，发现这TM的太适合.net新手搭建博客网站了。以前的... [阅读全文]
JWT 使用加密算法RS256 非对称加密解密

参考文档： https://gist.github.com/ssippe/8fc11c4d7e766e66f06db0431dba3f0ahttps:/... [阅读全文]

网友评论


验证码：

微信小程序代办清单任务之语言识别功能

2019年04月08日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论