当前位置：移动技术网 > IT编程>开发语言>Java > Java实现在线语音识别

Java实现在线语音识别

2019年07月19日 | 移动技术网IT编程 | 我要评论

本文为大家分享了java实现在线语音识别的具体方法，供大家参考，具体内容如下

利用讯飞开发平台作为第三方库

首先需要在讯飞开发平台下载sdk,网址为，，这些sdk 下载都是免费的，当然你需要先注册。在sdk 中不仅包含相应的jar包，还有一些相应的demo，可以供你参考学习

在我们下载下来第一个sdk 之后就可以进行开发了，讯飞的sdk 给我们提供了详尽而强大的函数支持，下面我就从代码的角度来进行一些解释。

代码

package myvoice;
import java.awt.button;
import java.awt.font;
import java.awt.frame;
import java.awt.gridlayout;
import java.awt.panel;
import java.awt.textarea;
import java.awt.event.actionevent;
import java.awt.event.actionlistener;
import java.lang.reflect.parameter;
import java.util.arraylist;
import javax.swing.imageicon;
import javax.swing.jframe;
import javax.swing.jlabel;
import com.iflytek.cloud.speech.recognizerlistener;
import com.iflytek.cloud.speech.recognizerresult;
import com.iflytek.cloud.speech.speecherror;
import com.iflytek.cloud.speech.speechrecognizer;
import com.iflytek.cloud.speech.speechutility;
import com.iflytek.util.debuglog;
import com.iflytek.util.jsonparser;
import com.iflytek.util.version;

public class voicespeech extends frame implements actionlistener {
button startbtn;
button stopbtn;
textarea textarea;

// 语音听写对象

speechrecognizer speechrecognize;
private static final string def_font_name = "宋体";
private static final int def_font_style = font.bold;
private static final int def_font_size = 30;
private static final int text_count = 100;

public voicespeech() {
// 初始化听写对象
speechrecognize = speechrecognizer.createrecognizer();
// 设置组件
startbtn = new button("start");
stopbtn = new button("stop");
textarea = new textarea();
panel btnpanel = new panel();
panel textpanel = new panel();
// button startbtn = new button("开始");

//添加监听器
startbtn.addactionlistener(this);
stopbtn.addactionlistener(this);
btnpanel.add(startbtn);
btnpanel.add(stopbtn);
textpanel.add(textarea);
add(btnpanel);
add(textpanel);

// 设置窗体
setlayout(new gridlayout(2, 1));
setsize(400, 300);
settitle("语音识别");
setlocation(200, 200);
setvisible(true);

}

public void actionperformed(actionevent e) {
if (e.getsource() == startbtn) {
textarea.settext("*************你说的是：");
if (!speechrecognize.islistening())
speechrecognize.startlistening(recognizerlistener);

else

speechrecognize.stoplistening();
} else if (e.getsource() == stopbtn) {
speechrecognize.stoplistening();

}

}

/**
* 听写监听器
*/

private recognizerlistener recognizerlistener = new recognizerlistener() {
public void onbeginofspeech() {

// debuglog.log( "onbeginofspeech enter" );
// ((jlabel) jbtnrecognizer.getcomponent(0)).settext("听写中...");
// jbtnrecognizer.setenabled(false);

}

public void onendofspeech() {
debuglog.log("onendofspeech enter");

}

/**
* 获取听写结果. 获取recognizerresult类型的识别结果，并对结果进行累加，显示到area里
*/

public void onresult(recognizerresult results, boolean islast) {
debuglog.log("onresult enter");

// 如果要解析json结果，请考本项目示例的 com.iflytek.util.jsonparser类
string text =

jsonparser.parseiatresult(results.getresultstring());

// string text = results.getresultstring();
// jsonparser json = new jsonparser();
//  string newtest = json.parseiatresult(text);
//  textarea.settext(newtest);

textarea.append(text);
text = textarea.gettext();
if (null != text) {
int n = text.length() / text_count + 1;
int fontsize = math.max(10, def_font_size - 2 * n);
debuglog.log("onresult new font size=" + fontsize);
int style = n > 1 ? font.plain : def_font_size;
font newfont = new font(def_font_name, style, fontsize);
textarea.setfont(newfont);

}

if (islast) {

iatspeechinitui();

}

}

public void onvolumechanged(int volume) {
debuglog.log("onvolumechanged enter");

if (volume == 0)
volume = 1;
else if (volume >= 6)
volume = 6;

// labelwav.seticon(new imageicon("res/mic_0" + volume + ".png"));

}

public void onerror(speecherror error) {
debuglog.log("onerror enter");
if (null != error) {
debuglog.log("onerror code：" + error.geterrorcode());
textarea.settext(error.geterrordescription(true));
iatspeechinitui();

}

}

public void onevent(int eventtype, int arg1, int agr2, string msg) {
debuglog.log("onevent enter");

}

};

/**
* 听写结束，恢复初始状态
*/

public void iatspeechinitui() {

// labelwav.seticon(new imageicon("res/mic_01.png"));
// jbtnrecognizer.setenabled(true);
// ((jlabel) jbtnrecognizer.getcomponent(0)).settext("开始听写");

}

public static void main(string[] args) {

// 初始化
stringbuffer param = new stringbuffer();
param.append( "appid=" + version.getappid() );
// param.append( ","+speechconstant.lib_name_32+"=mymscname" );
speechutility.createutility( param.tostring() );
voicespeech t = new voicespeech();

}

}

代码解析

1.speechrecognizer类，语音识别类，语音识别，包括听写、语法识别功能。本类使用单例，调用者使用本类的对象，只需要通过createrecognizer()创建一次对象后，便可一直使用该对象，直到通过调用destroy()进行单例对象销毁。调用者可通过getrecognizer()获取当前已经创建的单例。我们在一开始导包，把相应的类导入，然后声明语音识别类，然后在voicespeech类的构造器中初始化。

2.在speechrecognizer类中有很多有关语音识别的方法，

（1）startlistening方法，开始进行语音识别，其方法的参数是一个回调函数，这个方法是另一个类recognizerlistener声明的实例，在其匿名内部类中重写关键的方法，借此到底我们想要的结果，我们在onresult方法中重写，把识别的结果通过json解析之后（识别的结果默认是json格式），把它依次添加到文本栏上面，之后我们对文本栏的内容进行文字字体大小等的设定

（2）stoplistening方法，等录音结束之后，调用该方法，把录音结果通过网络传输给讯飞远程识别平台进行解析，解析完成之后，把解析结果传送过来

3.在main方法中先要进行speechutility.createutility，这是讯飞sdk的初始化，相当于远程连接讯飞识别平台，因为java现在还不支持离线识别，所以在进行识别方法调用之前，必须连接讯飞开发平台，这个方法的作用正是如此，其参数就是不同的识别版本

4.因为很多方法都是讯飞提供的，所以我们需要导入相应的包

具体如下

import com.iflytek.cloud.speech.recognizerlistener;
import com.iflytek.cloud.speech.recognizerresult;
import com.iflytek.cloud.speech.speecherror;
import com.iflytek.cloud.speech.speechrecognizer;
import com.iflytek.cloud.speech.speechutility;
import com.iflytek.util.debuglog;
import com.iflytek.util.jsonparser;//json解析类
import com.iflytek.util.version;//版本类

这些在sdk 中都有

最终的结果

ps:因为只是注重识别功能，所以界面很丑。

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持移动技术网。

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

remo video repair中文版

教程：1、将下载好的压缩文件解压的，得到Remo Video Repair原程序和Crack文件夹；2、首先双击... [阅读全文]
Pow(x, n)（快速幂+迭代实现）

题目实现 pow(x, n) ，即计算 x 的 n 次幂函数。说明:1、-100.0 < x < 1... [阅读全文]
第三次学JAVA再学不好就吃翔(part88)--ArrayList嵌套ArrayList

学习笔记，仅供参考，有错必纠ArrayList嵌套ArrayList举个例子package com.guiyan... [阅读全文]
ffmpeg编译硬转码

ffmpeg4.2.2编译+ubuntu18.02--prefix=/home/firefly/work/sof... [阅读全文]
使用ffmpeg视频切片并加密和视频AES-128加密后播放

创建加密文件：将一个mp4视频文件切割为多个ts片段，并在切割过程中对每一个片段使用AES-128 加密，最后生... [阅读全文]
JAVA程序设计：最长重复子串（LeetCode：1044）

给出一个字符串S，考虑其所有重复子串（S 的连续子串，出现两次或多次，可能会有重叠）。返回任何具有最长可能长度的... [阅读全文]
LiveGBS国标GB/T28181云端录像分布式录像存储自动清理时移回看录像下载播放

分布式录像集中存储1、云端录像1.1、与设备录像|实时录像的区别1.2、按需录像1.3、一直录像1.4、录像覆... [阅读全文]
教程地址整合

尚硅谷视频一、Java基础阶段java基础新版视频教程715集：https://www.bilibili.com... [阅读全文]
剑指 Offer 03. 数组中重复的数字

剑指 Offer 03. 数组中重复的数字在一个长度为 n 的数组 nums 里的所有数字都在 0～n-1 的范... [阅读全文]
inputstream 解决只能读取一次

inputstream只能读取一次如果你需要多次读取解决方案：1.客户端一次发送两次请求表单一次，ajax中再一... [阅读全文]

网友评论


验证码：

Java实现在线语音识别

2019年07月19日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论