当前位置: 移动技术网 > IT编程>移动开发>Android > Android音频编辑之音频转换PCM与WAV

Android音频编辑之音频转换PCM与WAV

2019年07月30日  | 移动技术网IT编程  | 我要评论

总裁的六年宠物,bozi,胡菜三国

前言

本篇开始讲解在android平台上进行的音频编辑开发,首先需要对音频相关概念有基础的认识。所以本篇要讲解以下内容:

1. 常用音频格式简介
2. wav和pcm的区别和联系
3. wav文件头信息
4. 采样率简介
5. 声道数和采样位数下的pcm编码
6. 音频文件解码
7. pcm文件转wav文件

现在先给出音频编辑的效果图,看看能不能提高大家的积极性~,哈哈

常用音频格式简介

在android平台上进行音频开发,首先需要对常用的音频格式有个大致的了解。在android平台上,常用的音频格式有:

  • wav

wav格式是微软公司开发的一种声音文件格式,也叫波形声音文件,是最早的数字音频格式,被windows平台及其应用程序广泛支持。

wav格式支持许多压缩算法,支持多种音频位数、采样频率和声道,采用44.1khz的采样频率,16位量化位数,因此wav的音质与cd相差无几,但wav格式对存储空间需求太大不便于交流和传播。

补充:无损格式,缺点:体积十分大!

  • mp3

mp3的全称是moving picture experts group audio layer iii。简单的说,mp3就是一种音频压缩技术,由于这种压缩方式的全称叫mpeg audio layer3,所以人们把它简称为mp3。
mp3是利用 mpeg audio layer 3 的技术,将音乐以1:10 甚至 1:12 的压缩率,压缩成容量较小的file,换句话说,能够在音质丢失很小的情况下把文件压缩到更小的程度。而且还非常好的保持了原来的音质。

正是因为mp3体积小,音质高的特点使得mp3格式几乎成为网上音乐的代名词。每分钟音乐的mp3格式只有1mb左右大小,这样每首歌的大小只有3-4mb。使用mp3播放器对mp3文件进行实时的解压缩(解码),这样,高品质的mp3音乐就播放出来了。

补充:最高比特率320k,高频部分一刀切是他的缺点。音质不高!

  • amr

全称adaptive multi-rate 和 adaptive multi-rate wideband,主要用于移动设备的音频,压缩比比较大,但相对其他的压缩格式质量比较差,多用于人声,通话,效果还是很不错的。

  • ogg

ogg全称应该是ogg vobis(ogg vorbis) 是一种新的音频压缩格式,类似于mp3等现有的音乐格式。
但有一点不同的是,它是完全免费、开放和没有专利限制的。ogg vobis有一个很出众的特点,就是支持多声道,随着它的流行,以后用随身听来听dts编码的多声道作品将不会是梦想。

vorbis 是这种音频压缩机制的名字,而ogg则是一个计划的名字,该计划意图设计一个完全开放性的多媒体系统。目前该计划只实现了oggvorbis这一部分。

ogg vorbis文件的扩展名是.ogg。这种文件的设计格式是非常先进的。现在创建的ogg文件可以在未来的任何播放器上播放,因此,这种文件格式可以不断地进行大小和音质的改良,而不影响旧有的编码器或播放器。
补充:目前最好的有损格式之一,mp3部分支持,智能手机装软件部分可以支持,最高比特率500kbps。

  • aac

aac(advanced audio coding),中文称为“高级音频编码”,出现于1997年,基于 mpeg-2的音频编码技术。

优点:相对于mp3,aac格式的音质更佳,文件更小。

不足:aac属于有损压缩的格式,与时下流行的ape、flac等无损格式相比音质存在“本质上”的差距。加之,目前传输速度更快的usb3.0和16g以上大容量mp3正在加速普及,也使得aac头上“小巧”的光环不复存在了。

前景:以发展的眼光来看,正如“高清”正在被越来越多的人所接受一样,“无损”必定是未来音乐格式的绝对主流。aac这种“有损”格式的前景不容乐观

  • flac

flac即是free lossless audio codec的缩写,中文可解为无损音频压缩编码。

flac是一套著名的自由音频压缩编码,其特点是无损压缩。不同于其他有损压缩编码如mp3 及 aac,它不会破任何原有的音频资讯,所以可以还原音乐光盘音质。现在它已被很多软件及硬件音频产品所支持。简而言之,flac与mp3相仿,但是是无损压缩的,也就是说音频以flac方式压缩不会丢失任何信息。这种压缩与zip的方式类似,但是flac将给你更大的压缩比率,因为flac是专门针对音频的特点设计的压缩方式,并且你可以使用播放器播放flac压缩的文件,就象通常播放你的mp3文件一样。

补充:为无损格式,较ape而言,他体积大点,但是兼容性好,编码速度快,播放器支持更广。

wav和pcm的区别和联系

在android平台上要进行音频编辑操作(比如裁剪,插入,合成等),通常都是需要将音频文件解码为wav格式的音频文件或者pcm文件。那么wav和pcm之间有什么关系,这里有必要了解一下。

pcm(pulse code modulation—-脉码调制录音)。所谓pcm录音就是将声音等模拟信号变成符号化的脉冲列,再予以记录。pcm信号是由[1]、[0]等符号构成的数字信号,而未经过任何编码和压缩处理。与模拟信号比,它不易受传送系统的杂波及失真的影响。动态范围宽,可得到音质相当好的影响效果。也就是说,pcm就是没有压缩的编码方式,pcm文件就是采用pcm这种没有压缩的编码方式编码的音频数据文件。

wav是由微软开发的一种音频格式。wav符合 piff resource interchange file format规范。所有的wav都有一个文件头,这个文件头音频流的编码参数。wav对音频流的编码没有硬性规定,除了pcm之外,还有几乎所有支持acm规范的编码都可以为wav的音频流进行编码。wav也可以使用多种音频编码来压缩其音频流,不过我们常见的都是音频流被pcm编码处理的wav,但这不表示wav只能使用pcm编码,mp3编码同样也可以运用在wav中,和avi一样,只要安装好了相应的decode,就可以欣赏这些wav了。

在windows平台下,基于pcm编码的wav是被支持得最好的音频格式,所有音频软件都能完美支持,由于本身可以达到较高的音质的要求,因此,wav也是音乐编辑创作的首选格式,适合保存音乐素材。因此,基于pcm编码的wav被作为了一种中介的格式,常常使用在其他编码的相互转换之中,例如mp3转换成wma。

如上引用的描述,也就是说我们对音频进行编辑操作,其实就是音频解码后的pcm音频采样数据进行操作,因为pcm记录的就是采样后的音频信息,而我们常说的wav文件是在pcm数据的基础上添加一组头信息,用于描述这个wav文件的采样率,声道数,采样位数,音频数据大小等信息,这样这个wav就可以被音频播放器正确读取并播放,而单纯的pcm文件因为只有编码的音频数据,没有其他描述信息,所以无法被音频播放器识别播放。

wav文件头信息

接下来有必要了解一下wav文件头信息是什么样的格式信息。

wav文件头信息由大小44个字节的数据组成:

4字节数据,内容为“riff”,表示资源交换文件标识
4字节数据,内容为一个整数,表示从下个地址开始到文件尾的总字节数
4字节数据,内容为“wave”,表示wav文件标识
4字节数据,内容为“fmt ”,表示波形格式标识(fmt ),最后一位空格。
4字节数据,内容为一个整数,表示pcmwaveformat的长度
2字节数据,内容为一个短整数,表示格式种类(值为1时,表示数据为线性pcm编码)
2字节数据,内容为一个短整数,表示通道数,单声道为1,双声道为2
4字节数据,内容为一个整数,表示采样率,比如44100
4字节数据,内容为一个整数,表示波形数据传输速率(每秒平均字节数),大小为 采样率 * 通道数 * 采样位数
2字节数据,内容为一个短整数,表示data数据块长度,大小为 通道数 * 采样位数
2字节数据,内容为一个短整数,表示采样位数,即pcm位宽,通常为8位或16位
4字节数据,内容为“data”,表示数据标记符
4字节数据,内容为一个整数,表示接下来声音数据的总大小

由以上信息可知,对于一个pcm文件来说,只要知道它的大小,采样率,声道数,采样位数,就可以通过添加一个wav文件头得到一个wav文件了。

采样率简介

那么采样率是什么意思,我们来了解下。

音频采样率是指录音设备在一秒钟内对声音信号的采样次数,采样频率越高声音的还原就越真实越自然。在当今的主流采集卡上,采样频率一般共分为22.05khz、44.1khz、48khz三个等级,22.05khz只能达到fm广播的声音品质,44.1khz则是理论上的cd音质界限,48khz则更加精确一些。

在数字音频领域,常用的采样率有:

8,000 hz - 电话所用采样率, 对于人的说话已经足够
11,025 hz

22,050 hz - 无线电广播所用采样率

32,000 hz - minidv 数码视频 camcorder、dat (lp mode)所用采样率

44,100 hz - 音频 cd, 也常用于 mpeg-1 音频(vcd, svcd, mp3)所用采样率

47,250 hz - 商用 pcm 录音机所用采样率

48,000 hz - minidv、数字电视、dvd、dat、电影和专业音频所用的数字声音所用采样率

50,000 hz - 商用数字录音机所用采样率

96,000 或者 192,000 hz - dvd-audio、一些 lpcm dvd 音轨、bd-rom(蓝光盘)音轨、和 hd-dvd (高清晰度 dvd)音轨所用所用采样率

2.8224 mhz - direct stream digital 的 1 位 sigma-delta modulation 过程所用采样率。

通常歌曲的采样率是44100,而android平台的人声录音支持8000,16000,32000三种采样率。

声道数和采样位数下的pcm编码
接下来再了解下声道数和采样位数代表什么意思,在pcm编码中是如何应用的。

声道通常可以分为单声道和双声道,双声道又分为左声道和右声道。

采样位数表示一个采样数据用多少位来表示,通常为8位和16位,对于8位表示一个字节来表示一个采样数据,16位表示用两个字节表示一个采样数据,两个字节为低位字节和高位字节,通常低位字节在前,高位字节在后。

因此结合声道和采样字节数(采样位数),可以组成下图的pcm数据格式:

可以看到8位单声道的pcm数据,只需要一个字节就能表示一个采样数据,而16位双声道(立体声)的pcm数据,需要4个字节来表示一个采样数据。那么计算一个pcm大小的方法就很简单了。

对于8位单声道,采样率为8000,1分钟的pcm音频来说,大小是

//采样率 * 通道数 * 采样位数/8 * 秒数
8000 * 1 * 8/8 * 60 = 480000,大约480k

对于16位双声道,采样率为44100,1分钟的pcm音频来说,大小是

//采样率 * 通道数 * 采样位数/8 * 秒数
44100 * 2 * 16/8 * 60 = 10584000,大约10m

而wav文件的大小就是比pcm多出44个字节数。

音频文件解码

有了以上音频相关知识的了解之后,现在可以来对android上常用音频文件进行解码和信息提取了。这里涉及了三个音频相关的类:
- mediaextractor 媒体文件数据提取器,负责媒体文件数据的提取操作。
- mediaformat 媒体文件格式信息,负责读取媒体文件的格式(如采样率,时长,声道数等)信息。
- mediacodec 媒体文件编解码类,负责媒体文件数据的编解码操作。

解码器支持解码常用的音频格式,如mp3, wav, 3gpp, 3gp, amr, aac, m4a, ogg, flac等,解码后的数据是pcm编码的数据。下面用代码实现下如何用上述类实现音频文件的解码操作,得到一个pcm数据文件

 /**
 * 将音乐文件解码
 *
 * @param musicfileurl 源文件路径
 * @param decodefileurl 解码文件路径
 * @param startmicroseconds 开始时间 微秒
 * @param endmicroseconds 结束时间 微秒
 * @param decodeoperateinterface 解码过程回调
 */
 private boolean decodemusicfile(string musicfileurl, string decodefileurl,
  long startmicroseconds, long endmicroseconds, decodeoperateinterface decodeoperateinterface) {

 //采样率,声道数,时长,音频文件类型
 int samplerate = 0;
 int channelcount = 0;
 long duration = 0;
 string mime = null;

 //mediaextractor, mediaformat, mediacodec
 mediaextractor mediaextractor = new mediaextractor();
 mediaformat mediaformat = null;
 mediacodec mediacodec = null;

 //给媒体信息提取器设置源音频文件路径
 try {
  mediaextractor.setdatasource(musicfileurl);
 }catch (exception ex){
  ex.printstacktrace();
  try {
  mediaextractor.setdatasource(new fileinputstream(musicfileurl).getfd());
  } catch (exception e) {
  e.printstacktrace();
  logutil.e("设置解码音频文件路径错误");
  }
 }

 //获取音频格式轨信息
 mediaformat = mediaextractor.gettrackformat(0);

 //从音频格式轨信息中读取 采样率,声道数,时长,音频文件类型
 samplerate = mediaformat.containskey(mediaformat.key_sample_rate) ? mediaformat.getinteger(
  mediaformat.key_sample_rate) : 44100;
 channelcount = mediaformat.containskey(mediaformat.key_channel_count) ? mediaformat.getinteger(
  mediaformat.key_channel_count) : 1;
 duration = mediaformat.containskey(mediaformat.key_duration) ? mediaformat.getlong(
  mediaformat.key_duration) : 0;
 mime = mediaformat.containskey(mediaformat.key_mime) ? mediaformat.getstring(mediaformat.key_mime)
   : "";

 logutil.i("歌曲信息track info: mime:"
  + mime
  + " 采样率samplerate:"
  + samplerate
  + " channels:"
  + channelcount
  + " duration:"
  + duration);

 if (textutils.isempty(mime) || !mime.startswith("audio/")) {
  logutil.e("解码文件不是音频文件mime:" + mime);
  return false;
 }

 if (mime.equals("audio/ffmpeg")) {
  mime = "audio/mpeg";
  mediaformat.setstring(mediaformat.key_mime, mime);
 }

 if (duration <= 0) {
  logutil.e("音频文件duration为" + duration);
  return false;
 }

 //解码的开始时间和结束时间
 startmicroseconds = math.max(startmicroseconds, 0);
 endmicroseconds = endmicroseconds < 0 ? duration : endmicroseconds;
 endmicroseconds = math.min(endmicroseconds, duration);

 if (startmicroseconds >= endmicroseconds) {
  return false;
 }

 //创建一个解码器
 try {
  mediacodec = mediacodec.createdecoderbytype(mime);

  mediacodec.configure(mediaformat, null, null, 0);
 } catch (exception e) {
  logutil.e("解码器configure出错");
  return false;
 }

 //得到输出pcm文件的路径
 decodefileurl = decodefileurl.substring(0, decodefileurl.lastindexof("."));
 string pcmfilepath = decodefileurl + ".pcm";

 //后续解码操作
 getdecodedata(mediaextractor, mediacodec, pcmfilepath, samplerate, channelcount,
  startmicroseconds, endmicroseconds, decodeoperateinterface);

 return true;
 }

以上操作创建了mediaextractor,获取mediaformat用于读取音频文件的相关信息如采样率,文件类型,声道数等。然后创建了mediacodec用于后续和mediaextractor一起进行音频的解码操作。接下来看看具体的解码过程:

 /**
 * 解码数据
 */
 private void getdecodedata(mediaextractor mediaextractor, mediacodec mediacodec,
  string decodefileurl, int samplerate, int channelcount, final long startmicroseconds,
  final long endmicroseconds, final decodeoperateinterface decodeoperateinterface) {

 //初始化解码状态,未解析完成
 boolean decodeinputend = false;
 boolean decodeoutputend = false;

 //当前读取采样数据的大小
 int sampledatasize;
 //当前输入数据的bytebuffer序号,当前输出数据的bytebuffer序号
 int inputbufferindex;
 int outputbufferindex;
 //音频文件的采样位数字节数,= 采样位数/8
 int bytenumber;

 //上一次的解码操作时间,当前解码操作时间,用于通知回调接口
 long decodenoticetime = system.currenttimemillis();
 long decodetime;

 //当前采样的音频时间,比如在当前音频的第40秒的时候
 long presentationtimeus = 0;

 //定义编解码的超时时间
 final long timeoutus = 100;

 //存储输入数据的bytebuffer数组,输出数据的bytebuffer数组
 bytebuffer[] inputbuffers;
 bytebuffer[] outputbuffers;

 //当前编解码器操作的 输入数据bytebuffer 和 输出数据bytebuffer,可以从targetbuffer中获取解码后的pcm数据
 bytebuffer sourcebuffer;
 bytebuffer targetbuffer;

 //获取输出音频的媒体格式信息
 mediaformat outputformat = mediacodec.getoutputformat();

 mediacodec.bufferinfo bufferinfo;

 bytenumber = (outputformat.containskey("bit-width") ? outputformat.getinteger("bit-width") : 0) / 8;

 //开始解码操作
 mediacodec.start();

 //获取存储输入数据的bytebuffer数组,输出数据的bytebuffer数组
 inputbuffers = mediacodec.getinputbuffers();
 outputbuffers = mediacodec.getoutputbuffers();

 mediaextractor.selecttrack(0);

 //当前解码的缓存信息,里面的有效数据在offset和offset+size之间
 bufferinfo = new mediacodec.bufferinfo();

 //获取解码后文件的输出流
 bufferedoutputstream bufferedoutputstream =
  filefunction.getbufferedoutputstreamfromfile(decodefileurl);

 //开始进入循环解码操作,判断读入源音频数据是否完成,输出解码音频数据是否完成
 while (!decodeoutputend) {
  if (decodeinputend) {
  return;
  }

  decodetime = system.currenttimemillis();

  //间隔1秒通知解码进度
  if (decodetime - decodenoticetime > constant.onesecond) {
  final int decodeprogress =
   (int) ((presentationtimeus - startmicroseconds) * constant.normalmaxprogress
    / endmicroseconds);

  if (decodeprogress > 0) {
   notifyprogress(decodeoperateinterface, decodeprogress);
  }

  decodenoticetime = decodetime;
  }

  try {

  //操作解码输入数据

  //从队列中获取当前解码器处理输入数据的bytebuffer序号
  inputbufferindex = mediacodec.dequeueinputbuffer(timeoutus);

  if (inputbufferindex >= 0) {
   //取得当前解码器处理输入数据的bytebuffer
   sourcebuffer = inputbuffers[inputbufferindex];
   //获取当前bytebuffer,编解码器读取了多少采样数据
   sampledatasize = mediaextractor.readsampledata(sourcebuffer, 0);

   //如果当前读取的采样数据<0,说明已经完成了读取操作
   if (sampledatasize < 0) {
   decodeinputend = true;
   sampledatasize = 0;
   } else {
   presentationtimeus = mediaextractor.getsampletime();
   }

   //然后将当前bytebuffer重新加入到队列中交给编解码器做下一步读取操作
   mediacodec.queueinputbuffer(inputbufferindex, 0, sampledatasize, presentationtimeus,
    decodeinputend ? mediacodec.buffer_flag_end_of_stream : 0);

   //前进到下一段采样数据
   if (!decodeinputend) {
   mediaextractor.advance();
   }

  } else {
   //logutil.e("inputbufferindex" + inputbufferindex);
  }

  //操作解码输出数据

  //从队列中获取当前解码器处理输出数据的bytebuffer序号
  outputbufferindex = mediacodec.dequeueoutputbuffer(bufferinfo, timeoutus);

  if (outputbufferindex < 0) {
   //输出bytebuffer序号<0,可能是输出缓存变化了,输出格式信息变化了
   switch (outputbufferindex) {
   case mediacodec.info_output_buffers_changed:
    outputbuffers = mediacodec.getoutputbuffers();
    logutil.e(
     "mediacodec.info_output_buffers_changed [audiodecoder]output buffers have changed.");
    break;
   case mediacodec.info_output_format_changed:
    outputformat = mediacodec.getoutputformat();

    samplerate =
     outputformat.containskey(mediaformat.key_sample_rate) ? outputformat.getinteger(
      mediaformat.key_sample_rate) : samplerate;
    channelcount =
     outputformat.containskey(mediaformat.key_channel_count) ? outputformat.getinteger(
      mediaformat.key_channel_count) : channelcount;
    bytenumber =
     (outputformat.containskey("bit-width") ? outputformat.getinteger("bit-width") : 0)
      / 8;

    logutil.e(
     "mediacodec.info_output_format_changed [audiodecoder]output format has changed to "
      + mediacodec.getoutputformat());
    break;
   default:
    //logutil.e("error [audiodecoder] dequeueoutputbuffer returned " + outputbufferindex);
    break;
   }
   continue;
  }

  //取得当前解码器处理输出数据的bytebuffer
  targetbuffer = outputbuffers[outputbufferindex];

  byte[] sourcebytearray = new byte[bufferinfo.size];

  //将解码后的targetbuffer中的数据复制到sourcebytearray中
  targetbuffer.get(sourcebytearray);
  targetbuffer.clear();

  //释放当前的输出缓存
  mediacodec.releaseoutputbuffer(outputbufferindex, false);

  //判断当前是否解码数据全部结束了
  if ((bufferinfo.flags & mediacodec.buffer_flag_end_of_stream) != 0) {
   decodeoutputend = true;
  }

  //sourcebytearray就是最终解码后的采样数据
  //接下来可以对这些数据进行采样位数,声道的转换,但这是可选的,默认是和源音频一样的声道和采样位数
  if (sourcebytearray.length > 0 && bufferedoutputstream != null) {
   if (presentationtimeus < startmicroseconds) {
   continue;
   }

   //采样位数转换,按自己需要是否实现
   byte[] convertbytenumberbytearray =
    convertbytenumber(bytenumber, constant.exportbytenumber, sourcebytearray);

   //声道转换,按自己需要是否实现
   byte[] resultbytearray = convertchannelnumber(channelcount, constant.exportchannelnumber,
    constant.exportbytenumber, convertbytenumberbytearray);

   //将解码后的pcm数据写入到pcm文件
   try {
   bufferedoutputstream.write(resultbytearray);
   } catch (exception e) {
   logutil.e("输出解压音频数据异常" + e);
   }
  }

  if (presentationtimeus > endmicroseconds) {
   break;
  }
  } catch (exception e) {
  logutil.e("getdecodedata异常" + e);
  }
 }

 if (bufferedoutputstream != null) {
  try {
  bufferedoutputstream.close();
  } catch (ioexception e) {
  logutil.e("关闭bufferedoutputstream异常" + e);
  }
 }

 //重置采样率,按自己需要是否实现
 if (samplerate != constant.exportsamplerate) {
  resample(samplerate, decodefileurl);
 }

 notifyprogress(decodeoperateinterface, 100);

 //释放mediacodec 和 mediaextractor
 if (mediacodec != null) {
  mediacodec.stop();
  mediacodec.release();
 }

 if (mediaextractor != null) {
  mediaextractor.release();
 }
 }

以上操作是在一个循环中,不断取得源音频输入数据,加入到输入队列中,交给mediacodec处理,然后再从解码后的输出队列中取得输出数据,写入到文件中,其中要判断源音频输入数据是否读取完毕,解码后的输出数据是否完成,来终止这个循环。后续的采样位数转换,声道数转换,以及采样率转换都是可选的,不是必须的,默认不实现的话,输出的pcm数据和源音频是一样的采样位数,声道数,和采样率。

pcm文件转wav文件
现在我们得到了解码后的pcm文件,但是它是不可直接播放的,因为不带音频相关的格式信息,下面我们将pcm和指定的音频相关格式信息去转换得到一个可播放的wav文件:

 /**
 * pcm文件转wav文件
 * @param inpcmfilepath 输入pcm文件路径
 * @param outwavfilepath 输出wav文件路径
 * @param samplerate 采样率,例如44100
 * @param channels 声道数 单声道:1或双声道:2
 * @param bitnum 采样位数,8或16
 */
 public static void convertpcm2wav(string inpcmfilepath, string outwavfilepath, int samplerate,
  int channels, int bitnum) {

 fileinputstream in = null;
 fileoutputstream out = null;
 byte[] data = new byte[1024];

 try {
  //采样字节byte率
  long byterate = samplerate * channels * bitnum / 8;

  in = new fileinputstream(inpcmfilepath);
  out = new fileoutputstream(outwavfilepath);

  //pcm文件大小
  long totalaudiolen = in.getchannel().size();

  //总大小,由于不包括riff和wav,所以是44 - 8 = 36,在加上pcm文件大小
  long totaldatalen = totalaudiolen + 36;

  writewavefileheader(out, totalaudiolen, totaldatalen, samplerate, channels, byterate);

  int length = 0;
  while ((length = in.read(data)) > 0) {
  out.write(data, 0, length);
  }
 } catch (exception e) {
  e.printstacktrace();
 } finally {
  if (in != null) {
  try {
   in.close();
  } catch (ioexception e) {
   e.printstacktrace();
  }
  }
  if (out != null) {
  try {
   out.close();
  } catch (ioexception e) {
   e.printstacktrace();
  }
  }
 }
 }


 /**
 * 输出wav文件
 * @param out wav输出文件流
 * @param totalaudiolen 整个音频pcm数据大小
 * @param totaldatalen 整个数据大小
 * @param samplerate 采样率
 * @param channels 声道数
 * @param byterate 采样字节byte率
 * @throws ioexception
 */
 private static void writewavefileheader(fileoutputstream out, long totalaudiolen,
  long totaldatalen, int samplerate, int channels, long byterate) throws ioexception {
 byte[] header = new byte[44];
 header[0] = 'r'; // riff
 header[1] = 'i';
 header[2] = 'f';
 header[3] = 'f';
 header[4] = (byte) (totaldatalen & 0xff);//数据大小
 header[5] = (byte) ((totaldatalen >> 8) & 0xff);
 header[6] = (byte) ((totaldatalen >> 16) & 0xff);
 header[7] = (byte) ((totaldatalen >> 24) & 0xff);
 header[8] = 'w';//wave
 header[9] = 'a';
 header[10] = 'v';
 header[11] = 'e';
 //fmt chunk
 header[12] = 'f'; // 'fmt '
 header[13] = 'm';
 header[14] = 't';
 header[15] = ' ';//过渡字节
 //数据大小
 header[16] = 16; // 4 bytes: size of 'fmt ' chunk
 header[17] = 0;
 header[18] = 0;
 header[19] = 0;
 //编码方式 10h为pcm编码格式
 header[20] = 1; // format = 1
 header[21] = 0;
 //通道数
 header[22] = (byte) channels;
 header[23] = 0;
 //采样率,每个通道的播放速度
 header[24] = (byte) (samplerate & 0xff);
 header[25] = (byte) ((samplerate >> 8) & 0xff);
 header[26] = (byte) ((samplerate >> 16) & 0xff);
 header[27] = (byte) ((samplerate >> 24) & 0xff);
 //音频数据传送速率,采样率*通道数*采样深度/8
 header[28] = (byte) (byterate & 0xff);
 header[29] = (byte) ((byterate >> 8) & 0xff);
 header[30] = (byte) ((byterate >> 16) & 0xff);
 header[31] = (byte) ((byterate >> 24) & 0xff);
 // 确定系统一次要处理多少个这样字节的数据,确定缓冲区,通道数*采样位数
 header[32] = (byte) (channels * 16 / 8);
 header[33] = 0;
 //每个样本的数据位数
 header[34] = 16;
 header[35] = 0;
 //data chunk
 header[36] = 'd';//data
 header[37] = 'a';
 header[38] = 't';
 header[39] = 'a';
 header[40] = (byte) (totalaudiolen & 0xff);
 header[41] = (byte) ((totalaudiolen >> 8) & 0xff);
 header[42] = (byte) ((totalaudiolen >> 16) & 0xff);
 header[43] = (byte) ((totalaudiolen >> 24) & 0xff);
 out.write(header, 0, 44);
 }

上面操作其实也很简单,只要你知道了wav文件头信息的格式,将采样率,声道数,采样位数,pcm音频数据大小等信息填充进去,然后将这个44个字节数据拼接到pcm文件的开头,就得到了一个可播放的wav文件了。

总结

上文讲解了常用音频文件的格式,采样率,声道,采样位数概念,以及pcm数据是如何构成等内容。然后是如何从音频文件解码为pcm数据文件,以及得到pcm编码的wav文件,有了以上的理解后,后续进行音频文件的裁剪,插入,合成等编辑操作就更容易理解了。请继续关注后续的音频编辑操作处理。

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持移动技术网。

如对本文有疑问,请在下面进行留言讨论,广大热心网友会与你互动!! 点击进行留言回复

相关文章:

验证码:
移动技术网