当前位置：移动技术网 > IT编程>开发语言>Java > java 中自定义OutputFormat的实例详解

java 中自定义OutputFormat的实例详解

2019年07月19日 | 移动技术网IT编程 | 我要评论

java 中自定义outputformat的实例详解

实例代码：

package com.ccse.hadoop.outputformat; 
 
import java.io.ioexception; 
import java.net.uri; 
import java.net.urisyntaxexception; 
import java.util.stringtokenizer; 
 
import org.apache.hadoop.conf.configuration; 
import org.apache.hadoop.fs.fsdataoutputstream; 
import org.apache.hadoop.fs.filesystem; 
import org.apache.hadoop.fs.path; 
import org.apache.hadoop.io.longwritable; 
import org.apache.hadoop.io.text; 
import org.apache.hadoop.mapreduce.job; 
import org.apache.hadoop.mapreduce.jobcontext; 
import org.apache.hadoop.mapreduce.mapper; 
import org.apache.hadoop.mapreduce.outputcommitter; 
import org.apache.hadoop.mapreduce.outputformat; 
import org.apache.hadoop.mapreduce.recordwriter; 
import org.apache.hadoop.mapreduce.reducer; 
import org.apache.hadoop.mapreduce.taskattemptcontext; 
import org.apache.hadoop.mapreduce.lib.input.fileinputformat; 
import org.apache.hadoop.mapreduce.lib.output.fileoutputcommitter; 
 
 
public class myselfoutputformatapp { 
   
  public final static string input_path = "hdfs://chaoren1:9000/mapinput"; 
  public final static string output_path = "hdfs://chaoren1:9000/mapoutput"; 
  public final static string output_filename = "/abc"; 
   
  public static void main(string[] args) throws ioexception, urisyntaxexception,  
    classnotfoundexception, interruptedexception { 
    configuration conf = new configuration(); 
    filesystem filesystem = filesystem.get(new uri(output_path), conf); 
    filesystem.delete(new path(output_path), true); 
     
    job job = new job(conf, myselfoutputformatapp.class.getsimplename()); 
    job.setjarbyclass(myselfoutputformatapp.class); 
     
    fileinputformat.setinputpaths(job, new path(input_path)); 
    job.setmapperclass(mymapper.class); 
    job.setmapoutputkeyclass(text.class); 
    job.setmapoutputvalueclass(longwritable.class); 
     
    job.setreducerclass(myreducer.class); 
    job.setoutputkeyclass(text.class); 
    job.setoutputvalueclass(longwritable.class); 
    job.setoutputformatclass(myselfoutputformat.class); 
     
    job.waitforcompletion(true); 
  } 
   
  public static class mymapper extends mapper<longwritable, text, text, longwritable> { 
 
    private text word = new text(); 
    private longwritable writable = new longwritable(1); 
     
    @override 
    protected void map(longwritable key, text value, 
        mapper<longwritable, text, text, longwritable>.context context) 
        throws ioexception, interruptedexception { 
      if (value != null) { 
        string line = value.tostring(); 
        stringtokenizer tokenizer = new stringtokenizer(line); 
        while (tokenizer.hasmoretokens()) { 
          word.set(tokenizer.nexttoken()); 
          context.write(word, writable); 
        } 
      } 
    } 
     
  } 
   
  public static class myreducer extends reducer<text, longwritable, text, longwritable> { 
 
    @override 
    protected void reduce(text key, iterable<longwritable> values, 
        reducer<text, longwritable, text, longwritable>.context context) 
        throws ioexception, interruptedexception { 
      long sum = 0;  
      for (longwritable value : values) { 
        sum += value.get(); 
      } 
      context.write(key, new longwritable(sum)); 
    } 
  } 
 
  public static class myselfoutputformat extends outputformat<text, longwritable> { 
 
    private fsdataoutputstream outputstream = null; 
     
    @override 
    public recordwriter<text, longwritable> getrecordwriter( 
        taskattemptcontext context) throws ioexception, 
        interruptedexception { 
      try { 
        filesystem filesystem = filesystem.get(new uri(myselfoutputformatapp.output_path), context.getconfiguration()); 
        //指定文件的输出路径 
        final path path = new path(myselfoutputformatapp.output_path  
                     + myselfoutputformatapp.output_filename); 
        this.outputstream = filesystem.create(path, false); 
      } catch (urisyntaxexception e) { 
        e.printstacktrace(); 
      } 
      return new myselfrecordwriter(outputstream); 
    } 
 
    @override 
    public void checkoutputspecs(jobcontext context) throws ioexception, 
        interruptedexception { 
    } 
 
    @override 
    public outputcommitter getoutputcommitter(taskattemptcontext context) 
        throws ioexception, interruptedexception { 
      return new fileoutputcommitter(new path(myselfoutputformatapp.output_path), context); 
    } 
     
  } 
   
  public static class myselfrecordwriter extends recordwriter<text, longwritable> { 
 
    private fsdataoutputstream outputstream = null; 
     
    public myselfrecordwriter(fsdataoutputstream outputstream) { 
      this.outputstream = outputstream; 
    } 
     
    @override 
    public void write(text key, longwritable value) throws ioexception, 
        interruptedexception { 
      this.outputstream.writebytes(key.tostring()); 
      this.outputstream.writebytes("\t"); 
      this.outputstream.writelong(value.get()); 
    } 
 
    @override 
    public void close(taskattemptcontext context) throws ioexception, 
        interruptedexception { 
      this.outputstream.close(); 
    } 
     
  } 
   
}

2.outputformat是用于处理各种输出目的地的。

2.1 outputformat需要写出去的键值对，是来自于reducer类，是通过recordwriter获得的。

2.2 recordwriter中的write(...)方法只有k和v，写到哪里去哪？这要通过单独传入outputstream来处理。write就是把k和v写入到outputstream中的。

2.3 recordwriter类位于outputformat中的。因此，我们自定义的outputfromat必须继承outputformat类型。那么，流对象必须在getrecordwriter(...)方法中获得。

以上就是java 中自定义outputformat的实例，如有疑问请留言或者到本站社区交流讨论，感谢阅读，希望能帮助到大家，谢谢大家对本站的支持！

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

Mybatis环境搭建及文件配置过程解析

mybatis的环境搭建：　　1、创建maven工程并且导入坐标：即我们需要在pop.xml文件中添加我们需要的依赖具体方法：搜索maven中央仓库，搜索你需要... [阅读全文]
jsp中el表达式和jstl标签使用

bean 豆在java中是类的意思jar 罐子在java中是一个包的意思，里面有多个类el表达式（Expres... [阅读全文]
springboot利用profile配置文件进行多环境切换

springboot 多环境切换properties文件profile是Spring对不同环境提供不同配置功能的... [阅读全文]
归并排序与希尔排序算法(Java语言数据结构)

归并排序与希尔排序介绍归并排序归并排序的思想很简单，如果有一组待排序列，先切分再重组。任何一篇教程也都会说采用的... [阅读全文]
如何使用MyBatis-Plus代码生成器(逆向工程)一键生成代码

简介MyBatis-Plus 提供了功能强大的的代码生成器, 可以快速生成 Entity、Mapper、Mapp... [阅读全文]
俄罗斯方块(Java语言实现)

目录一、心得二、游戏实例三、代码一、心得在学习Java的过程中，难免会遇到很多的问题，这些问题可能会困扰你... [阅读全文]
最详细阿里Java岗的详细流程和面试问题

最近一个朋友跟我说，现在面试太难了，再也不是以前那种随便背几个面试题然后就能拿到offer的时候了。最近准备换工... [阅读全文]
jvm面试题(看了这篇就能成功收获offer)

前言这是一篇看了能说的出来的jvm面试；个人能力有限，文中描述难免有错误，请指正；一 JVM面试1.1 简述Ja... [阅读全文]
java语法关键字保留字分割字符以及数据类型

下面展示一些内联代码片。遇到的问题和我的一些总结:1:不能用非静态的方法访问静态的成员变量,也不能用静态的方法... [阅读全文]
蚂蚁庄园怎么雇佣小鸡? 蚂蚁庄园没有雇佣小鸡功能的解决办法

蚂蚁庄园有一个雇佣小鸡的功能，有的朋友可能不知道雇佣小鸡是什么意思，有什么用，想要雇佣小鸡却发现没有这个功能又该怎么办？下面我们就来看看详细介绍。一、雇佣小鸡1... [阅读全文]

网友评论


验证码：

java 中自定义OutputFormat的实例详解

2019年07月19日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论