当前位置：移动技术网 > IT编程>移动开发>Android > Android ORC文字识别之识别身份证号等（附源码）

Android ORC文字识别之识别身份证号等（附源码）

2018年03月06日 | 移动技术网IT编程 | 我要评论

拿命线索,蕲春租房,陈妙林打人

项目地址
https://github.com/979451341/OrcTest

我们说说实现这个项目已实现的功能，能够截图手机界面的某一块，将这个某一块图片的Bitmap传给tess-two的代码来获取扫描结果

我这里在贴出tess-two这个专为Android而创建的文字识别框架的地址
https://github.com/rmtheis/tess-two

接下来我就说我如何一步一步的实现项目

1.实现基础界面，我这里贴出已完成的界面

这样是为了模仿扫描二维码的界面，因为扫描身份证号码或者是手机号那样长条的数字，就将扫描区域也做成长条状，这个扫描区域是有意义的，因为到时候截图会只将扫描区域里的图片信息拿去扫描，这也是为了提高扫描速度和精度。

首先要实现这个界面，我们需要画出四个灰色长方体的位置大小，上下左右。

left是扫描区域左边离手机屏幕左边的距离是手机屏幕宽度的1/10，right就是扫描区域右边离手机屏幕左边的距离是手机屏幕宽度的9/10，top是扫描区域顶部离手机屏幕顶部的距离是手机屏幕宽度的1/3，bottom是扫描区域底部离手机屏幕顶部的距离是手机屏幕宽度的4/9

        WindowManager manager = (WindowManager) context.getSystemService(Context.WINDOW_SERVICE);
        Display display = manager.getDefaultDisplay();

        PMwidth = display.getWidth();
        PMheight = display.getHeight();

        left = PMwidth/10;
        top = PMheight/3;
        right = PMwidth*9/10;
        bottom = PMheight*4/9;
        mFrameRect = new Rect(left,top,right,bottom);

画画

    @Override
    public void onDraw(Canvas canvas) {
        int width = PMwidth;
        int height = PMheight;
        Rect frame = mFrameRect;

        // 绘制焦点框外边的暗色背景
        mPaint.setColor(mMaskColor);
        canvas.drawRect(0, 0, width, frame.top, mPaint);
        canvas.drawRect(0, frame.top, frame.left, frame.bottom + 1, mPaint);
        canvas.drawRect(frame.right + 1, frame.top, width, frame.bottom + 1, mPaint);
        canvas.drawRect(0, frame.bottom + 1, width, height, mPaint);

    }

还没有完，还有布局文件放SurfaceView和按钮，还有刚才做的自定义View

2.显示Camera预览和Camera拍摄

这里SurfaceView如何显示Camera我不多说，只说如何把Camera预览变清晰，这里是通过循环自动对焦来完成。

设置自动对焦接口

mCamera.autoFocus(autoFocusCallback);

这个接口初始化传入了Handler

autoFocusCallback.setHandler(handler,MSG_AUTOFUCS);

然后这个接口实现类里，当完成自动对焦，会通过handler发送一个消息

    @Override
    public void onAutoFocus(boolean success, Camera camera) {
        Log.v("zzw", "autof focus "+success);
        if (mAutoFocusHandler != null) {
            mAutoFocusHandler.sendEmptyMessageDelayed(mAutoFocusMessage,AUTO_FOCUS_INTERVAL_MS);
//            mAutoFocusHandler = null;
        } else {
            Log.v(TAG, "Got auto-focus callback, but no handler for it");
        }
    }

然后handler如何执行以下代码，再进行一次自动对焦，这样就完成了循环

                    case MSG_AUTOFUCS:
                        cameraUtil.autoFocus();
                        break;

然后给按钮赋予拍摄功能，拍摄的还要停止聚焦

                handler.removeCallbacksAndMessages(null);
                cameraUtil.takePicture(TwoActivity.this,TwoActivity.this,TwoActivity.this);

这个函数会被调用，data就是图片数据

    @Override
    public void onPictureTaken(byte[] data, Camera camera)

这里要注意一件事，拍摄后Camera预览界面就会停止，因为他停止聚焦了，我们需要重新设置自动对焦，并开启预览

    // 刷新相机
    public void refreshCamera(){
        if (surfaceHolder.getSurface() == null){
            // preview surface does not exist
            return;
        }

        // stop preview before making changes
        try {
            mCamera.stopPreview();
        } catch(Exception e){
            // ignore: tried to stop a non-existent preview
        }

        // set preview size and make any resize, rotate or
        // reformatting changes here
        // start preview with new settings





        try {
            mCamera.setPreviewDisplay(surfaceHolder);
            mCamera.startPreview();
            mCamera.autoFocus(autoFocusCallback);
        } catch (Exception e) {

        }
        surfaceHolder.setType(SurfaceHolder.SURFACE_TYPE_PUSH_BUFFERS);
    }

3.处理图片数据，完成局部截图

继续在onPictureTaken函数的data数据处理

因为处理图片是耗时任务，所以开启子线程完成

这里先开启一个等待对话框

        if(!mypDialog.isShowing())
        mypDialog.show();

然后开启子线程

        if(data != null){
            new Thread(new BitmapThread(bitmap,data,handler,TwoActivity.this)).start();

        }

将data转换为Bitmap数据

        bitmap = BitmapFactory.decodeByteArray(data, 0, data.length);

将图片旋转90度

        bitmap = rotateBitmap(bitmap,90);

这是旋转Bitmap的函数

    public static Bitmap rotateBitmap(Bitmap source, float angle) {
        Matrix matrix = new Matrix();
        matrix.postRotate(angle);
        return Bitmap.createBitmap(source, 0, 0, source.getWidth(), source.getHeight(), matrix, true);
    }

切割Bitmap，将扫描区域的图片切割出来

        int PMwidth = bitmap.getWidth(); // 得到图片的宽，高
        int PMheight = bitmap.getHeight();

        int left = PMwidth/10;
        int top = PMheight/3;
        int right = PMwidth*9/10;
        int bottom = PMheight*4/9;
        int width = right - left;
        int height = bottom - top;

        Log.v("zzw",PMheight+" "+PMwidth);


        bitmap = Bitmap.createBitmap(bitmap, left, top, width, height, null,
                false);

4.扫描出结果

其实tess-two框架的使用很简单，但是使用这个框架需要依靠训练文件来完成扫描，我在res目录下放了raw文件夹，里面的eng_traineddata文件就是这个用途，但是我们不能直接使用它们，我们需要将他们复制到手机存储里

下面的代码意思是在应用私有路径里创建tesseract/tessdata/eng.traineddata相关路径的文件并使用输入流将文件的数据读出来，然后使用输出流将数据传入eng.traineddata文件

    public static void initTessTrainedData(Context context){

        if(initiated){
            return;
        }

        File appFolder = context.getFilesDir();
        File folder = new File(appFolder, tessdir);
        if(!folder.exists()){
            folder.mkdir();
        }
            
        tesseractFolder = folder.getAbsolutePath();

        File subfolder = new File(folder, subdir);
        if(!subfolder.exists()){
            subfolder.mkdir();
        }

        File file = new File(subfolder, filename);
        trainedDataPath = file.getAbsolutePath();
        Log.d(TAG, "Trained data filepath: " + trainedDataPath);

        if(!file.exists()) {

            try {
                FileOutputStream fileOutputStream;
                byte[] bytes = readRawTrainingData(context);
                if (bytes == null){
                    return;
                }
                    
                fileOutputStream = new FileOutputStream(file);
                fileOutputStream.write(bytes);
                fileOutputStream.close();
                initiated = true;
                Log.d(TAG, "Prepared training data file");
            } catch (FileNotFoundException e) {
                Log.e(TAG, "Error opening training data file\n" + e.getMessage());
            } catch (IOException e) {
                Log.e(TAG, "Error opening training data file\n" + e.getMessage());
            }
        }
        else{
            initiated = true;
        }
    }

好了再说说tess-two框架的使用

创建TessBaseAPI

        TessBaseAPI tessBaseAPI = new TessBaseAPI();

关闭测试

        tessBaseAPI.setDebug(true);

设置训练数据路径和识别文字是英文

        tessBaseAPI.init(path, "eng");

设置白名单

        tessBaseAPI.setVariable(TessBaseAPI.VAR_CHAR_WHITELIST, "ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz0123456789");

设置黑名单

        tessBaseAPI.setVariable(TessBaseAPI.VAR_CHAR_BLACKLIST, "!@#$%^&*()_+=-[]}{;:'\"\\|~`,./<>?");

设置识别模式

        tessBaseAPI.setPageSegMode(TessBaseAPI.PageSegMode.PSM_AUTO_OSD);

传入bitmap数据

        tessBaseAPI.setImage(bitmap);

获取扫描结果

        String inspection = tessBaseAPI.getHOCRText(0);

结束TestBaseAPI的使用

        tessBaseAPI.end();

实现扫描身份证号码，这里是通过正则表达式来判断扫描出的结果是否有身份证号码，也就是说tess-two其实是只是扫描出Bitmap文件里面有哪些文字，然后使用正则表达式来筛选出我们需要的数据。也就是说我们通过换取正则表达式就能做到扫描手机号等，带有某种规律的数字或者字母

这是正则表达式的线上工具地址，大家可以自己试试 http://tool.oschina.net/regex/#

    private static Pattern pattern = Pattern.compile("\\d{17}[\\d|x]|\\d{15}");
    public static String getTelNum(String sParam){
        if(TextUtils.isEmpty(sParam)){
            return "";
        }

        Matcher matcher = pattern.matcher(sParam);
        StringBuilder bf = new StringBuilder();
        while (matcher.find()) {
            bf.append(matcher.group()).append(",");
        }
        int len = bf.length();
        if (len > 0) {
            bf.deleteCharAt(len - 1);
        }
        return bf.toString();
    }

然后通过handler返回结果

        Message message = Message.obtain();
        message.what = 1;
        Bundle bundle = new Bundle();
        bundle.putString("decode",strDecode);
        message.setData(bundle);
        message.what = TwoActivity.MSG_BITMAP;
        handler.sendMessage(message);

取消加载框，并将局部截图的图像和扫描的结果通过DialogFragment显示出来

                        mypDialog.dismiss();
                        String strDecode = msg.getData().getString("decode","扫描失败");

                        if(strDecode == null ||strDecode.equals(""))
                            strDecode = "扫描失败";

                        imageDialogFragment.setImage(bitmap);
                        imageDialogFragment.setText(strDecode);
                        imageDialogFragment.show(getFragmentManager(), "ImageDialogFragment");

5.结论

其实还没有结束因为我本想做出一个能够扫描整张身份证的项目，我看一下网上有很多API都能实现这个功能，但都要钱，如果要是能够实现这个功能，并发到github，我岂不是成为大神了。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。

您可能感兴趣的文章:

如对本文有疑问，请在下面进行留言讨论，广大热心网友会与你互动！！点击进行留言回复

Android原生视频播放VideoView的使用

本文实例为大家分享了android原生视频播放videoview的具体代码，供大家参考，具体内容如下布局文件activity_video.xml<rela... [阅读全文]
Android apk 项目一键打包并上传到蒲公英的实现方法

项目一键打包并上传到蒲公英缘由:测试流程由打包找包准备上传填写更新信息然后上传过于复杂所以想要简化开发阅读须知:需要读者了解如何在项目里面建立... [阅读全文]
flutter的环境安装配置问题及解决方法

flutter简介flutter是google推出的基于dart语言开发的跨平台开源ui框架，旨在统一纷纷扰扰的跨平台开发框架，在ui层面上多端共用一套dart... [阅读全文]
Android 自定义LineLayout实现满屏任意拖动功能的示例代码

1.前言在开发中，会有需求实现控件在屏幕随意拖动，这就需要自定义view,然后在ontouchevent事件中，处理motionevent.action_mov... [阅读全文]
Android scheme 跳转的设计与实现详解

缘起随着 app 的成长，我们难免会遇到以下这些需求： h5 跳原生界面 notification 点击调相关界面根据后台返回数据跳转界面，例如登录成功... [阅读全文]
Android 通过腾讯TBS实现文件预览功能

1.集成腾讯tbs使用腾讯tbs来预览pdf,word,excel,ppt等多种类型的文件，去下载sdk，按照官方文档文档集成sdk。2.使用tbsreade... [阅读全文]
android 限制某个操作每天只能操作指定的次数(示例代码详解)

最近有个需求，要求启动页的拦截页每天只能显示3次，超过三次就显示别的页面，然后到第二天才可以再次显示，利用sharepreferences保存天数和每天的次数，... [阅读全文]
Android 集成 google 登录并获取性别等隐私信息的实现代码

前言公司做海外产品的，集成的是 google 账号登录，账号信息、邮箱等这些不涉及隐私的按 google 的正常登录流程可以轻松实现。但是一旦需要获取涉及隐私... [阅读全文]
Android 应用Crash 后自动重启的方法小结

前提首先，我们肯定要在application里面注册一个crashhandler，监听应用crashpublic class testapplication e... [阅读全文]
Android FTP服务器上传文件攻略(代码详解)

1.前言在开发中，会遇到向ftp服务器上传文件的需求,首先要导入commons-net-3.3.jar 然后利用api进行相关操作，具体功能如下：ftp相关代码... [阅读全文]

网友评论


验证码：