当前位置：移动技术网 > IT编程>开发语言>c# > 使用NOPI读取Word、Excel文档内容

使用NOPI读取Word、Excel文档内容

2019年07月18日 | 移动技术网IT编程 | 我要评论

使用nopi读取excel的例子很多，读取word的例子不多。

excel的解析方式有多中，可以使用odbc查询，把excel作为一个数据集对待。也可以使用文档结构模型的方式进行解析，即解析workbook（工作簿）、sheet、row、column。

word的解析比较复杂，因为word的文档结构模型定义较为复杂。解析word或者excel，关键是理解word、excel的文档对象模型。

word、excel文档对象模型的解析，可以通过com接口调用，此类方式使用较广。（可以录制宏代码，然后替换为对应的语言）

也可以使用xml模型解析，尤其是对于2007、2010版本的文档的解析。

using npoi.poifs.filesystem;
using npoi.ss.usermodel;
using npoi.xssf.usermodel;
using npoi.xwpf.usermodel;
using system;
using system.collections.generic;
using system.configuration;
using system.io;
using system.text;

namespace eyuan
{
  public static class nopihandler
  {
    /// <summary>
    /// 
    /// </summary>
    /// <param name="filename"></param>
    /// <returns></returns>
    public static list<list<list<string>>> readexcel(string filename)
    {
      //打开excel工作簿
      xssfworkbook hssfworkbook = null;
      try
      {
        using (filestream file = new filestream(filename, filemode.open, fileaccess.read))
        {
          hssfworkbook = new xssfworkbook(file);
        }
      }
      catch (exception e)
      {
        loghandler.logwrite(string.format("文件{0}打开失败，错误：{1}", new string[] { filename, e.tostring() }));
      }
      //循环sheet页
      int sheetscount = hssfworkbook.numberofsheets;
      list<list<list<string>>> workbookcontent = new list<list<list<string>>>();
      for (int i = 0; i < sheetscount; i++)
      {
        //sheet索引从0开始
        isheet sheet = hssfworkbook.getsheetat(i);
        //循环行
        list<list<string>> sheetcontent = new list<list<string>>();
        int rowcount = sheet.physicalnumberofrows;
        for (int j = 0; j < rowcount; j++)
        {
          //row（逻辑行）的索引从0开始
          irow row = sheet.getrow(j);
          //循环列（各行的列数可能不同）
          list<string> rowcontent = new list<string>();
          int cellcount = row.physicalnumberofcells;
          for (int k = 0; k < cellcount; k++)
          {
            //icell cell = row.getcell(k);
            icell cell = row.cells[k];
            if (cell == null)
            {
              rowcontent.add("nil");
            }
            else
            {
              rowcontent.add(cell.tostring());
              //rowcontent.add(cell.stringcellvalue);
            }
          }
          //添加行到集合中
          sheetcontent.add(rowcontent);
        }
        //添加sheet到集合中
        workbookcontent.add(sheetcontent);
      }

      return workbookcontent;
    }

    /// <summary>
    /// 
    /// </summary>
    /// <param name="filename"></param>
    /// <returns></returns>
    public static string readexceltext(string filename)
    {
      string excelcellseparator = configurationmanager.appsettings["excelcellseparator"];
      string excelrowseparator = configurationmanager.appsettings["excelrowseparator"];
      string excelsheetseparator = configurationmanager.appsettings["excelsheetseparator"];
      //
      list<list<list<string>>> excelcontent = readexcel(filename);
      string filetext = string.empty;
      stringbuilder sbfiletext = new stringbuilder();
      //循环处理workbook中的各sheet页
      list<list<list<string>>>.enumerator enumeratorworkbook = excelcontent.getenumerator();
      while (enumeratorworkbook.movenext())
      {

        //循环处理当期sheet页中的各行
        list<list<string>>.enumerator enumeratorsheet = enumeratorworkbook.current.getenumerator();
        while (enumeratorsheet.movenext())
        {

          string[] rowcontent = enumeratorsheet.current.toarray();
          sbfiletext.append(string.join(excelcellseparator, rowcontent));
          sbfiletext.append(excelrowseparator);
        }
        sbfiletext.append(excelsheetseparator);
      }
      //
      filetext = sbfiletext.tostring();
      return filetext;
    }

    /// <summary>
    /// 读取word内容
    /// </summary>
    /// <param name="filename"></param>
    /// <returns></returns>
    public static string readwordtext(string filename)
    {
      string wordtablecellseparator = configurationmanager.appsettings["wordtablecellseparator"];
      string wordtablerowseparator = configurationmanager.appsettings["wordtablerowseparator"];
      string wordtableseparator = configurationmanager.appsettings["wordtableseparator"];
      //
      string capturewordheader = configurationmanager.appsettings["capturewordheader"];
      string capturewordfooter = configurationmanager.appsettings["capturewordfooter"];
      string capturewordtable = configurationmanager.appsettings["capturewordtable"];
      string capturewordimage = configurationmanager.appsettings["capturewordimage"];
      //
      string capturewordimagefilename = configurationmanager.appsettings["capturewordimagefilename"];
      //
      string filetext = string.empty;
      stringbuilder sbfiletext = new stringbuilder();

      #region 打开文档
      xwpfdocument document = null;
      try
      {
        using (filestream file = new filestream(filename, filemode.open, fileaccess.read))
        {
          document = new xwpfdocument(file);
        }
      }
      catch (exception e)
      {
        loghandler.logwrite(string.format("文件{0}打开失败，错误：{1}", new string[] { filename, e.tostring() }));
      }
      #endregion

      #region 页眉、页脚
      //页眉
      if (capturewordheader == "true")
      {
        sbfiletext.appendline("capture header begin");
        foreach (xwpfheader xwpfheader in document.headerlist)
        {
          sbfiletext.appendline(string.format("{0}", new string[] { xwpfheader.text }));
        }
        sbfiletext.appendline("capture header end");
      }
      //页脚
      if (capturewordfooter == "true")
      {
        sbfiletext.appendline("capture footer begin");
        foreach (xwpffooter xwpffooter in document.footerlist)
        {
          sbfiletext.appendline(string.format("{0}", new string[] { xwpffooter.text }));
        }
        sbfiletext.appendline("capture footer end");
      }
      #endregion

      #region 表格
      if (capturewordtable == "true")
      {
        sbfiletext.appendline("capture table begin");
        foreach (xwpftable table in document.tables)
        {
          //循环表格行
          foreach (xwpftablerow row in table.rows)
          {
            foreach (xwpftablecell cell in row.gettablecells())
            {
              sbfiletext.append(cell.gettext());
              //
              sbfiletext.append(wordtablecellseparator);
            }

            sbfiletext.append(wordtablerowseparator);
          }
          sbfiletext.append(wordtableseparator);
        }
        sbfiletext.appendline("capture table end");
      }
      #endregion

      #region 图片
      if (capturewordimage == "true")
      {
        sbfiletext.appendline("capture image begin");
        foreach (xwpfpicturedata picturedata in document.allpictures)
        {
          string picextname = picturedata.suggestfileextension();
          string picfilename = picturedata.getfilename();
          byte[] picfilecontent = picturedata.getdata();
          //
          string pictempname = string.format(capturewordimagefilename, new string[] { guid.newguid().tostring() + "_" + picfilename + "." + picextname });
          //
          using (filestream fs = new filestream(pictempname, filemode.create, fileaccess.write))
          {
            fs.write(picfilecontent, 0, picfilecontent.length);
            fs.close();
          }
          //
          sbfiletext.appendline(pictempname);
        }
        sbfiletext.appendline("capture image end");
      }
      #endregion

      //正文段落
      sbfiletext.appendline("capture paragraph begin");
      foreach (xwpfparagraph paragraph in document.paragraphs)
      {
        sbfiletext.appendline(paragraph.paragraphtext);

      }
      sbfiletext.appendline("capture paragraph end");
      //

      //
      filetext = sbfiletext.tostring();
      return filetext;
    }


  }
}

以上就是本文的全部内容，希望对大家的学习有所帮助，也希望大家多多支持移动技术网。

您可能感兴趣的文章:

如对本文有疑问，点击进行留言回复！！

C#连接Informix数据库的问题

引言informix 11 与之前版本的 informix 相比，新增了很多特性，如 sql 语句跟踪、非阻断的检查点、sds 辅节点、星型连接、自动存储扩展、... [阅读全文]
C#实现猜数字游戏

本文实例为大家分享了c#实现猜数字游戏具体代码，供大家参考，具体内容如下给定一个0-100的随机数字猜其大小题目样式：电脑产生一个0到100之间的随机数字，并且... [阅读全文]
使用Visual Studio2019创建C#项目(窗体应用程序、控制台应用程序、Web应用程序)

一、vs的开发环境首先你得安装了vs2019，然后确认下下面三个组件是否存在，如果没有要下载一下。vs2019的安装可参考。二、创建c#窗体应用程序打开vs可以... [阅读全文]
C# 可空类型的具体使用

在项目中我们经常会遇到可为空类型，那么到底什么是可为空类型呢？下面我们将从4个方面为大家剖析。1、可空类型基础知识顾名思义，可空类型指的就是某个对象类型可以为空... [阅读全文]
C#存储相同键多个值的Dictionary实例详解

涉及到两个问题：一、访问磁盘中文件夹、文件夹下面的文件夹先看一下磁盘文件夹结构c盘下面有个根文件夹savefile，savefile下面有两个子文件夹分别为，2... [阅读全文]
vs2019安装和使用详细图文教程

vs2019已经在4月2日正式发布，vs2019发布会请看这个链接：vs2019发布活动vs2019和vs2017一样强大，项目兼容，不用互相删除，而且c/c+... [阅读全文]
C#实现猜数字小游戏

本文实例为大家分享了c#实现猜数字小游戏的具体代码，供大家参考，具体内容如下效果如图：代码：using system;using system.collecti... [阅读全文]
Visual Studio 中自定义代码片段的方法

第一步、打开 visual studio code，按ctrl + shift + p，输入：configure user snippets，选择 prefer... [阅读全文]
C#实现简单俄罗斯方块

最近在看《.net游戏编程入门经典 c#篇》第一章介绍了如何制作俄罗斯方块，自己试了试按照书上的步骤，可算是完成了。于是写下这篇文章留作纪念。1.类的设计在充... [阅读全文]
C#实现获取本地内网(局域网)和外网(公网)IP地址的方法分析

本文实例讲述了c#实现获取本地内网(局域网)和外网(公网)ip地址的方法。分享给大家供大家参考，具体如下：1、获取本机的ip地址集合：/// <summa... [阅读全文]

网友评论


验证码：

使用NOPI读取Word、Excel文档内容

2019年07月18日 | 移动技术网IT编程 | 我要评论

您可能感兴趣的文章:

相关文章:

网友评论