我正在使用POI 3.11并排读取两个Excel文件来比较它们 .
当我循环浏览两个文件以查找每个工作表的行数/列数时,POI声明其中一个工作表没有行,但是如果我打开其中一个文件,并在一个工作表上进行一次编辑,然后运行通过POI再次,然后数字是不同的 .
我写了一个小程序,在我做出改变之前和之后计算单个文件中的行,这是输出:
FileName: clean.xls Sheet name: [One] [One] row count: 1 Sheet name: [Two] [Two] row count: 2 FileName: modified.xls Sheet name: [One] [One] row count: 3499 Sheet name: [Two] [Two] row count: 10
请记住,我所做的更改只是表单 One
,但两张表的行计数似乎都在更新 . 重要的是,在这两个版本的文件中分别有3499行和10行 .
这是代码的缩减版本:
package com.jpmc.firmrisk.tools.excel; import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.IOException; import org.apache.log4j.Logger; import org.apache.poi.ss.usermodel.Row; import org.apache.poi.xssf.usermodel.XSSFSheet; import org.apache.poi.xssf.usermodel.XSSFWorkbook; public class ExcelFileParser { private static final Logger LOG = Logger.getLogger(ExcelFileParser.class); public static void main(String[] args) { String[] fileNames = new String[] { "clean.xls", "modified.xls" }; for (String fileName: fileNames) { try { LOG.info("FileName: " + fileName); FileInputStream file = new FileInputStream(new File(fileName)); XSSFWorkbook workbook = new XSSFWorkbook(file); for (int i = 0; i < workbook.getNumberOfSheets(); i++) { XSSFSheet sheet = workbook.getSheetAt(i); String sheetName = sheet.getSheetName(); LOG.info(" Sheet name: " + sheetName); int rowCount = 0; for (Row ignored: sheet) { rowCount++; } LOG.info(" " + sheetName + " row count: " + rowCount); } file.close(); } catch (FileNotFoundException e) { e.printStackTrace(); } catch (IOException ae) { ae.printStackTrace(); } } } }
我没有使用迭代器,而是尝试使用 Sheet.getFirstRowNum()
, Sheet.getLastRowNum()
和 Sheet.getPhysicalNumberOfRows()
方法,但是所有方法都声称清洁电子表格的工作表上没有数据 .
谁看过这个吗?它有解决方法吗?或者这是Excel文件的已知问题?
1 回答
事实证明原始工作表是使用SpreadSheet Gears(显然是AC#库)而不是Excel创建的,我猜测POI和SSG对Excel保存文件的结构做出了不同的假设,这就是问题源于何处 .