我目前正在尝试创建一个可以处理大型XML文件读取的方法 . 我只需要一种方法,一次加载1000行或小批量加载 .
我一直在寻找流读取器,xmlreaders和文件流,我已经看到一些提到只是在处理数据时保持流打开以获得我需要的东西,但我似乎无法理解它 .
我花了很长时间检查类似的问题,但似乎找到任何可以帮助我的东西 .
PS . 首先想到我正在考虑围绕readline做一个for循环到一个1000的计数器,但似乎无法弄清楚如何从1000行继续阅读另一个1000等直到文件的结尾 .
我的感觉是他需要一个自定义XML阅读器实现 .
例如 - 如果您的结构看起来像:
root item stuff /item item stuff /item item stuff /item item stuff /item /root
您必须编写读取多个“项目”块的代码(与yo希望批量处理一样多),然后将它们转换为有效的XML文档以供进一步处理 .
但是,如果您的XML文档是一个庞大的庞大实体 - 我认为没有任何优雅的方法可以处理它 .
1 回答
我的感觉是他需要一个自定义XML阅读器实现 .
例如 - 如果您的结构看起来像:
您必须编写读取多个“项目”块的代码(与yo希望批量处理一样多),然后将它们转换为有效的XML文档以供进一步处理 .
但是,如果您的XML文档是一个庞大的庞大实体 - 我认为没有任何优雅的方法可以处理它 .