首页 文章

文本编辑器打开大(巨大,巨大,大)文本文件[关闭]

提问于
浏览
1023

我的意思是100 MB大;这样的文本文件可以推动编辑的信封 .

我需要查看一个大型XML文件,但如果编辑器有错误则无法查看 .

有什么建议?

2 回答

  • 169

    免费只读查看器:

    • glogg(Windows,macOS,Linux) - 确认可以处理多GB文件 . 它的主要功能是正则表达式搜索 . 有标签,直接从磁盘读取文件,可以观看/跟踪文件,并允许用户标记行 .

    • LogExpert(Windows) - tail 的GUI替换和大文件查看器 . 支持以下,搜索,过滤,可配置的突出显示,插件和外部工具 . 是否有大于6 GB的日志文件的膨胀作业 .

    • Large Text File Viewer(Windows) - 极简主义且可执行文件的大小非常小 . 支持拆分视图,文本主题自定义,正则表达式搜索和以下 .

    免费编辑:

    • Large File Editor(Windows) - 打开并编辑TB文件,支持Unicode,使用少量内存,具有特定于XML的功能,并包含二进制模式 .

    网络浏览者:

    • htmlpen.com - 可以打开和语法高亮显示TB文件 . 允许编辑,非常大的文件除外 . 支持搜索,正则表达式捕获,导出 .

    • readfileonline.com - 另一个HTML5大文件查看器 . 支持搜索 .

    付费编辑:

    • 010 Editor(Windows,macOS,Linux) - 打开巨型(高达50 GB)文件 .

    • SlickEdit(Windows,macOS,Linux) - 可以打开大文件 .

    • UltraEdit(Windows,macOS,Linux) - 可以打开超过6 GB的文件,但必须更改配置才能实现:菜单»高级»配置»文件处理»临时文件»打开没有临时文件的文件.. .

    • EmEditor(Windows) - 很好地处理非常大的文本文件(正式高达248 GB,但根据一份报告高达900 GB) .

    而且当然:

    • Traditional programmers' editors - 您是否尝试使用普通编辑器打开大文件?有些编辑器实际上可以处理相当大的文件 . 特别是,Notepad++(Windows)支持最大2 GB的文件 .

    • VimEmacs (Windows,macOS,Linux) - 每个人都知道这些程序是什么 . 它们很难学习,但对于大文件非常有效和良好 .

    • less(Windows,macOS,Linux) - 命令行寻呼机和传统的Unix工具 . 该程序附带macOS和Linux . 在Windows上,它可以与MSYS2,Chocolatey,Cygwin,MinGW或WSL一起安装;或手动下载the GnuWin32 binaries,解压缩 less.exe ,然后将其添加到 PATH .

    • MORE(Windows) - 这是指Windows MORE ,而不是Unix more . 此内置程序适用于所有版本的Windows,并允许您一次读取一个屏幕 . 它's good in a pinch if you'在Windows上,不想安装任何东西 .

  • 1166

    提示和技巧

    你为什么要使用编辑器来查看(大)文件?

    在* nix或Cygwin下,只需使用less . (有一句名言 - "less is more, more or less" - 因为"less"取代了早期的Unix命令"more",另外还可以向上滚动 . )在less下搜索和导航与Vim非常相似,但是没有交换文件和使用的少量RAM .

    有一个GNU的Win32端口少 . 请参阅上面答案的“更少”部分 .

    Perl

    Perl适用于快速脚本,它的 .. (范围触发器)运算符提供了一个很好的选择机制来限制你必须涉及的问题 .

    例如:

    $ perl -n -e 'print if ( 1000000 .. 2000000)' humongo.txt | less
    

    这将从100万行提取到200万行,并允许您手动筛选输出 .

    另一个例子:

    $ perl -n -e 'print if ( /regex one/ .. /regex two/)' humongo.txt | less
    

    当“正则表达式1”找到某些内容时,这将开始打印,当“正则表达式2”找到有趣块的结尾时停止打印 . 它可能会找到多个块 . 筛选输出......

    logparser

    这是您可以使用的另一个有用的工具 . 引用the Wikipedia article

    logparser是一个灵活的命令行实用程序,最初由Microsoft员工Gabriele Giuseppini编写,用于自动化IIS日志记录的测试 . 它旨在与Windows操作系统一起使用,并包含在IIS 6.0 Resource Kit Tools中 . logparser的默认行为类似于“数据处理管道”,通过在命令行上获取SQL表达式,并输出包含SQL表达式匹配项的行 . Microsoft将Logparser描述为一个功能强大的多功能工具,它提供对基于文本的数据的通用查询访问,例如日志文件,XML文件和CSV文件,以及Windows操作系统上的关键数据源,如事件日志,注册表,文件系统和Active Directory . 输入查询的结果可以在基于文本的输出中自定义格式化,也可以持久保存到更多专业目标,如SQL,SYSLOG或图表 .

    用法示例:

    C:\>logparser.exe -i:textline -o:tsv "select Index, Text from 'c:\path\to\file.log' where line > 1000 and line < 2000"
    C:\>logparser.exe -i:textline -o:tsv "select Index, Text from 'c:\path\to\file.log' where line like '%pattern%'"
    

    尺寸的相对性

    100 MB不是太大 . 3 GB变得有点大 . 我曾经在印刷和邮件设施工作,创造了约2%的美国头等舱邮件 . 我作为技术主管的系统之一约占邮件的15% . 我们在这里和那里有一些大文件要调试 .

    还有更多......

    您可以在此处添加更多工具和信息 . 这个答案是社区wiki的原因!我们都需要更多关于处理大量数据的建议......

相关问题