首页 文章

反向工程二进制字典文件以提取字符串

提问于
浏览
0

我有一个~600MB .DAT文件,其中包含一个意大利语词典(带有定义的重音词) .

我想从这个文件中提取所有字符串(只要我能阅读单词和定义,包含字符串和脏 Headers /二进制数据的原始转储就可以了) .

所以我的问题是: Is there a software that could do this in an automated way?

我会告诉它:'我知道这个文件包含字符串“TREE”,“DOG”,“CAT”,“COLLISION”......现在使用一些蛮力,统计分析或任何方法来尝试找出这些字符串的方式编码'

我要提的两件事:

  • 我是软件开发人员,但在逆向工程,十六进制编辑等方面完全没有经验或知识......

  • 我不想花费数小时阅读逆向工程教程并使用许多软件进行反复试验 . 如果我不放弃这项任务 .

我意识到这很可能(如果文本是加密的)这个任务不能简单地执行,我只想尝试使用最好的工具 .

1 回答

  • 0

    似乎这样的自动化工具不存在,如果它存在,它只适用于一小组输入文件 .

    我终于找到了解决问题的方法 .

    我有一个EXE程序,允许浏览字典和显示单词的定义 .

    使用AutoHotkey,我写了一个相对简单的脚本,它搜索400k字输入列表中每个单词的定义,将其复制到剪贴板,然后将其粘贴到另一个输出文本文件中 .

    我必须在击键,窗口切换等之间插入一些 Sleep 语句以使脚本稳定 . 预计到"parse"整个词典的时间:20天:)

相关问题