获取中文HTML内容并将其移动到另一个HTML文件中的相应div中-Java 学习之路

我的任务是使用英文HTML的中文翻译，并重新设计它以匹配原始的英文HTML . 中文“HTML”不再具有英文HTML的任何原始Div或样式 . 汉字编码为GB2312 .

我想创建一个程序/脚本来自动执行此操作，因为有182个HTML文件需要重新设置样式，我不想手动完成 . 我最熟悉PHP但对任何事情都很开放 .

如您所见，他们只需复制中文字符并将其粘贴到匹配的DIV中 - 同时替换英文文本 . 然后在 <head> 中将编码更改为GB2312，以便正确显示中文字符 . 例如：

<meta charset="gb2312">

我的想法就转换这两个是解析中文文件，找到每个独立的中文字符串，将每个字符串填充到它自己的变量中，然后通过等效的英文文件解析，找到英文文本的字符串，并替换为来自变量的等效汉字 . 为＆reg和＆copy添加例外 .

有人知道我怎么会这样做吗？大多数脚本语言甚至支持查找非UTF8字符吗？

1 回答