首页 文章
  • 0 votes
     answers
     views

    在Excel中打开UTF-8 CSV文件,而不强制用户设置编码

    我有一个CSV文件,我用Javascript生成 . 我将编码设置为utf-8,在将数据和URI编码为输出之前附加数据和URI,如下所示: const csvContent = data:text/csv;charset=utf-8,${csvData} const encodedUri = encodeURI(csvContent) 在标准(.e.g LibreOffice)强制执行UTF-...
  • 389 votes
     answers
     views

    UTF-8,UTF-16和UTF-32

    UTF-8,UTF-16和UTF-32有什么区别? 我知道他们都将存储Unicode,并且每个都使用不同的字节数来表示字符 . 选择一个优于另一个是否有优势?
  • 1 votes
     answers
     views

    NiFi:Split Record处理器UTF-16 CSV到JSON

    尝试将csv制表符分隔文件转换为CSV文件为UTF-16的JSON .所有字段都是CSV和JSON字符串 . 在NiFi中使用SplitRecord处理器 . 处理器运行时没有任何错误,但转换为JSON的数据值如下所示 “\ u0000R \ u0000e \ u0000t \ u0000a \ u0000i \ u0000l .......” 我应该提到这是avro架构中的UTF-16吗?如果是...
  • 1 votes
     answers
     views

    如何将NSData UTF8编码数据转换为UTF16

    我从我的数据库接收UTF8编码的一些数据 . 我想知道如何把这个NSData用UTF8并用UTF16重新编码? 有没有办法做到这一点?我知道在将NSString传递给NSData时如何做到这一点 [@"myString" dataUsingEncoding:NSUTF16StringEncoding]; 但是我不能完全确定它是如何或者如果它可以做到而不必先将它放入一个字符串....
  • 47 votes
     answers
     views

    为什么.net对字符串使用UTF16编码,但是使用utf8作为保存文件的默认值?

    From here 本质上,string使用UTF-16字符编码形式 但是当保存vs StreamWriter时: 此构造函数创建一个StreamWriter,其UTF-8编码没有字节顺序标记(BOM), 我见过这个样本(删除了断开的链接): 看起来 utf8 对于某些字符串来说更小,而 utf-16 在某些其他字符串中更小 . 那么为什么.net使用 utf16 作为字符串的默认编码...
  • 2 votes
     answers
     views

    URL编码ASCII / UTF16字符

    我正在尝试对一些字符串进行URL编码,但是我对.Net框架提供的方法存在问题 . 例如,我'm trying the encode strings that contain the 'â字符 . 例如,根据w3schools,我希望这个字符被编码为'%E2'(我必须调用的PHP系统也期望这样......) . 我尝试使用这些方法: System.Web.HttpUtility.UrlEncode(...
  • 1 votes
     answers
     views

    读取用Java编写的UTF16编码的XML文件

    我试图用Java读取UTF-16 xml文件 . 该文件是用C#编写的 . 这是java代码: import java.io.File; import javax.xml.parsers.DocumentBuilder; import javax.xml.parsers.DocumentBuilderFactory; import org.w3c.dom.Document; import or...
  • 0 votes
     answers
     views

    在PDI Kettle中的文本文件输出中使用带有BOM编码的UTF16-LE

    我是PDI水壶的新手 . 我有一个要求,客户希望输出文本文件/ csv文件中的BOM编码为UTF16-LE . 但是在“文本文件输出步骤”的“内容”选项卡中,我只能看到以下选项UTF-16,UTF-16LE,UTF-16BE . 是否有其他设置我可以使用BOM将字符代码设置为UTF16-LE . 请建议 .
  • 1 votes
     answers
     views

    Python Pandas read_csv(encoding = 'utf16')仅适用于engine = 'python'?

    我在OSX El Capitan 10.11.2上的Python 2.7.10上使用Pandas 0.18.1,如果我没有设置 engine='python' ,则无法使用read_csv()读取UTF-16文件 . 文档指出Python解析器功能更完整,因此Pandas可能默认使用C解析器,并且它还不支持UTF-16 . 有人可以确认是否是这种情况,或者这里是否还有其他事情发生? 以下是最小的再...
  • 0 votes
     answers
     views

    在Java Script中解码UTF16编码的字符串(URL)

    我有用UTF16编码的字符串,我想用JS解码它,当我使用简单的decodeURI()函数时,我得到了所需的结果,但是如果字符串中有特殊字符,如á,ó等,则不进行解码 . 在更多分析中,我发现编码字符串中的这些字符包含ASCII值 . 假设我有字符串“Acessejá,编码版本:”Acesse%20j%E1“ . 如何使用java脚本从编码版本中获取字符串? 编辑:字符串是URL的一部分
  • 1 votes
     answers
     views

    将以单个空字节结尾的字节数组转换为UTF16编码的字符串

    我得到一个字节数组,其中包含以UCS-2LE编码的字符串,通常,UCS-2LE字符串中的空字符串终结符将被编码为两个空字节(00 00),但有时只有一个如下: import java.nio.charset.Charset; import java.util.Arrays; class Ucs { public static void main(String[] args) { ...
  • -2 votes
     answers
     views

    在C中将UTF16(Windows wchar_t)转换为UTF8非英文字母已损坏(韩文)

    我正在尝试制作一个多平台应用程序 . 在Windows应用商店应用程序(winrt)端,打开一个文件并以Platform :: String格式读取其路径,该格式为Windows中的wchar_t,UTF16 . 由于我的核心逻辑是独立于平台的并且只使用标准C数据类型,因此我通过以下代码将路径转换为UTF8中的std :: string: Platform::String^ copyPath = ...
  • 4 votes
     answers
     views

    带有Str的Perl6 NativeCall被编码('utf16')得到随机损坏的结果

    我使用 NativeCall 在perl6脚本中映射 GetFullPathName windows API,因此我编写了以下内容: #!perl6 use NativeCall; constant \WIN32_MAX_PATH = 260; #I may use directly $path.IO.absolute() sub Win32-GetFullPathName( ...
  • 5 votes
     answers
     views

    UnicodeEncodeError:'charmap' codec无法将字符字符映射编码为<undefined>

    我在使用unicode写入文件时遇到问题 . 我使用的是python 2.7.3 . 它给了我这样一个错误: UnicodeEncodeError: 'charmap' codec can't encode character u'\u2019' in position 1006: character maps to &lt;undefined&gt; 以下是我的代码示例:错误在线:f3.wri...
  • 4 votes
     answers
     views

    如何逐行将utf-16文件读入utf-8 std :: string

    我正在使用期望utf8编码的std :: string变量的代码 . 我希望能够处理用户提供的文件,该文件可能具有utf-16编码(我不知道设计时的编码,但最终希望能够处理utf8 / 16/32),读取它行-by-line,并将每一行转发给代码的其余部分作为utf8编码的std :: string . 我有c 11(真的,c 11的当前MSVC子集)和1.55.0的增强功能 . 我最终需要代码才...
  • 3 votes
     answers
     views

    UTF-16 codecvt方面

    关于locales的问题扩展并在_2559335中描述:我真正想要做的是在熟悉UTF-16文件的语言环境中安装codecvt facet . 我可以写自己的 . 但我不是UTF专家,因此我相信我会得到它几乎正确;但它会在最不方便的时候破裂 . 所以我想知道是否有任何可以在C中使用的预构建codecvt(或其他)方面的资源(在网上)经过同行评审和测试? 原因是默认语言环境(在我的系统MAC OS X...
  • 37 votes
     answers
     views

    ISO / IEC在sizeof(char)中混淆不同的字符集编码,如UTF-16

    假设程序在具有UTF-16编码字符集的系统上运行 . 所以根据C编程语言 - 第4页,第150页: char可以保存机器字符集的字符 . →我认为char变量的大小是2字节 . 但根据ISO / IEC 14882:2014: sizeof(char),sizeof(signed char)和sizeof(unsigned char)是1“ . 或C语言程序设计 - 第4页,第149页: ...

热门问题