我收到了调试问题 .
由于我在这里很新,请原谅可能的janky文本墙 .
几个小时后,我终于得到 elementtree
做我想要的,但是我无法输出我的结果,因为
tree.write("output3.xml")
以及
print(ET.tostring(root))
给我
TypeError:无法序列化0.029999999999999999(类型为float64)
我不知道你们需要帮助我的是什么,所有源代码都很冗长 . 错误信息也是如此 . 但这有点容易,所以我在这里发布......
提前说明:
-
据我所见,Ctrl F我的数据中没有0.029999999 ....
-
我的数据中所有数字都舍入到2位小数
-
舍入改变了什么btw?还是只是为了展示?
-
我对此非常感到困惑,特别是因为似乎没有可谷歌类似的案例,只是几乎 - 但不完全 - 足够的 .
------------------------------------------------- -------------------------- TypeError Traceback(最近一次调用last)in()----> 1 tree.write(“output3 . xml“)C:\ Anaconda \ lib \ xml \ etree \ ElementTree.pyc in write(self,file_or_filename,encoding,xml_declaration,default_namespace,method)818)819 serialize = _serialize [method] - > 820 serialize(write,self ._root,encoding,qnames,namespaces)821如果file_or_filename不是file:822 file.close()C:\ Anaconda \ lib \ xml \ etree \ ElementTree.pyc in _serialize_xml(write,elem,encoding,qnames,namespaces)937在elem中写入(_escape_cdata(text,encoding))938 for e: - > 939 _serialize_xml(write,e,encoding,qnames,None)940 write(“”)941 else:C:\ Anaconda \ lib \ xml \ etree \ _Serialize_xml中的ElementTree.pyc(写,elem,编码,qnames,名称空间)937为ele中的e写入(_escape_cdata(text,encoding))938: - > 939 _serialize_xml(write,e,encoding,qnames,None)940写(“”)941否则:_serialize_xml中的C:\ Anaconda \ lib \ xml \ etree \ ElementTree.pyc (写,元素,编码,qnames,名称空间)937写(_escape_cdata(text,encoding))938 for ele in elem: - > 939 _serialize_xml(write,e,encoding,qnames,None)940 write(“”)941 else:C:\ Anaconda \ lib \ xml \ etree \ ElementTree.pyc in _serialize_xml(write,elem,encoding,qnames,namespaces)937 write(_escape_cdata(text,encoding))938 for e in elem: - > 939 _serialize_xml (写,e,编码,qnames,无)940写(“”)941 else:C:\ Anaconda \ lib \ xml \ etree \ ElementTree.pyc in _serialize_xml(write,elem,encoding,qnames,namespaces)937 write( _escape_cdata(text,encoding))938 for e in elem: - > 939 _serialize_xml(write,e,encoding,qnames,None)940 write(“”)941 else:C:\ Anaconda \ lib \ xml \ etree \ ElementTree .pyc in _serialize_xml(write,elem,encoding,qnames,namespaces)930 v = qnames [v.text] 931 else: - > 932 v = _escape_attrib(v,encoding)933 write(“%s = \”%s \“”%(qnames [k],v))934 if text或len(elem):C:\ Anaconda \ lib \ xml \ etree \ ElementTree.pyc in _escape_attrib(text,encoding)1090 ret urn text.encode(encoding,“xmlcharrefreplace”)1091除外(TypeError,AttributeError): - > 1092 _raise_serialization_error(text)1093 1094 def _escape_attrib_html(text,encoding):C:\ Anaconda \ lib \ xml \ etree \ ElementTree.pyc in _raise_serialization_error(text)1050 def _raise_serialization_error(text):1051引发TypeError( - > 1052“无法序列化%r(类型%s)”%(text,type(text).name)1053)1054 TypeError:无法序列化0.029999999999999999(类型float64)
Okay, first edits first. 我将粘贴我想要实现的精华的截图 .
手头的任务是使用python和pandas以及 elementtree
来更新xml文件 .
该文件由文本转语音系统MARY输出,并包含如何合成给定话语的信息 .
该文件具有以下结构(简化)
<phrase>
<word>
<syllable = "t e s t">
<phone = "t" duration = "30" end = "230">
<phone = "e" duration = "90" end = "320" f0 = "(25,144)(50,145)(75,150)(100,149)">
...and so on...see screenshot for details...
这意味着对于“测试”一词中的任何给定电话/声音,XML按顺序包含声音信息:声音类型,长度,时间终点,音高(f0)曲线 . f0曲线由元组组成(时间点@经过的时间百分比,音高(以赫兹为单位)@时间点)
从另一个程序,PRAAT,我获得了更新的时间和音高信息,存储在数据帧中,请参阅其他截图 .
我的Python解析xml并覆盖每个声音的声学信息 . 但后来无法输出 .
回答中的浮动初学者链接使事情变得更加清晰 . 显然舍入并没有任何帮助 .
我可能没有浮点数并且使用字符串,但奇怪的是我的Dataframe中的东西似乎是BE字符串,因为当我尝试对从那里提取的任何值应用round()函数时,它会抗议输入不是浮点数...
screenys:
雅 . 大 . 需要更多的图像声誉 . 老鼠 . 所以只是链接 .
1 回答
You should boil your problem down to a simple example. 这可以帮助您自己解决问题,但更重要的是,现在读取它的任何人基本上都必须猜测您的意图,因为您没有显示您的代码,输入或预期输出的示例 .
可能问题是你正在设置
ElementTree
属性的值或text
到Numpy float64 object . ElementTree库不知道float64
类型,并且不会尝试将其静默转换为字符串 .例如,你的代码中可能有这样的东西(我不知道你的代码是如何工作的,因为你没有显示它):
你应该用这个替换它:
Python本身及其大多数标准库对类型检查都很严格,不会自动从数字类型转换为字符串 .