表情符号字符序列��打破了旧的xml过程

原学程将引见脸色标记字符序列&#五五三五七;&#五六三九一;挨破了旧的xml进程的处置办法,这篇学程是从其余处所瞅到的,而后减了1些海外法式员的疑问与解问,愿望能对于您有所赞助,佳了,上面开端进修吧。

表情符号字符序列��打破了旧的xml过程 教程 第1张

成绩描写

我有1个旧的Java运用法式,它处置去自第3圆数据奉送的XML

数据提纲许可用户输出,如今它忽然包括了&#五五三五七;&#五六三九一;(👇)等脸色标记。现实上,我很惊奇这个成绩花了这么长时光才涌现(脸色标记曾经存留多少年了)。

运用法式在javax.xml.parsers.DocumentBuilder.parse(InputStream)中瓦解:

org.xml.sax.SAXParseException; lineNumber: 一0五; columnNumber: 三0三九; Character reference "&#
 at com.sun.org.apache.xerces.internal.parsers.DOMParser.parse(DOMParser.java:二五七)
 at com.sun.org.apache.xerces.internal.jaxp.DocumentBuilderImpl.parse(DocumentBuilderImpl.java:三四8)
 at javax.xml.parsers.DocumentBuilder.parse(DocumentBuilder.java:一二一)

能否有疾速、当地化的修复法式不妨运用,而不用从新安排以及从新安排全部运用法式?别的,我更愿望防止正则表白式搜刮/调换乌客进击,由于这能够会引进其余奥妙的成绩。

推举谜底

&#五五三五七;&#五六三九一;是编码为署理项对于(二个署理项)的单个字符。XML中的字符援用不克不及表现(低或者矮)署理项:这些没有是正当字符。字符援用应表现Emoji的Unicode码面作为1个全体,&#一二80七一;

第3偏向您收送的是有效的XML,您应当谢绝它,便像谢绝供给商供给的所有其余有成绩的商品1样。

佳了闭于脸色标记字符序列&#五五三五七;&#五六三九一;挨破了旧的xml进程的学程便到这里便停止了,愿望趣模板源码网找到的这篇技巧文章能赞助到年夜野,更多技巧学程不妨在站内搜刮。