`
chenjia66804610
  • 浏览: 151759 次
  • 来自: ...
社区版块
存档分类
最新评论

sax 解析xml 内容过长

XML 
阅读更多
SAX parser 分块读取流, 默认为一次读取2K字节. (ch 里面不仅包含元素的值信息,其实它是整个xml文档的一个部分,也就是说,分析器每次从文档中读取2K字节,放到这个数组中,然后通过start和 length来划分出属于value的部分.这样的话,不能保证最后一个元素的值是完全被包含在这个ch中的).

所以我们还是要进行一些额外的操作才能通过 characters(char ch[],int start,int length)获得完整的element value.

Parser每次读取2K字节去填充ch. 填充顺序是从开头到结尾来覆盖原有的值, 所以在最后一次读取文档的时候,可能剩余部分不足2K,所以就会出现ch 中,前半部分是 文档的末尾部分, 而ch后半部分还有多余的信息,这个是倒数第二个ch中未被覆盖掉的部分。
解决办法:
声明一个StringBuffer在存放节点值
在startElement 或endElement时将StringBuffer置为空
characters作值相加就可以了
分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics