在进行XML转换时，如何保持源文档中的空白和格式？_技术学堂

在进行XML转换时，如何保持源文档中的空白和格式？

发布时间：2025-12-05 16:15

发布者：网络

浏览次数：

要保持XML转换时的空白字符，需在解析、处理和输出三环节主动配置：首先设置解析器保留空白节点，如DOM中setIgnoringElementContentWhitespace(false)；其次在XSLT中使用xsl:preserve-space声明需保留空白的元素，避免xsl:strip-space；最后通过xsl:output设置indent="no"防止输出重排，并用xsl:copy-of或xsl:text精确控制文本节点输出，避免normalize-space等函数破坏原始格式。

在进行xml转换时，如何保持源文档中的空白和格式？

XML转换时默认会忽略大部分空白字符，要保持源文档中的空白和格式，关键在于控制解析器行为和XSLT处理逻辑。

设置解析器保留空白节点

大多数XML解析器（如J*a的DOM、SAX，或.NET的XmlDocument）默认会丢弃“无关空白”（即元素间用于缩进和换行的空格、制表符、回车）。需显式启用保留：

DOM解析器中调用 setIgnoringElementContentWhitespace(false)（J*a）或确保 XmlReaderSettings.IgnoreWhitespace = false（.NET）
使用SAX时，重写 ignorableWhitespace() 方法，而非只处理 characters()
对于Python的lxml，创建解析器时传入 remove_blank_text=False

在XSLT中声明保留空白的元素

XSLT本身不自动保留所有空白，但可通过 xsl:preserve-space 明确指定哪些元素的内容应保留空白：

在样式表顶部添加：（适用于含格式化文本的元素）
避免使用 xsl:strip-space（除非你明确想清除某些元素的空白）
若需全局保留（谨慎使用），可写，但会影响性能且可能干扰逻辑处理

输出时控制缩进与换行

即使输入空白被保留，XSLT处理器默认输出仍可能重新格式化。需配置输出方法：

拾贝

一键同步微信读书所有笔记和划线，并在新标签页回顾

186 查看详情

在XSLT中添加：（禁用自动缩进）
若需部分缩进但保留原始结构，改用 indent="yes" 并配合 disable-output-escaping="yes" 处理特定文本节点
使用包裹需要原样输出的换行或空格，例如：

处理文本节点时避免隐式规范化

XSLT中直接用会合并并截断空白；应改用更精确的方式：

用复制原始文本节点（包括空格、换行）
对混合内容（如段落内有标签和文本），用 apply-templates> 配合模板匹配 text() 节点，并关闭 normalize-space()
避免在XPath中无意识使用 normalize-space(@attr) 或 string(.) —— 它们会破坏原始空白

基本上就这些。核心是分清“输入保留”“处理不破坏”“输出不重排”三个环节，每步都需主动配置，不能依赖默认行为。

以上就是在进行XML转换时，如何保持源文档中的空白和格式？的详细内容，更多请关注其它相关文章！

# python # java # 处理器 # app # xml解析 # .net # 转换为 # 如何将 # 换行 # 拾贝 # 文档 # 样式表 # 如何使用 # 如何用 # 它比 # 若需 # 关键词十佳歌手排名表格 # 山西营销推广哪家好做点 # 关键词排名软件询问l火28星 # 营销推广主题公园 # 网站工具推广有哪些方法 # 宝鸡seo排名合作商家 # 广汉网站建设优化 # 莱州seo优化推广营销 # 长春seo外包哪家好 # 西安短视频seo排名