暂无图片
暂无图片
暂无图片
暂无图片
暂无图片

Oracle 由于转义字符导致的XML解析错误

askTom 2016-08-18
1814

问题描述

嗨,汤姆,

我们有一个过程,我们尝试使用XML并将其作为CLOB存储在表中。我们得到的这些XML在XML的文本部分中具有诸如 “&” 或 “<” 之类的转义字符。

当我们尝试使用XMLtable解析XML时,它会引发以下错误。是否有任何方法/机制/解决方法可以克服以下错误。唯一的问题是,我们不能从源头改变数据。

这就是我们所做的:


create table test_xml (trd_pyload clob );

insert into test_xml values ('
 
  1
  XYZABC & ASSOC
 
');
COMMIT;


SELECT *
  FROM test_xml
       INNER JOIN
       XMLTABLE (
          '/ROWSET/ROW'
          PASSING XMLTYPE (TRD_PYLOAD)
          COLUMNS SHD_ID NUMBER PATH 'SHD_ID',
                  AMP_TEXT VARCHAR2 (250) PATH 'AMP_TEXT')
          ON 1 = 1;


ORA-31011: XML解析失败
ORA-19213: 第4行的XML处理中出现错误
LPX-00242: 无效使用 & 符号 ('&') 字符 (使用 &)
ORA-06512: 在 “SYS.XMLTYPE”,第272行
ORA-06512: 在第1行


专家解答

有几个选择。

您可以分别将小于和大于 & <和> 的 “与” 转换为 &。

或者,您可以在 标签中包装可能包含转义字符的文本。

如果可以的话,在源数据中更改此设置最简单。但如果你不是,那还是有可能出去的。

使用 “&” 号,您可以直接替换-前提是您知道它不用于转义字符!

set define off
create table test_xml (trd_pyload clob );

insert into test_xml values ('
 
  1
  XYZABC & ASSOC
 
');

SELECT amp_text
  FROM test_xml,
       XMLTABLE (
          '/ROWSET/ROW'
          PASSING XMLTYPE (replace(TRD_PYLOAD, '&', '&'))
          COLUMNS SHD_ID NUMBER PATH 'SHD_ID',
                  AMP_TEXT VARCHAR2 (250) PATH 'AMP_TEXT');

AMP_TEXT        
XYZABC & ASSOC 


大于和小于都比较棘手。你需要弄清楚哪些是真正的标签标记,哪些不是。将违规标签内容包装在CDATA标签中更容易。

您可以使用regexp_replace来执行此操作。

使用以下正则表达式查找您知道可能具有转义字符的标签:

<安培 _ 文本> (。)<\/安培 _ 文本>

和下面的替换字符串:



\ 1是对标记之间匹配的文本的回引用。

综合起来就是:

DELETE test_xml;

insert into test_xml values ('
 
  1
  XYZABC & 
 
');
COMMIT;

SELECT amp_text
  FROM test_xml,
       XMLTABLE (
          '/ROWSET/ROW'
          PASSING XMLTYPE (
            regexp_replace(TRD_PYLOAD, 
              '<安培 _ 文本> (。)<\/安培 _ 文本>',
              ''
            )  
          )
          COLUMNS SHD_ID NUMBER PATH 'SHD_ID',
                  AMP_TEXT VARCHAR2 (250) PATH 'AMP_TEXT');

AMP_TEXT          
XYZABC &   

「喜欢这篇文章,您的关注和赞赏是给作者最好的鼓励」
关注作者
【版权声明】本文为墨天轮用户原创内容,转载时必须标注文章的来源(墨天轮),文章链接,文章作者等基本信息,否则作者和墨天轮有权追究责任。如果您发现墨天轮中有涉嫌抄袭或者侵权的内容,欢迎发送邮件至:contact@modb.pro进行举报,并提供相关证据,一经查实,墨天轮将立刻删除相关内容。

评论