当前位置: 移动技术网 > IT编程>网页制作>XML > XML入门的常见问题(四)

XML入门的常见问题(四)

2017年12月08日  | 移动技术网IT编程  | 我要评论

  在 xml 对象模型中如何处理空白字符?

  有些时候,xml 对象模型将显示包含空白字符的 text 节点。空白字符被截断后,多半会带来一些混乱。例如下面的 xml 例子:


   ]>
  smith
  john
 

  生成下列树:


   processing instruction: xml
  doctype: person
  element: person
  text:
  element: lastname
  text:
  element: firstname
  text: 


  名字和姓氏两边是只包含空白字符的 text 节点,因为“person”元素的内容模型是 mixed;它包含 #pcdata 关键字。mixed 内容模型指定元素之间可以有文本存在。因此,下面的内容也是正确的:


   my last name is smith and my first name is
  john


  结果是类似于下面的树:


   element: person
  text: my last name is
  element: lastname
  text: and my first name is
  element: firstname
  text: 


  如果没有单词“is”之后和 之前的空白字符,以及 之后和单词“and”之前的空白字符,那么句子便无法理解。因此,对于 mixed 内容模型来说,文字组合、空白字符和元素都是相关的。对于非 mixed 内容模型来说则不是这样。

  要使只有空白字符的 text 节点消失,请从“person”元素声明中删除 #pcdata 关键字:

  结果是下面清晰的树:


   processing instruction: xml
  doctype: person
  element: person
  element: lastname
  element: firstname

  xml 声明做什么?

  xml 声明必须列在 xml 文档的顶部:

  它指定下面的项目:

  该文档是 xml 文档。在丢失或者还没有指定 mime 类型时 mime 探测器可以用它来检测文件是否为类型 text/xml。
  文档符合 xml 1.0 规范。在以后 xml 有其他版本时这一点很重要。
  文档字符编码。编码属性是可选的,默认为 utf-8。
  注意:xml 声明必须在 xml 文档的第一行,因此下面的 xml 文件:

  产生下面的分析错误:

  无效的 xml 声明。
  行 0000002:    
  位置  0000007: ------^
  注意:xml 声明是可选的。如果需要在顶部指定注释或者处理指令,那么请不要放入 xml 声明。但是,默认的编码将为 utf-8。

  如何以可读格式打印我的 xml 文档?

  在用 dom 从零开始构造文档以产生 xml 文件时,任何内容都在一行上,相互之间没有空格。这是默认的行为。

  构造在 internet explorer 5 中的默认 xsl 样式表,以可读格式显示和打印 xml 文档。例如,如果已经安装了 ie5,请尝试查看 nospace.xml 文件。浏览器中应该显示下面的树:

  -
  -
  xyz
  12.56

  在 xml 中没有插入空白字符。

  打印可读 xml 是非常有趣的,特别是有定义不同类型内容模型的 dtd 时。例如,在混合内容模型 (#pcdata) 下不能插入空格,因为它可能改变内容的含义。比如请考虑下面的 xml:

  elephant
  这最好不输出为:

  e
  lephant
  因为单词边界不再正确。

  所有这些都使自动化打印成为问题。如果不需要打印可读 xml,那么可以使用 dom 在适当的位置插入空白字符作为文本节点。

  如何在 dtd 中使用名称空间? 要在 dtd 中使用名称空间,请在使用它的元素的 attlist 声明中声明它,如下所示:

  名称空间类型必须为 #fixed。属性的名称空间也是这样:

  名称空间和 xml 架构
  dtd 和 xml 架构不能混合。例如,下面的


   xmlns:x cdata #fixed "x-schema:myschema.xml"


  将不导致使用在 myschema.xml 中定义的架构定义。对 dtd 和 xml 架构的使用是互斥的。

  如何在 visual basic 中使用 xmldso?

  使用下面的 xml 作为例子:


   mark hanson
  206 765 4583
  
  jane smith
  425 808 1111 


  可以按如下方式绑定到 ado 记录集:

  创建新的 vb 6.0 项目。

  添加对 microsoft activex data objects 2.1 或更高版本、microsoft data adapter library 和 microsoft xml 2.0 版的引用。

  用下面的代码将 xml 数据加载到 xml dso 控件中:


   dim dso as new xmldsocontrol
  dim doc as ixmldomdocument
  set doc = dso.xmldocument
  doc.load ("d:\test.xml")

  用下面的代码将 dso 映射到使用 dataadapter 的新记录集对象中:


   dim da as new dataadapter
  set da.object = dso
  dim rs as new adodb.recordset
  set rs.datasource = da


  访问数据:


   msgbox rs.fields("name").value

  结果显示字符串“mark hanson”
  如何在 java 中使用 xml dom?

  必须已经安装 msxml.dll 的 ie5 版本。在 visual j++ 6.0 中,从项目菜单选择添加 com 包装程序,然后从 com 对象列表中选择“microsoft xml 1.0”。该操作将把所需的 java 包装程序构造到称为“msxml”的新软件包中。这些预先构造的 java 包装程序也可以下载。类可以按如下方法使用:


   import com.ms.com.*;
  import msxml.*;
  public class class1
  {
  public static void main (string[] args)
  {
  domdocument doc = new domdocument();
  doc.load(new variant("file://d:/samples/ot.xml"));
  system.out.println("loaded " + doc.getdocumentelement().getnodename());
  }
  }

 

  代码示例将从 sun religion 示例中加载 3.8mb 测试文件“ot.xml”。variant 类用于包装 win32 variant 基本类型。

  因为在每次检索节点时实际上都获得了新的包装程序,因此不能在节点上使用指针比较。因此,不要使用下面的代码,


   ixmldomnode root1 = doc.getdocumentelement();
  ixmldomnode root2 = doc.getdocumentelement();
  if (root1 == root2)...

 

  而要使用下面的代码:


   if (comlib.isequalunknown(root1, root2)) ....

 

  .class 包装程序的总大小大约为 160kb。但是,为了与 w3c 规范完全符合,应该只使用 ixmldom* 包装程序。下面的类是旧的 ie 4.0 xml 接口,可以从 msxml 文件夹中删除它们:


   ixmlattribute*,
  ixmldocument*, xmldocument*
  ixmlelement*,
  ixmlerror*,
  ixmlelementcollection*,
  tagxmlemem_type*
  _xml_error* 

 

  这使大小减少为 147kb。同时还可以删除下面的项目:


   domfreethreadeddocument
  在 java 应用程序中从多个线程访问 xml 文档。
  xmlhttprequest
  用 xml dav http 扩展与服务器通信。
  ixtlruntime
  定义 xsl 样式表脚本对象。
  xmldsocontrol
  绑定到 html 页面中的 xml 数据。
  xmldomdocumentevents
  在分析过程中返回回调。 

 

  这可以将大小减少到 116kb。要使它更小,请考虑 dom 本身有两层的事实:核心层包括:


   domdocument, ixmldomdocument
  ixmldomnode*
  ixmldomnodelist*
  ixmldomnamednodemap*
  ixmldomdocumentfragment*
  ixmldomimplementation
  ixmldomparseerror 


  和用户可能需要保留的 dtd 信息:


   ixmldomdocumenttype
  ixmldomentity
  ixmldomnotation 


  xml 文档中的所有节点类型都是 ixmldomnode,它提供全部功能,但是存在每种节点类型的更高级别的包装程序。因此,如果修改 domdocument 包装程序并将这些特定类型更改为使用 ixmldomnode,那么所有下面的接口都可以删除:


   ixmldomattribute
  ixmldomcdatasection
  ixmldomcharacterdata
  ixmldomcomment
  ixmldomelement
  ixmldomprocessinginstruction
  ixmldomentityreference
  ixmldomtext
 

  删除这些将使大小减少到 61kb。但是,对 ixmldomelement 来说,getattribute 和 setattribute 方法都是有用的。否则需要使用:


   ixmldomnode.getattributes().setnameditem(...)
 

如对本文有疑问, 点击进行留言回复!!

相关文章:

验证码:
移动技术网