xmlhack.ru XML-форумы
Обсуждение XML и связанных с ним технологий

(binary XML) Интересно...


Автор Сообщение
prokoudine
Новичок

Зарегистрирован: 24.03.2005
Сообщения: 1
Откуда: Москва
[6833] Чт Мар 24, 2005 23:03
(binary XML) Интересно...
...что уважаемые коллеги думают вот об этом:

http://news.com.com/2102-1007_3-5630957.html?tag=st.util.print
olpa
Любитель

Зарегистрирован: 23.04.2002
Сообщения: 981
Откуда: Санкт-Петербург
Посетить сайт автора
[6848] Сб Мар 26, 2005 01:57

Это вечная тема. Последний раз бинарный XML обсуждался в xml-dev несколько месяцев назад. По его следам Edd Dumbill написал краткий обзор:

Faster, Faster!

Лично я вряд ли буду использовать binary XML. Во-первых, меня обычный XML всем устраивает, во-вторых, я не вижу преимуществ binary XML по сравнению с просто XML.

Объём данных? Но ведь можно просто сжать XML gzip'ом.

Скорость? Вряд ли. Способ сериализации вряд ли сильно влияет на скорость обработки XML-данных.

Вот, нашёл, что я писал в 2001-м году:

Цитата:


From: "Oleg A. Paraschenko" <...>
To: Christian Nentwich <...>, xml-dev@lists.xml...
Date: Tue, 10 Apr 2001 16:34:12 +0400

...

Цитата:

Of course loading binary files is faster than parsing huge text files, anyone who's been in this field for any time will tell you that, without needing empirical evidence.



About empirical evidence.

A long time ago I wrote a parser of PYX format (www.pyxie.org). PYX format is a simple line-oriented presentation of XML. Every XML element/attribute/PI/data is represented by one line, first character of line -- code of type of content.

Obviously, parsing of this specific format is more efficient and faster than parsing of standard XML.

In order to demonstrate it, I compared that module with 'XML::Parser'. I took ~1000 XML files in sum ~40 Mb. Result is: general-purpose XML parser is faster than pyx parser. By the way, XML::Parser was also converting content of file to utf8.

Obviously this is result of my bad /dev/hands, but...

...



Про это на xml.com тоже писали: Intuition and Binary XML.

И напоследок:

Цитата:

XML is a popular way to represent data in a portable, vendor-neutral, readable format. But what if you need to send XML data across a process boundary in a distributed application? Bruce Martin examines three approaches to accomplishing that in Java.
...
Surprisingly, the performance results presented below indicate that a textual representation of XML is a far more efficient representation than a serialized DOM representation. Also, the time required to externalize a DOM representation and reparse the textual form is cheaper than the direct Java serialization and deserialization of the DOM.