xmlhack.ru XML-форумы
Обсуждение XML и связанных с ним технологий

Делай XML, делай лучше XML!

На страницу 1, 2  След.

Автор Сообщение
Maksim N.
Новичок

Зарегистрирован: 06.02.2006
Сообщения: 12

[8893] Пн Фев 06, 2006 22:09
Делай XML, делай лучше XML!
Вы видите в XML недостатки ??? зачем его вообще создали ??? проблему национальных языков XML так и не решил. Этим вроде бы «международным стандартом» занимаются неизвестные люди и группы. ВЫ ХОТИТЕ ЧТО ТО УЛУЧШИТЬ В XML, Вам что то в нем нахватает ??? или Вы всем довольны ???

Для начало зачем в общем то XML нужен: для того чтобы документ(файл, сообщение) уже содержали древовидную структуру, мы хотим сохранить или передать данные, нам надо их «обернуть в какую либо структуру» и тут на помощь приходит стандартизированная древовидная структура XML. Не надо больше ломать голову в какой структуре передать данные, «ЗАВОРАЧИВАЙТЕ ВСЕ В XML».
(хотя мы и раньше использовали «структуры обертки» для передачи или сохранения данных)
Пример:
1) любую информацию (в теле компьютера или в его передающих линиях(провода, провода, радиоволны)) мы сначала оборачиваем в двоичный код 0 и 1.
2) Затем люди придумали структура над этим двоичным кодом это 8и битные таблицы символов (Стандарт ввели Американцы и сейчас все добровольно-принудительно(и тупо) им пользуються) (Для любителей Юникода 16 битные таблицы символов Smile)))) дело даже не в количестве бит, мне важно показать что следующей структурой которую придумали люди для обертки информации (для экономических и производственных нужд) был одномерный массив или список (что вообщем одинаково) в эту структуру можно было обернуть текст(или бинарный массив), и передать его куда угодно, везде где знали стандарт 8и битных таблиц могли прочесть этот текст (у нас в стране тоже когда-то были свои таблицы 60-70г. потом все загнулось в нашей ИТ промышленности, и мы слизали Американские стандарты).
3) И вот наши дни Smile))) передача информации в виде массива сейчас мало для человека, нынче передают очень разнообразно структурированную информацию. Вообщем пришло время ввести еще один уровень структуры информации, именно деревья (общий корень, от него отходят ветки, со своими узлами и ветками) это есть XML. Как всегда «Язык мирового общения создали никого вообще ни спросив в США» сейчас все поют XML рулады, ну в принципе да XML лучше всего что было раньше. Но вы как разработчики, как пользователи, просто как умные люди --- Вам все нравиться и устраивает ???

(Какой будет следующий уровень структуры которую повально введут над «структурой деревьев» конечно Smile))) многосвязные, путанные сетевые графы Smile)))) я сейчас уже страдаю без стандарта на них Smile))))

Вот несколько моих претензий и «непонятнок»: Где нормальное использование национальных языков ??? (это мой давнишний бзик, если считаете меня неправым, просто ничего не говорите)

Второе: почему структура XML именно такая «закрывающийся поименованный тэг» ???

<parent>
<child>
text1
</child>
<child>
text2
</child>
</parent>

Почему не так:

Код:
<parent>
<child>
text1
</>
<child>
text2
</>
</>


Или так:

Код:
<parent
<child
text1
>
<child
text2
>
>


Ну здесь уже ЛИСП получился

(конечно запись:

Код:
<parent>
<child>
text1
</child>
<child>
text2
</child>
</parent>


теоретически при повреждении файла, "быстре обнаружит повреждение" и "некоторые части файла можно востановить" но файл то все равно не дееспособен, ни один валидатор его не пропустит, значит перестроховка зря, только место на диске и в памяти сжерает ???)

Хотелось бы услышать Ваше мнение по поводу
1) Что вам не нравиться в XML что Вы считаете недоработкой или намеренным допущением в стандарте, и чего в нем не хватает (хотелось бы еще услышать, Ваше личное мнение о самом стандарте и группе которая его разрабатывает)
2) считаете ли Вы возможным создание (В мире и на просторах сети) аналога/конкурента XML, а также его использование, или все войны уже проиграны и нам остается только сидеть и терпеть оккупационные войска Smile))))) ???

(почему не назвал тему «недостатки XML» потому что эта фраза все не выразит, все понимают что XML не просто язык описания, через какое-то время он превратиться в язык описания ВСЕГО и решать какой он будет(или его вообще не будет) надо сейчас, и не кому не будь а нам (хотелось бы в это верить))
Sergiy
Аспирант

Зарегистрирован: 19.02.2005
Сообщения: 225
Откуда: Киев
Посетить сайт автора
[8904] Ср Фев 08, 2006 19:16

Ну первым делом чё первым делом...
Берём XML и делаем из него то что нам действительно необходимо
Добавляем в <?xml?> заголовок атрибуты size и md5(разумеется не обязательные) при чем они описывают не документ в целом, а только корневой елемент (нафига всё это, думаю, должно быть сразу понятно)
Туда же добавляем атрибут с названием name | document-name | file-name и соответствующего содержания.... типа откуда этот XML собственно взялся
А вот теперь можно держать несколько XML документов в одном файле практически так же как и в каталоге, при этом в качестве разделителя использовать <?xml?> заголовок. Практическое применение эта особенность наверняка найдёт
Сам файл должен начинатся как с <?xml?> заколовка так и с комбинации вида "#!.*\n". Так же её аналог можно ввести в непосредственно в <?xml?> заголовок (хотя подобные описания есть в DTD и XSD, можно ограничится и ими)
По организации данных пока всё, теперь по поводу программирования
Для начала стоит поднять из могилы XQL+ и добавить в него возможность генерации XML из не XML. Можно в принципе и XPath дополнить этими возможностями
ps
Я как программист прежложил изменения, облегчающие программирование. Но это пока не полный перечень
_________________
развлекайся и ни в чём себе не отказывай...
Maksim N.
Новичок

Зарегистрирован: 06.02.2006
Сообщения: 12

[8931] Вс Фев 12, 2006 21:12

Sergiy писал(а):


А вот теперь можно держать несколько XML документов в одном файле практически так же как и в каталоге,


Если надо то можно создать стандарт «Завернуть в XML несколько файлов, сообщений, сам XML» то есть надо тебе передать файлы (или сохранить), ты даешь их программе она по стандарту заворачивает их в XML и выдает 1ин файл, а в нем несколько и документов XML и вообще файлов любого формата. Куда ты это передашь/сохранишь на том конце программа развернет этот файл и получит все твои документы. (выход из ситуации есть, не знаю плохой или хороший :)))))

Я затевая эту ветку форума, хотел спросить «Можно ли сегодня создать конкурента XML (То есть тоже язык обертку) и при этом конкурентнее XML (лишенного корпоративно-коррупционных недостатков XML)»

(Сам XML первоначально создавался для описания документации, чтобы можно было отделить данные от оформления (хотя я сам точно не знаю), а уж потом к нему прицепилась идея «завернуть в него ВСЁ», поэтому может стоить создать новый язык именно с ПЕРВОНАЧАЛЬНОЙ ЦЕЛЬЮ «завернуть в него любые данные»)

Например как бы Вы решили проблему национальных языков ???
Как в языке описания всего должна выглядеть глобальная ссылка (оставлять ссылки вида www.xml.org или обернуть ее в сам этот язык, думаю что ссылка должна тоже описываться на этом же языке) ???
Как можно сделать пространства имен более правильными, разработанными (как это точно то сказать) как внутренне именовать данные, отличать их, внутренние ссылки, внешние ссылки….
Кто должен принимать стандарт по этому языку ???
olpa
Любитель

Зарегистрирован: 23.04.2002
Сообщения: 981
Откуда: Санкт-Петербург
Посетить сайт автора
[8948] Ср Фев 15, 2006 08:16

Цитата:

зачем его вообще создали?


Рассказано в спецификации XML (русский перевод) в главе "Origin and Goals" ("Возникновение языка XML и его задачи").

Цитата:

занимаются неизвестные люди и группы


Почему ж неизвестные? Вот они: The World Wide Web Consortium (W3C).

Цитата:

Вы хотите что-то улучшить в XML, вам что-то в нём не хватает?


Не хватает? Наоборот, нужно убрать лишнее. Вот ещё один товарищ так думает: "Выиграй, отказавшись".

Цитата:

у нас в стране тоже когда-то были свои таблицы в 60-70г. Потом всё загнулось в нашей ИТ-промышленности, и мы слизали американские стандарты.


Вообще-то, порядок был другой. Вначале наших заставили слизать у американцев, и только после этого наша ИТ стала сосать.

Цитата:

Как всегда, "язык мирового общения" создали, никого вообще ни спросив, в США


Не уверен. Например, Tim Berners-Lee играл не последнюю роль в создании XML. Кажется, тогда он ещё был в CERN, Швейцария.

Цитата:

Вам все нравиться и устраивает?


Конечно, нет. Но мышки плакали и кололись, но продолжали жрать кактус.

Цитата:

многосвязные, путанные сетевые графы? Я сейчас уже страдаю без стандарта на них


Возможно, что-нибудь есть у Object Management Group.

Цитата:

Где нормальное использование национальных языков?


А именно? Что подразумевается под "использованием национальных языков"?

Цитата:

Почему не так:

Код:


<parent>
  <child>
    text1
  </>
  <child>
    text2
  </>
</>


Про это уже выяснили. Так получилось, а почему, уже забылось. Вот ссылка: http://xmlhack.ru/forum/xml/viewtopic.php?p=5774#5774.

Цитата:

Или так:

Код:


<parent
  <child
   text1
  >
  <child
    text2
  >
>


Несовместимо с SGML.

Цитата:

только место на диске и в памяти сжирает?


Место и память никого не волновали. Источник -- спецификация XML: "Краткость при разметке XML документа имеет минимальное значение".

Цитата:

Что вам не нравится в XML, что Вы считаете недоработкой или намеренным допущением в стандарте, и чего в нем не хватает


Хватает всего. XML+XPath+XSLT+Schematron -- наше всё. Я бы лучше выкинул:
* пространства имён,
* DTD и W3C Schema,
* мелкие технические детали.

Цитата:

или все войны уже проиграны, и нам остается только сидеть и терпеть оккупационные войска?


Я думаю, что всё, война выиграна. XML теперь -- второй ASCII.

Цитата:

XML не просто язык описания, через какое-то время он превратиться в язык описания ВСЕГО, и решать, какой он будет (или его вообще не будет) надо сейчас, и не кому-нибудь, а нам


На основе XML может появиться что-то более высокоуровневое. Вот, придёт сюда taler, и заспамит всё семантической сетью.

Цитата:

Сам файл должен начинатся как с <?xml?> заколовка так и с комбинации вида "#!.*\n".


"#!.*\n" -- кстати да, я был бы не против.
Maksim N.
Новичок

Зарегистрирован: 06.02.2006
Сообщения: 12

[8955] Ср Фев 15, 2006 15:46

Olpa – ты просто божество какое-то с белыми крыльями и золотым клювом. Спасибо.

Почему нужны конкуренты XML. Ниже одна моя мысль на эту тему.

Повальное применение SOAP сотрет национальные экономики 3их стран, как взрыв солнца землю (скорее эти национальны экономики не поймут «а что это было ?»). Ориентированность стандартов электронной коммерции на «запад» а также лоббирование с помощью этих стандартов своих интересов + пассивность национальных ИТ центров (сюда входит: взятие ИТ центров под контроль корпораций и США, не понимание «местным» руководством важности ИТ политики и стандартов, мизерное финансирование как со стороны «местного» правительства так и со стороны «местных» фирм).
Появиться то что на западе понимают под термином «глобализация»
США – офисы и менеджеры (управление миром, дележка дохода от этого «мира»).
Восток (Китай и прочие) – рабсила, промзоны.
Россия, Африка, Ближний восток – сырьевые базы.
Европа – просто потребительский сектор (ну возможно тоже офисы и менеджеры, но не имеющие никакой силы вроде США).
Sergiy
Аспирант

Зарегистрирован: 19.02.2005
Сообщения: 225
Откуда: Киев
Посетить сайт автора
[8980] Пн Фев 20, 2006 03:42

Maksim N. писал(а):

Повальное применение SOAP сотрет национальные экономики 3их стран, как взрыв солнца землю (скорее эти национальны экономики не поймут «а что это было ?»). Ориентированность стандартов электронной коммерции на «запад» а также лоббирование с помощью этих стандартов своих интересов + пассивность национальных ИТ центров (сюда входит: взятие ИТ центров под контроль корпораций и США, не понимание «местным» руководством важности ИТ политики и стандартов, мизерное финансирование как со стороны «местного» правительства так и со стороны «местных» фирм).
Появиться то что на западе понимают под термином «глобализация»
США – офисы и менеджеры (управление миром, дележка дохода от этого «мира»).
Восток (Китай и прочие) – рабсила, промзоны.
Россия, Африка, Ближний восток – сырьевые базы.
Европа – просто потребительский сектор (ну возможно тоже офисы и менеджеры, но не имеющие никакой силы вроде США).


Ну вот ещё одна жертва агитации и пропаганды, и ни чем не лутше тех кто убеждён что "Американское лутше, американское качественей" и пытается перейти на их стандарты.
Один мой знакомый както мне сказал "управлять человеком гораздо легче чем машиной". Я чем дальше тем больше убеждаюсь, что он прав. Но заниматся гипнотическими практиками я не стал.... скорей потому что машины мне всегда нравились больше чем люди. Теперь ориентируясь на людей стараюсь всётаки придерживатся принципа "по себе не судят"
Шо за страх перед глобализацией? Неужели нет в разных странах олигархических групп, которые захотят править автономно? И причём тут стандарты обмена информацией? Ведь любую инормацию можно свести к удоваримому виду... зачем ддругой (альтернативный) стандарт, когда и текущий стандарт справляется с поставлеными задачами? Ну разве для оптимизации решения этих задач или адаптации к другим нуждам. Нафиг выдумывать шото новое только для того чтобы было не как у других?
Откуда такой страх и такие опасения? Может просто стооит взглянуть на себя... выявить внешниие влияния....?
И ещё раз относительно териториального расположения офисов и менеджеров: я точно знаю что смог бы править миром, обпутаном проводами, будучи запечатаным в склепе не зависимо от того на каком бы кладбище он не находился, лиш бы был информационный интерфейс во вне...(это так к дополнительным размышлениям)

ps

я не знаком с SOAP
_________________
развлекайся и ни в чём себе не отказывай...
Maksim N.
Новичок

Зарегистрирован: 06.02.2006
Сообщения: 12

[9319] Вс Мар 26, 2006 19:50
Генезис XML
<<<Обращение к читателям форума>>>

Я написал статью. Вернее это помогли мне сделать, все те с кем я общался, в это ветке форума. Это коллективное творчество-раздумье.
Используйте ее(статью) чтобы «взбудоражить» свой ум. Интересны любые отзывы. Основная цель этой статьи опять же «взбудоражить» ум. Представьте что у вас волшебная палочка, которой можно изменить или изобрести любой стандарт/топологию/язык этого мироздания. Вот в таком ключе и напишите здесь об XML.


<<<Генезис XML>>>

Для начала зачем XML нужен? Официальная документация гласит «XML должен иметь широкий круг применения» смысл который таит эта фраза поистине необъятен Smile
Полный список чего еще «должен» XML, ниже:

1. XML должен быть пригоден для непосредственного использования в Интернет.

2. XML должен иметь широкий круг применения.

3. XML должен быть совместим с SGML.

4. Обработчики документов XML должны быть просты в написании.

5. Количество факультативных свойств в XML должно быть сведено к абсолютному минимуму, в идеале число их вообще должно быть нулевым.

6. XML документы должны быть удобны для чтения и достаточно понятны.

7. Подготовка XML документа должна осуществляться быстро.

8. Процедура построения XML документа должна быть формальной и точной.

9. Процедура создания XML документов должна быть проста.

10. Краткость при разметке XML документа имеет минимальное значение.

Ключевые слова «просто», «быстро», «понятно», «удобно» неужели разработчики технологий поняли что самой критической частью любой системы является человек, и «сделай удобно человеку и сделаешь самую надежную систему». Психологические наклонности человека стали основным фактором построения инженерных и информационных систем и стандартов (пока только для англоязычного населения нескольких развитых стран).
Сам стандарт и язык XML является наследником языка SGML, но SGML предоставляет пользователям этого языка (сюда входят и разработчики и конечные пользователи) довольно «большую широту взглядов и интерпретации». XML более формален и строг, и более прост, XML урезает поле возможного поведения SGML, XML маленькое заштрихованное множество на большом поле множества SGML. Но именно благодаря своему строгому, формальному минимализму XML дает безграничные возможности по описанию документов.
Жестко стандартизировать синтаксис (применять только закрывающиеся тэги и ничего более) и структуру документа (только древовидная структура и ничего более), чтобы дать свободу в разметке, в описании данных. Описание данных, представление данных корневая проблема теории информации изучающаяся на протяжении уже 50 лет, и маятник концепций мотается из десятилетия в десятилетие, из стороны в сторону. Похоже в нынешний период и теоретики и практики начинают подходить к единому знаменателю: ее решение надо искать в человеке, в его психологии и сознании.

Для более понятного и легкого восприятия и обработки данных человек вводит в них иерархию структур (ситуация вполне типичная для человека).

Количество данных диктует структуру, а структура диктует представление. Проследим эволюцию структур и представлений используемых людьми (ни на какую точность и научность эта классификация не претендует).

СИМВОЛЫ И СЛОВА. любую информацию (в теле компьютера или в его передающих линиях (провода, радиоволны)) мы сначала оборачиваем в двоичный код 0 и 1. Почему? – потому что это легче всего реализовать, потому что это самая элементарная и легкая логика (хотя были и есть проекты компьютеров с трехзначной логикой, и более).

ОДНОМЕРНЫЕ МАССИВЫ И СПИСКИ. Затем людям понадобилась структура над этим двоичным кодом это 8и битные таблицы символов (Стандарт был введен в США и сейчас все добровольно-принудительно им пользуются. Для любителей Юникода 16 битные таблицы символов) дело даже не в количестве бит, мне важно показать что следующей структурой которая понабилась людям для обертки информации (для экономических и производственных нужд) был одномерный массив или одномерный список (что одинаково). В эту структуру можно было обернуть текст (или бинарный массив), и передать его куда угодно, везде где знали стандарт 8и битных таблиц могли прочесть этот текст (у нас в стране тоже когда-то были свои таблицы 60-70г. потом все загнулось в нашей ИТ промышленности, и мы скопировали Американские стандарты, но это тема уже отдельного позорного учебника истории).

ДРЕВОВИДНЫЕ СТРУКТУРЫ. И вот наши дни передача информации в виде массива сейчас мало для человека, нынче передают очень разнообразно структурированную информацию и прежде всего данные с разметкой или данные о данных. Пришло время ввести еще один уровень структуры информации, именно деревья (общий корень, от него отходят ветви, со своими узлами и ветвями) это есть XML. Почему следующий уровень иерархии структур данных именно деревья. Ответ опять лежит на стыке психологии человека и устройства мироздания, попробуйте сами найти структуру информации следующую после одномерных массивов, у вас ничего не получиться кроме деревьев.
XML существует именно для того чтобы документ (файл, сообщение) уже содержали древовидную структуру, мы хотим сохранить или передать данные, нам надо их «обернуть в какую либо структуру», и тут на помощь приходит стандартизированная древовидная структура XML. Не надо больше ломать голову в какой структуре передать данные, «ЗАВОРАЧИВАЙТЕ ВСЕ В XML».

Какой будет следующий уровень структуры которую повально введут над «структурой деревьев» конечно многосвязные, путанные сетевые графы, или гипертекст (что опять же одно и тоже) Вы можете воскликнуть «а как же WWW, с её ссылками», да WWW использует свойство гипертекста но только на доли процента. Свойства гипертекста более раскрыты в таких проектах как Wiki. Использование и ИССЛЕДОВАНИЕ гипертекста все еще осуществляется энтузиастами, а проекты с его использованием на «полную катушку» вызывают «интеллектуальный шок». Как и в случае с предыдущими структурами данных, исследовать и применять гипертекст человека заставит взрывное увеличение информации, данных и знаний, а также последующие за этим проблемы


<<<Послесловие специально для читателей форума>>>

Похоже это единственная ветка форума во всем рунете обсуждающая философскую инженерию XML.

<<<допечетенно после раздумий>>>

Есть предложение создать «рабочую группу» для создания нового языка обертки, «максимально приближенному к идеалу». (фраза «максимально приближенному к идеалу» здесь указывает на самый широкий смысл, который вы вкладываете в слово «идеальный», исходя из вашего жизненного опыта)Относитесь к этому как к интересному времяпрепровождению.
olpa
Любитель

Зарегистрирован: 23.04.2002
Сообщения: 981
Откуда: Санкт-Петербург
Посетить сайт автора
[9442] Пт Мар 31, 2006 05:01

Спасибо за статью. С ходу есть несколько комментариев.

Цитата:

пока только для англоязычного населения нескольких развитых стран
...
у нас в стране тоже когда-то были свои таблицы 60-70г. потом все загнулось в нашей ИТ промышленности, и мы скопировали Американские стандарты


Подобные выказывания лучше убрать, чтобы вместо обсуждения темы статьи не получилось бы обсуждения оффтопика.

Цитата:


СИМВОЛЫ И СЛОВА
ОДНОМЕРНЫЕ МАССИВЫ И СПИСКИ
ДРЕВОВИДНЫЕ СТРУКТУРЫ


Пропущено: реляционные структуры данных.

Цитата:

Похоже это единственная ветка форума во всем рунете обсуждающая философскую инженерию XML.


Возможно, что да, а может и нет. В любом случае, те, кто общается здесь и кому есть что сказать, уже высказались. Интересно было бы услышать мнение тех, кто живёт на других форумах. Например, на xpoint или на rsdn тут или тут. Отправьте им ссылку, мы с интересном последим за обсуждением.
Maksim N.
Новичок

Зарегистрирован: 06.02.2006
Сообщения: 12

[9627] Вс Апр 09, 2006 20:27

Цитата:


Подобные выказывания лучше убрать, чтобы вместо обсуждения темы статьи не получилось бы обсуждения оффтопика.


Ну это же те самые «иголки» которые заставят шевелиться мозги кул-програмеров которые думают что «что-то значат в этом мире» в мире правит тот кто задает правила игры и стандарты.
Не знаю, оставлю, точно оставлю, посмотрю на реакцию. Оффтопик – ну все же взрослые люди, знают когда остановиться, если не знают, значит задело за живое, значит по делу в тексте стоит.


Цитата:


СИМВОЛЫ И СЛОВА
ОДНОМЕРНЫЕ МАССИВЫ И СПИСКИ
ДРЕВОВИДНЫЕ СТРУКТУРЫ

Пропущено: реляционные структуры данных.


Нет не путай структуру и виртуальную модель (или математическую модель).
На примерах покажу, реляционная модель это «виртуальная математическая модель основанная на множествах и алгебре множеств: сложении, вычитании, умножении и др.» то есть в чистой реляционной модели нет вообще никакой структуры данных, ну может ли иметь математическое множество какую либо структуру ??? (если оно даже облачком изображается Smile самое главное в реляционной модели именно те арифметические действия со множествами, ну а то что на практике в БД реляционная модель использует таблицы, это просто удобно, в реляционной модели можно использовать и списки и графы (какая разница во что завернуть множество).
Примеры приведу вот структуры это: деревья, графы, списки (ну скажу еще таблицы).
Математические и логические модели (виртуальные машины и прочее) это: реляционная модель, функциональная модель (ЛИСП), модель предикатов (она же логическая модель, ПРОЛОГ), объектная модель (это уже не математическая модель, а философская Smile ибо ООП не имеет ни одной математической формулы или правила, или аксиомы).
Здесь долго объяснять (но я думаю ты понял).
Скажу только что составленная мной иерархия:
СИМВОЛЫ И СЛОВА
ОДНОМЕРНЫЕ МАССИВЫ И СПИСКИ
ДРЕВОВИДНЫЕ СТРУКТУРЫ
Призвана показать эволюцию «структур несущих информацию и данные» которые использует человек. Это иерархия «сложности» структур несущих данные. Дальше темы «эволюции сложности структур» я некуда не отдалялся в это статье.


Цитата:


Возможно, что да, а может и нет. В любом случае, те, кто общается здесь и кому есть что сказать, уже высказались. Интересно было бы услышать мнение тех, кто живёт на других форумах. Например, на xpoint или на rsdn тут или тут. Отправьте им ссылку, мы с интересном последим за обсуждением.


На одном тусуються уехавшие, на другом пишущие под Windows. Не знаю, но всегда что-то лучше делать, чем не делать ничего.
Ты не знаешь еще жарких мест где тусуються крутые программисты/инжерены.
Sergiy
Аспирант

Зарегистрирован: 19.02.2005
Сообщения: 225
Откуда: Киев
Посетить сайт автора
[9733] Чт Май 04, 2006 02:04

Цитата:

XML должен быть совместим с SGML


Может просто уберём этот пункт и получим и получим коечто очень интересное.
Тогда действительно заворачивать можно любые, данные не опираясь на SGML. А так за основу можно взять любой другой популярный язык, тот же Lisp, C или C++.
Как я помню, языки разметки, основаные на C пользовались некогда довольно большой популярностью. Возьмём те же неоткомпилированые файлы ресурсов или графические изображения в X-windows.
Можно этот пункт заменить таким "Язык разметки должен быть совместим с С++(быть подмножеством C++)". Тогда получаем удобный язык обёртки любых, особенно бинарных данных.
В чём отличия?:
Несколько другой подход к пространствам имён, допустима их вложенность.
Схема документа, скорей всего, будет представлять собой набор инструкций typedef или class, возможно с описаниями стандартных конструкторов(в доументе должны быть данные, а не код).
данные могут представлять собаой просто объявления переменных и вызовы конструкторов.
Жду других размышлений по этому поводу.
_________________
развлекайся и ни в чём себе не отказывай...
Maksim N.
Новичок

Зарегистрирован: 06.02.2006
Сообщения: 12

[9742] Чт Май 04, 2006 20:52

Язык обертка для всего должен быть простым Smile)))

<<<<<ПРОСТО>>>>>

Структуры на основе списков и деревьев (не куда мы от них не денемся) (С++ это тоже «древовидная структура описания классов»)
Давайте пока «зрить в корень» выберем структуру, и тут есть 2 варианта:
Тот самый «списки деревья» это XML, Lisp, C++ (ну пусть и он).
И вторая структура это «ссылочная» (как её назвать то ???)
Это похоже на БД с самой простейшей формой записи:
Объект1 (какой либо знак связи) Объект2. Или
какой либо знак связи(Объект1, Объект2).
Примеры языков: ПРОЛОГ, ini файлы, бинарная таблица БД.
По сути дела здесь парсер после прочтения файла строит не дерево как в Lisp или XML, а граф.
Пример:
Город(Москва).
Город(Киев).
Город(Барселона).
Город(Оренбург).
Путь(Москва, Киев).
Путь(Москва, Оренбург).
Путь(Киев, Барселона).
Путь(Оренбург, Киев).
---- здесь парсер вернет граф, например по запросу «с чем связан узел «Оренбург» парсер спокойно выдаст что с объектами Киев и Москва связью Путь, и что узел Оренбург имеет свойство Город »

Попробуем записать это на «древоподобном языке» (Оформление, и грамматика условна и абстрактна, но похожа на XML):

<Путь>
<Город>
Москва
</Город>
<Город>
Киев
</Город>
</Путь>
<Путь>
<Город>
Москва
</Город>
<Город>
Оренбург
</Город>
</Путь>
и т.д….
------ Здесь парсер вернет дерево, для узла «Москва» из первой ветки дерева, парсер не как не сопоставляет узел «Москва» из второй ветки дерева, для него это абсолютно разные узлы, и сопоставление должны делать либо приложение стоящее выше парсера (и написанное специально для этой задачи), либо пользователь Smile))) Получается парсер снимает «какую-то сложность» с задачи (он извлекает из файла текст и строит по нему дерево, а приложение уже видит только дерево и его узлы) но почему бы парсер не загрузить еще какой либо рутинной работой «пусть парсер снимает сложность в еще большей степени» возвращает не дерево а граф.

Древовидные языки тоже ни лишены ссылок внутри себя, но эта задача не низкоуровневая, можно сказать нетривиальная, и решается разработчиком заново и по-своему в каждом случае где это надо использовать.

Еще раз повторю что слово «Парсер» а также все примеры с языками имеют чисто абстрактную природу (в данном тексте).
Гость





[9747] Пт Май 05, 2006 07:58

xml-парсеры - не строят графов связей (хотя легко могли бы)
потому что:

1) В более чем 90% они не требуются (примеры: такие "xml-приложения" или интернет-языки, как XHTML, RSS, а также MSWord-ML и пр. и пр..) На всякий пожарный строить для XHTML граф связей в расчете, что это однажды понадобится трем лицам и не понадобится еще 996?

2) накладные xml-расходы и так не малы - едва ли не каждый второй, изучая варианты, использовать ли для производства его сайта XML или "доброе старое", жалуется на тормоза (это не секоет), в итоге отказывается от xml, следовательно, распространение xml и так медленнее, чем могло бы

3) принцип "ленивых вычислений" не отменен. зачем парсеру строить полносвязный граф, если вашему юзеру потребуется [однажды] спросить про путь до Барселоны, после чего уже не нужен ваш граф о городах, а интересует нечто другое, к примеру, граф межвалютных обмено-отношений в г. Барселона, и в нем конкретная ветка, начинающаяся с имени "руб.", после чего третий граф "о ценниках на услуги ночных бабочек" в избранной валюте и т.д.. и т.л.

4) Тогда почему бы и word'у не выпиливать полносвязные графы между всеми словами тестового документа? это так удобно.. - некоторому пользователю.. позволяло бы ему решать новые и потенциально нерешенные еще языково-лингвистические (информационные) задачи?
Maksim N.
Новичок

Зарегистрирован: 06.02.2006
Сообщения: 12

[9774] Пн Май 08, 2006 21:01

<<<<ЗАГРУЗИ МАШИНУ, НЕ ЗАГРУЖАЙ ЛЮДЕЙ>>>>

Разъясним тут кой, какие детали

>
>xml-парсеры - не строят графов связей (хотя легко могли бы)
>потому что:
>

xml-парсеры - не строят графов связей, потому что: сам XML не графовый язык, конструкция языка XML это деревья и только (конечно через эти деревья можно реализовать ссылки на друг друга, но это будет делать приложение стоящее выше парсера).

>
> 1) В более чем 90% они не требуются (примеры: такие "xml-приложения" или интернет-языки, как XHTML, RSS, а также MSWord-ML и пр. и пр..) На всякий пожарный строить для XHTML граф связей в расчете, что это однажды понадобится трем лицам и не понадобится еще 996?
>

Здесь вдеться дискуссия о том что возможно никогда не будет использоваться Smile))) а именно о «идеальном языке обертке». Положение дел сейчас возможно как рассмотрения урока истории, чтобы в будущем исправить эти ошибки, да сейчас существует «довлеющая концепция обработки и хранения данных» это вроде «процедурный язык значит - легкий, логический - сложный», «методанный – зачем они ??? они только нагружают машину», «какие сложные эти метаданные, и как трудно под них писать программы, пусть лучше Маши(Петя, Катя) ручками проанатируют эти документы, дешевле выйдет». Да но время не стоит на месте, а данные тем более, Маш(Петь, Кать) скоро не хватит на все документы, только использование «повальной автоматизации» даст выжить и сделает успешным предприятие или страну. И в этой «повальной автоматизации» только использование постгуманистичных «концепций» (то есть это когда все понятно и удобно человеку + гармония в отношениях со средой (это машины, природа и пр.)) даст этой фирме или этой стране опять же преимущество.
Короче скоро это понадобиться и этим 996 (если они хотят остаться хотя бы на плаву)

>2) накладные xml-расходы и так не малы - едва ли не каждый второй, изучая варианты, использовать ли для производства его сайта XML или "доброе старое", жалуется на тормоза (это не секоет), в итоге отказывается от xml, следовательно, распространение xml и так медленнее, чем могло бы
>

Накладные расходы на человеческие руки и мозги еще больше, Использование «обертки данных» и «метаначинки» должно свести к минимуму (в идеале к 0) «лишних телодвижений разработчика» (представьте себе крупные проекты, теперь умножьте это в 100 раз, вот это понадобиться строить через несколько лет). «загрузи машину, не загружай людей» Smile)))
Здесь есть еще один момент: система построенная на использование «обертки данных» и «метаначинки» на каком-то этапе начинает работать даже производительнее «старого доброго» (даже на том же железе), Например поиск новая система будет производить интеллектуально (все что включает в себя это слово)в отличие от «старого доброго» перелапатывающего все и вся.

>
>3) принцип "ленивых вычислений" не отменен. зачем парсеру строить полносвязный граф, если вашему юзеру потребуется [однажды] спросить про путь до Барселоны, после чего уже не нужен ваш граф о городах, а интересует нечто другое, к примеру, граф межвалютных обмено-отношений в г. Барселона, и в нем конкретная ветка, начинающаяся с имени "руб.", после чего третий граф "о ценниках на услуги ночных бабочек" в избранной валюте и т.д.. и т.л.
>

Оптимизация вычислений нужна везде, она будет и в этом «суперпарсере» Smile))))
«а интересует нечто другое, к примеру, граф межвалютных обмено-отношений в г. Барселона» --- но боюсь что это вам не скажет ни одни парсер, потому что документ в данном случае содержит только информацию о связях между городами, чтобы получить информацию о финансах города или «что-то другое» потребуется загрузить документ отвечающий за это

>
> 4) Тогда почему бы и word'у не выпиливать полносвязные графы между всеми словами тестового документа? это так удобно.. - некоторому пользователю.. позволяло бы ему решать новые и потенциально нерешенные еще языково-лингвистические (информационные) задачи?
>

Такую систему уже строят.
Вы очень зациклены на «реализации» я же не говорю что парсер будет строить граф и держать его весь в памяти, конечно нет, но приложение работающее с парсером «будет видеть именно это: граф».

Теперь напрямую по теме форума: разграничение «форматов данных» на «высокосвязные»(гиперсвязные, где почти каждое слово, или сущность, или свойство представляет из себя связь, ссылку) (например Пролог) и «несвязные» (например XML где у нас по документу строиться только дерево, связь между «Анной Петровной» из одного узла и «Анной Петровной» из другого узла приходиться искать приложению (причем специально для этого созданного, скока трудов то) стоящему выше парсера).
Так вот и в XMLе можно организовать любые связи, используйте дополнительные стандарты и расширения, пишите свои приложения над парсерами, можно в XML создать «кокон из данных», почему же мы не видим «прошитых» по самые не хочу(не могу) документов на XML с которыми приложения творили такие бы фокусы, что вам и не снилось, где все это ???. Потому что это «сложно», «не прозрачно для разработчика и пользователя», «не постгуманистично одним словом».
Гость





[9776] Пн Май 08, 2006 21:47

Не более чем мнения,
минус только в том, что вот высказываетесь вы сильно нравоучительно и безаппеляционо. Но спорить о мнениях - лично по мне не очень полезно.
Думаю, вы-таки способны неким образом простить других, если их воззрения могут совершенно не совпадать с вашими практически в любом месте.
Гость-2
Гость




[9777] Вт Май 09, 2006 10:47

Если вверху у Максима:
a) дана информация b) дана полезная информация,
с) та, что пригодна для «повальной автоматизации»
И если a,b и c :=true,

тогда.. нельзя ли попросить Максима взять да обозначить/нарисовать конкретный пример 'узлов графа' "именно на примере любого из своих постингов", чтобы сейчас всем стало понятно, какие именно узлы (уж бог с ними со связями - это было бы развитие) - пусть хотя бы узлы - должен бы излечь из его речи "постгуманистичный парсер"..

Это было бы крайне интересно, и конкретно из такого примера стало бы уже ясно, как именно и чему нам далее парсеры учить