henry_flower: A melancholy wolf (Default)
henry_flower ([personal profile] henry_flower) wrote2012-08-31 01:05 am
Entry tags:

Не могу блядь молчать. Советские пишут xml. Начинается н�

Не могу блядь молчать. Советские пишут xml. Начинается невинно:

<rss version="2.0" xmlns:orgsource="http://purl.org/dc/elements/1.1/">

Отот namespace--это legacy неймспейс Dublin Core. Ничего необычного нет, пока не напарываемся:

<category domain="http://советский.сайт">События</category>
<orgsource:tags>взятка,судья</orgsource:tags>

Что такое 'tags'? Никакого tags в dc нету. Откуда они его выкопали? И зачем, когда есть элемент category?

Дальше:

<fulltext><![CDATA[Как сообщалось, в Донецке&amp;nbsp;двух следователей милиции&amp;nbsp;обвиняют&amp;nbsp;в получении $25 тыс взятки.</p>]]></fulltext>

Что такое fulltext? Никакого fulltext в rss/2.0 нету, дегенераты.

Если внимательно посмотреть на содержимое этого fulltext, можно увидеть такое:

&amp;nbsp;

Т.е. существо писавшее генератор, что-то слышало об CDATA, и об html entities и "защитило" содержимое своего fulltext от парсера xml. Теперь, чтобы получить чистый html из того fulltext, его нужно обработать напильником, заменяя html entities на соотв. символы и только потом html читать.

Зачем тогда было упаковавать в CDATA?  Для полноценного ощущения идиотизма, в отой xml некоторые элементы fulltext никакой "защиты" не содержат.

Про наличие в html entities в элементе title, где должен быть только текст, можно уже не вспоминать.

Впрочем, какое содержание rss, такой и генератор. Какая уркаина страна, такие тут и девелоперы вместе с джавовскими синьорами в 23 года.

Permalink: https://plus.google.com/115290581164606462017/posts/GVU7ctydBeA