henry_flower (
henry_flower) wrote2012-08-31 01:05 am
Entry tags:
Не могу блядь молчать. Советские пишут xml. Начинается н�
Не могу блядь молчать. Советские пишут xml. Начинается невинно:
<rss version="2.0" xmlns:orgsource="http://purl.org/dc/elements/1.1/">
Отот namespace--это legacy неймспейс Dublin Core. Ничего необычного нет, пока не напарываемся:
<category domain="http://советский.сайт">События</category>
<orgsource:tags>взятка,судья</orgsource:tags>
Что такое 'tags'? Никакого tags в dc нету. Откуда они его выкопали? И зачем, когда есть элемент category?
Дальше:
<fulltext><![CDATA[Как сообщалось, в Донецке&nbsp;двух следователей милиции&nbsp;обвиняют&nbsp;в получении $25 тыс взятки.</p>]]></fulltext>
Что такое fulltext? Никакого fulltext в rss/2.0 нету, дегенераты.
Если внимательно посмотреть на содержимое этого fulltext, можно увидеть такое:
&nbsp;
Т.е. существо писавшее генератор, что-то слышало об CDATA, и об html entities и "защитило" содержимое своего fulltext от парсера xml. Теперь, чтобы получить чистый html из того fulltext, его нужно обработать напильником, заменяя html entities на соотв. символы и только потом html читать.
Зачем тогда было упаковавать в CDATA? Для полноценного ощущения идиотизма, в отой xml некоторые элементы fulltext никакой "защиты" не содержат.
Про наличие в html entities в элементе title, где должен быть только текст, можно уже не вспоминать.
Впрочем, какое содержание rss, такой и генератор. Какая уркаина страна, такие тут и девелоперы вместе с джавовскими синьорами в 23 года.
<rss version="2.0" xmlns:orgsource="http://purl.org/dc/elements/1.1/">
Отот namespace--это legacy неймспейс Dublin Core. Ничего необычного нет, пока не напарываемся:
<category domain="http://советский.сайт">События</category>
<orgsource:tags>взятка,судья</orgsource:tags>
Что такое 'tags'? Никакого tags в dc нету. Откуда они его выкопали? И зачем, когда есть элемент category?
Дальше:
<fulltext><![CDATA[Как сообщалось, в Донецке&nbsp;двух следователей милиции&nbsp;обвиняют&nbsp;в получении $25 тыс взятки.</p>]]></fulltext>
Что такое fulltext? Никакого fulltext в rss/2.0 нету, дегенераты.
Если внимательно посмотреть на содержимое этого fulltext, можно увидеть такое:
&nbsp;
Т.е. существо писавшее генератор, что-то слышало об CDATA, и об html entities и "защитило" содержимое своего fulltext от парсера xml. Теперь, чтобы получить чистый html из того fulltext, его нужно обработать напильником, заменяя html entities на соотв. символы и только потом html читать.
Зачем тогда было упаковавать в CDATA? Для полноценного ощущения идиотизма, в отой xml некоторые элементы fulltext никакой "защиты" не содержат.
Про наличие в html entities в элементе title, где должен быть только текст, можно уже не вспоминать.
Впрочем, какое содержание rss, такой и генератор. Какая уркаина страна, такие тут и девелоперы вместе с джавовскими синьорами в 23 года.
Permalink: https://plus.google.com/115290581164606462017/posts/GVU7ctydBeA
