henry_flower (
henry_flower) wrote2020-02-17 11:31 am
Коли вирішив почитати економічні новини
Сміявсь.
$ ua='Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.106 Safari/537.36'
$ curl -sA "$ua" https://www.bloomberg.com/markets/economics \
| adieu -pe 'JSON.parse($("body script[type=\"application/ld+json\"]").html()).diversityPolicy'
https://www.bloomberg.com/diversity-inclusionВсьо чьотко: навіть скіму додали для автоматизації; зразу видно, як люди старалися.
Робота-мрія: працювати VP of дайвєрсіті-інклужн, на дозвіллі малювати css-анімацію зі сповнених щастя людей на стокових світлинах, дзвінко гомоніти про невблаганну боротьбу на конференціях. Ех.

no subject
Айтішники навіть новини читають через виклик JSON.parse()
no subject
ггг
у блумберзі працює один дотепний дядько--matt levine
я захотів зібрати його тексти в 1 epub
газета активно чинила опір через пейвол та захист від "роботів", але я її поборов, завантажив 2188 статей, а у процесі виколупування текстів з html побачив смішну метадейту
я розумію коли metadata вставляють для гоогла (дату, тайтла, авторів, тощо), але навіщо гооглівському кролєру знати їх diversity policy?
no subject
(And the idea to load json as scripts is also new to me.)
no subject
no subject
2. там інлайновий <script>, у який можна запхнути все що завгодно. напр, до того як з'явився <template> тег, писали `<script type="text/template">...</script>`
блумберг має таке:
`