temmokan: (Default)
[personal profile] temmokan
Шей да пори — не будет пустой поры. Вот уже который раз даю себе честное благородное слово начать писать сугубо положительно, конструктивно и доброжелательно. Но куда уж там!

Вот нужно мне .doc преобразовать в .html. Естественно, это все умеют. И MS Word, и OpenOffice Writer, и AbiWord, и много кто. Но если по поводу итогов работы первого и так всё понятно &mdsah; привычка программистов этой конторы любые гланды удалять сугубо автогеном и исключительно через задний проход — имманентная их черта; то с OO и прочими я даже слегка растерялся.

Ну почему после преобразования заголовка я вижу конструкции вида
<H1>Заголовок </H1><H1></H1><H1>произведения</H1>

? Недостаточно мозгов, чтобы выкосить подобные огрехи?

Почему все теги пишутся заглавными буквами? Господа, вы хоть немного читаете спецификации XHTML и планы развития языка разметки?

Почему вся типографика вида двойных угловых кавычек и длинных тире остаётся как есть, а не переводится в HTML entity? Что, господа программисты не в курсе, что есть &laquo; и тому подобное?

Почему вместо того, чтобы все стили определить в заголовке, и далее использовать классы, эти умники помимо огромной шапки стилей в заголовке фаршируют каждый тег чёртовой уймой встроенных стилей? Религия не позволяет делать всё НЕ через одно место?

Я, конечно, понимаю, что буквально десятком регулярных выражений вся эта жуткая свалка превращается в причёсанный и умытый HTML, но доколе, блин?

...Вот так и приучаешься к осознанию: хочешь, чтобы что-то работало как следует — делай всё сам. Жаль только, что жизнь коротка, а в сутках всего 24 часа.

(no subject)

Date: 2010-10-25 05:07 pm (UTC)
From: [identity profile] vorchunn.livejournal.com
Во-во, мне регулярно по работе приходится с этим конвертированным ужасом бороться. Впрочем, те же cms-ы аналогично код громоздят ;/

(no subject)

Date: 2010-10-25 10:23 pm (UTC)
From: [identity profile] temmokan.livejournal.com
CMS да, тоже как сделают... Такое ощущение, что производство нормального, читабельного HTML там считают лютым эстетством.

(no subject)

Date: 2010-10-25 06:15 pm (UTC)
From: [identity profile] doldonius.livejournal.com
Очень похоже на банальную лень: вместо полноценной трансляции просто свое внутреннее представление текста обрамляют слегка похожим на правду HTML, и типа опа.

Я уже давно плюнул. Черновики пишу в plaintext, а когда текст в основном собран — тупеньким скриптом на bash добавляю базовую разметку. Дальше, если что, руками.

(no subject)

Date: 2010-10-25 10:25 pm (UTC)
From: [identity profile] temmokan.livejournal.com
Ну, если говорить про себя самого, то я в итоге написал для LyX самодельные конвертеры в HTML/RTF и тоже чувствую себя спокойно. TeX особенно легко во что угодно конвертируется, вследствие структуры.

Однако и там тоже не всё в порядке с преобразованием - известные мне конвертеры в упомянутые два формата тоже плодят жуткий ужас. Действительно, трансляция безо всякой оптимизации полученного представления.

(no subject)

Date: 2010-10-25 06:50 pm (UTC)
From: [identity profile] baogun (from livejournal.com)
а может, это следствие багов внутренней разметки в текстовом процессоре? Ибо, по логике, преобразование должно производиться as is, без самодеятельности, иначе на каждый чих не наздравствуешься. Т.е. "мусор" должен быть убираем всегда, вне зависимости от формата сохранения. И глядишь, "толстый" RTF окажется более стройным. Было бы интересно узнать, насколько мусорный и неоптимизированный получается текст в самом редакторе...

(no subject)

Date: 2010-10-25 10:29 pm (UTC)
From: [identity profile] temmokan.livejournal.com
Строго говоря, форматы все неоднозначны. Если я ещё как-то могу представить, что DOC и HTML взаимозаменяемы (и то придётся тучу служебной информации в DOC куда-то прятать - в комментарии? а обратно как?) в смысле передачи информации, то не все прочие пары форматов таковы.

А потому, если глядеть с точки зрения пользователя, надо давать опцию оптимизировать под конечный формат с предупреждением, что форматы неравноценны и часть информации (стили и пр.) может быть потеряна.

Упомянутые "врезки" закрывающего-открывающего тега демонстрируют, что и во внутреннем представлении творится такой бардак, что лучше не интересоваться лишний раз.

(no subject)

Date: 2010-11-11 12:16 pm (UTC)
From: [identity profile] starcat13.livejournal.com
работают с лозунгом "HTML должен читать браузер, а не человек"? :(

(no subject)

Date: 2010-11-12 02:07 pm (UTC)
From: [identity profile] temmokan.livejournal.com
Угу, видимо. Иначе трудно понять, отчего всё именно так.

(no subject)

Date: 2010-11-16 03:48 am (UTC)
From: [identity profile] starcat13.livejournal.com
скорее всего хватает работы в других местах, а качество HTML'я волнует совсем немного людей (которым еще и весьма сложно угодить, к тому же)

Profile

temmokan: (Default)
Konstantin Boyandin

June 2022

S M T W T F S
   1 234
5 67891011
12131415161718
19202122232425
2627282930  

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags