temmokan: (Default)
[personal profile] temmokan
В данном конкретном случае речь пойдёт о программах-конверторах, из формата в формат.

Тексты свои давно уже пишу и правлю в LyX. Всем хорош процессор, одно "но": преобразование из формата в формат работает безобразно - словом, как со всеми прочими текст- и документ-процессорами.

В конце концов, пришлось самому написать скрипт для конвертирования файлов .lyx в формат RTF. А потому огромная просьба ко всем, кто может скачать девяностокилобайтный архив - скачать, распаковать и попробовать открыть файл .rtf внутри вашим офисным приложением (AbiWord, Microsoft Word, OpenOffice Writer и т.д.). И посмотреть, нет ли там внутри странностей - нерусских букв, "битого" форматирования, прочего мусора. Затем сохранить, и вновь открыть той же программой - и посмотреть, что получится.

У меня под рукой оказалось не так много текст-процессоров, чтобы с уверенностью сказать, что конвертируется всё приемлемо. Если в принципе то, что получается, читабельно, я доведу конвертор до состояния, когда он перенесёт и стили, и всё прочее, что можно перенести.

Вот этот файл: n02s.zip (90 кб), в качестве "подопытного кролика" взята "Муза киберпанка". Если не сложно было проверить, оставьте комментарий и укажите, чем открывали и нормально ли читался файл.

Заранее огромное спасибо!

Обновление: вот другая версия того же файла, обработанная улучшенным вариантом конвертора: n02s-rtf.zip (90 кб).

(no subject)

Date: 2010-08-06 04:13 am (UTC)
From: [identity profile] leha-sparrow.livejournal.com
Ворд из 2003 офиса открыл, хоть и с небольшим скрипом. Читается нормально, форматирование на месте. В скобках замечу, что в качестве верстальщика я _такое_ форматирование считаю своим злейшим врагом. В самом ворде читать нормально, если бы я читала в ворде зачем-то.

(no subject)

Date: 2010-08-06 04:15 am (UTC)
From: [identity profile] leha-sparrow.livejournal.com
(перечитав сообщение, в ужасе) еще помимо этого стили????? Мать моя, женщина, ворд и так ругательски ругается на макросы несколько минут их преодолевает.

(no subject)

Date: 2010-08-06 04:46 am (UTC)
From: [identity profile] temmokan.livejournal.com
Стили в данном случае - это вот что:
- задание для параграфов кегля и цвета шрифта, всех прочих параметров (границы, фон и пр.)
- корректное преобразование нетекстовых элементов оформления (картинок)

Собственно, только это. О каких макросах речь? Насколько могу судить по RTF, там нет макро.

(no subject)

From: [identity profile] alexrat.livejournal.com - Date: 2010-08-06 05:16 am (UTC) - Expand

(no subject)

From: [identity profile] temmokan.livejournal.com - Date: 2010-08-06 05:18 am (UTC) - Expand

(no subject)

From: [identity profile] leha-sparrow.livejournal.com - Date: 2010-08-06 06:49 am (UTC) - Expand

(no subject)

Date: 2010-08-06 04:44 am (UTC)
From: [identity profile] temmokan.livejournal.com
Стоп, Алёна, какое именно форматирование считаешь злейшим врагом?
Что не так? Модифицировать выход конвертора несложно.

Спасибо.

(no subject)

Date: 2010-08-06 06:53 am (UTC)
From: [identity profile] leha-sparrow.livejournal.com
ответила в другом комменте.
Костя, текст для любой обработки хочется иметь чистый, без разных кеглей, с минимальными параграфическими элементами, без цвета, без разных начертаний, с отбивкой глав максимум - звездочками, цифрами и непрерывным переносом строки. То есть не абзац (enter), а shift+enter.
Извини.

Word 2003

Date: 2010-08-06 05:12 am (UTC)
From: [identity profile] alexrat.livejournal.com
Открылось нормально. Явных косяков: бредовая кодировка, "битое" форматирование и мусора, - не видно.
Хотя само форматирование наводит на размышления? А почему собственно?
Это так и задумано, что после каждого абзаца пустая строка? Или это косяк?
Это так и задумано, что все диалоги начинаются с трёх минусов? Или это косяк?
И почему:
--- Уже, - подтвердил Василий, уже совершенно автоматически ставящий автографы. - Но пока не скажу, о чём.
А не:
--- Уже, --- подтвердил Василий, уже совершенно автоматически ставящий автографы. --- Но пока не скажу, о чём.
Или что подразумевается под одним, двумя, тремя дефисами?

Re: Word 2003

Date: 2010-08-06 05:17 am (UTC)
From: [identity profile] temmokan.livejournal.com
Три дефиса - это то, что станет, в окончательной версии, длинным тире (mdash).
Два - коротким (ndash).

В начале прямой речи у меня длинное тире, дефис обрамляет слова автора. Все прочие тире в тексте короткие. Это тоже всё настраивается без парвки исходного текста.

Кодировка - в смысле бредовая? Что сообщает Word?

Пояснение: отступы, расстояния между параграфами - это то, что библитека-генератор выставляет по умолчанию. В следующей итерации исправлю и преобразование, и стили параграфа.

Спасибо!

Re: Word 2003

From: [identity profile] alexrat.livejournal.com - Date: 2010-08-06 05:21 am (UTC) - Expand

Re: Word 2003

From: [identity profile] temmokan.livejournal.com - Date: 2010-08-06 05:28 am (UTC) - Expand

Re: Word 2003

From: [identity profile] alexrat.livejournal.com - Date: 2010-08-06 05:35 am (UTC) - Expand

Re: Word 2003

From: [identity profile] leha-sparrow.livejournal.com - Date: 2010-08-06 06:55 am (UTC) - Expand

Re: Word 2003

From: [identity profile] temmokan.livejournal.com - Date: 2010-08-06 07:25 am (UTC) - Expand

форматирование

From: [identity profile] leha-sparrow.livejournal.com - Date: 2010-08-09 02:14 pm (UTC) - Expand

Re: форматирование

From: [identity profile] temmokan.livejournal.com - Date: 2010-08-09 02:57 pm (UTC) - Expand

Re: форматирование

From: [identity profile] leha-sparrow.livejournal.com - Date: 2010-08-09 03:02 pm (UTC) - Expand

Re: форматирование

From: [identity profile] temmokan.livejournal.com - Date: 2010-08-09 03:11 pm (UTC) - Expand

(no subject)

Date: 2010-08-06 05:23 am (UTC)
From: [identity profile] alexrat.livejournal.com
Ещё открыл файл OOo 3.1.1. Полёт нормальный. Что не удивительно :)

(no subject)

Date: 2010-08-06 05:29 am (UTC)
From: [identity profile] temmokan.livejournal.com
Прежние версии именно он не желал открывать - не прощает ошибок форматирования. Что хорошо.

(no subject)

Date: 2010-08-06 06:44 am (UTC)
From: [identity profile] fhtagn-ussr.livejournal.com
Ubuntu 10.01
OOo 3.2.0
Все работает.

(no subject)

Date: 2010-08-06 07:25 am (UTC)
From: [identity profile] temmokan.livejournal.com
Спасибо!

Очень ценный тест

Date: 2010-08-06 09:04 am (UTC)
From: [identity profile] gilgatech.livejournal.com
Вордом 2007))
Никаких кракозябр, кроме агриппин и аристархов нету. После сохранения тоже))

Re: Очень ценный тест

Date: 2010-08-06 09:24 am (UTC)
From: [identity profile] temmokan.livejournal.com
Mamma mia! А что стало с Аристархом?
И спасибо за помощь!

Re: Очень ценный тест

From: [identity profile] temmokan.livejournal.com - Date: 2010-08-06 02:28 pm (UTC) - Expand

Re: Очень ценный тест

From: [identity profile] temmokan.livejournal.com - Date: 2010-08-07 02:06 am (UTC) - Expand

Re: Очень ценный тест

From: [identity profile] olgeria.livejournal.com - Date: 2010-08-07 06:29 pm (UTC) - Expand

Re: Очень ценный тест

From: [identity profile] olgeria.livejournal.com - Date: 2010-08-07 06:31 pm (UTC) - Expand

Re: Очень ценный тест

From: [identity profile] temmokan.livejournal.com - Date: 2010-08-08 05:21 am (UTC) - Expand

(no subject)

Date: 2010-08-06 04:43 pm (UTC)
From: [identity profile] morthan2006.livejournal.com
Нормально открылось OpenOffice.org pro 3.2.1. Несколько напрягает разделение абзацев пустыми строками. В LyX или TeX такое уместно (как и в моём любимом asciidoc), но при конвертации в RTF я бы, наверно, пустые строки убирал.

Ещё: почему в начале диалога длинное тире, а дальше обычное? Я везде ставлю длинное тире, за исключением диапазонов (там — короткое) и дефисов. И кавычки почему-то не типографские. Так было в оригинале или при конвертировании поплыло?

Кстати, попадался ли вам на глаза pandoc? Я им совсем недавно конвертировал свой ЖЖ в формат OpenOffice. :-)

(no subject)

Date: 2010-08-07 02:05 am (UTC)
From: [identity profile] temmokan.livejournal.com
Пустые вставки я ликвидировал (в тексте заметки, чуть ниже, ссылка на новый вариант текста), это мой косяк. Похоже, библиотеку для создания RTF тоже придётся писать самому.

Кавычки и тире тоже теперь должны быть правильными. Правда, дефисы вокруг авторской речи ещё остались, но это уже сам исходник надо править.

pandoc попадался мне в поисках, но отзыв были противоречивыми. Главная пакость, что абсолютное большинство конверторов в RTF написаны людьми, только смутно понимающими, что бывают языки помимо английского. Как итог - "мусорный", набитый ненужными вставками конечный файл. Тот, что я делаю своим скриптом, как минимум читается пока что разными версиями Word/OO без запинок.

С третеьй стороны, заодно и Хаскель в памяти освежить. :)
Edited Date: 2010-08-07 02:06 am (UTC)

(no subject)

Date: 2010-08-06 04:53 pm (UTC)
From: [identity profile] kondrlan.livejournal.com
MS Word 2007
В конце каждого абзаца сначала разрыв строки, за ним собственно конец абзацы. (При наборе комбинация shift+enter и еще enter). Не уверена, баг это или так задумано.
Про тире уже сказали.
Все прочее в порядке.

(no subject)

Date: 2010-08-07 01:55 am (UTC)
From: [identity profile] temmokan.livejournal.com
Спасибо. Я уже дополнил конвертор, в тексте заметки новый вариант того же файла, с учётом замечаний.

(no subject)

Date: 2010-08-07 07:04 am (UTC)
From: [identity profile] nut79.livejournal.com
Всё нормально.

(no subject)

Date: 2010-08-07 12:35 pm (UTC)
From: [identity profile] temmokan.livejournal.com
Спасибо!

(no subject)

Date: 2010-08-07 10:02 am (UTC)
From: [identity profile] olgeria.livejournal.com
исключительно приятно видеть чужое творчество там, откуда ушла.

без шуток и подначек. честно. исключительно приятно.
(может быть приятно потому, что ушла, когда мой смысл этого дела иссяк, - неважно!)

это как бы для хозяйки: какое счастье, что кто-то сварил борщ, и это не я!

(no subject)

Date: 2010-08-07 12:40 pm (UTC)
From: [identity profile] temmokan.livejournal.com
Спасибо на добром слове - а "откуда ушла" - это про что именно?

про бывшую работу

From: [identity profile] olgeria.livejournal.com - Date: 2010-08-07 06:21 pm (UTC) - Expand

Re: про бывшую работу

From: [identity profile] temmokan.livejournal.com - Date: 2010-08-08 05:22 am (UTC) - Expand

Re: про бывшую работу

From: [identity profile] olgeria.livejournal.com - Date: 2010-08-08 07:10 am (UTC) - Expand

Обновление

Date: 2010-08-09 02:16 pm (UTC)
From: [identity profile] leha-sparrow.livejournal.com
Существенно лучше.

Re: Обновление

Date: 2010-08-09 02:57 pm (UTC)
From: [identity profile] temmokan.livejournal.com
Спасибо. Что ещё мешает или можно было бы улучшить?

Re: Обновление

From: [identity profile] leha-sparrow.livejournal.com - Date: 2010-08-09 03:04 pm (UTC) - Expand

Re: Обновление

From: [identity profile] leha-sparrow.livejournal.com - Date: 2010-08-09 03:05 pm (UTC) - Expand

Re: Обновление

From: [identity profile] temmokan.livejournal.com - Date: 2010-08-09 03:12 pm (UTC) - Expand

(no subject)

Date: 2010-08-09 05:51 pm (UTC)
From: [identity profile] dropinweb.livejournal.com
Доброго времени суток!
Открыл в Abiword, Debian.

Открылся нормально, сразу. Вопросы по типографике:
1) Длинное тире в начале диалога - там, вроде бы, короткое должно быть?
(Сейчас покопался в Википедии - в начале диалогов ставится тоже длинное, но я уже как-то привык в макетах книг делать вначале именно короткое - имхо, эстетичнее длинного)
2) Соответственно, короткое внутри текста и дефис после знаков препинания - имхо, длинное тире...
(Опять же, попробуйте между точкой (запятой) и длинным пробелом НЕ ставить пробела - оно, конечно, может быть и не правилам, но намного красивше...)
3) Три точки вместо многоточия. Это, конечно, достаточно спорный момент, но мне, например, очень нравится именно цельное многоточие вместо трёх точек.
4) У разделитель частей (три дефиса через пробелы), может быть, есть смысл добавить отступы до и после. Также и у цифирок-начал глав. Только у них перед - больше, а после - меньше.

Ещё по мелочи - выключка текста слева, висящие кое-где слова...

(no subject)

Date: 2010-08-10 12:40 am (UTC)
From: [identity profile] temmokan.livejournal.com
Спасибо, что нашли время проверить!

1. Вот тут спорный момент. Поставить любое из них несложно; я, в свою очередь. привык к длинному.
2. Дефис вокруг авторской речи надо заменить на тире, тут не спорю - это не для конвертора задача, а задача правки исходного текста.
3. Тут буду отстаивать три точки - визуально они просто лучше заметны, чем многоточие одним символом (…, …)
4. Подумываю, не заменить ли дефисы там повсюду на звёздочки. Как минимум, заметнее.

Выключка текста - что именно имеется в виду? Висящие слова - надо пристальнее глянуть, это может быть дефект исходного файла.

Спасибо!

(no subject)

From: [identity profile] dropinweb.livejournal.com - Date: 2010-08-10 05:01 am (UTC) - Expand

(no subject)

From: [identity profile] temmokan.livejournal.com - Date: 2010-08-10 04:57 pm (UTC) - Expand

Profile

temmokan: (Default)
Konstantin Boyandin

June 2022

S M T W T F S
   1 234
5 67891011
12131415161718
19202122232425
2627282930  

Most Popular Tags

Style Credit

Expand Cut Tags

No cut tags