|
|
Текстовые форматы файлов
Самый часто используемый тип данных в компьютерном мире и интернете – текстовый. Видео и графика много красочнее и вообще лучше один раз увидеть, чем сто раз услышать. Ну и услышать тоже неплохо – на этот случай есть аудио-форматы данных. Однако правят компьютерный бал неказистые и скромные буквы и цифры. Без них никуда, даже названия другому файлу не дать. Текстовые данные важны и разнообразны – это и книги, и документы, и программный код. И для каждого назначения существуют собственные варианты форматов. Именно о них и пойдёт речь в этой статье. Правда следует сразу же сделать одну оговорку – в данном обзоре не будут затронуты форматы электронных книг, они заслуживают отдельного разговора. Здесь же говориться будет о форматах именно документов.
Текстовый формат – TXT (PlainText)
Итак – самое простое из возможных, формат TXT. Это текст в его, по сути, чистом и незамутнённом виде. Содержит только содержимое текста и абсолютный минимум служебных данных – символы начала и конца текста, перевода каретки и тому подобные.
Несмотря на практически спартанскую простоту, формат не лишён вариантов и различий. Во-первых, есть некоторые различия между Windows, Unix и MacOS версиями в которых используются разные символы конца строки. Также различия могут быть обусловлены использованием 8-битной (ASCII) либо 16-битной (UNICODE) кодовых страниц.
Однако, несмотря на это, формат TXT отличается крайней универсальностью, за что весьма любим программистами и системными администраторами.
Форматы документов MS Office и аналоги– DOC, DOCX, RTF, ODT
При всей универсальности и простоте TXT абсолютно непригоден для создания собственно документов – текстов предназначенных для печати с соблюдением определённых правил и норм оформления. Поскольку подобные документы кроме самого текста должны содержать ещё массу информации об оформлении и форматировании текста. А также о формате и размере листа бумаги, где они должны размещаться.
Для этих целей были созданы довольно многочисленные форматы различных офисных пакетов. Наиболее популярным и фактически близким к универсальному можно считать форматы MS Word – doc и docx. Первый представляет собой специальный закрытый формат, созданный компанией Microsoft для своего текстового редактора (точнее целую линейку форматов – за время своего существования он несколько раз подвергался усовершенствованию). Наряду с ним ещё на заре развития компании в сотрудничестве с корпорацией Adobe был создан формат RTF (Rich Text Format). В отличие от DOC структура этого формата доступна и он успешно поддерживается практически всеми существующими текстовыми редакторами. Хотя и несколько уступает DOC по набору доступных функций.
Закрытость разработок компании Microsoft привела к созданию открытого офисного пакета Open Office. Для которого был разработан собственный формат ODT (OpenDocument Text Format). Формат не очень хорошо поддерживается коммерческими редакторами, в том числе MS Word и может открываться ими с ошибками.
Наконец в 2007 году Microsoft решила отказаться от ставки на формат DOC и разработала семейство форматов Office Open XML в которое входит DOCX ставший основным форматов новых версий MS Word.
Формат PDF
Отказавшись от сотрудничества с Microsoft, компания Adobe двинулась своим путём. Ею был разработан формат PDF представлявший собой формат не столько для разработки документов, сколько для их просмотра и печати. В отличие от предыдущей группы, представляющих собой форматированный текст, вид которого тем не менее может изменяться
в зависимости от того на какой конкретной машине он отображается или печатается, PDF представляет собой формат документа
принципиально неизменного и сохраняющего внешний вид и вёрстку в любых условиях. Также он поддерживает довольно широкий
спектр как полиграфических элементов, так и дополнительного сервиса (например защита документа паролем от редактирования либо печати и так далее). Всё это делает PDF скорее форматом для распространения сложных и профессионально выполненных документов и даже книг.
|
|
|
|
|
|
|