Кот, который гуляет сам по себе (murmau) wrote in science_freaks,
Кот, который гуляет сам по себе
murmau
science_freaks

Category:

Заинтриговался

Ваше мнение?


НОВЫЙ СПОСОБ АРХИВАЦИИ ДАННЫХ



Разработан принципиально новый метод представления данных, позволя­ющий произвести более краткую запись представленного сообщения, то есть осуществить сжатие без потерь. Алгоритм и математическое обоснование предлагаемой теории кодирования основаны на теории больших чисел и обес­печивают на существующей материальной базе практически неограниченную степень архивации.

В настоящее время на мировом рынке имеются программы архивации дан­ных, позволяющие сжимать исходное сообщение до некоторого предела, ха­рактеризуемого как бинарной структурой файла, так и особенностями алгорит­мов архивации. При этом общей чертой, объединяющей существующие мето­ды архивации, является ориентировка на изначальную избыточность файлов по первой производной, то есть наличие априорной вероятности появления сим­волов. Причем степень сжатия современных архиваторов без потери данных, ориентированных на исходные предпосылки, не превышает для текстовых дан­ных 4-х кратного, а для двоичного (исполняемые модули, данные) 2-3-х крат­ного сжатия.



Предложенный метод является многопроходным и позволяет получить за один проход коэффициент сжатия порядка 1,02 - 1,028, что соответствует вы­игрышу от 2% до 2,8%. Минимальный объем сжимаемого файла на сегодняш­ний день составляет порядка 1 мегабайта. Любой больший файл, используя разработанный метод, возможно сжать до этого размера за некоторое время, зависящее от мощности вычислительных средств. К примеру, архив arj разме­ром 16 Мб. с почти равновероятным распределением символов и не сжимае­мый далее никаким из существующих архиваторов, сжимается новым методом до 1,3 Мб на персональном компьютере Pentium-600/128 за 16 часов.

Столь разительные результаты были получены путем перехода от стан­дартного арифметического кодирования к новым созданным способам опти­мальной записи битовых потоков с равновероятным распределением, то есть белого шума, который невозможно сжать без потерь существующими метода­ми.

Разработанный метод основан на разделении исходной информации на "динамическую" и "статическую" составляющие по некоторым "признакам", причем статическая часть является неотделимой частью кода. В результате многолетних исследований выявлено, что статическая часть является меньшей по объему (по результатам исследований), а динамическая часть (большая со­ставляющая), теоретически может быть сжата не только до некоторого объема по первой производной, используемой современными архиваторами, но и до стремящегося при больших числах к минимуму значения.

Данная разработка может быть использована в системах обработки и хра­нения данных больших объемов, в системах цифровой связи, работающих в ре­жиме ограничения объема передаваемой информации и т. д. Она реализова­на в виде программного продукта в составе пакета прикладных программ обра­ботки и анализа исходных сообщений, выполнена под операционную систему Windows 95 на языке С++.



Кафедра автоматизации предприятий связи (АПС)

А.П. Луценко Тел.: (812) 589 8390, 589 8274. E-mail: aps@scientist.com.

взято здесь http://ut27972.narod.ru/Book_4/02_Book_4_part_2.htm
Subscribe
  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 33 comments