cover image: Модификация одного алгоритма восстановления текстовых сообщений и математическая модель распределения числа осмысленных текстов

20.500.12592/rjx9xj

Модификация одного алгоритма восстановления текстовых сообщений и математическая модель распределения числа осмысленных текстов

23 Apr 2021

Классическая схема бесключевого ской границы Lкр : восстановления исходного текста Li n li1 li2 ...lin d Lкр , (1) Однако с увеличением количества вариантов где n – длина отрезка, li – количество вариантов знаков для каждого символа сообщения восстанов- j ление исходного текста подобным образом стано- символа для j-го знака в i-й n-грамме. [...] Предлагается следующая оценка макси- мально допустимого числа вариантов дешифрования N N содержит около N повторяющихся эле- N для участков сообщения заданной длины: 1 n N 20,1n , N (2) ментов. [...] N Для проверки качества и естественности со-N , (3) 1n / N зданных словарей проводится проверка их соответ- где N – размер исходного словаря, n – число одно- ствия закону Ципфа. [...] торые могут быть построены из символов алфавита мощностью m, D – число осмысленных текстов дли- ны s в том же алфавите, n – число построенных ва- риантов для восстанавливаемого отрезка сообщения (в рассматриваемой модели – разное для каждого дешифруемого отрезка из-за различных длин коло- нок), k – количество найденных осмысленных тек- стов для восстанавливаемого отрезка сообщения. [...] Т а б л и ц а 3 В этом случае гипергеометрическое распределение Значения энтропии n-грамм хорошо аппроксимируется биномиальным распре- N N N делением с параметрами n и D/N.

Authors

Anastasia

Pages
4
Published in
Russia
Title in English
Modification of a single text message recovery algorithm and mathematical model for the distribution of the number of meaningful texts [from PDF fonts]