Программы >> TACU >> [ duplicator | cross-entropy | generator | suffsort | trised | xcitata ]

Программа generator версия 0.9.5

Программа generator версия 0.9.5

Проект начат 2003-01-19; Последние изменения 2004-05-31

1  Загрузка
2  Файл readme.koi
3  Использование и сводка опций
4  Описание
5  Развитие программы
6  Лицензия

1  Загрузка

Исходники: src/generator-0.9.5.tgz [31 Кб ]

Исполнимый файл для Win9x/2000/XP (кросс-скомпилированный под minGW): mingw/generator.zip [22 Кб ]

2  Файл readme.koi

generator --- генератор случайных текстов по заданному тексту-модели 

ПОДДЕРЖИВАЕМЫЕ ОКРУЖЕНИЯ

http://www.gnu.org    GNU/Linux 
http://www.mingw.org  MinGW --- Minimalist GNU For Windows


КОМПИЛЯЦИЯ

Введите make (или gmake) в директории, где находятся исходные тексты
программы.


КРАТКАЯ ИНСТРУКЦИЯ

Эту программу можно использовать для генерации случайного текста по
заданному модельному тексту. Вызов

generator file.txt

выведет случайный текст похожий на file.txt в стандартный вывод

Условия использования описаны файле LICENSE.koi


3  Использование и сводка опций

user@computer$ ./generator --help
Usage: generator [OPTION]... FILE
  -o, --order <num=2>       the maximal order for the model
  -s, --seed <num=1>        seed the model with integer <num>
  -c, --catch-eof <num=1>   stop output on meeting EOF if 1; no stop if 0
  -g, --generator <num=1>   select random number generator 1..3
  -b, --bytes <num>         output <num> bytes (warning: sets -c0)
  -k, --kbytes <num>        output <num>*1024 bytes (warning: sets -c0)
  -r, --randomize           the seed is chosen using the current time
  -n, --naive-sort          use naive sort (decrease memory use but slower)
  -q, --quiet               do not send any messages to stderr
  -h, --help                display this help and exit
  -m, --man                 display complete description
  -v, --version             display version and exit


4  Описание

user@computer$ ./generator --man
<Пропущена информация, присутствующая в предыдущем разделе>


This program generates random output using statistics from file
FILE1. It uses Markov model of order <order> defined by switcher
--order (and equal to 2 by default) to output next symbol from current
context of length <order>. If current context does not present in
FILE, then the length of context is decreased and program uses Markov
model of smaller order. Finally it arrives at order 2 and outputs a
randomly-chosen symbol from FILE. If --catch-eof=0 (-c0), then the
program would output -b bytes or -k kilobytes, or will never stop if
-b and -k options were not specified. If --catch-eof=1, then the
program stops as soon as it encounter the context at the end of FILE;
for <order>=0, the program stops with probability 1/(size(FILE)+1) on
each outputted symbol (this way you can produce outputs of size
comparable to size(FILE). The initial context is chosen at random.

You can define initial seed number for random number generator,
randomize it with current time by -r option (in this case the random
number used is outputted to STDERR). Three random number generators
from are available with option -g<num>. All of them were taken from
the book "Numerical Recipes in C, 2nd edition"

-g1 (default) "Minimal" random number generator of Park and Miller
    with Bays-Durham shuffle and added safeguards.

-g2 Long period(>2E18) random number generator of L'Ecuyer with Durham
    shuffle.

-g3 Knuth's random number generator using subtractive method
    "Seminumerical algorithms", 2nd edition., vol. 2 of "The art of
    computer programming", sections 3.2-3.3

We use Larsson-Sadakane sorting algorithm for suffix sort described in
"Faster Suffix Sorting" by N. Jesper Larsson (jesper@cs.lth.se) and
Kunihiko Sadakane (sada@is.s.u-tokyo.ac.jp). It requires 9*size(FILE)
memory. One can reduce memory requirements by switcher -n for naive
suffix sort using system qsort function. In the last case memory
requirements decay to 5*size(FILE), at cost of slowing by factor 4.
However, the system qsort may require a lot of memory, in particular,
in the stack which might lead to errors in sorting


5  Развитие программы

Даты изменения файлов программы:

2003-01-19

2003-02-08

2003-05-16

2003-05-18

2003-08-27

2004-05-31

6  Лицензия

generator

Программа доступна с http://www.math.toronto.edu/dkhmelev/PROGS/tacu/

Автор:

Дмитрий Викторович Хмелёв dkhmelev((at))math.toronto.edu [замените ((at)) на @, чтобы получить настоящий адрес - антиспам]

119 992, Москва, Ленинские горы, МГУ, 1 Гум. корп., Филологический факультет, Лаборатория общей и компьютерной лексикологии и лексикографии.

УСЛОВИЯ ИСПОЛЬЗОВАНИЯ

Эта программа может использоваться бесплатно в научных исследованиях и в образовательных целях. Для коммерческого использования Вы обязаны получить лицензию у автора.

Научные результаты, полученные с использованием этой программы должны ссылаться на её использование. Пример ссылки:

Д.В. Хмелёв, Утилиты для анализа и преобразования текста. http://www.math.toronto.edu/dkhmelev/PROGS/tacu/

Более того, Вы должны проинформировать автора о публикации.

Эта программа не должна модифицироваться и распространяться без предварительного разрешения автора.

Используя программу generator Вы соглашаетесь с условиями использования.

ОТСУТСТВИЕ ГАРАНТИЙНЫХ ОБЯЗАТЕЛЬСТВ

ПОСКОЛЬКУ НАСТОЯЩАЯ ПРОГРАММА РАСПРОСТРАНЯЕТСЯ БЕСПЛАТНО, ГАРАНТИИ НА НЕЕ НЕ ПРЕДОСТАВЛЯЮТСЯ В ТОЙ СТЕПЕНИ, В КАКОЙ ЭТО ДОПУСКАЕТСЯ ПРИМЕНИМЫМ ПРАВОМ. НАСТОЯЩАЯ ПРОГРАММА ПОСТАВЛЯЕТСЯ НА УСЛОВИЯХ "КАК ЕСТЬ". ЕСЛИ ИНОЕ НЕ УКАЗАНО В ПИСЬМЕННОЙ ФОРМЕ, АВТОР И/ИЛИ ИНОЙ ПРАВООБЛАДАТЕЛЬ НЕ ПРИНИМАЕТ НА СЕБЯ НИКАКИХ ГАРАНТИЙНЫХ ОБЯЗАТЕЛЬСТВ, КАК ЯВНО ВЫРАЖЕННЫХ, ТАК И ПОДРАЗУМЕВАЕМЫХ, В ОТНОШЕНИИ ПРОГРАММЫ, В ТОМ ЧИСЛЕ ПОДРАЗУМЕВАЕМУЮ ГАРАНТИЮ ТОВАРНОГО СОСТОЯНИЯ ПРИ ПРОДАЖЕ И ПРИГОДНОСТИ ДЛЯ ИСПОЛЬЗОВАНИЯ В КОНКРЕТНЫХ ЦЕЛЯХ, А ТАКЖЕ ЛЮБЫЕ ИНЫЕ ГАРАНТИИ. ВСЕ РИСКИ, СВЯЗАННЫЕ С КАЧЕСТВОМ И ПРОИЗВОДИТЕЛЬНОСТЬЮ ПРОГРАММЫ, НЕСЕТ ЛИЦЕНЗИАТ. В СЛУЧАЕ ЕСЛИ В ПРОГРАММЕ БУДУТ ОБНАРУЖЕНЫ НЕДОСТАТКИ, ВСЕ РАСХОДЫ, СВЯЗАННЫЕ С ТЕХНИЧЕСКИМ ОБСЛУЖИВАНИЕМ, РЕМОНТОМ ИЛИ ИСПРАВЛЕНИЕМ ПРОГРАММЫ, НЕСЕТ ЛИЦЕНЗИАТ.

ЕСЛИ ИНОЕ НЕ ПРЕДУСМОТРЕНО ПРИМЕНЯЕМЫМ ПРАВОМ ИЛИ НЕ СОГЛАСОВАНО СТОРОНАМИ В ДОГОВОРЕ В ПИСЬМЕННОЙ ФОРМЕ, АВТОР И/ИЛИ ИНОЙ ПРАВООБЛАДАТЕЛЬ, КОТОРЫЙ МОДИФИЦИРУЕТ И/ИЛИ РАСПРОСТРАНЯЕТ ПРОГРАММУ НА УСЛОВИЯХ НАСТОЯЩЕЙ ЛИЦЕНЗИИ, НЕ НЕСЕТ ОТВЕТСТВЕННОСТИ ПЕРЕД ЛИЦЕНЗИАТОМ ЗА УБЫТКИ, ВКЛЮЧАЯ ОБЩИЕ, РЕАЛЬНЫЕ, ПРЕДВИДИМЫЕ И КОСВЕННЫЕ УБЫТКИ (В ТОМ ЧИСЛЕ УТРАТУ ИЛИ ИСКАЖЕНИЕ ИНФОРМАЦИИ, УБЫТКИ, ПОНЕСЕННЫЕ ЛИЦЕНЗИАТОМ ИЛИ ТРЕТЬИМИ ЛИЦАМИ, НЕВОЗМОЖНОСТЬ РАБОТЫ ПРОГРАММЫ С ЛЮБОЙ ДРУГОЙ ПРОГРАММОЙ И ИНЫЕ УБЫТКИ). АВТОР И/ИЛИ ИНОЙ ПРАВООБЛАДАТЕЛЬ В СООТВЕТСТВИИ С НАСТОЯЩИМ ПУНКТОМ НЕ НЕСУТ ОТВЕТСТВЕННОСТИ ДАЖЕ В ТОМ СЛУЧАЕ, ОНИ БЫЛИ ПРЕДУПРЕЖДЕНЫ О ВОЗМОЖНОСТИ ВОЗНИКНОВЕНИЯ ТАКИХ УБЫТКОВ.

1  Загрузка
2  Файл readme.koi
3  Использование и сводка опций
4  Описание
5  Развитие программы
6  Лицензия

Программы >> TACU >> [ duplicator | cross-entropy | generator | suffsort | trised | xcitata ]

- ???????@Mail.ru
© 2002--2003 Д.Хмелёв -