Программы >> TACU >> [ duplicator | cross-entropy | generator | suffsort | trised | xcitata ]

Программа suffsort версия 0.1.6

Программа suffsort версия 0.1.6

Проект начат 2003-02-13; Последние изменения 2004-05-31

1  Загрузка
2  Файл readme.koi
3  Использование и сводка опций
4  Описание
5  Развитие программы
6  Лицензия

1  Загрузка

Исходники: src/suffsort-0.1.6.tgz [33 Кб ]

Исполнимый файл для Win9x/2000/XP (кросс-скомпилированный под minGW): mingw/suffsort.zip [20 Кб ]

2  Файл readme.koi

suffsort --- построение суффиксного массива для заданного файла

ПОДДЕРЖИВАЕМЫЕ ОКРУЖЕНИЯ

http://www.gnu.org    GNU/Linux 
http://www.mingw.org  MinGW --- Minimalist GNU For Windows


КОМПИЛЯЦИЯ

Введите make (или gmake) в директории, где находятся исходные тексты
программы.


КРАТКАЯ ИНСТРУКЦИЯ

Эту программу можно использовать для построения суффиксных массивов.
При вызове

suffsort file.txt

суффиксный массив буде записан в файл in file.txt.ary, откуда он может
в дальнейшем использоваться программой cross-entropy, например.

Условия использования описаны файле LICENSE.koi


3  Использование и сводка опций

user@computer$ ./suffsort --help
Usage: suffsort [OPTION]... FILE
Output file: FILE.ary
  -n, --naive               naive sort
  -l, --larsson-sadakane    Larsson-Sadakane
  -r, --resilence-naive     resilence naive sort (default)

  -d, --digital             output suffix array as a digital number per line

  -q, --quiet               do not send any messages to stderr
  -h, --help                display this help and exit
  -m, --man                 display complete description
  -v, --version             display version and exit


4  Описание

user@computer$ ./suffsort --man
<Пропущена информация, присутствующая в предыдущем разделе>


We use Larsson-Sadakane sorting algorithm for suffix sort described in
"Faster Suffix Sorting" by N. Jesper Larsson (jesper@cs.lth.se) and
Kunihiko Sadakane (sada@is.s.u-tokyo.ac.jp). It requires 9*size(FILE)
memory. One can reduce memory requirements by switchers -n (or -r) for
naive (or resilence naive) suffix sort using system qsort function. In
the last case memory requirements decay to 5*size(FILE), at cost of
slowing by factor 4.  However, the system qsort may require a lot of
memory, in particular, in the stack which might lead to errors in
sorting


5  Развитие программы

Даты изменения файлов программы:

2003-02-13

2003-02-18

2003-02-19

2003-05-15

2003-05-16

2004-04-10

2004-05-31

6  Лицензия

suffsort

Программа доступна с http://www.math.toronto.edu/dkhmelev/PROGS/tacu/

Автор:

Дмитрий Викторович Хмелёв dkhmelev((at))math.toronto.edu [замените ((at)) на @, чтобы получить настоящий адрес - антиспам]

119 992, Москва, Ленинские горы, МГУ, 1 Гум. корп., Филологический факультет, Лаборатория общей и компьютерной лексикологии и лексикографии.

УСЛОВИЯ ИСПОЛЬЗОВАНИЯ

Эта программа может использоваться бесплатно в научных исследованиях и в образовательных целях. Для коммерческого использования Вы обязаны получить лицензию у автора.

Научные результаты, полученные с использованием этой программы должны ссылаться на её использование. Пример ссылки:

Д.В. Хмелёв, Утилиты для анализа и преобразования текста. http://www.math.toronto.edu/dkhmelev/PROGS/tacu/

Более того, Вы должны проинформировать автора о публикации.

Эта программа не должна модифицироваться и распространяться без предварительного разрешения автора.

Используя программу suffsort Вы соглашаетесь с условиями использования.

ОТСУТСТВИЕ ГАРАНТИЙНЫХ ОБЯЗАТЕЛЬСТВ

ПОСКОЛЬКУ НАСТОЯЩАЯ ПРОГРАММА РАСПРОСТРАНЯЕТСЯ БЕСПЛАТНО, ГАРАНТИИ НА НЕЕ НЕ ПРЕДОСТАВЛЯЮТСЯ В ТОЙ СТЕПЕНИ, В КАКОЙ ЭТО ДОПУСКАЕТСЯ ПРИМЕНИМЫМ ПРАВОМ. НАСТОЯЩАЯ ПРОГРАММА ПОСТАВЛЯЕТСЯ НА УСЛОВИЯХ "КАК ЕСТЬ". ЕСЛИ ИНОЕ НЕ УКАЗАНО В ПИСЬМЕННОЙ ФОРМЕ, АВТОР И/ИЛИ ИНОЙ ПРАВООБЛАДАТЕЛЬ НЕ ПРИНИМАЕТ НА СЕБЯ НИКАКИХ ГАРАНТИЙНЫХ ОБЯЗАТЕЛЬСТВ, КАК ЯВНО ВЫРАЖЕННЫХ, ТАК И ПОДРАЗУМЕВАЕМЫХ, В ОТНОШЕНИИ ПРОГРАММЫ, В ТОМ ЧИСЛЕ ПОДРАЗУМЕВАЕМУЮ ГАРАНТИЮ ТОВАРНОГО СОСТОЯНИЯ ПРИ ПРОДАЖЕ И ПРИГОДНОСТИ ДЛЯ ИСПОЛЬЗОВАНИЯ В КОНКРЕТНЫХ ЦЕЛЯХ, А ТАКЖЕ ЛЮБЫЕ ИНЫЕ ГАРАНТИИ. ВСЕ РИСКИ, СВЯЗАННЫЕ С КАЧЕСТВОМ И ПРОИЗВОДИТЕЛЬНОСТЬЮ ПРОГРАММЫ, НЕСЕТ ЛИЦЕНЗИАТ. В СЛУЧАЕ ЕСЛИ В ПРОГРАММЕ БУДУТ ОБНАРУЖЕНЫ НЕДОСТАТКИ, ВСЕ РАСХОДЫ, СВЯЗАННЫЕ С ТЕХНИЧЕСКИМ ОБСЛУЖИВАНИЕМ, РЕМОНТОМ ИЛИ ИСПРАВЛЕНИЕМ ПРОГРАММЫ, НЕСЕТ ЛИЦЕНЗИАТ.

ЕСЛИ ИНОЕ НЕ ПРЕДУСМОТРЕНО ПРИМЕНЯЕМЫМ ПРАВОМ ИЛИ НЕ СОГЛАСОВАНО СТОРОНАМИ В ДОГОВОРЕ В ПИСЬМЕННОЙ ФОРМЕ, АВТОР И/ИЛИ ИНОЙ ПРАВООБЛАДАТЕЛЬ, КОТОРЫЙ МОДИФИЦИРУЕТ И/ИЛИ РАСПРОСТРАНЯЕТ ПРОГРАММУ НА УСЛОВИЯХ НАСТОЯЩЕЙ ЛИЦЕНЗИИ, НЕ НЕСЕТ ОТВЕТСТВЕННОСТИ ПЕРЕД ЛИЦЕНЗИАТОМ ЗА УБЫТКИ, ВКЛЮЧАЯ ОБЩИЕ, РЕАЛЬНЫЕ, ПРЕДВИДИМЫЕ И КОСВЕННЫЕ УБЫТКИ (В ТОМ ЧИСЛЕ УТРАТУ ИЛИ ИСКАЖЕНИЕ ИНФОРМАЦИИ, УБЫТКИ, ПОНЕСЕННЫЕ ЛИЦЕНЗИАТОМ ИЛИ ТРЕТЬИМИ ЛИЦАМИ, НЕВОЗМОЖНОСТЬ РАБОТЫ ПРОГРАММЫ С ЛЮБОЙ ДРУГОЙ ПРОГРАММОЙ И ИНЫЕ УБЫТКИ). АВТОР И/ИЛИ ИНОЙ ПРАВООБЛАДАТЕЛЬ В СООТВЕТСТВИИ С НАСТОЯЩИМ ПУНКТОМ НЕ НЕСУТ ОТВЕТСТВЕННОСТИ ДАЖЕ В ТОМ СЛУЧАЕ, ОНИ БЫЛИ ПРЕДУПРЕЖДЕНЫ О ВОЗМОЖНОСТИ ВОЗНИКНОВЕНИЯ ТАКИХ УБЫТКОВ.

1  Загрузка
2  Файл readme.koi
3  Использование и сводка опций
4  Описание
5  Развитие программы
6  Лицензия

Программы >> TACU >> [ duplicator | cross-entropy | generator | suffsort | trised | xcitata ]

- ???????@Mail.ru
© 2002--2003 Д.Хмелёв -