RiSearch Pro
Введение
Поисковый скрипт, написанный на Перле и не требующий внешней базы данных.
Скрипт использует эффективный механизм индексации, позволяющий легко
работать с сотнями мегабайт текстовой информации. В новой версии появилась
возможность на лету добавлять новые документы в индекс. Другие возможности:
поиск с учетом морфологии русского языка (требуется библиотека RuMor),
сортировка результатов поиска по релевантности, размеру файла и дате последнего редактирования,
подсветка ключевых слов в результатах поиска,
расширенный поиск, индексация архивов.
Особенности
RiSearch Pro не использует какие-либо библиотеки или базы данных, кроме самого Перла.
Следовательно, его можно использовать на любом сервере, где у Вас
есть доступ к CGI (включая некоторые бесплатные хостинги).
Скрипт способен работать с разными языками.
Простой и удобный язык запросов.
RiSearch Pro использует платформонезависимые бинарные файлы, которые могут
быть использованы на разных компьютерах. То есть, Вы можете проводить
индексацию локальной копии сайта у себя дома под Windows9x, а затем
использовать созданные скриптом файлы на сервере.
Возможна индексация на локальном диске и через HTTP.
Конфигурируемый список стоп-слов.
Настраиваемый внешний вид результатов поиска.
Возможен поиск в одном или нескольких подразделах сайта.
Поиск с учетом морфологии русского языка.
Сортировка результатов поиска по релевантности, размеру файла, дате последнего редактирования.
Подсветка ключевых слов в результатах поиска.
Возможность использовать в запросе логические операторы (AND, OR, NOT).
Индексирование разных форматов файлов (PDF, DOC, PS) через внешние парсеры.
Сортировка результатов поиска с учетом растояния между словами -
документы, в которых искомые слова стоят рядом, получают дополнительный рейтинг
(скрипт различает только слова стоящие рядом или через одно).
Подсветка найденных слов в оригинальном документе - аналог функции "Показать найденные слова"
в Яндексе.
Инкрементальное индексирование.
Панель администратора.
Поиск фраз.
Нечеткий поиск.
Индексация архивов.
Фронтэнд на ПХП.
Подсветка ключевых слов в сохраненных копиях документов.
Корректировка опечаток в запросе.
Скачать демо-версию
Вы можете использовать этот скрипт в течение 30 дней для тестирования.
risearch_pro_3.2.08 (last changes 06.04.05)
risearch_pro_3.2.02 (preconfiguried to work with Ikonboard v.2.x datafiles)
Версия с морфологическим анализатором (демо-версия включает в себя обрезанную версию
морфологического модуля).
risearch_pro_rumor_3.2.08 (last changes 06.04.05)
Пользователи
Helpix - мобильные телефоны, мобильные новости
Фонтанка.Ру - новости Петербурга
Demo
Поиск с учетом русской морфологии на сайте TarraNova:
History
- Ver. 3.2.08 - 19.01.2005.
- Спайдер может использовать файл ROBOTS.TXT.
- Скрипт может удалить сразу несколько страниц из индекса по шаблону.
- Ver. 3.2.08 - 21.12.2004.
- Исправлена ошибка в парсинге SSI инструкий в шаблоне.
- Исправлена ошибка поиска по шаблону с использованием кеширования результатов поиска.
- Исправлена ошибка в "Show terms".
- Ver. 3.2.08 - 06.09.2004.
- Исправлена ошибка в поиске в разделах сайта и кеширования результатов.
- Исправлено несколько некритичных ошибок.
- Улучшена поддержка внешних парсеров.
- Тип поиска может быть изменен через форму поиска.
- Ver. 3.2.06 - 22.05.2004.
- Исправлена ошибка в коде подсветки искомых слов.
- Добавлен бинарный тип файлов (только УРЛ будет проиндексирован для этих файлов).
- Длина УРЛ на странце поиска может быть ограничена.
- Ver. 3.2.06 - 13.05.2004.
- Корректировка опечаток в запросе.
- Ver. 3.2.05 - 05.05.2004.
- Подсветка ключевых слов в сохраненных копиях документов.
- Ver. 3.2.04 - 28.04.2004.
- Нечеткий поиск.
- Переписан код подсветки искомых слов.
- Добавлена фильтрация документов при индексации по контенту.
- Ver. 3.2.03 - 08.04.2004.
- Исправлена ошибка в демо-версии с морфологией.
- Ver. 3.2.03 - 02.02.2004.
- Инкрементальное индексирование через броузер.
- Ver. 3.2.03 - 21.01.2004.
- Поиск по подстроке (поиск по шаблонам).
- Добавлена возможность автоматического перекодирования документов.
- Ver. 3.2.02 - 08.12.2003.
- Исправлено несколько некритичных ошибок.
- Ver. 3.2.02 - 21.11.2003.
- Добавлен ПХП фронтэнд.
- Ver. 3.2.02 - 13.11.2003.
- Исправлена ошибка в операциях сравнения расширенного поиска.
- Исправлена ошибка в "add.pl".
- Исправлена ошибка в коде перезапуска паука.
- Ver. 3.2.02 - 04.11.2003.
- исправлена ошибка в "update.pl".
- Добавлена возможность ограничить глубину индексирования пауком.
- Ver. 3.2.02 - 30.10.2003.
- Кеширование результатов поиска.
- Ver. 3.2.01 - 20.10.2020
- Расширенный поиск (поиск с атрибутами).
- Возможность использования нескольких шаблонов.
- Ver. 3.1.02 - 11.09.2003.
- Индексирующие скрипты можно остановить и перезапустить позже.
- Ver. 3.1 - 21.08.2020
- Более эффективный формат индекса.
- Уменьшенные требования к памяти во время индексации.
- Индексация архивов.
- Ver. 3.0.005 - 24.04.2020
- Новые команды для фильтра - Index, NoIndex, Follow, NoFollow.
- Исправлено несколько ошибок.
- Ver. 3.0.005 - 10.02.2020
- Исправлена ошибка в обработке списка стоп-слов.
- Реализован поиск фраз.
- Поиск в найденном.
- Ver. 3.0 - 23.01.2021
- Инкрементальное индексирование.
- Ver. 2.2 - 13.11.2020
- Сортировка результатов с учетом расстояния между словами.
- Функция подсветки найденных слов в оригинальном документе.
- При индексации возможно сохранение резервной копии старого индекса.
- Изменен язык запросов - по умолчанию теперь ищется точное совпадение.
- Ver. 2.1 - 09.07.2020
- Возможность создания промежуточных индексов.
- Ver. 2.0 - 30.04.2020
- Проведена глобальная чистка кода. Скрипт теперь работает с 'use strict'.
- Расширена функциональность шаблонов. Возможно использование условных операторов.
- Исправлена ошибка в spider.pl.
- Переписан скрипт статистики запросов. На данный момент доступно 8 типов отчетов.
- Ver. 1.1 - 28.03.2020
- Добавлена поддержка русской морфологии.
- Ver. 1.0 - 03.11.2020
|