ENG/RUS   Главная :: RiSearch :: RiSearch Pro :: RiSearch PHP :: RiLax :: RuMor :: Forum

RiSearch Software

      На этом сайте Вы найдете программные продукты для создания собственной поисковой системы на Вашем сайте. Скрипты написаны на языке Perl и являются достаточно быстрыми и мощными для работы с десятками мегабайт текстовой информации.

Поиск по сайту:

Если вы желаете получать информацию о новых версиях скриптов, подпишитесь на рассылку.

RiSearch Pro
Информация... | Документация | Купить | Скачать.

Поисковый скрипт, написанный на Перле и не требующий внешней базы данных. Скрипт использует эффективный механизм индексации, позволяющий легко работать с сотнями мегабайт текстовой информации. В новой версии появилась возможность на лету добавлять новые документы в индекс. Другие возможности: поиск с учетом морфологии русского языка (требуется библиотека RuMor), сортировка результатов поиска по релевантности, размеру файла и дате последнего редактирования, подсветка ключевых слов в результатах поиска, расширенный поиск.

Особенности

  1. RiSearch Pro не использует какие-либо нестандартные библиотеки или базы данных, кроме самого Перла. Следовательно, его можно использовать на любом сервере, где у Вас есть доступ к CGI (включая некоторые бесплатные хостинги).

  2. Скрипт способен работать с разными языками.

  3. Простой и удобный язык запросов.

  4. RiSearch Pro использует платформонезависимые бинарные файлы, которые могут быть использованы на разных компьютерах. То есть, Вы можете проводить индексацию локальной копии сайта у себя дома под Windows9x, а затем использовать созданные скриптом файлы на сервере.

  5. Возможна индексация на локальном диске и через HTTP.

  6. Конфигурируемый список стоп-слов.

  7. Настраиваемый внешний вид результатов поиска.

  8. Возможен поиск в одном или нескольких подразделах сайта.

  9. Поиск с учетом морфологии русского языка.

  10. Сортировка результатов поиска по релевантности, размеру файла, дате последнего редактирования.

  11. Подсветка ключевых слов в результатах поиска.

  12. Расширенный поиск, с возможностью использовать в запросе логические операторы (AND, OR, NOT).

  13. Индексирование разных форматов файлов (PDF, DOC, PS) через внешние парсеры.

  14. Сортировка результатов поиска с учетом растояния между словами - документы, в которых искомые слова стоят рядом, получают дополнительный рейтинг (скрипт различает только слова стоящие рядом или через одно).

  15. Подсветка найденных слов в оригинальном документе - аналог функции "Показать найденные слова" в Яндексе.

  16. Инкрементальное индексирование.

  17. Панель администратора.

  18. Поиск фраз.

  19. Индексация архивов.

RiSearch - поисковый скрипт со множеством функций: платформонезависимые бинарные индексы, индексация на локальном диске и через HTTP, настраиваемый внешний вид результатов поиска и множество других...

RuMor

RuMor - морфологический модуль для русского языка, включающий в себя две основные функции: нахождение базовой формы слова или всех его словоформ. Данный модуль может использоваться в поисковых системах для улучшения поиска по документам с русским текстом. В качестве исходных данных для генерации словоформ используется словарь Зализняка, дополненный 23 тысячами основ. Всего в словаре содержится около 115 тысяч основ, что позволяет генерировать 1900000 словоформ.

Модуль полностью написан на языке Перл (также есть версия на ПХП) и не требует каких-либо дополнительных библиотек. Он легко может быть интегрирован в любую web-систему, где требуется поиск с учетом морфологии русского языка. Модуль является абсолютно кроссплатформенным продуктом и может работать как на локальной машине под управлением Windows для написания и отладки приложений, так и на вебсервере.

RiLax

Поисковый скрипт для текстовых баз данных. Использует индексы для быстрого поиска. Возможен поиск в отдельных полях базы, сортировка по любому полю и много другое. Полностью настраиваемый вывод результатов поиска. Способен работать с базами, имеющими порядка 50000-100000 записей.

RiSearch PHP - бесплатный поисковый скрипт, предназначенный для небольших сайтов (до 5000 страниц). Не требует наличия базы данных для хранения индекса. Поддерживает индексацию локальных файлов и индексацию через HTTP.



Другие скрипты (в данный момент не поддерживаются)

RiSearch CDROM Package - простой способ для записи вашего сайта с поисковым механизмом на CDROM.

RiSearch SQL - RiSearch SQL использует MySQL для хранения индекса. Скрипт предназначен для средних сайтов объемом 1000-10000 страниц. Возможно добавление новой страницы без полной переиндексации сайта. По остальным возможностям скрипт аналогичен скрипту RiSearch.

RiFlex - скрипт для индексации больших текстовых корпусов. По функциональности практически полностью аналогичен RiSearch, но имеет гораздо меньшие требования к объему доступной памяти, что позволяет индексировать порядка 1-2 Гб текста на компьютере с 256 Mb RAM. Скорость индексации - 10-15 Мб/мин.



http://risearch.org С.Тарасов, © 2000-2005