ENG/RUS   Главная :: RiSearch :: RiSearch Pro :: RiSearch PHP :: RiLax :: RuMor :: Forum

Введение :: Настройка :: License

Введение

      RiSearch PHP - поисковый скрипт, предназначенный для небольших сайтов.

Особенности

  1. RiSearch PHP не требует наличия базы данных для хранения индекса.

  2. Простой и удобный язык запросов.

  3. RiSearch PHP использует платформонезависимые бинарные файлы, которые могут быть использованы на разных компьютерах. То есть, Вы можете проводить индексацию локальной копии сайта у себя дома под Windows9x, а затем использовать созданные скриптом файлы на сервере.

  4. Возможна индексация на локальном диске и через HTTP.

  5. Конфигурируемый список стоп-слов.

  6. Настраиваемый внешний вид результатов поиска.

Язык запросов

      Ключевые слова в поле ввода разделяются пробелом или запятой. Регистр не имеет значения.
      Режим поиска "AND" ("И") означает, что будут найдены только те данные, где встречается каждое из ключевых слов. При использовании режима "OR" ("ИЛИ") результатом поиска будут все файлы, где встречается хотя бы одно ключевое слово. В любом режиме знак "+" перед ключевым словом означает, что данное ключевое слово должно присутствовать в найденных файлах. Если вы хотите исключить какое-либо слово из поиска, поставьте перед ним знак "-". Например: "+толстой -алексей".
      По умолчанию скрипт ищет все данные, которые начинаются с введенной вами строки. Например, при запросе "город" будут найдены слова "город", "городок", "городской" и многие другие. Восклицательный знак после ключевого слова означает, что будут найдены только слова точно соответствующие запросу ("город!"). При соответствующих настройках скрипт способен искать по подстроке.

Производительность

      Скрипт предназначен для небольших сайтов объемом до 5000-10000 страниц. Время поиска для такого сайта в большинстве случаев будет меньше секунды. Если ваш сайт имеет более 10000 страниц, рекомендуется использовать более производительный скрипт RiSearch Pro, который написан на Перле, но имеет фронтэнд на ПХП. RiSearch Pro также имеет множество дополнительных функций, отсутствующих в бесплатных версиях:

  • Возможность индексирования порядка 100000 файлов.
  • Меньшие требования к свободной оперативной памяти.
  • Инкрементальное индексирование, включая возможность автоматического перезапуска скрипта на серверах, где скрипту не позволено работать длительное время.
  • Поиск с учетом морфологии русского языка.
  • Сортировка результатов поиска по релевантности, размеру файла, дате последнего редактирования.
  • Подсветка ключевых слов в результатах поиска.
  • Индексирование файлов разных форматов (PDF, DOC, PS) через внешние парсеры и индексирование архивов.
  • Поиск фраз и учет расстояний между словами.
  • Поиск с атрибутами.

RiSearch PHP с морфологическим анализатором

      Данная версия скрипта предназначена для работы совместно с морфологическим анализатором RuMor и позволяет находить различные формы введенного слова. Например по запросу "идти" будут найдены слова "иду", "шел", "шедший". Морфологическй анализатор необходимо приобретать отдельно, с демо-версией поставляется обрезанная версия анализатора.

Download

risearch_php-0.2.01 (last changes 10.08.2020)
risearch_php_rumor-0.2.01 (last changes 10.08.2020)

Известные проблемы

  • Если скрипт не работает с русским языком, попробуйте добавить следующую строку в начало каждого скрипта:
      setlocale(LC_ALL, "ru_RU.CP1251"); 
  • Из-за ошибки в некоторых версиях ПХП более быстрый код убран из новой версии и снова используется старый алгоритм. Пользователи Windows могут скачать более быструю версию здесь - risearch_php-0.2

History

Ver. 0.2.01 - 10.08.2020
Исправлена ошибка с $no_index_dir.
Ver. 0.2.01 - 25.08.2020
Исправлена ошибка с поиском нескольких слов.
Ver. 0.2.01 - 11.02.2020
Небольшое изменение в функции "hash" необходимое для PHP версии 5.02.
Ver. 0.2.01 - 10.05.2020
Из-за ошибки в некоторых версиях ПХП более быстрый код убран из новой версии и снова используется старый алгоритм.
Ver. 0.2 - 18.04.2020
Поиск стал быстрее на 20-30%.
Подсветка ключевых слов.
Ver. 0.1.06 - 17.09.2020
Исправлено несколько ошибок.
Ver. 0.1.05 - 26.07.2020
Исправлена ошибка с $no_index_dir.
Ver. 0.1.05 - 10.06.2020
Проведена чистка кода.
Добавлен конфигурирующий скрипт.
Ver. 0.1.04 - 03.02.2020
Исправлена ошибка в spider.l - скрипт теперь корректно обрабатывает несуществующие файлы.
Ver. 0.1.03 - 13.01.2021
Исправлено несколько ошибок.
Ver. 0.1.02 - 14.12.2020
Исправлена ошибка с search.php - стопслова исключаются из запроса.
Ver. 0.1.01 - 05.12.2020
Добавлено выборочное индексирование (индексирование только определенной части документа).
Ver. 0.1b - 11.11.2020


http://risearch.org С.Тарасов, © 2000-2005