Введение
RiSearch PHP - поисковый скрипт, предназначенный для небольших сайтов.
Особенности
RiSearch PHP не требует наличия базы данных для хранения индекса.
Простой и удобный язык запросов.
RiSearch PHP использует платформонезависимые бинарные файлы, которые могут
быть использованы на разных компьютерах. То есть, Вы можете проводить
индексацию локальной копии сайта у себя дома под Windows9x, а затем
использовать созданные скриптом файлы на сервере.
Возможна индексация на локальном диске и через HTTP.
Конфигурируемый список стоп-слов.
Настраиваемый внешний вид результатов поиска.
Язык запросов
Ключевые слова в поле ввода разделяются пробелом или запятой. Регистр не имеет значения.
Режим поиска "AND" ("И") означает, что будут найдены только те данные, где встречается каждое из
ключевых слов. При использовании режима "OR" ("ИЛИ") результатом поиска будут все файлы, где
встречается хотя бы одно ключевое слово. В любом режиме знак "+" перед ключевым словом означает,
что данное ключевое слово должно присутствовать в найденных файлах. Если вы хотите исключить
какое-либо слово из поиска, поставьте перед ним знак "-". Например: "+толстой -алексей".
По умолчанию скрипт ищет все данные, которые начинаются с введенной вами строки. Например, при
запросе "город" будут найдены слова "город", "городок", "городской" и многие
другие. Восклицательный знак после ключевого слова означает, что будут найдены только
слова точно соответствующие запросу ("город!"). При соответствующих настройках скрипт способен
искать по подстроке.
Производительность
Скрипт предназначен для небольших сайтов объемом до 5000-10000 страниц.
Время поиска для такого сайта в большинстве случаев будет
меньше секунды. Если ваш сайт имеет более 10000 страниц,
рекомендуется использовать более производительный скрипт RiSearch Pro,
который написан на Перле, но имеет фронтэнд на ПХП. RiSearch Pro
также имеет множество дополнительных функций, отсутствующих
в бесплатных версиях:
- Возможность индексирования порядка 100000 файлов.
- Меньшие требования к свободной оперативной памяти.
- Инкрементальное индексирование, включая возможность автоматического
перезапуска скрипта на серверах, где скрипту не позволено работать длительное
время.
- Поиск с учетом морфологии русского языка.
- Сортировка результатов поиска по релевантности, размеру файла, дате последнего редактирования.
- Подсветка ключевых слов в результатах поиска.
- Индексирование файлов разных форматов (PDF, DOC, PS) через внешние парсеры и индексирование архивов.
- Поиск фраз и учет расстояний между словами.
- Поиск с атрибутами.
RiSearch PHP с морфологическим анализатором
Данная версия скрипта предназначена для работы совместно с
морфологическим анализатором RuMor и позволяет находить
различные формы введенного слова. Например по запросу
"идти" будут найдены слова "иду", "шел", "шедший".
Морфологическй анализатор необходимо приобретать отдельно,
с демо-версией поставляется обрезанная версия анализатора.
Download
risearch_php-0.2.01 (last changes 10.08.2020)
risearch_php_rumor-0.2.01 (last changes 10.08.2020)
Известные проблемы
- Если скрипт не работает с русским языком, попробуйте добавить следующую
строку в начало каждого скрипта:
setlocale(LC_ALL, "ru_RU.CP1251");
- Из-за ошибки в некоторых версиях ПХП более быстрый код убран из новой версии
и снова используется старый алгоритм. Пользователи Windows могут скачать более
быструю версию здесь - risearch_php-0.2
History
- Ver. 0.2.01 - 10.08.2020
- Исправлена ошибка с $no_index_dir.
- Ver. 0.2.01 - 25.08.2020
- Исправлена ошибка с поиском нескольких слов.
- Ver. 0.2.01 - 11.02.2020
- Небольшое изменение в функции "hash" необходимое для PHP версии 5.02.
- Ver. 0.2.01 - 10.05.2020
- Из-за ошибки в некоторых версиях ПХП более быстрый код убран из новой версии
и снова используется старый алгоритм.
- Ver. 0.2 - 18.04.2020
- Поиск стал быстрее на 20-30%.
- Подсветка ключевых слов.
- Ver. 0.1.06 - 17.09.2020
- Исправлено несколько ошибок.
- Ver. 0.1.05 - 26.07.2020
- Исправлена ошибка с $no_index_dir.
- Ver. 0.1.05 - 10.06.2020
- Проведена чистка кода.
- Добавлен конфигурирующий скрипт.
- Ver. 0.1.04 - 03.02.2020
- Исправлена ошибка в spider.l - скрипт теперь корректно обрабатывает несуществующие файлы.
- Ver. 0.1.03 - 13.01.2021
- Исправлено несколько ошибок.
- Ver. 0.1.02 - 14.12.2020
- Исправлена ошибка с search.php - стопслова исключаются из запроса.
- Ver. 0.1.01 - 05.12.2020
- Добавлено выборочное индексирование (индексирование только определенной части документа).
- Ver. 0.1b - 11.11.2020
|