Новые технологии информационного сервиса в Internet


Индексирование и Поиск


Модели индексирования и поиска:

  • векторная модель информационного потока
  • нечеткие множества
  • вероятностная модель

Типы информационно поисковых языков:

  • традиционные ИПЯ
  • взвешивание терминов
  • ИПЯ типа "Like this"

Способы коррекции результатов поиска

  • фильтрация
  • коррекция по релевантности
  • кластеризация

Векторная модель:


Запрос к системе:

Lxq=r

где

q -вектор запроса

r - вектор отклика

Традиционный ИПЯ:

((информационная and система) or ИПС) not СУБД

Найти все документы, в которых встречается термин

"информационная" и "система", либо термин "ИПС", но не встречается

термин "СУБД".

Недостатки:

Плохая масштабируемость выдачи. OR приводит к слишком

большому расширению списка релевантных документов, а AND резко

сужает отклик.

Модификации:

Взвешенный запрос (каждому термину приписывают некоторый

вес)




Начало  Назад  Вперед