Информационно-поисковые системы
ВВЕДЕНИЕ
Современный этап развития цивилизации
характеризуется переходом наиболее развитой части человечества от
индустриального общества к информационному. Одним из наиболее ярких явлений
этого процесса является возникновение и развития глобальной информационной
компьютерной сети.
Проблема поиска и сбора информации - одна из
важнейших проблем информационно поисковых систем. Конечно, нельзя сравнивать в
этом отношении, скажем, средние века, когда поиск информации был проблемой
потому, что этой информации было мало, и требовались усилия только для того,
чтобы найти хоть что-то по более или менее значительному интересующему вопросу.
Так, сначала появилась возможность пойти в библиотеку и, потратив там время на
выбор нужной книги по каталогу, найти необходимую информацию. Но каталоги не
решают полностью проблем поиска информации даже в рамках одной библиотеки, так
как в каталожную запись входит относительно мало информации: заголовок, автор,
место издания. Проблема поиска информации приобрела новый характер в 20-м
столетии, с началом развития века информационных технологий. Теперь она
заключается не в том, что информации мало и поэтому ее трудно найти, а в том,
что ее теперь наоборот становится все больше и больше, и от этого найти ответ
на интересующий вопрос может оказаться тоже довольно сложной задачей. Проблема
поиска информации значительно усложняется при использовании виртуальных
источников. Здесь используется технология онлайновых каталогов, в результате
применения которой пользователь имеет возможность выполнять поиск в каталогах
сразу нескольких библиотек, чем, на самом деле, еще больше усложняет себе
задачу, но, с другой стороны, увеличивает шансы решить ее.
1. ИНФОРМАЦИОННО-ПОИСКОВЫЕ СИСТЕМЫ
Под информационной системой понимается
организованная совокупность программно - технических и других вспомогательных
средств, технологических процессов и функционально - определенных групп
работников, обеспечивающих сбор, представление и накопление информационных
ресурсов в определённой предметной области, поиск и выдачу сведений необходимых
для удовлетворения информационных потребностей пользователей. Информационных
системы являются основным средством, инструментарием решения задач
информационного обеспечения различных видов деятельности и наиболее бурно
развивающейся отраслью индустрии информационных технологий.
Информационно-поисковая система - это система,
обеспечивающая поиск и отбор необходимых данных в специальной базе с описаниями
источников информации (индексе) на основе информационно-поискового языка и соответствующих
правил поиска.
В настоящее время для поиска информации в
постоянно увеличивающемся информационном пространстве могут использоваться две
принципиально разные информационно-поисковые системы (ИПС):
информационно-поисковые системы для глобальной сети и справочно-правовые
системы (СПС). Обе системы развиваются и функционируют независимо друг от
друга. Совместное использование этих систем позволяет быстро и качественно
решить задачу поиска информации при решении широкого круга инженерных задач.
Главной задачей любой ИПС является поиск
информации релевантной информационным потребностям пользователя. Очень важно в
результате проведенного поиска ничего не потерять, то есть найти все документы,
относящиеся к запросу, и не найти ничего лишнего. Поэтому вводится качественная
характеристика процедуры поиска - релевантность.
1.1 Информационно-поисковый язык и
информационно-поисковый словарь
Когда говорят об информационно-поисковой
системе, подразумевают, что она использует предметный указатель. Предметный указатель
позволяет отыскивать документы, касающиеся некоего "предмета". Для
составления предметного указателя анализируется содержание документа и
определяется "предмет" или "предметы", о которых в
документе идет речь. Затем названия этих предметов переводятся на
информационно-поисковый язык (ИПЯ). Таким образом, мы получаем поисковый образ
документа (ПОД). Проиндексировав (создав поисковые образы) все информационные
ресурсы, мы получаем то, что принято называть индексом (index database) -
основной массив данных ИПС.
Так как процесс поиска заключается в
сопоставлении запроса пользователя с имеющимися данными, полученный запрос
также должен быть переведен на ИПЯ. После сопоставления переведенного на ИПЯ
запроса и поисковых образов документов пользователь получает список ссылок на
документы, которые соответствуют, по мнению системы, его запросу.
Поиск происходит не по тексту документов, а по
их поисковым образам, составленным на ИПЯ. Поэтому ИПЯ - основная часть
информационно-поисковой системы, от которой в первую очередь зависит качество
системы. В состав информационно-поискового языка входят:
.Словарь индексированных терминов - множество
терминов индексирования.
.Кодовый словарь - множество кодовых терминов.
.Словарь входов - множество входных терминов.
. Вспомогательные средства языка индексирования
- средства, используемые совместно с индексационными терминами для расширения
или сужения определенных понятий.
.Правила использования языка индексирования.
Типовая схема ИПС, использующей предметное
индексирование, представлена на рис.1.1.
Рисунок 1.1 - Типовая схема ИПС
Для повышения эффективности поиска словарь,
используемый системой, должен быть контролируемым, то есть он должен быть
организован таким образом, чтобы полнота и точность поиска была оптимальной.
Очевидно, что организация словаря зависит от многих факторов - предметной
области, в которой будет использоваться ИПС, характера интересов пользователей,
степени их подготовки и т. д.
В общем виде процедура поиска является
процедурой итеративной, то есть за этапом выдачи результатов поиска следует
коррекция запроса, поиск по этому запросу и т. д. Схематично такая процедура
показана на рис. 1.2.
Рисунок 1.2 - Процедура поиска
Коррекция запроса происходит исходя из
количества полученных документов и их релевантности, и может выполняться как
пользователем, так и самой информационно-поисковой системой.
1.2 Подсистемы информационной
системы
В составе информационной системы можно выделить
три подсистемы:
.Организационно - технологическая подсистема
сбора информации обеспечивает информационную систему и включает совокупность
источников информации, организационно - технологической цепочки отбора
информации для накопления в системе. Без правильного организованной подсистемы
сбора информации невозможна эффективная организация функционирования все
информационной системы в целом.
.Подсистема предоставления и обработки
информации составляет ядро информационной системы и является отражением представления
разработчиками и абонентами системы структуры и картины предметной области,
сведения о которой должна отражать информационная система. Подсистема
представления и обработки информации является одним из наиболее сложных
компонентов при разработке информационной системы.
.Нормативно - функциональная подсистема выдачи
информации определяет пользователей, или иначе абонентов системы, реализует
целевой аспект назначения и выполнения задач информационной системы.
2. ФУНКЦИИ ИНФОРМАЦИОННО-ПОИСКОВЫХ
СИСТЕМ
Основой всех поисковых систем составляют базы
данных - совокупность данных организованных по предельным правилам,
предусматривающим общие принципы описания, хранения и манипулирования данными,
независимо от прикладных программ.
Можно выделить следующие элементы
функционирования информационных систем:
Сбор информации - организованный в специальном
порядке процесс сбора и отображения информации:
получение информации;
оценка относимости информации;
порядок отбора и фиксации информации.
Комплектование - процесс сложения информации из
множества частей в единое целое и доведения её до пользователя.
Поиск и выдача информации - установление
специального технологического порядка удовлетворения информационных
потребностей абонентов информационной системы в управленческой деятельности и
технологических процессах.
Поддержание целостности и сохранения информации
- пересмотр, ревизия и отсеивание утратившей актуальность информации являются
неотъемлемой функцией информационных подразделений. Сохранность информации
осуществляется с помощью нормативно - инструктивных документов.
По характеру предоставления логической
организации хранимой информации информационные системы разделяются на
фактографические, документальные и геоинформационные.
Фактографические информационные системы
накапливают и хранят данные в виде множества экземпляров одного или нескольких
типов структурных элементов. Каждый из таких экземпляров структурных элементов
или некоторая их совокупность отражают сведения, по какому - либо факту,
событию. Структура каждого типа информационного объекта состоит из конечного
набора реквизитов, отражающих основные аспекты и характеристики сведений для
объектов данной предметной области.
В документальных информационных системах
единичным элементом информации является нерасчлененный на более мелкие элементы
документ и информация при вводе, как правило, не структурируется, или
структурируются в ограниченном виде. Для вводимого документа могут
устанавливаться некоторые формализованные позиции - дата изготовления,
исполнитель, тематика. Некоторые виды документальных информационных систем
обеспечивают установление логической взаимосвязи вводимых документов -
соподчиненность по смысловому содержанию.
В геоинформационных системах данные организованы
в виде отдельных информационных объектов, привязанных к общей электронной
топографической основе. Геоинформационные системы применяются для
информационного обеспечения в тех предметных областях, структура информационных
объектов и процессов в которых имеется географический компонент.
Другим критерием классификации поисковых систем
являются функции или решаемые задачи. По данному признаку различаются
справочные, поисковые и расчётные системы.
Справочные являются наиболее распространенным
типом функций информационных систем, и заключается в предоставлении абонентам
системы возможностей получения установочных данных на определённые классы
объектов.
Поисковые являются наиболее распространённым
классом информационных систем. В общем, виде можно рассматривать как некое
информационное пространство, задаваемое в терминах информационно - логического
описания предметной области.
Расчетные заключается в обработке информации,
находящейся в системе, по определённым расчётным алгоритмам для различных
целей.
Технологические функции информационных систем заключаются
в автоматизации всего технологического цикла или отдельных его компонентов,
производственной или организационной структуры.
Таким образом, к основным функциям ИПС можно
отнести:
хранения больших объемов информации;
быстрого поиска требуемой информации;
добавления, удаления и изменения хранимой
информации;
вывода информации в удобном для человека виде.
Различают: - автоматизированные (coputerised);
библиографические (reference);
диалоговые (online);
документальные и фактографические информационно-поисковые
системы.
Информационно-поисковые системы в последнее
время начали ускоренно развиваться, появляются новые системы, они широко
рекламируются и продаются. Это обусловлено значительно возросшей потребностью
общества в эффективной работе с правовой и нормативно-технической информацией и
использованием при этом компьютерных информационно-поисковых систем. Широкое
распространение поисковых систем явилось подлинным прорывом в области
информатизации в России и дало возможность техническим специалистам предприятий
получить свободный доступ к правовым и нормативно-техническим документам.
Качество принятых специалистом решений зависит
от количества обработанной информации. В современных условиях обойтись без
мощного и удобного инструмента, помогающего в поиске и обработке информации,
невозможно. Эффективное использование поисковых систем зависит от того,
насколько технический специалист знает специфику, возможности и область
применения этих новых информационных систем.
Создание современных систем хранения информации
осуществляется двумя основными способами: с использованием иерархической и
гипертекстовой моделей. В иерархической модели используется многоуровневая
рубрикация при классификации информации. Для поиска документа используется его
краткое описание, составляемое при вводе информации в систему. Современная
гипертекстовая модель позволяет в электронных документах использовать ссылки на
другие документы.
Опыт эксплуатации различных систем обработки и
поиска информации, основанных на таких моделях указывает на то, что они не
лишены недостатков. Обе системы требуют значительных материальных затрат на
разработку и формирование, а значит, ограничены в объемах хранимой информации.
Формирование рубрикаторов и ссылок производится специалистами, а их
представление об информации и представление пользователя могут различаться.
3. ОБЗОР СОВРЕМЕННЫХ
ИНФОРМАЦИОННО-ПОИСКОВЫХ СИСТЕМ
Принятие обоснованных решений в сфере, как
экономики, так и политики невозможно без обладания достаточным объемом правовой
информации. Особенно остро эта необходимость ощущается в период реформирования
экономического и политического устройства. Задачу удовлетворения потребности в
своевременном предоставлении необходимого объема правовой информации решают
различные средства массовой информации (СМИ).
В этой области конкурируют как традиционные СМИ,
так и справочно-правовые системы (СПС). По-настоящему эффективная СПС может
быть создана только с применением современных информационных технологий.
Созданная таким образом СПС называется компьютерной.
Компьютерная справочно-правовая система - это
программный комплекс, включающий в себя массив правовой информации и
инструменты для работы с ним. Эти инструменты могут позволять производить поиск
документов, формировать подборки документов, выводить документы или их
фрагменты на печать. Преимущества компьютерных СПС очевидны. Это и доступность
информации, и удобство работы с нею. Проблема же, присущая таким системам, -
недостаточная оперативность - может быть решена с помощью глобальной сети
Интернет.
На рынке справочно-правовых систем в России
работает большое количество фирм как разрабатывающих собственные программные
комплексы, так и обслуживающих существующие. Наиболее известны следующие
продукты таких фирм (поданным АО "Консультант Плюс"):
"Консультант Плюс" (АО
"Консультант Плюс");
"ГАРАНТ" (НПП
"Гарант-Сервис");
"Кодекс" (Центр компьютерных
разработок).
"Эталон" (НЦПИ при Министерстве
юстиции РФ);
"Система" (НТЦ "Система" при
ФАПСИ).
Кроме того, на российском рынке представлены
такие системы, как:
"ЮСИС" (фирма "Инталекс");
"Референт" (ЗАО
"Референт-Сервис");
"Юридический мир" (издательство
"Дело и право");
"Ваше право" и "Юрисконсульт"
(фирма "Информационные системы и технологии");
"1C: Кодекс", "1C: Гарант",
"1C: Эталон" (компания "1C");
"Законодательство России" (Ассоциация
развития банковских технологий) и некоторые другие.
Различные продукты могут существенно различаться
не только по задачам, решаемым с их помощью, но и по качеству.
Качество СПС зависит как от качества
предоставляемой информации, так и от качества инструментов, используемых для
работы с ней. Применение самых последних компьютерных технологий не поможет,
если в СПС не содержится полной правовой информации или если информация
обновляется с недостаточной периодичностью. И наоборот, СПС, содержащая даже
самую полную и оперативно обновляющуюся информацию, не будет достаточно
эффективна, если не предоставлены качественные инструменты для обработки этой
информации. Таким образом, основными параметрами, позволяющими определить
качество содержания информационной базы, являются:
полнота информации;
достоверность информации;
оперативность обновления информации.
Параметры, характеризующие качество программной
оболочки:
поисковые возможности системы;
средства актуализации информации;
дополнительные сервисные функции.
Рассмотрим основные справочные системы.
3.1 Справочно-правовая система
«Консультант Плюс»
Справочно-правовая система «Консультант Плюс»
создана АО «Консультант Плюс» и распространяется с 1992г. Система хорошо
известна и по состоянию на начало 2005г. занимает одну из лидирующих позиций на
территории России. Сеть компании «Консультант Плюс» объединяет более 300
региональных информационных центров, производящих поставку СПС, сервисное
обслуживание и передачу информации пользователям. Справочно-правовая система
«Консультант Плюс» содержит самые разные типы правовой информации: от
нормативных актов, материалов судебной практики, комментариев, законопроектов,
финансовых консультаций, схем отражения операций в бухучете до бланков
отчетности и узкоспециальных документов, документы содержатся в едином
информационном массиве «Консультант Плюс». Поскольку документы каждого типа
имеют свои специфические особенности, они включаются в соответствующие разделы
информационного массива: законодательство, судебная практика, финансовые
консультации, комментарии законодательства, формы документов, законопроекты,
международные правовые акты, правовые акты по здравоохранению.
Для поиска документов в СПС «Консультант Плюс»
можно использовать несколько инструментов, главный из них - карточка поиска.
Карточка поиска представляет собой таблицу с
некоторым количеством поисковых полей. Для каждого поискового поля в системе
предусмотрен словарь, автоматически заполняемый и корректируемый по мере
поступления документов в информационную базу (ИБ). При вводе в систему каждого
документа его реквизиты заносятся в соответствующий словарь.
В СПС «Консультант Плюс» имеется возможность
перенести найденный документ или его часть в текстовый редактор Word, чтобы
вставить цитаты в собственный материал.
В программе «Консультант Плюс» имеется Правовой
навигатор. Он представляет собой алфавитно-предметный указатель, состоящий из
ключевых понятий. Близкие ключевые понятия объединены в Группы. Такая
двухуровневая структура облегчает выбор ключевых понятий, когда вы указываете
их для поиска документов.
Все базы СПС «Консультант Плюс» связаны между
собой через гипертекстовые ссылки, позволяющие нажатием клавиши моментально
перейти, например, из текста консультации в текст нормативного документа, на
который ссылается автор ответа. Самое главное, что дает гипертекст
пользователям - это возможность без дополнительных усилий проследить логику
рассуждений автора, быстро просматривая по ходу чтения консультации нормативные
акты, используемые им для аргументации своей позиции по тому или иному вопросу.
3.2 Справочная правовая система
«Гарант»
Справочная правовая система «Гарант»
распространяется с 1990 г. и вполне заслуженно пользуется широкой популярностью
у большого числа пользователей на рынке СПС. Ее разработала и распространяет
компьютерная фирма-разработчик справочных правовых систем -
Научно-производственное предприятие (НПП) «Гарант-Сервис».
Фирма активно сотрудничает с Правовым
управлением Государственной думы и рядом других государственных учреждений и
организаций. Она обладает высокотехнологичным и наукоемким производством с
большим штатом сотрудников в Москве и широкой сетью представительств в России и
за рубежом.
Система «Гарант» представляет собой справочную
систему, которая обеспечивает поиск и работу с различными документами правового
характера. В систему входят нормативные документы, комментарии и разъяснения,
судебная и арбитражная практика, а также толковые словари.
Система имеет механизм периодического обновления
информационных баз, поэтому вы все время будете в курсе последних изменений в
законодательстве.
В системе «Гарант» имеется целая группа малых и больших
информационно-правовых блоков, из которых пользователь может выбрать
необходимые ему по роду деятельности и составить индивидуальный комплект, в
котором будет осуществляться сквозной поиск документов.
Комплект «Гарант-Максимум» включает в себя все блоки
федерального и один блок регионального законодательств. В данный комплект
входят документы по всем разделам законодательства: уголовное, административное
и международное право, а также судебная и арбитражная практика и многое другое.
Некоторые специальные информационные блоки не
имеют на сегодняшний день аналогов в других СПС. К ним относятся
«Законодательство в схемах», «Проекты законов», «Комментарии к
законодательству», «Законодательство России на английском языке».
Довольно часто возникает ситуация, когда при
обращении к той или иной СПС пользователю известна только рассматриваемая
проблема, а информации о формальных реквизитах документа нет. В таких случаях
без мощной системы поиска по ситуации найти нужную норму права практически
невозможно. В СПС «Гарант» эту задачу решает двухуровневый словарь ключевых
слов («Энциклопедия ситуаций»).
3.3 Информационно-правовые системы
серии «Кодекс»
Разработчиком информационно-правовой системы
(ИПС) «Кодекс» является государственное предприятие «Центр компьютерных
разработок» (ГП «ЦКР», Санкт-Петербург), созданное в начале 1991 г.
Продажи первой версии системы, содержащей
нормативные акты Санкт-Петербурга и России, начались в мае 1992 г.
ИПС «Кодекс» относится к программным продуктам,
выполненным на хорошем профессиональном уровне, обладающим положительными
характеристиками по всем основным параметрам (полнота, оперативность,
юридическая обработка и др.).
Информационные продукты «Кодекс» включают в
себя: профессиональные юридические системы, системы судебной и арбитражной
практики, специализированные справочные системы, электронные правовые
справочники.
Независимо от количества подключенных
информационных баз работа осуществляется в едином информационном пространстве,
связанном гиперссылками.
Единая линия программных продуктов включает в
себя ряд разработок, в том числе программный комплекс «Кодекс-Мастер»,
представляющий собой набор инструментальных средств для создания и управления
полнотекстовыми информационно-поисковыми системами различного направления.
Принцип открытости информационной системы
«Кодекс» позволил с помощью комплекса «Кодекс-Мастер» создать новые проекты,
при этом существенно расширив спектр информационных продуктов «Кодекса»,
например: «Ассистент аудитора», «Жилищно-коммунальное хозяйство России»,
«Промышленная безопасность», что крайне актуально в нашу эпоху техногенных
катастроф.
Важным направлением деятельности консорциума
«Кодекс» является предоставление доступа к правовой информации через Интернет,
обеспечивая как коммерческий, так и свободный доступ к правовым ресурсам
системы «Кодекс».
3.4 Системы серии «Референт»
информационный поисковый система
гарант
ЗАО «Референт-Сервис» в конце 1995 г.
зарегистрировало интегрированную информационную систему (ИИС) «Референт»,
распространение которой началось с 1996 г. К этому времени СПС «Консультант
Плюс», «Гарант» и «Кодекс» уже были известными лидерами рынка, и
«Референт-Сервис» имел возможность учесть все лучшее, что было достигнуто этими
фирмами.
Системы семейства «Референт» состоят из оболочки
и информационных модулей. В настоящее время наибольшей популярностью пользуется
оболочка «Референт-2000». Она позволяет одновременно работать с локальными
базами данных и с Интернет-серверами правовой информации, а также создавать
внутри оболочки собственную базу данных с мощным редактором и инструментами
администрирования.
Справочные правовые системы семейства «Референт»
имеют удобный дружественный интерфейс и реализуют все основные функции
традиционных правовых баз по поиску документов, а также по работе со списком и
текстом документов.
Интерфейс «Референта» максимально приближен к
Windows, благодаря чему пользователю не потребуется тратить много времени на
освоение программы. «Референт» поддерживает функцию Drag and Drop, позволяющую
при формировании запроса для поиска документов перемещать информацию по экрану
при помощи мыши. Сам поиск можно производить одновременно в объединенных
модулях, а ряд документов содержит встроенные цветные графические объекты,
например герб России или Москвы.
Встроенный редактор документов позволяет не
только редактировать тексты, но и создавать карту документа, вносить
комментарии, а также вставлять графические изображения, в том числе и
анимированные (движущиеся), и расставлять гипертекстовые ссылки.
Еще одной особенностью оболочки «Референт»
является возможность создания и ведения собственной базы документов, содержащей
до 200 документов, включая графику и видео. Эта функция особенно интересна для
фирм с небольшим документооборотом и численностью. Крупным фирмам предлагается система
хранения документов объемом до 65000 документов.
ЗАКЛЮЧЕНИЕ
Наиболее простой способ получить информацию в
постоянно расширяющемся информационном пространстве Internet является
использование различных поисковых машин. Основной функцией такой машины
является автоматический просмотр узлов Сети и сбор необходимой информации.
Собранная информация подвергается индексированию, т. е. выстраивается в
определенном порядке и классифицируется по определенному критерию. В дальнейшем
эта информация используется для обслуживания запросов клиентов.
Специализированные каталоги или справочники
создаются по отдельным отраслям и темам, новостям, городам, адресам электронной
почты и т. п.
При обслуживании пользователя реализуются два
основных подхода: поиск информации либо путем перемещения по дереву
иерархического каталога, либо формирование поискового запроса в рамках
поддерживаемого системой поискового языка.
Для пользователя современного Internet основной
проблемой является организация эффективного поиска информации. Трудности,
связанные с решением этой проблемы, очевидно, с течением времени будут
возрастать, так как каждые четыре месяца объем информации в сети удваивается.
СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ
1. Алексеев Е.Г., Богатырев
С.Д. Информатика. Мультимедийный электронный учебник.
2. Ашманов И.С.
Продвижение сайта в поисковых системах / И. С. Ашманов. - М.: «Вильямс», 2007.
- 304 с.
. Ивасенко А.Г.
Информационные технологии в экономике и управлении: учебное пособие / А.Г.И
васенко, А.Ю. Гридасов, В.А. Павленко.- 2-е изд., стер.- М.: КНОРУС, 2007.-
160с.
. Информатика. Базовый
курс: учебник / под ред. С. В. Симоновича. - СПб.: «Питер», 2007.- 110 с.
. Кадеев Д.Н.
Информационные технологии и электронные коммуникации / Д.Н. Кадеев.- М.:
«Электро», 2005.- 250 с.
. Колисниченко Д.Н.
Поисковые системы и продвижение сайтов в Интернете / Д.Н. Колисниченко. - М.:
«Диалектика», 2007. - 272 с.
. Ландэ Д.В. Поиск
знаний в Internet / Д.В. Ландэ. - М.: «Диалектика», 2005. - 272 с.
. Маннинг К. Введение в
информационный поиск / К. Маннинг. - М.: «Вильямс», 2011.- 200 с.
. Михеева Е.В.
Информационные технологии в профессиональной деятельности: учебное пособие.-
М.: ТК ВЕЛБИ, Изд-во Проспект, 2007.- 448с.
. Организация работы с
документами: Учебник / Под ред. проф. В.А. Кудряева.- 2-е изд., перераб. и
доп.- М.: ИНФРА-М, 2001.- 592с.
. Сахарова Е.В.
Информатика. Методические указания / Е.В. Сахарова.- Ставрополь: СТИС, 2006.-
200 с.
. Чурсин Н.А. Популярная
информатика / Н.А. Чурсин.- М.: «Вильямс», 2007.- 300 с.