Принципи індексування документів в мережі Інтернет

  • Вид работы:
    Реферат
  • Предмет:
    Информационное обеспечение, программирование
  • Язык:
    Русский
    ,
    Формат файла:
    MS Word
    22,73 kb
  • Опубликовано:
    2010-10-23
Вы можете узнать стоимость помощи в написании студенческой работы.
Помощь в написании работы, которую точно примут!

Принципи індексування документів в мережі Інтернет

Зміст

1. Індексування: технологія, принципи

2. Транспортні ресурси мережі Інтернет

Список використаних джерел

1. Індексування: технологія, принципи

Здійснення ефективного пошуку документів можливе лише за умови певної організації зберігання самих документів і відомостей про них. Інакше кажучи, необхідно дотримуватися зручного порядку в розташуванні документів у фондосховищах та їхніх бібліографічних записів у пошукових масивах. Для цього доцільно групувати документи і бібліографічні записи їх за певними ознаками. Ознаками групування можуть виступати формальні характеристики документів (прізвища авторів, назви творів, роки видання тощо), але для здійснення тематичного бібліографічного пошуку, тобто пошуку документів за їхнім змістом, як основні мають виступати саме ознаки змісту. Групування документів відповідно до їх тематики, галузі знання і забезпечує індексування [2, c. 44].

Суть індексування полягає в тому, щоб передати зміст документів, а в разі необхідності й деякі формальні ознаки у вигляді коротких закодованих повідомлень, так званих пошукових образів документів (ПОД). Наявність ПОД забезпечує подальший пошук документів завдяки зіставленню ПОД із пошуковим приписом.

Індексування здійснюється на основі певних інформаційно-пошукових мов. Інформаційно-пошукова мова (ІПМ) — це спеціалізована штучна мова, призначена для передачі змісту і формальних ознак документів, а також інформаційних запитів пошуку потрібних документів. Як будь-яка мова, ІПМ має абетку (система графічних знаків для запису слів і виразів), лексику (сукупність слів, якими користується мова), граматику (засоби, правила, якими користуються для побудови і поєднання слів). Індексуючи документ, здійснюють переклад відомостей про нього з природної мови на штучну — інформаційно-пошукову.

Залежно від ІПМ, яка використовується в тому чи іншому пошуковому масиві, документи підлягають обробці за такими видами індексування: систематизація, предметизація, координатне індексування. Усі ці види індексування пов'язані з розподілом документів за певними класами. Далі розглядатимуться ІПМ класифікаційного типу, на яких базуються предметизація та систематизація і які більше поширені. ІПМ, покладені в основу координатного індексування, використовуються в автоматизованій інформаційно-пошуковій системі (АІПС) і розглядатимуться в курсах інформатики.

Початковим, найпростішим методом розподілу сукупності певних об'єктів є метод групування, тобто розчленування цієї сукупності на групи якісно однорідних об'єктів. У групи об'єкти об'єднуються за найпростішими, зазвичай зовнішніми ознаками, які не розкривають природу і суть досліджуваних явищ, наприклад, групування людей за зростом або кольором волосся. Документи та бібліографічні записи їх також можуть групуватися, наприклад, за абеткою прізвищ авторів, номерами, місцями або роками видання й т. ін.

На більш високому рівні розвитку дослідницького процесу стоїть класифікація. У науці під класифікацією розуміють процес розподілу чисельності об'єктів на підчисельності (класи, підкласи). Оскільки такий розподіл здійснюється за істотними, найважливішими ознаками об'єктів, виникають взаємопов'язані класи, встановлюються зв'язки між окремими об'єктами. Таким чином, для класифікації характерне більш глибоке проникнення в суть досліджуваних об'єктів, що визначається усвідомленням їхніх загальних ознак, властивостей і відношень. У результаті розподілу об'єктів створюється система супідрядних понять (класів). Якщо класи відображають поняття якоїсь галузі знання або діяльності людей, така система також називається класифікацією [4, c. 45].

Класифікація широко використовується в науковій і практичній діяльності людей. Це метод дослідження, який дає змогу впорядкувати явища, предмети і тим самим полегшує процес їх вивчення, допомагає розкрити внутрішні закономірності об'єктивного світу. Кожна наука розробляє класифікацію об'єктів свого вивчення, без чого неможливе узагальнення закономірностей їх розвитку.

Кожен предмет, явище, процес мають багато ознак. Навіть такий простий предмет, як стіл, може мати ознаки форми (круглий, квадратний, овальний), призначення (письмовий, обідній, журнальний), матеріалу (дерев'яний, металевий, пластмасовий) тощо. Істотність ознаки, обраної для класифікації об'єктів, визначається завданнями і метою дослідження, тобто з усіх ознак обираються ті, що найбільше сприяють вирішенню поставлених дослідником завдань. Ознака, за якою здійснюється класифікація об'єктів, називається основою ділення. Так, класифікуючи художню літературу, основою ділення найчастіше обирають національну ознаку — українська література, польська література, французька література. Кожну з національних літератур, у свою чергу, можна поділити на прозові твори й поетичні, а далі на жанри, наприклад, романи, оповідання, нариси тощо.

Важливе значення має класифікація у бібліотечній, бібліографічній, видавничій, архівній, книготорговельній, науково-інформаційній та інших видах діяльності. Об'єктом класифікації в названих галузях виступають документи, тому класифікації називаються документними.

Документні класифікації в органах НТІ забезпечують доведення інформаційних повідомлень до абонентів інформації і, відповідно, впровадження останніх досягнень науки у виробництво, поширення цінного досвіду. У бібліотечних фондах зібрано документи, які відображають духовні надбання людства, і метою бібліотечних класифікацій є сприяння прилученню читачів до цих надбань, сприяння їхньому вихованню і навчанню, культурному розвитку суспільства. У видавничій, книготорговельній справі класифікація дає змогу забезпечити публікацію документів з різноманітних галузей науки, сфер діяльності, тем і проблем, довести інформацію про опубліковані видання та видання, що готуються до друку, до зацікавлених споживачів. Документні класифікації в архівах допомагають упорядкувати їхні фонди, сприяють вивченню досвіду людства, надбанню знань про минуле. Класифікації, які використовуються в діловодстві, дають змогу підтримувати зручний порядок у зберіганні ділової документації і завдяки цьому полегшують управлінську діяльність.

Щоб класифікація успішно розв'язувала поставлені перед нею завдання, вона має відповідати певним вимогам.

Будь-яка класифікація є результатом логічної операції, що базується на загальних правилах, сформульованих формальною логікою. По-перше, ділення на класи має здійснюватися за однією певною основою ділення і не змінюватися в процесі ділення. По-друге, ділення має здійснюватися безперервно, тобто між членами ділення є відношення супідрядності (родове поняття поділяється на видові, ціле — на частини). По-третє, члени ділення мають виключати один одного, тобто не може бути в різних місцях класифікації однакових класів. У структурному відношенні класифікація має бути повною, тобто охоплювати весь обсяг об'єктів, що класифікуються. З іншого боку, для всіх без винятку об'єктів мають бути оформлені класи, до яких можна було б зарахувати будь-який з об'єктів класифікації.

Це загальні правила, на яких будуються будь-які класифікації і, зокрема, документні. Крім того, до документних класифікацій висуваються деякі специфічні, характерні саме для них вимоги. Суть вимоги науковості полягає в тому, що класифікація має відтворювати сучасний рівень розвитку науки і практичної діяльності людей, реальні зв'язки між галузями науки і сферами діяльності, об'єктивні закони розвитку природи і суспільства. Класифікація має надавати можливість відображення документів з найактуальнішої тематики, про найновіші досягнення науки і виробництва, має відображати стан терміносистеми в певній галузі знання. Класифікація має використовувати найновіші досягнення теорії інформаційного пошуку, каталогізації та інших суміжних дисциплін.

Універсальність класифікації полягає у максимальній повноті відображення всієї сукупності людських знань; у наданні можливості відобразити документи на різних носіях інформації, виданих різними мовами; у можливості використання в інформаційних установах різних профілів і масштабу; документів, які відповідають на запити як загального, так і вузькофахового характеру.

Вимога багатоаспектності виявляється у можливості класифікації відображати документи в різних аспектах з урахуванням їх змісту і певних формальних ознак (вид, читацьке призначення, мова публікації тощо) [1, c. 36].

І, нарешті, до класифікації ставиться вимога чіткості й простоти побудови, що забезпечує одержання потрібної інформації у мінімальні строки при найменших затратах праці й у стислому обсязі.

2. Транспортні ресурси мережі Інтернет

 

"Автоперевізник" #"_Toc212363635">Список використаних джерел

1.   Бондаренко М. Ф., Маторін С. І., Єльчанінов Д. Б. Системна технологія моделювання інформаційних і організаційних систем. — Х.: ХНУРЕ, 2005. — 112 с.

2.   Волочій Б. Ю. Технологія моделювання алгоритмів поведінки інформаційних систем. — Л.: Видавництво Національного ун-ту "Львівська політехніка", 2004. — 220 с.

3.   Інтегровані інформаційні технології та системи (ІІТС-2005): Матеріали наук.-практ. конф. мол. учених та аспірантів, 21-23 листопада 2005 р. — К.: НАУ, 2005. — 180 с.

4.   Карпенко С. Г., Попов В. В., Тарнавський Ю. А., Шпортюк Г. А. Інформаційні системи і технології. — К.: МАУП, 2004. — 192 с.

5.   Плескач В. Л., Рогушина Ю. В., Кустова Н. П. Інформаційні технології та системи. — К.: Книга, 2004. — 519 с.

Похожие работы на - Принципи індексування документів в мережі Інтернет

 

Не нашли материал для своей работы?
Поможем написать уникальную работу
Без плагиата!