Інформаційно –пошукові системи (ІПС)
Інформаційно-пошукові системи
— це різновид автоматизованих інформаційних систем, в яких завершальна обробка даних не передбачається. Ці системи призначені для пошуку текстів (документів, їх частин, фактографічних записів) в сховищах (базах даних) за формальними характеристиками. Тому в роботі ІПС можна виділити два основних етапи: перший — збір і зберігання інформації, другий — пошук і видача інформації користувачам.
В економіці ІПС можуть використовуватися для зберігання і пошуку нормативних, планових, бухгалтерських та інших документів, даних для наукових досліджень.
ІПС відрізняються одна від одної за багатьма ознаками, але при вирішенні задач збору, зберігання і видачі інформації мають такі спільні процедури:
аналіз документів і їх добір;
створення пошукового образу документів (ПОД);
запис документів і їх пошукових образів на прийняті носії;
зберігання документів і ПОД;
аналіз запитів;
видача документів користувачам.
ІПС можна класифікувати за такими ознаками:
родом виконуваних операцій;
режимом пошуку;
типом інформаційно-пошукової мови (ІПМ);
типом критерію відповідності;
ступенем автоматизації.
За першою ознакою ІПС діляться на документальні, фактографічні, логічні і комплексні.
Документальні ІПС на інформаційні запити видають адреси зберігання пошукових образів, оригінали чи копії документів з необхідною інформацією.
Фактографічні ІПС у відповідь на введені в них інформаційні запити безпосередньо видають відповідні фактичні дані (структурний склад, формули, характеристики матеріалів і тому подібне).
Логічні ІПС видають на запит не лише введену раніше інформацію, але, якщо необхідно, виконують логічну переробку цієї інформації для одержання нової, що явно в систему не вводилась.
Комплексні ІПС містять сукупність елементів документальних, фактографічних і логічних ІПС.
За режимом пошуку ІПС діляться на системи, що працюють в режимі вибіркового розподілу інформації, тобто за постійними інформаційними запитами в масивах постійно поповнюваних документів, і системи ретроспективного пошуку за разовими змінними запитами абонентів з пошуком документів з даної тематики в масивах.
За типом інформаційно-пошукової мови ІПС класифікуються на системи з природними (людськими) і інформаційними мовами. Інформаційно-пошукові мови — це синтетично створені мови для ідентифікації і пошуку документів за запитом (наприклад, дескрипторна мова).
За критерієм відповідності, тобто сукупністю правил визначення ступеня формальної відповідності між ПОД (ПОД — виражений у термінах мови ІПС основний зміст документа, що займає значно менше машинної пам’яті від повного змісту документа) і пошуковим розпорядженням ПР (ПР — виражений у термінах ІПС пошуковий запит), ІПС поділяються на системи з використанням логічних схем (І, ЧИ, НЕ); з використанням аналітичних функцій (статистичні і векторні критерії); з використанням «вагових» функцій чи коефіцієнтів; з аналізом критерію відповідності на збіг чи часткове входження (пошукового розпорядження в ПОД).
За ступенем автоматизації ІПС класифікуються на системи з автоматичною класифікацією масивів (формування в ПОД породження класів за мітками, на основі асоціативних зв’язків між термінами в ПОД), системи з автоматичним пошуком для сортування і порівняння ПОД з пошуковим розпорядженням, системи з автоматичним індексуванням для автоматизації процесів згортання при реферуванні, анотуванні, виборі ключових слів і т. ін., системи з автоматичною видачею різновидів інформації (бібліографічних описів, ПОД, копій документів), системи з автоматичним управлінням (при наявності зворотного зв’язку і зміни режимів пошуку в ІПС).
Як уже зазначалося, на основі ІПМ використовують два основних режими чи методи організації пошуку: з вибірковим розподілом інформації і з ретроспективним пошуком.
При цьому застосовують різні мовні засоби, залежно від категорії користувачів і можливостей мов. Використовують мови, що забезпечують тільки можливості запитів, тобто виведення даних на екран чи друк в необхідному форматі; комплексні мови запитів-обновлень, що як більш розвинені мови дозволяють формулювати запити, які стосуються декількох взаємозв’язаних записів і дозволяють поновляти дані так же легко, як і формулювати запити; генератори звітів, що дозволяють вибирати необхідні дані і форматувати їх у вигляді потрібних форм документів; графічні мови, що дозволяють виводити інформацію у вигляді різних графіків і діаграм та інших зображувальних засобів.
При створенні ІПС неминуче виникає потреба у створенні тезаурусу системи, тобто набору спеціальних термінів для кодування понять та зв’язків між ними. Тезаурус дозволяє виражати зміст документів та запитів формалізованою інформаційною мовою.
Найбільш поширеними в сучасних автоматизованих ІПС є тезауруси з використанням мов дескрипторного типу, на відміну від тезаурусів з мовами класифікаційного типу, що використовуються, наприклад, в бібліотечно-бібліографічній класифікації з фіксованим обмеженим списком слів і словосполучень. Дескрипторами можуть бути окремі слова або словосполучення із групи синонімічних чи близьких за значенням слів, що використовуються в системі для контрольованого індексування (кодування) змісту документів і запитів встановленням відповідності між текстом документа і набором ключових дескрипторів.
В економіці ІПС можуть використовуватися для зберігання і пошуку нормативних, планових, бухгалтерських та інших документів, даних для наукових досліджень.
ІПС відрізняються одна від одної за багатьма ознаками, але при вирішенні задач збору, зберігання і видачі інформації мають такі спільні процедури:
аналіз документів і їх добір;
створення пошукового образу документів (ПОД);
запис документів і їх пошукових образів на прийняті носії;
зберігання документів і ПОД;
аналіз запитів;
видача документів користувачам.
ІПС можна класифікувати за такими ознаками:
родом виконуваних операцій;
режимом пошуку;
типом інформаційно-пошукової мови (ІПМ);
типом критерію відповідності;
ступенем автоматизації.
За першою ознакою ІПС діляться на документальні, фактографічні, логічні і комплексні.
Документальні ІПС на інформаційні запити видають адреси зберігання пошукових образів, оригінали чи копії документів з необхідною інформацією.
Фактографічні ІПС у відповідь на введені в них інформаційні запити безпосередньо видають відповідні фактичні дані (структурний склад, формули, характеристики матеріалів і тому подібне).
Логічні ІПС видають на запит не лише введену раніше інформацію, але, якщо необхідно, виконують логічну переробку цієї інформації для одержання нової, що явно в систему не вводилась.
Комплексні ІПС містять сукупність елементів документальних, фактографічних і логічних ІПС.
За режимом пошуку ІПС діляться на системи, що працюють в режимі вибіркового розподілу інформації, тобто за постійними інформаційними запитами в масивах постійно поповнюваних документів, і системи ретроспективного пошуку за разовими змінними запитами абонентів з пошуком документів з даної тематики в масивах.
За типом інформаційно-пошукової мови ІПС класифікуються на системи з природними (людськими) і інформаційними мовами. Інформаційно-пошукові мови — це синтетично створені мови для ідентифікації і пошуку документів за запитом (наприклад, дескрипторна мова).
За критерієм відповідності, тобто сукупністю правил визначення ступеня формальної відповідності між ПОД (ПОД — виражений у термінах мови ІПС основний зміст документа, що займає значно менше машинної пам’яті від повного змісту документа) і пошуковим розпорядженням ПР (ПР — виражений у термінах ІПС пошуковий запит), ІПС поділяються на системи з використанням логічних схем (І, ЧИ, НЕ); з використанням аналітичних функцій (статистичні і векторні критерії); з використанням «вагових» функцій чи коефіцієнтів; з аналізом критерію відповідності на збіг чи часткове входження (пошукового розпорядження в ПОД).
За ступенем автоматизації ІПС класифікуються на системи з автоматичною класифікацією масивів (формування в ПОД породження класів за мітками, на основі асоціативних зв’язків між термінами в ПОД), системи з автоматичним пошуком для сортування і порівняння ПОД з пошуковим розпорядженням, системи з автоматичним індексуванням для автоматизації процесів згортання при реферуванні, анотуванні, виборі ключових слів і т. ін., системи з автоматичною видачею різновидів інформації (бібліографічних описів, ПОД, копій документів), системи з автоматичним управлінням (при наявності зворотного зв’язку і зміни режимів пошуку в ІПС).
Як уже зазначалося, на основі ІПМ використовують два основних режими чи методи організації пошуку: з вибірковим розподілом інформації і з ретроспективним пошуком.
При цьому застосовують різні мовні засоби, залежно від категорії користувачів і можливостей мов. Використовують мови, що забезпечують тільки можливості запитів, тобто виведення даних на екран чи друк в необхідному форматі; комплексні мови запитів-обновлень, що як більш розвинені мови дозволяють формулювати запити, які стосуються декількох взаємозв’язаних записів і дозволяють поновляти дані так же легко, як і формулювати запити; генератори звітів, що дозволяють вибирати необхідні дані і форматувати їх у вигляді потрібних форм документів; графічні мови, що дозволяють виводити інформацію у вигляді різних графіків і діаграм та інших зображувальних засобів.
При створенні ІПС неминуче виникає потреба у створенні тезаурусу системи, тобто набору спеціальних термінів для кодування понять та зв’язків між ними. Тезаурус дозволяє виражати зміст документів та запитів формалізованою інформаційною мовою.
Найбільш поширеними в сучасних автоматизованих ІПС є тезауруси з використанням мов дескрипторного типу, на відміну від тезаурусів з мовами класифікаційного типу, що використовуються, наприклад, в бібліотечно-бібліографічній класифікації з фіксованим обмеженим списком слів і словосполучень. Дескрипторами можуть бути окремі слова або словосполучення із групи синонімічних чи близьких за значенням слів, що використовуються в системі для контрольованого індексування (кодування) змісту документів і запитів встановленням відповідності між текстом документа і набором ключових дескрипторів.
труктуру людино-машинної ІПС можна подати у вигляді схеми, показаної на рис. 11.1. Загальна функціонально-структурна схема ІПС може мати вигляд, поданий на рис. 11.2.
Як видно із рис. 11.2, на вході в систему документи, що надходять, аналізуються і відбираються. Їм і їх копіям присвоюються адреси, за якими вони надсилаються на зберігання. Крім того, на дібрані документи складаються їх пошукові образи (переважно вручну), що направляються в сховище ПОД. Створення ПОД полягає в семантичному аналізі основного змісту документа та описі його мовою ІПС. Процес створення ПОД і ПР ще називають індексуванням.
Документи, їх копії і пошукові образи не тільки знаходяться в різних сховищах, але можуть розміщуватися і на різних носіях (паперових, магнітних, оптичних і т. ін.). В сучасних ІПС копії документів і їх ПОД переважно розміщуються на магнітних і лазерних носіях у відповідних базах даних. Видозмінюються в конкретних умовах і принципи роботи ІПС.
Як видно із рис. 11.2, на вході в систему документи, що надходять, аналізуються і відбираються. Їм і їх копіям присвоюються адреси, за якими вони надсилаються на зберігання. Крім того, на дібрані документи складаються їх пошукові образи (переважно вручну), що направляються в сховище ПОД. Створення ПОД полягає в семантичному аналізі основного змісту документа та описі його мовою ІПС. Процес створення ПОД і ПР ще називають індексуванням.
Документи, їх копії і пошукові образи не тільки знаходяться в різних сховищах, але можуть розміщуватися і на різних носіях (паперових, магнітних, оптичних і т. ін.). В сучасних ІПС копії документів і їх ПОД переважно розміщуються на магнітних і лазерних носіях у відповідних базах даних. Видозмінюються в конкретних умовах і принципи роботи ІПС.
незалежній Україні на основі зарубіжного досвіду (насамперед — американського) створюється національна сільськогосподарська інформаційно-пошукова система, роботи щодо створення якої координують Міністерство агропромислового комплексу України та Українська академія аграрних наук (УААН). Першим етапом таких робіт є розробка національної комп’ютерної інформаційної системи наукового обслуговування УААН «Агронаука», яка підвищить ефективність розробки і впровадження наукових досліджень у галузі.
Система «Агронаука» забезпечить доступ до вітчизняних та зарубіжних банків даних та знань різного підпорядкування, полегшить обмін інформацією між науково-дослідними установами, консультаційними центрами і пунктами, надаватиме допомогу окремим користувачам в прийнятті рішень сільськогосподарського і інших напрямків. При розробці системи особлива увага приділяється створенню якісного її тезаурусу, який дозволив би ефективно кодувати зміст документів і запитів користувачів, навіть висловлених звичайною мовою.
Система орієнтується на використання відомого пакета прикладних програм CDS/ISIS, розробленого ЮНЕСКО для автоматизованого зберігання, пошуку і обробки інформації в діалоговому режимі як автономно, так і в мережах.
Особливостями системи CDS/ISIS є:
можливість обробки в режимі діалогу багатьох баз даних;
використання розвинутих лінгвістичних засобів для складання ІПС з неконтрольованою лексикою пошукових мов, або з мовами дискрипторного типу;
універсальність структур даних, можливість доступу до всіх полів документів та інвертування будь-якого елемента бази даних для використання як ключа доступу при пошукових операціях;
можливість розширення пакета за рахунок підімкнення модулів користувача;
автоматизація ретроспективного пошуку, підготовки рефератів та розподіленого поширення інформації.
Використання вказаного пакета має важливе значення з точки зору налагодження інформаційних зв’язків з іноземними установами, оскільки на його основі працює інформаційна система Продовольчої і сільськогосподарської організації Об’єднаних Націй AGRIS. Для функціонування AGRIS уже розроблений багатомовний сільськогосподарський словник-тезаурус AGROVOC на 15 тис. термінів, створені бази даних AGRIN (про наукові публікації) та CARIS (про проекти та незавершені наукові розробки). Користувачі AGRIS дістають інформацію на магнітних носіях та компактних дисках, а на замовлення і на паперових носіях. Доступ до оперативної інформації забезпечується безпосереднім зв’язком з БД AGRIS через міжнародні телекомунікаційні мережі TYMNET, INTERNET і інші.
Подібні інформаційні системи створюються і в інших сферах. Наприклад, при технічній допомозі програми «TACIS» на державному рівні, а також у Донецькому, Дніпропетровському, Вінницькому, Луганському, Львівському, Миколаєвському, Одеському та Сумському управліннях сільського господарства облдержадміністрацій створюються автоматизовані системи моніторингу продовольчого ринку. З допомогою WEB-сервера, що функціонує в Мінагропромі, сховищем даних про продовольчий ринок і іншою інформацією можуть скористатись в автоматизованому режимі всі зацікавлені служби і окремі громадяни, котрі мають доступ до системи Internet.
Система «Агронаука» забезпечить доступ до вітчизняних та зарубіжних банків даних та знань різного підпорядкування, полегшить обмін інформацією між науково-дослідними установами, консультаційними центрами і пунктами, надаватиме допомогу окремим користувачам в прийнятті рішень сільськогосподарського і інших напрямків. При розробці системи особлива увага приділяється створенню якісного її тезаурусу, який дозволив би ефективно кодувати зміст документів і запитів користувачів, навіть висловлених звичайною мовою.
Система орієнтується на використання відомого пакета прикладних програм CDS/ISIS, розробленого ЮНЕСКО для автоматизованого зберігання, пошуку і обробки інформації в діалоговому режимі як автономно, так і в мережах.
Особливостями системи CDS/ISIS є:
можливість обробки в режимі діалогу багатьох баз даних;
використання розвинутих лінгвістичних засобів для складання ІПС з неконтрольованою лексикою пошукових мов, або з мовами дискрипторного типу;
універсальність структур даних, можливість доступу до всіх полів документів та інвертування будь-якого елемента бази даних для використання як ключа доступу при пошукових операціях;
можливість розширення пакета за рахунок підімкнення модулів користувача;
автоматизація ретроспективного пошуку, підготовки рефератів та розподіленого поширення інформації.
Використання вказаного пакета має важливе значення з точки зору налагодження інформаційних зв’язків з іноземними установами, оскільки на його основі працює інформаційна система Продовольчої і сільськогосподарської організації Об’єднаних Націй AGRIS. Для функціонування AGRIS уже розроблений багатомовний сільськогосподарський словник-тезаурус AGROVOC на 15 тис. термінів, створені бази даних AGRIN (про наукові публікації) та CARIS (про проекти та незавершені наукові розробки). Користувачі AGRIS дістають інформацію на магнітних носіях та компактних дисках, а на замовлення і на паперових носіях. Доступ до оперативної інформації забезпечується безпосереднім зв’язком з БД AGRIS через міжнародні телекомунікаційні мережі TYMNET, INTERNET і інші.
Подібні інформаційні системи створюються і в інших сферах. Наприклад, при технічній допомозі програми «TACIS» на державному рівні, а також у Донецькому, Дніпропетровському, Вінницькому, Луганському, Львівському, Миколаєвському, Одеському та Сумському управліннях сільського господарства облдержадміністрацій створюються автоматизовані системи моніторингу продовольчого ринку. З допомогою WEB-сервера, що функціонує в Мінагропромі, сховищем даних про продовольчий ринок і іншою інформацією можуть скористатись в автоматизованому режимі всі зацікавлені служби і окремі громадяни, котрі мають доступ до системи Internet.
Комментариев нет:
Отправить комментарий