четвер, 24 квітня 2014 р.

Інформаційно-пошукові системи

         Пошук інформації є однією з основних складових людської діяльності, з ним ми зіштовхуємося щодня: вивчаючи театральну афішу, щоб вибрати цікавий спектакль, підбираючи в розкладі поїздів зручну електричку, перегортаючи телефонну книгу... Людині, яка в силу своєї професії чи захоплень часто зіштовхується з підбором і пошуком якої-небудь тематичної інформації, рано чи пізно (зі зростанням її обсягу) приходиться застосовувати деякі принципи систематизації і класифікації наявних даних, що забезпечують більш зручний і ефективний пошук. Так, у бібліотеках складають картотеку: відомості про книгу за визначеною схемою записуються на картку, туди ж міститься шифр - кілька букв і цифр, по яких можна визначити місце розташування книги (сховище, стелаж, полицю); картки розставляються в алфавітному чи тематичному порядку. Застосування ЕОМ дає більш широкі можливості для роботи з великими масивами інформації.
 
          Інформаційно-пошукові системи з'явилися досить давно. Теорії і практиці побудови таких систем присвячена досить велика кількість статей, основна маса яких приходиться на кінець 70-х - початок 80-х років. Тобто не можна сказати, що з появою Internet і бурхливим входженням його в практику інформаційного забезпечення, з'явилося щось принципово нове, чого не було раніш. Якщо бути точним, то інформаційно-пошукові системи в Internet - це визнання того, що ні ієрархічна модель Gopher, ні гіпертекстова модель World Wide Web не вирішують проблему пошуку інформації у великих обсягах різнорідних документів. І на сьогоднішній день немає іншого способу швидкого пошуку даних, крім пошуку за ключовими словами. При використанні ієрархічної моделі Gopher треба досить довго блукати по дереву каталогів, поки не зустрінеш потрібну інформацію. Ці каталоги повинні кимсь підтримуватися і при цьому їх тематичне розбиття повинно збігатися з інформаційними потребами користувача. З огляду на анархічність Internet і величезну кількість всіляких інтересів у користувачів Мережі, зрозуміло, що комусь може і не повезти, і в мережі не буде каталогу, що відображає конкретну предметну область.
         Аналогічний розвиток подій ми бачимо й у World Wide Web. Розробка нових інформаційних систем для Web не довершена. Причому як на стадії написання комерційних систем, так і на стадії досліджень. Однак, багато проблем, що ставить перед розробниками ІПС Internet не вирішені дотепер. Саме цією обставиною і викликана поява проектів типу AltaVista компанії Digital, головною метою якого є розробка програмних засобів інформаційного пошуку для Web і підбор архітектури для інформаційного сервера Web.
 

Інформаційно-пошукова система (ІПС) - програмна система для збереження, пошуку і видачі цікавлячої користувача (абонента) інформації.

Наприклад, документальний масив ІПС Internet - це досить різнорідна інформація, що представлена у виді різних, ніяк неузгоджених один з одним форматів даних. Тут є і текстова інформація, і графічна інформація, і аудіо інформація і т. д. Природно постає питання, як інформаційно-пошукова система повинна з усім цим працювати.
Абонент звертається до ІПС з інформаційним запитом - текстом, що відбиває інформаційну потребу даного абонента, наприклад, його бажання знайти список книг по теорії інформаційного пошуку чи список аптек, у яких можна купити потрібні ліки. Пошук інформації ведеться в пошуковому масиві, що формується (і в міру необхідності обновляється) розробниками чи адміністраторами системи. Елементи пошукового масиву вводяться в інформаційно-пошукову систему на природному (чи близькому до нього) мові, а потім звичайно піддаються індексуванню, тобто перекладу на формальну інформаційно-пошукову мову (ІПМ).
Індексування - вираження центральної теми чи предмета якого-небудь тексту чи опис якого-небудь об'єкта інформаційно-пошуковою мовою.




Пошукові системи включають три основні компоненти:

  • Веб-сторінка з пошуковим механізмом, яка виконує роль інтерфейсу для організації взаємодії з базою даних.
  • База даних, де міститься інформація, що зібрана спеціальними програмами пошукової системи. Власне наявністю баз даних пояснюється висока швидкість виведення результатів пошуку на сторінку пошукової системи.
  • Пошукові роботи (Robots), павуки (Spiders) або хробаки (Worms) - спеціальні програми, які автоматично періодично «відвідують» сайти, збирають відомості про вміст сторінок, тобто індексують їх і наповнюють бази даних пошукової системи.
          Більшість пошукових систем світу - індексні пошукові системи, які ще називають пошуковими покажчиками, пошуковими серверами, словниковими пошуковими системами, автоматичними індексами, пошуковими машинами, Search Engines - в англомовних джерелах тощо. Їхнє призначення – якнайкраще охопити інформаційних веб-простір і подати його користувачам у зручному вигляді.
       

Принцип роботи з індексними пошуковими системами (ІПС) засновано на ключових словах. Розпочинаючи пошук інформації з певної теми, користувач має ввести ключові слова у рядок пошуку, які описують його тему і вибрати кнопку Знайти (або Найти, Go, Search), яка розташована поряд з рядком пошуку.
        Після вибору кнопки Знайти, ключова фраза посилається на сервер і пошукова система починає пошук у своїх базах даних адреси веб-ресурсів, які містять вказані ключові слова. Як здійснюється пошук, користувач не може бачити, він лише побачить результат запиту – нове вікно в якому відображається перелік веб-ресурсів, які містять ключові слова.



 

                   Приклади:

  • Google
  • Yandex
  • Yahoo
  • Rambler
     

Немає коментарів:

Дописати коментар