Теория фреймов
Теория фреймов
- это парадигма для представления знаний с целью
использования этих знаний компьютером . Впервые была представлена Минским как попытка
построить фреймовую сеть , или парадигму с целью достижения большего
эффекта понимания . С одной стороны Минский пытался сконструировать базу
данных , содержащую энциклопедические знания , но с
другой стороны , он хотел создать наиболее описывающую базу ,
содержащую информацию в структурированной и упорядоченной форме . Эта
структура позволила бы компьютеру вводить информацию в более гибкой форме , имея
доступ к тому разделу , который требуется в данный момент . Минский
разработал такую схему , в которой информация содержится в специальных
ячейках , называемых фреймами , объединенными в сеть ,
называемую системой фреймов . Новый фрейм активизируется с наступлением
новой ситуации . Отличительной его чертой является то , что он
одновременно содержит большой объем знаний и в то же время является достаточно
гибким для того , чтобы быть использованным как отдельный элемент БД . Термин «фрейм» был
наиболее популярен в середине семидесятых годов , когда существовало много
его толкований , отличных от интерпретации Минского .
Чтобы лучше понять эту теорию ,
рассмотрим один из примеров Минского , основанный на связи между ожиданием ,
ощущением и чувством человека , когда он открывает дверь и входит в комнату .
Предположим , что вы собираетесь открыть дверь и зайти в комнату
незнакомого вам дома . Находясь в доме , перед тем как открыть
дверь , у вас имеются определенные представления о том , что вы
увидите , войдя в комнату . Например , если вы увидите к-л пейзаж или морской берег , поначалу
вы с трудом узнаете их . Затем вы будете удивлены , и в
конце концов дезориентированы , так как вы не сможете объяснить поступившую
информацию и связать ее с теми представлениями , которые у вас имелись до
того . Также у вас возникнут затруднения с тем , чтобы
предсказать дальнейший ход событий. С аналитической точки зрения это можно
объяснить как активизацию фрейма комнаты в момент открывания двери и его
ведущую роль в интерпретации поступающей информации . Если бы
вы увидели за дверью кровать , то фрейм комнаты приобрел бы более узкую форму
и превратился бы во фрей кровати . Другими словами , вы бы имели доступ к
наиболее специфичному фрейму из всех доступных .Возможно ,б что вы
используете информацию , содержащуюся в вашем фрейме комнаты для того
чтобы распознать мебель , что называется процессом сверху-вниз , или в
контексте теории фреймов фреймодвижущим распознаванием . Если бы
вы увидели пожарный гидрант , то ваши ощущения были бы аналогичны первому
случаю. Психологи подметили , что распознавание
объектов легче проходит в обычном контексте, чем в нестандартной обстановке . Из этого
примера мы видим , что фрейм - это модель знаний , которая
активизируется в определенной ситуации и служит для ее объяснения и
предсказания . У Минского имелись достаточно расплывчатые идеи о
самой структуре такой БД , которая могла бы выполнять подобные вещи . Он
предложил систему , состоящую из связанных между собой фреймов , многие
из которых состоят из одинаковых подкомпонентов , объединенных в сеть . Таким
образом , в случае , когда к-л входит в дом , его
ожидания контролируются операциями , входящими в сеть системы фреймов . В
рассмотренном выше случае мы имеем дело с фреймовой системой для дома , и с
подсистемами для двери и комнаты . Активизированные фреймы с дополнительной
информацией в БД о том , что вы открываете дверь , будут
служить переходом от активизированного фрейма двери к фрейму комнаты . При этом
фреймы двери и комнаты будут иметь одинаковую подструктуру . Минский
назвал это явление разделом терминалов и считал его важной частью теории
фреймов .
Минский также ввел терминологию , которая
могла бы использоваться при изучении этой теории ( фреймы , слоты ,
терминалы и т. д.) . Хотя примеры этой теории были разделены на
языковые и перцептуальные , и Минский рассматривал их как имеющих общую
природу , в языке имеется более широкая сфера ее применения . В
основном большинство исследований было сделано в контексте общеупотребительной
лексики и литературного языка .
Как наиболее доступную иллюстрацию распознаванию ,
интерпретации и предположению можно рассмотреть две последовательности
предложений , взятых из Шранка и Абельсона . На
глобальном уровне последовательность А явно отличается от В .
A John went to a restaurant
He asked the waitress for a hamburger
He paid the tip & left
B John went to a park
He asked the midget for a mouse
He picked up the box & left
Хотя все эти предложения имеют одинаковую
синтаксическую структуру и тип семантической информации ,
понимание их кардинально различается . Последовательность А имеет доступ к некоторому
виду структуры знаний высшего уровня , а В не имеет . Если бы А не имело такой
доступ , то ее понимание сводилось бы к уровню В и
характеризовалось бы как дезориентированное . Этот контраст является
наглядным примером мгновенной работы высшего уровня структуры знаний .
Была предложена программа под названием SAM ,
которая отвечает на вопросы и выдает содержание таких рассказов . Например
, SAM может
ответить на следующие вопросы , ответы на которые не даны в тексте , с
помощью доступа к записи предполагаемых событий , предшествующих обеду в
ресторане .
Did John sit down in the restaurant ?
Did John eat the hamburger ?
Таким образом , SAM может распознать описанную ситуацию как обед в
ресторане и затем предсказать оптимальное развитие событий . В нашем
случае распознавание не представляло трудностей , но в большинстве случаев
оно довольно непростое и является самой важной частью теории .
Рассмотрим другой пример :
C He plunked down $5 at the window .
She tried to give him $ 2.50 , but he wouldn’t
take it .
Он интересен тем , что у большинства людей он вызывает цикл
повторяющихся неправильных или незаконченных распознаваний и
реинтерпретаций .
В случаях с многозначными словами многозначность
разрешается с помощью активизированного ранее фрейма . Для этих
целей необходимо создать лексикон к каждому фрейму . Когда
фрейм активизируется , соответствующему лексикону отдается
предпочтение при поиске соответствующего значения слова . В
контексте ТФ это распознавание процессов , контролируемых фреймами , которые , в свою
очередь , контролируют распознавание входящей информации . Иногда
это называется процессом сверху - вниз фреймодвижущего распознавания .
Применение этих процессов нашло свое отражение в
программе FRAMP , которая может суммировать газетные сводки и
классифицировать их в соответствие с классом событий , например
терроризм или землетрясения . Эта программа хранит набор объектов , которые
должны быть описаны в каждой разновидности текстов , и этот
набор помогает процессу распознавания описываемых событий .
Манипуляция фреймами
Детали спецификации Ф и их репрезентации могут быть
опущены , так же как и алгоритмы их манипуляции , потому
что они не играют большой роли в ТФ .
Такие вопросы , как размер Ф или доступ к нему , связаны
с организацией памяти и не требуют специального рассмотрения .
Распознавание
В литературе имеется много рассуждений по поводу
процессов , касающихся распознавания фреймов и доступа к
структуре знаний высшего уровня . Несмотря на то , что люди могут распознать
фрейм без особых усилий , для компьютера в большинстве случаев это
довольно сложная задача . Поэтому вопросы распознавания фреймов остаются
открытыми и трудными для решения с помощью ИИ .
Размер фрейма
Размер фрейма гораздо более тесно связан с
организацией памяти , чем это кажется на первый взгляд . Это
происходит потому , что в понимании человека размер фрейма определяется
не столько семантическим контекстом , но и многими другими факторами . Рассмотрим
фрейм визита к доктору , который складывается из подфреймов , одним из
которых является комната ожидания . Таким образом мы можем сказать , что
размер фрейма не зависит от семантического содержания представленного фрейма /
такого , как , например , визит к врачу / , но зависит от того , какие
компоненты описывающей информации во фрейме /
таком , как
комната ожидания / используются в памяти . Это означает , что
когда определенный набор знаний используется памятью более чем в одной
ситуации , система памяти определяет это , затем
модифицирует эту информацию во фрейм , и реструктурирует исходный фрейм так , чтобы
новый фрей использовался как его подкомпонент .
Вышеперечисленные операции также остаются открытыми
вопросами в ТФ .
Инициализационные категории
Рош предложил три уровня категорий представления
знаний : базовую , субординатную и суперординационную . Например
в сфере меблировки концепция кресла является примером категории основного
уровня , а концепция мебели - это пример суперординационной
категории . Язык представления знаний подвержен влиянию этой
таксономии и включает их как различные типы данных . В сфере
человеческого общения категории основного уровня являются первейшими
категориями , которые узнают человек , другие же категории
вытекают из них . То есть суперординационная категория - это обобщение
базовой , а субординатная - это подраздел базовой категории .
пример
суперординатная
идеи события
базовая события
действия
субординатная действия прогулка
Каждый фрейм имеет свой определенный так
называемый слот . Так , для фрейма действие слот может быть
заполнен только к-л исполнителем этого действия , а соседние фреймы могут
наследовать этот слот .
Некоторые исследователи предположили , что
случаи грамматики падежей совпадают со слотами в ТФ , и эта
теория была названа теорией идентичности слота и падежа . Было
предложено число таких падежей , от 8 до 20 , но точное число не определено . Но если
агентив полностью совпадает со своим слотом , то остальные падежи
вызвали споры . И до сих пор точно не установлено , сколько
всего существует падежей .
Также вызвал трудность тот факт , что
слоты не всегда могут быть переходными . Например , в соответствие с ТФ можно сказать , что
фрейм одушевленный предмет может иметь слот живой , фрейм человек
может иметь слот честный , а фрейм блоха не может иметь такой
слот , и он к нему никогда не перейдет .
СФ иногда адаптируются для построения описаний или
определений . Был создан смешанный язык ,
названный KRYPTON , состоящий из фреймовых компонентов и компонентов
предикатных исчислений , помогающих делать к-л выводы с помощью
терминов и предикатов . Когда активизируется фрейм , факты
становятся доступными пользователю . Также существует язык Loops , который
объединяет объекты , логическое программирование и процедуры .
Существуют также фреймоподобные языки , которые
за исходную позицию принимают один тип данных в памяти , к-л
концепцию , а не две / напр фрейм и слот / , и
представление этой концепции в памяти должно быть цельным .
Объектно - ориентированные языки
Параллельно с языками фреймов существуют объектно -
ориентированные программные языки , которые используются для составления программ
, но имеют некоторые св-ва языков фреймов , такие , как
использование слотов для детальной , доскональной классификации объектов . Отличие
их от языков фреймов в том , что фреймовые языки направлены на более
обобщенное представление информации об объекте .
Одной из трудностей представления
знаний и языка фреймов является отсутствие формальной семантики . Это
затрудняет сравнение свойств представления знаний различных языков фреймов , а также
полное логическое объяснение языка фреймов .