Моделирование взаимосвязей между сущностями

       

Идентификация сущностей


Сущности - это объекты, о которых люди говорят, пишут, хранят и обрабатывают сведения - по определению.

Сущность - это важный объект или явление, будь то реальное или воображаемое, информация о котором подлежит выяснению или запоминанию.

Такое определение существенно облегчает нашу задачу, ибо с его помощью сущности обнаруживаются фактически в любой фразе, где только используются имена существительные.

Почему же иногда возникают трудности с их идентификацией?

Примеры, синонимы, омонимы и роли

Ответ на этот вопрос прост. Люди зачастую в своей речи пользуются примерами, аналогиями и иллюстративными ссылками. Вместо того, чтобы просто сказать "самолет", они ведут речь о реактивном лайнере, Боинге-747 или Конкорде.

Дополнительные сложности создает и частое употребление синонимов. Синонимом называется слово, имеющее другое звучание, но тот же смысл, так что синонимом слова "самолет" может выступать "аэроплан".

Омонимом можно назвать то же слово, но имеющее уже другое значение. Текущее значение омонима определяется контекстом и часто одно и то же слово может выступать в нескольких значениях даже внутри одного предложения. Так слово "программа" в настоящее время имеет множество альтернативных значений, например:

  • набор инструкций для ЭВМ
  • ряд событий
  • курс обучения
  • план достижения цели


  • перечень произведений, исполняемых на музыкальном концерте
  • план телепередач.
  • Зачастую в своей речи люди ссылаются на роли, исполняемые объектами, в особенности это относится к отдельным лицам и к организациям. Такими ролями иногда являются профессии, уровни неофициальной ответственности и имена тех людей, с которыми мы контактируем. Приведем несколько примеров ролей, которые может исполнять отдельная личность: менеджер, клерк, секретарь, офицер службы безопасности, мать, лидер, руководитель группы, тренер, авиапилот, политик, гуру, приемщик, ребенок, машинист, жертва обмана, адвокат, ученый, дворник, клоун, авиадиспетчер, эколог.

    Использование множественного числа и других грамматических тонкостей также требует особого внимания.
    Кроме того, даже в одном языке написание слов может различаться в зависимости от страны, например (в английском): aeroplane/airplane; colour/color; sulphur/sulfur.

    Ни одно из этих альтернативных имен не изменяет сущности самого объекта.

    Наша задача состоит в идентификации сущности явления, выборе обобщающего термина для ее обозначения и в последующем ее описании. В процессе решения данной задачи нам поможет весь набор синонимов и примеров, связанных с описываемым объектом.

    Пример:

    Сущность ЛОКОМОТИВ имеет синоним ПОЕЗД и примеры: "The Flying Scotsman", "Puffing Billy", "Stephenson's Rocket" и более свежий пример - японский монорельсовый Bullet.

    Анализ результатов интервьюирования

    Обратимся к тексту интервью, проведенного аналитиком, и посмотрим, каким образом из него можно будет выбрать сущности.

    Вопрос: Расскажите мне о различных способах, с помощью которых можно приобретать билеты.

    Ответ: В большинстве случаев звонят в трансагентство и рассказывают о путешествии, которое хотели бы предпринять. Иногда все решается просто. Хотят, к примеру, взять билет на рейс British Airways 747 до Парижа на определенную дату. Чаще, однако, обсуждаются все "за" и "против" каждой авиалинии, каждого рейса (времени отправления, аэропорта приземления) - должностные лица могут даже зафрахтовать целый самолет и приземлиться на местном аэродроме или на отдельной посадочной полосе. Агент прорабатывает расписание, по возможности учитывающее желательное время прибытия, проверяет наличие окна в рейсах, набирает пассажиров, выделяет места и после этого выписывает билеты. Стандартная ситуация имела место вчера, когда вошедший пассажир попросил билет до Сан-Франциско с открытой датой отправления - после 10-го июня, с тем чтобы иметь возможность организовать свою поездку позднее и сэкономить на оформлении.

    ....

    С другой часто возникающей проблемой мы сталкиваемся, когда формирующий тур оператор запрашивает сразу, скажем, 20 мест со скидкой.


    И зачастую почти до последней минуты мы не знаем имен пассажиров, которым предназначаются эти места, и не можем указать их на билетах.

    ....

    Если проанализировать состоявшееся обсуждение и выбрать обобщающие термины для обозначения перечисленных в нем объектов, результат будет выглядеть приблизительно так:



    Понятия "стоимость", "скидка" и "имя" почти наверное выступают в качестве атрибутов других сущностей.

    Документированная информация

    Подобным же образом анализируются выписываемые документы. Особое значение имеют годовые отчеты компаний, которые зачастую оказываются неиссякаемыми источниками по-настоящему важных сущностей.

    Бумажные формы могут тоже оказаться полезными, хотя в них чаще всего отражаются атрибуты, поскольку заполняемым в них графам почти всегда предшествует наименование атрибута.

    Что нам подсказывает здравый смысл

    Расширим наше видение, выйдя за рамки контекста анализируемой организации. Большинство объектов, обнаруживаемых нами, на поверку оказывается экземплярами сущностей.

    Если вернуться к нашему примеру и представить себе, что вы находитесь в трансагентстве - что вы увидите вокруг? Очевидно, столы, кресла, стойку, телефоны, двери, окна и т.п.

    Все это может не представлять интереса, если не принимать во внимание имущественный аспект.

    С другой стороны, может оказаться важным следующее:

  • брошюры


  • расписания


  • карты


  • бланки заказов


  • условия предоставления кредита


  • процедура обмена


  • и т.п.


  • Что из этого будет включено в модель, обычно явствует из сведений, полученных вами от пользователей, или из результатов экстраполяции функций, выполняемых с помощью существующих систем и процедур.

    Наблюдательность, здравый смысл и дедуктивное мышление позволят вам разработать качественную модель.

    Помните о том, что по завершении этапа анализа каждая сущность должна иметь уникальное определение и по меньшей мере два атрибута (ни один из которых не должен быть связью). Нужно все время задавать себе прямой вопрос:

    "А как можно уникально определить...............?"


    Содержание раздела