Как настроить смартфоны и ПК. Информационный портал
  • Главная
  • Ошибки
  • Как получать знания. чем знания отличаются от данных и информации

Как получать знания. чем знания отличаются от данных и информации



Данные и знания

Информация

Данные

Процедурная декларативная

Предметной областью

Знания

Логический вывод

фактами Эвристики

механизмом вывода , логическим выводом или машиной вывода .

интерфейс

База знаний,

Механизм вывода,

Интерфейс с пользователем.

Понятие формальной системы

Основой логических моделей является понятие формальной системы, задаваемой четверкой M = (T , P , A , F ).

Множество T есть множество базовых элементов различной природы, например слов из некоторого ограниченного словаря. Предполагается, что существует процедура П(Т ) проверки принадлежности произвольного элемента множеству Т .

Множество P есть множество синтаксических правил. С их помощью из элементов T образуют синтаксически правильные выражения, например, из слов ограниченного словаря строятся синтаксически правильные выражения. Должна существовать процедура П(Р ), позволяющая определить, является ли

некоторое выражение синтаксически правильным.

В множестве Р выделяется подмножество А априорно истинных выражений (аксиом). Должна существовать процедура П(А ) проверки принадлежности любого синтаксически правильного выражения множеству А .

Множество F есть множество семантических правил вывода. Применяя их к элементам А , можно получать новые синтаксически правильные выражения, к которым снова можно применять правила из F . Так формируется множество выводимых в данной формальной системе выражений. Если имеется процедура П(F ), позволяющая определить для любого синтаксически правильного выражения является ли оно выводимым, то соответствующая формальная система называется разрешимой .

Для знаний, входящих в базу знаний, можно считать, что множество А образуют все информационные единицы, введенные в базу знаний, а с помощью правил вывода из них выводятся новые производные знания . Другими словами, формальная система представляет собой генератор новых знаний, образующих множество выводимых в данной системе знаний .

Данная модель лежит в основе построения многих дедуктивных ИИС . В таких системах база знаний описывается в виде предложений и аксиом теории, а механизм вывода реализует правила построения новых предложений из имеющихся в базе знаний. На вход системы поступает описание задачи на языке этой теории в виде запроса (предложения, теоремы), явно не представленного в БЗ. Процесс работы механизма вывода называют доказательством запроса (теоремы).

Использование логик различного типа при построении синтаксических и семантических правил порождает логические модели различных типов.

Исчисление высказываний

Исчисление высказываний изучает предложения, которые могут быть либо истинными, либо ложными. Не всякое предложение является высказыванием. Например, бессмысленно говорить об истинности вопросительных предложений. Не являются высказываниями предложения, для которых нет единого мнения о том, истинны эти предложения или ложны. По-видимому, далеко не все согласятся с утверждением «математическая логика – увлекательный предмет».

Предложение «Шел снег» также не является высказыванием, так как, чтобы судить о его истинности, нужны дополнительные сведения о том, когда и где шел снег.

Объединяя предложения с помощью связок типа «и» , «или» ,«если… то…» , можно образовывать новые предложения.

В исчислении высказываний используется пять логических связок: отрицание, конъюнкция, дизъюнкция, импликация и эквивалентность.

Конъюнкция (логическое И ) истинна только тогда, когда оба составляющих ее высказывания истинны.

Дизъюнкция (логическое ИЛИ ) ложна только тогда, когда ложны оба составляющих ее высказывания.

У импликации (соответствует связке «Если…, то… ») первый операнд называется посылкой, а второй – заключением. Импликация ложна только тогда, когда ее посылка истинна, а заключение – ложно.

Логическая операция эквивалентность соответствует связке «тогда и только тогда ». Ее результатом является истина , если оба высказывания или одновременно истинны, или одновременно ложны.

Логическое отрицание выполняется над одним высказыванием. Высказывание и его отрицание всегда имеют противоположные истинностные значения.

Символы, используемые для обозначений высказываний, называют атомами .

Правильно построенные формулы в логике высказываний рекурсивно определяются следующим образом:

1) атом есть формула;

2) если A и B – формулы, то формулами являются

и ØA , A Ù B , A Ú B , A ® B , A « B .

Здесь связки обозначены символами:

Ú - логическое ИЛИ (дизъюнкция);

Ù - логическое И (конъюнкция);

® - логическое СЛЕДУЕТ (импликация);

« - логическое ЭКВИВАЛЕНТНО (эквиваленция);

Ø - логическое отрицание.

Интерпретацией формулы называется приписывание каждому атому, входящему в формулу, истинностного значения (истина или ложь ).

Формула, состоящая из n различных атомов, имеет 2 n различных интерпретаций.

Формула, истинная при всех интерпретациях, называется общезначимой (например, A Ú ØA ).

Формула, ложная при всех интерпретациях, называется противоречивой (например, A ÙØA ).

Формула, для которой существует хотя бы одна интерпретация, при которой она истинна, называется выполнимой.

Эквивалентными называются формулы, истинностные значения которых совпадают при всех интерпретациях. С помощью эквивалентных замен формулы можно преобразовывать из одной формы в другую.

Для преобразований формул исчисления высказываний применяют следующие эквивалентности:

1) A Ú ØA = true (истина);

A Ù ØA = false (ложь);

2) правило двойного отрицания

Ø (ØA ) = A ;

3) A ® B = ØA Ú B ;

4) A « B = (A ® B ) Ù (B ® A );

5) законы коммутативности

A Ú B = B Ú A , A Ù B = B Ù A ;

6) законы ассоциативности

(A Ú B ) Ú C =A Ú (B Ú C ), (A Ù B ) ÙC = A Ù (B Ù C );

7) законы дистрибутивности

A Ú (B Ù C ) = (A Ú B ) Ù (A Ú C ), A Ù (B Ú C ) = (A Ù B ) Ú (A Ù C );

8) законы де Моргана

Ø(A Ú B ) = ØA Ù ØB , Ø(A Ù B ) = ØA Ú ØB ;

9) A ® B = ØB ® ØA .

Исчисление предикатов

Аппарат исчисления высказываний во многих случаях не позволяет удовлетворительно описать предметную область. Значительная часть предметных областей может быть описана средствами исчисления предикатов первого порядка. Для этого в рассмотрение вводятся:

а) константы, обозначающие индивидуальный объект или понятие;

б) переменные, которые в разное время могут обозначать разные объекты;

в) термы, простейшими из которых являются константы и переменные, а в более общем случае представляемые выражениями типа , где - функциональный символ, а - термы;

г) предикаты, используемые для представления отношений между объектами в некоторой предметной области;

д) кванторы – средство задания количественных характеристик предметной области.

Предикат – это логическая функция, принимающая только истинностные значения «истина » или «ложь ».

Предикат состоит из предикатного символа и соответствующего ему упорядоченного множества термов, являющихся его аргументами. Предикатный символ P используется для именования отношений между объектами. Если он имеет n аргументов, то называется n-местным предикатным символом.

Запись , являющаяся простейшей (атомарной) формулой, означает, что истинно высказывание: объекты связаны отношением P.

С помощью тех же логических связок, что и в исчислении высказываний (И, ИЛИ, НЕ, СЛЕДУЕТ, ЭКВИВАЛЕНТНО ), можно строить более сложные формулы.

Для определения областей действия переменных в формулах используются кванторы (всеобщности) и (существования). Кванторы позволяют строить высказывания о множестве объектов и формулировать утверждения, истинные для этого множества.

Формулы исчисления предикатов (ППФ – правильно построенные формулы) определяются рекурсивно следующим образом:

1. атом есть формула;

2. если A и B – формулы, то формулами являются и

ØA , A Ù B , A Ú B , A ® B , A « B ;

3. если - есть формула, то формулами являются и и .

Интерпретация формул в исчислении предикатов – это задание областей значений всем константам, функциональным и предикатным символам. Формула, интерпретируемая на области D , принимает значения истина или ложь по следующим правилам:

а) если заданы значения формул A и B , то истинностные значения формул ØA , A Ù B , A Ú B , A ® B , A « B получаются по таблицам истинности, справедливым для исчисления высказываний;

б) формула получает значение истина , если для каждого из D имеет значение истина , в противном случае ее значение – ложь .

в) формула получает значение истина , если хотя бы для одного из D имеет значение истина , в противном случае ее значение – ложь.

Формула A есть логическое следствие формул , тогда и только тогда, когда для любой интерпретации, в которой формула истинна, формула A также истинна.

Кроме формул эквивалентных преобразований, приведенных для исчисления высказываний, в исчислении предикатов справедливы следующие:

Ø($ ) = () (Ø );

Ø() = () (Ø ).

Виды фреймов

По познавательному назначению различают два типа фреймов: фрейм – прототип и фрейм – пример. Фрейм – прототип отражает знания об абстрактных стереотипных понятиях, которые являются классами каких-то конкретных объектов. Фреймы-прототипы отражают интенсиональные знания, т.е. обобщенные знания о закономерностях, присущих рассматриваемому классу объектов. Фреймы – примеры отражают знания о конкретных фактах предметной области, или так называемые экстенсиональные знания. Переход от фрейма-прототипа к фрейму-экземпляру выполняется при проведении процедуры означивания фрейма-прототипа в процессе работы механизма логического вывода.

В качестве примера рассмотрим упрощенную схему фрейма – прототипа понятия ДАТА:

<ДАТА> (<МЕСЯЦ><имя>)(<ДЕНЬ><целые числа {1,2,…, 31}>)

(<ГОД><функция>)(<ДЕНЬ НЕДЕЛИ><перечень {ПНД,ВТР,…,ВСК}>

<функция>)

Имя фрейма – прототипа – ДАТА. В слоте МЕСЯЦ на месте значения записано ИМЯ, т.е. значением слота может быть любое буквенное выражение. Значением слота ДЕНЬ являются целые числа, причем перечень их приведен в слоте. В слоте ГОД указана функция, которая может реализовать следующие действия. Если во входном предложении указан год, то он вносится в поле значения слота во фрейме – примере; если год не указан, то отсутствующее значение заполняется текущим годом. Такого рода функции называются функциями, выполняемыми по умолчанию.

В слоте ДЕНЬ НЕДЕЛИ также определена функция, которая при обработке входного сообщения будет вызываться автоматически для проверки на непро-

тиворечивость значения дня недели, указанного пользователем, либо вычисле-

ния этого значения, если пользователь его не указал.

Конкретный фрейм – пример фрейма ДАТА может выглядеть следующим образом:

<ISA ДАТА>(<МЕСЯЦ><ИЮНЬ>)(<ДЕНЬ><5>)

Метка ISA обозначает, что данный фрейм является фреймом – примером. Здесь заполнены только 2 слота. Значения остальных могут быть вычислены с помощью соответствующих процедур.

Процедуры, включаемые в слот, делят на два типа: процедуры – демоны и

процедуры – слуги.

Процедуры – демоны активизируются автоматически каждый раз, когда данные попадают в соответствующий фрейм – пример или удаляются из него. Так, процедура, встроенная в слот ДЕНЬ НЕДЕЛИ в описанном выше примере, является представителем процедуры – демона. С помощью процедур этого типа выполняются все рутинные операции, связанные с ведением баз данных и знаний.

Процедуры – слуги активизируются только по запросу. Примером такой процедуры является функция, встроенная в слот ГОД в фрейме – прототипе ДАТА, которая вызывается только в том случае, если пользователь не указал год.

Рис. 4.6 Сеть фреймов

на фрейм Ребенок. Наследование слота «любит» из фрейма Ребенок.

Запрос 2. Каков возраст учеников?

Ответ: 6-17 – значение слота «возраст» берется из фрейма Ученик. Значение из фрейма Ребенок не берется, т.к. значение указано явно в самом фрейме «ученик», относительно которого задается вопрос.

По функциональному назначению различают следующие виды фреймов:

Фреймы – объекты (пример выше);

Фреймы – операции (например, фрейм «процесс синтеза корректирующих устройств», слоты: модель, алгоритм расчета, параметры и т.д.);

Фреймы – ситуации (например, фрейм «Аварийный режим работы аналогового датчика», слоты: напряжение, сила тока и т.д.);

Фреймы – сценарии (например, фрейм «Тушение пожара», слоты: место пожара, средства тушения и т.д.).

Фреймовая модель представления знаний используется в языках FRL (Frame Representation Language ) ,KRL (Knowledge Representation Language ) и др.

Особенности логического вывода

Во фреймовых языках основной операцией является поиск по образцу . Образец представляет собой фрейм, в котором заполнены не все структурные единицы, а только те, по которым среди фреймов, хранящихся в памяти системы, будут отыскиваться нужные фреймы. Образец может, например, содержать имя фрейма, а также имя некоторого слота во фрейме с указанием значения слота. Такой образец проверяет наличие в памяти системы фрейма с данным именем и данным значением слота, указанного в образце. В образце может быть указано имя некоторого слота и его значение. Тогда процедура поиска по образцу должна обеспечить выборку всех фреймов, в которых содержится слот с таким именем и таким значением слота, как у образца. Наконец, может быть задана некоторая логическая функция от имени фрейма, каких-то имен слотов и значений слотов. Таким образом, логический вывод в сети фреймов основан на операции сопоставления.

Другими процедурами, характерными для фреймовых языков, являются процедуры наполнения слотов данными, а также процедуры введения в систему новых фреймов-прототипов (т.е. новых знаний) и введения новых связей между ними.

Рассмотрим фрагмент описания из "мира блоков" (рис. 4.7) в виде фреймов на языке FRL.

Рис. 4.7 «Мир блоков»

(frame (name (Cube )) (length (NULL )) (width (IF-DEFAULT (use length ))) (height (IF-DEFAULT (use length )))) (frame (name (B 1)) (AKO (Cube )) (color (red )) (length (80))) (frame (name (B 2)) (AKO (Cube )) (color (green )) (length (65))))

Слот AKO указывает на то, что объекты B 1 и B 2 являются подтипом объекта Cube и наследуют его свойства, а именно, length = width = height. Процедура - демон IF-DEFAULT заполняет значения слотов по умолчанию.

Допустим, роботу дается приказ «Возьми желтый предмет, который поддерживает пирамиду». На языке представления знаний вопрос записывается так:

(object X (color (yellow )) (hold Y (type (pyramid ))))

Программа сопоставления с образцом находит в базе знаний описание объектов:

(frame (name (B 3)) (type (block )) (color (yellow )) (size (20 20 20)) (coordinate (20 50 0)) (hold (P 2)))

(frame (name (P 2)) (type (pyramid )) ...)

Ответ получен: X = B 3, Y = P 2, и роботу выдается команда take (object B 3).

Достоинства фреймов как модели представления знаний – возможность структуризации базы знаний благодаря свойствам иерархичности и наследования. Недостатком является сложность организации логического вывода.

Лекция. Основы построения продукционной системы

Применение метаправил

Иногда, для того чтобы решить, какое правило следует активизировать, желательно использовать конкретные знания, а не следовать общей стратегии разрешения конфликтов. С этой целью в некоторые интерпретаторы правил включены средства, позволяющие программисту сформулировать и ввести в программу метаправила. Метаправила определяют правила, по которым выполняется отбор из списка заявок тех правил, которые следует рассматривать в первую очередь или, более того, выполнять обязательно.

Метаправила позволяют значительно сузить круг правил - кандидатов на основании какого-либо критерия или изменить порядок приоритетов правил. Метаправила часто используют знания из конкретной предметной области. Примером может служить приведенное ниже метаправило, относящееся к сис-

теме медицинской диагностики MYCIN .

МЕТАПРАВИЛО 001

ЕСЛИ (1) инфекция относится к классу pelvic-abscess , и

(2) существуют правила, в предпосылках которых упоминается

enterobacteria , и

(3) существуют правила, в предпосылках которых упоминается

грамположительная окраска,

ТО с уверенность 0.4 приоритет следует отдать первым из перечисленных правил.

Лекция. Основные понятия в области искусственного интеллекта

Область науки, получившая название «искусственный интеллект», имеет целью выявить принципиальные механизмы, лежащие в основе человеческой деятельности, чтобы применить их при решении конкретных научно-технических задач. «Разумные» системы создаются для работы в средах, где присутствие человека невозможно или опасно для жизни. Этим устройствам придется действовать в условиях большого разнообразия возможных ситуаций. Невозможно заранее описать эти ситуации с той степенью подробности и однозначности, которые позволили бы заложить в создаваемую систему жестко запрограммированные алгоритмы поведения. Поэтому системы, вооруженные искусственным интеллектом, должны располагать механизмами адаптации, которые позволили бы им строить программы целесообразной деятельности по решению поставленных перед ними задач на основании конкретной ситуации, складывающейся на данный момент в окружающей их среде.

Такая постановка проблемы выдвигает перед исследователями особые задачи, не возникавшие ранее при проектировании технических систем. К числу таких задач относятся: описание богатой внешней среды и ее отражение внутри системы (эту задачу называют задачей представления знаний); управление банком знаний, его пополнение, обнаружение противоречий и недостатка в знаниях; восприятие внешней среды с помощью различного рода рецепторов (зрительных, тактильных, слуховых и т.д.); понимание естественного языка, который служит для человека универсальным средством коммуникации; восприятие печатного текста и устной речи и преобразование содержащейся в сообщениях информации в форму представления знаний; планирование деятельности – задача, решение которой позволит системе формировать планы достижения цели с помощью имеющихся в ее распоряжении средств; адаптация и обучение на основе накопленного опыта.

Таково поле деятельности специалистов в области систем искусственного интеллекта. Оно лежит на стыке самых разнообразных дисциплин: программирования и психологии, техники и лингвистики, математики и физиологии.

Итак, теория искусственного интеллекта – это наука о знаниях, о том, как их извлекать, представлять в искусственных системах, перерабатывать внутри системы и использовать для решения практических задач. Другими словами, системы, изучаемые в рамках искусственного интеллекта и создаваемые в русле этой науки, - это системы, работа которых опирается на знания, отражающие семантику и прагматику того внешнего мира, в котором действуют интеллектуальные системы.

Таким образом, основными проблемами искусственного интеллекта являются представление и обработка знаний. Решение этих проблем состоит как в разработке эффективных моделей представления знаний, методов получения новых знаний, так и в создании программ и устройств, реализующих эти модели и методы.

Элементы искусственного интеллекта находят широкое применение для создания интеллектуальных программных средств ЭВМ, автоматизированных систем управления (АСУ), систем автоматизации проектирования (САПР), информационно-поисковых систем (ИПС), систем управления базами данных (СУБД), экспертных систем (ЭС), систем поддержки принятия решений (СППР), т.е. позволяют повысить уровень интеллектуальности создаваемых информационных систем.

Достижения в области искусственного интеллекта применяются в промышленности (открытие и разработка месторождений, космонавтика, автомобилестроение, химия, и т.д.), в экономике (финансы, страхование, и т.д.), в непромышленной сфере (транспорт, медицина, связь и т.д.), в сельском хозяйстве.

Средства искусственного интеллекта позволяют разрабатывать модели и программы решения задач, для которых неизвестны прямые и надежные методы решения. Такие задачи относятся к области творческой деятельности человека. Специалисты по искусственному интеллекту ставят такие научные проблемы, как доказательство математических теорем, диагностика заболеваний или неисправностей в оборудовании, финансовый анализ субъектов хозяйствования, синтез программ на основе спецификаций, понимание текста на естественном языке, анализ изображения и идентификация его содержимого, управление роботом и др.

Данные и знания

Приведем определения основных понятий изучаемой дисциплины и рассмотрим различия между понятиями «данные» и «знания».

Информация – совокупность сведений, воспринимаемых из окружающей среды, выдаваемых в окружающую среду либо сохраняемых внутри информационной системы (ИС).

Данные – представленная в формализованном виде конкретная информация об объектах предметной области, их свойствах и взаимосвязях, отражающая события и ситуации в этой области.

Данные представляются в виде, позволяющем автоматизировать их сбор, хранение и дальнейшую обработку. Данные – это запись информации в соответствующем виде, пригодном для хранения, передачи, обработки и получения новой информации.

Информация, с которой имеет дело ЭВМ, разделяется на процедурную и декларативную.

Процедурная информация представляется программами, которые выполняются в процессе решения задач, а декларативная – данными, которые обрабатывают эти программы.

Любая интеллектуальная деятельность опирается на знания о предметной области, в которой ставятся и решаются задачи.

Предметной областью называют совокупность взаимосвязанных сведений, необходимых и достаточных для решения определенного множества задач. Знания о предметной области включают описания объектов, явлений, фактов, а также отношений между ними.

Знания – это обобщенная и формализованная информация о свойствах и законах предметной области, с помощью которой реализуются процессы решения задач, преобразования данных и самих знаний, и которая используется в процессе логического вывода.

Логический вывод – это генерирование новых утверждений (суждений) на основе исходных фактов, аксиом и правил вывода.

Знания с точки зрения решаемых задач в некоторой предметной области делят на 2 большие категории - факты и эвристики. Под фактами обычно понимают общеизвестные в данной предметной области истины, обстоятельства. Эвристики – это эмпирические алгоритмы, основанные на неформальных соображениях, которые ограничивают число вариантов решения и обеспечивают целенаправленность поведения решающей системы, не гарантируя, однако, получения наилучшего решения. Такие знания основаны на опыте специалиста (эксперта) в данной предметной области.

Со знаниями тесто связано понятие процедуры получения решений задач (стратегии обработки знаний). В ИИС такую процедуру называют механизмом вывода , логическим выводом или машиной вывода .

Знания, с которыми работает система, хранятся в базе знаний (БЗ).

Для организации взаимодействия с ИИС в ней должны быть средства общения с пользователем, т.е. интерфейс . Интерфейс обеспечивает работу с БЗ и механизмом вывода на языке достаточно высокого уровня, приближенном к профессиональному языку специалистов в той предметной области, к которой относится ИИС. Кроме того, в функции интерфейса входит поддержка диалога пользователя с системой, позволяющего пользователю получать объяснения действий системы, участвовать в поиске решения задачи, пополнять и корректировать базу знаний. Таким образом, основными частями ИИС являются:

База знаний,

Механизм вывода,

Интерфейс с пользователем.

Особенности знаний, отличающие их от данных

Пример . Пусть в качестве предметной области выступают родственные связи. Объектами этой предметной области являются такие понятия, как мать,

отец, дочь, мужчина, женщина и т.п.

Пусть известны факты:

Виктор является отцом Тани.

Владимир является отцом Виктора.

На языке Пролог эти факты описываются следующим образом:

отец (виктор, таня).

отец (владимир, виктор).

Здесь «отец» является именем отношения или предикатом, а «виктор», «таня» и «владимир» - константами.

Пусть X , Y , Z – переменные. Используя переменные X и Z , можно в общем случае записать отношение «X является отцом Z » на языке Пролог:

отец (X , Z ).

Используя предикат «отец» и переменные X , Y , Z , сформулируем новое отношение «дед», а именно:

Если X является отцом Z и

Z является отцом Y

то X является дедом Y .

Такая форма записи отношения «Если.…То» называется продукционным правилом , продукцией или просто правилом .

На языке Пролог отношения «дед» записывается следующим образом:

дед (X , Y ): – отец (X , Z ), отец (Z , Y ).

Символ « : – » интерпретируется как «Если».

На примере отношения «дед» сформулирована общая закономерность определения понятия «дед» через понятие «отец». Имя «владимир», взятое вне зависимости от отношения, ни о чем не свидетельствует. Возможно это имя человека или наименование города. Точно так же рассматриваются числовые или другие данные, например, в файле данных. Данное, взятое вместе с отношением, определяет некоторый смысл и таким образом представляет собой знание.

Рассмотрим особенности знаний, в которых заключается их отличие от данных.

1. Интерпретируемость . Данные, хранимые в памяти ЭВМ, могут интерпретироваться только соответствующей программой. Данные без программы не несут никакой информации, в то время как знания имеют интерпретацию, так как они содержат одновременно и данные, и соответствующие им имена, описания, отношения, т.е. вместе с данными представлены информационные структуры, которые позволяют не только хранить знания, но и использовать их.

Знания в современных компаниях

Компания "Ксерокс" в последние годы позиционирует себя не как производитель копировальных аппаратов, а как компания по обработке документов. Компания "ЗМ" называет себя компаний по инновационному решению задач. "ИБМ" идентифицирует себя как компания, создающая долгосрочные экономические преимущества для клиентов, объединяя свои знания в области бизнеса с широкими технологическими возможностями. Компания Steelcase, которая производит конторское оборудование, утверждает, что она продает собственные знания и услуги, которые позволяют создать лучшие условия пребывания людей на своих рабочих местах. Что добавляет стоимость в деятельность всех этих компаний? Это в основном решения, базирующиеся на знаниях: технические и технологические ноу-хау, дизайн продукта, маркетинговые исследования, выявление истинных нужд клиентов. Именно знания дают устойчивое конкурентное преимущество этим компаниям.

Рассмотрим, в чем отличие знаний от данных и информации. То, что это разные вещи, руководители начинают осознавать особенно ярко после того, как в организации потрачены значительные средства для создания той или иной базы данных, или информационной системы, или же просто эти средства потрачены на компьютеризацию, причем без соответствующего эффекта.

Данные - это совокупность различных объективных фактов. В корпорациях это, например, структурированные записи о трансакциях (в частности, данные обо всех продажах: сколько, когда и кто купил, сколько и когда заплатил и пр.). Эти данные не говорят о том, почему покупатель пришел именно сюда и придет ли он еще раз.

Информация - это иерархическая совокупность данных о тех или иных аспектах реального мира. Информация - это поток сообщений, а знание создается из этого потока, оно находится в зависимости от мнений и убеждений носителя знания.

Информация - это своего рода послание, обычно в форме документа или в видео- либо в аудиоформе. Она имеет получателя и отправителя. Она информирует, т.е. "придает форму", получателю путем изменения его оценок или поведения. Насколько послание является информацией, определяет получатель. Именно он оценивает, насколько полученное сообщение информирует его, а насколько оно представляет собой просто информационный шум.

Данные превращаются в информацию несколькими путями:

  • o контекстуализация : мы знаем, для чего эти данные нужны;
  • o категоризация : мы разбиваем данные на типы и компоненты;
  • o подсчет : мы обрабатываем данные математически;
  • o коррекция : мы исправляем ошибки и ликвидируем пропуски;
  • o сжатие : мы сжимаем, концентрируем, агрегируем данные.

Знания - понятие более глубокое и широкое, чем просто данные или информация. Каждое предприятие в ходе своей деятельности осуществляет сбор данных, их структуризацию и генерирование нового знания. Чаще всего это знание касается технологии, если речь идет о материальном производстве, а также технологии работы с клиентами и технологии взаимодействия друг с другом, если речь идет о предприятии, осуществляющем обслуживание клиентов. Также это может быть знание относительно окружающей среды предприятия - о демографических, макроэкономических, социальных, макроэкономических, технологических и конъюнктурных трендах.

Отличие знаний от информации и данных: пример

У компании Chrysler имеется собрание компьютерных файлов, которые носят название "Книга инженерных знаний" и представляют собой исчерпывающие данные и информацию о создании автомобилей этой компании, которыми может пользоваться каждый разработчик новых автомобилей. Когда управляющий получил данные о проведенных крэш-тестах, то он отказался их поместить в файлы без соответствующей обработки. Он предложил ответить на следующие вопросы:

  • o почему эти тесты проводились;
  • o каковы результаты по сравнению другими аналогичными тестами данной компании других лет и конкурентов;
  • o какие выводы дачи тесты для конструкции автомобиля и его основных узлов?

Аналогичные вопросы трансформируют информацию в знания; более того, ответы на эти вопросы добавляют информации ценность, или, говоря другими словами, добавляют стоимость. На практике встречаются противоположные примеры, когда путем добавления ненужной, пустой информации исходная информация теряет в своей цене. Происходит потеря стоимости за счет размывания нужной информации в потоке информационного шума.

Знание - это комбинация опыта, ценностей, контекстной информации, экспертных оценок, которая дает общие рамки для оценки и инкорпорирования нового опыта и информации. Знание существует в сознании тех, кто знает. В организациях оно фиксируется не только в документах, но и в процессах, процедурах, нормах, в целом в практике деятельности.

Точно так же как информация возникает из данных, так и знания возникают из информации путем:

  • o сравнения, определения области применения (как и когда мы можем применить информацию об этом явлении к другому, аналогичному);
  • o установления связей (как эта информация соотносится с другой информацией);
  • o оценки (как можно оценить данную информацию и как ее оценивают другие);
  • o определения области применения (какое применение имеет эта информация к тем или иным решениям или действиям).

Процесс трансформации данных в информацию, а информации в знания показан на рис. 14.1.

Рис. 14.1.

Различают индивидуальные и групповые знания. Традиционные представления исходят из того, что знания - это прерогатива отдельных людей, при этом группа - это лишь простая сумма членов этой группы, а групповое знание - сумма их знаний.

Существует другая, современная точка зрения, в соответствии с которой группа людей формирует новую сущность со своей уникальной спецификой. В рамках этого представления можно говорить о групповом поведении и о групповом знании соответственно. Это новое представление широко используется в рамках науки об управлении знаниями. Таким образом, знание может быть не только у отдельного человека, но и у группы людей. Тогда говорят о том, что что-то знает организация в целом, что-то знает группа, бригада и т.д.

Билл Гейтс в своей книге "Бизнес со скоростью мысли" пишет о необходимости повышения корпоративного IQ. При этом он имеет в виду не только количество умных сотрудников, но и накопление знаний в компании в целом и свободное распространение информации, которое позволяет сотрудникам пользоваться идеями друг друга.

Знание может быть явным и неявным. Явное знание может быть выражено в виде слов и цифр и может передаваться в формализованном виде на носителях. Это относится к тем видам знаний, которые передаются в форме предписаний, инструкций, книг, на различных носителях, в виде памятных записок и пр.

Неявное знание в принципе не формализуется и может существовать лишь вместе с его обладателем - человеком или группой лиц.

Существует два вида неявного знания. Первое - это технические навыки, которые проявляются у мастеров своего дела и выступают, как правило, результатом многолетней практики. Второе - это верования, идеалы, ценности и ментальные модели, которые мы используем, не задумываясь о них.

Неявные знания формируются и развиваются в процессе создания и укрепления позитивной корпоративной культуры и с помощью средств группового взаимодействия (ретриты, творческие группы и пр.).

Отношение к явному и неявному знанию со стороны коммерческих фирм весьма противоречиво. С одной стороны, многие фирмы стремятся перевести неявное знание в явное. Это делается для того, чтобы, с одной стороны, не зависеть от отдельных личностей, а с другой - продублировать значимые достижения. В то же время эти фирмы не заинтересованы в том, чтобы основные конкурентные преимущества перешли в форму, готовую для дублирования. Именно поэтому многие компании стараются сохранять некоторые из своих конкурентных преимуществ в тех формах, которые не поддаются дублированию (специфические тренинги, корпоративная культура, специальные системы обслуживания и пр.).

Носителем как явного, так и неявного знания может быть не только конкретная личность, но и организация . Следовательно, можно говорить и о неявном групповом знании, которое лежит в основе устойчивых моделей коллективных реакций и внутренних взаимодействий.

В западной литературе для обозначения неявного группового знания иногда используется термин "рутины" (routines), которые есть повторяющиеся по шаблону действия, регулярные поведенческие шаблоны организации или фирмы. Рутины - это то, что происходит автоматически, без инструкций и в отсутствие процедуры выбора; при этом рутины не могут быть кодифицированы.

В русском языке под рутиной понимаются заведенный порядок, установившаяся практика, определенный режим, шаблон, сложившиеся правила, касающиеся занятий людей. В то же время понятие "рутина" имеет еще один опенок: это косный порядок, т.е. такой порядок, который тяготеет к старому, привычному, в силу своей отсталости невосприимчивый к новому, прогрессивному. В тех случаях, когда термин "рутина" применяется для обозначения группового неявного знания, то оттенки, относящиеся к косности, отсутствуют.

Таким образом, персональное неявное знание - это, прежде всего, умения. В то же время групповое неявное знание - это, прежде всего, рутины. Рутины существуют не изолированно, а образуя взаимозависимость. Некоторые рутины могут быть неявными для одних членов группы (организации) и явными для других. Таким образом, границы между явными и неявными знаниями относительны, также можно говорить о степени неявности этих знаний. Соотношение явных и неявных, индивидуальных и групповых знаний представлено в табл. 14.1.

Таблица 14.1

Соотношение знаний

Наличие неявных знаний в организации заставляет подходить к управлению знаниями нетрадиционным способом. Традиционно под управлением знаниями понимают создание, развитие и использование различных баз данных и знаний. Наличие неявных знаний смещает внимание к средствам прямого общения между людьми. Важно не только и не столько создать корпоративную энциклопедию, в которой записано все, что кто-либо из работников знал и с чем сталкивался. В случае с неявными знаниями важнее иметь под рукой координаты людей, которые знают рецепт и имеют соответствующий опыт, создать культуру общения, используя "мозговые штурмы", совещания, "разборы полетов" и соответствующие средства общения, такие как электронная почта, персональные сайты, телеконференции и пр.


Модуль 1 (1,5 кредит): Введение в экономическую информатику

Тема 1.1: Теоретические основы экономической информатики

Тема 1.2: Технические средства обработки информации

Тема 1.3: Системное программное обеспечение

Тема 1.4: Сервисное программное обеспечение и основы алгоритмизации

Экономическая информатика и информация

1.1. Теоретические основы экономической информатики

1.1.2. Данные, информация и знания

Основные понятия данных, информации, знаний.

К базовым понятиям, которые используются в экономической информатике, относятся: данные, информация и знания. Эти понятия часто используются как синонимы, однако между этими понятиями существуют принципиальные различия.

Термин данные происходит от слова data - факт, а информация (informatio) означает разъяснение, изложение, т.е. сведения или сообщение.

Данные - это совокупность сведений, зафиксированных на определенном носителе в форме, пригодной для постоянного хранения, передачи и обработки. Преобразование и обработка данных позволяет получить информацию.

Информация - это результат преобразования и анализа данных. Отличие информации от данных состоит в том, что данные - это фиксированные сведения о событиях и явлениях, которые хранятся на определенных носителях, а информация появляется в результате обработки данных при решении конкретных задач. Например, в базах данных хранятся различные данные, а по определенному запросу система управления базой данных выдает требуемую информацию.

Существуют и другие определения информации, например, информация – это сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают имеющуюся о них степень неопределенности, неполноты знаний.

Знания – это зафиксированная и проверенная практикой обработанная информация, которая использовалась и может многократно использоваться для принятия решений.

Знания – это вид информации, которая хранится в базе знаний и отображает знания специалиста в конкретной предметной области. Знания – это интеллектуальный капитал.

Формальные знания могут быть в виде документов (стандартов, нормативов), регламентирующих принятие решений или учебников, инструкций с описанием решения задач.

Неформальные знания – это знания и опыт специалистов в определенной предметной области.

Необходимо отметить, что универсальных определений этих понятий (данных, информации, знаний) нет, они трактуются по-разному.

Принятия решений осуществляются на основе полученной информации и имеющихся знаний.

Принятие решений – это выбор наилучшего в некотором смысле варианта решения из множества допустимых на основании имеющейся информации.

Взаимосвязь данных, информации и знаний в процессе принятия решений представлена на рисунке.


Рис. 1.

Для решения поставленной задачи фиксированные данные обрабатываются на основании имеющихся знаний, далее полученная информация анализируется с помощью имеющихся знаний. На основании анализа, предлагаются все допустимые решения, а в результате выбора принимается одно наилучшее в некотором смысле решение. Результаты решения пополняют знания.

В зависимости от сферы использования информация может быть различной: научной, технической, управляющей, экономической и т.д. Для экономической информатики интерес представляет экономическая информация.

Глава 1 Основные понятия

В этой книге описываются методы обработки информации, представленной в различной форме - в виде «данных», «знаний», «структур» и т. д. В основе анализа всех этих видов информации лежат две процедуры: процедура обнаружения закономерностей, содержащихся в представленной информации, и процедура использования обнаруженных закономерностей для предсказания значения одной части информации по известным значениям другой ее части. Но прежде чем переходить к описанию этих процедур, нужно пояснить смысл употребляемых в книге терминов, в частности таких распространенных, как данные, знания, гипотеза, закономерность и т. п.

§ 1. Чем отличаются «данные» от «знаний»?

Исходная информация, которую нужно обрабатывать, чаще всего имеет вид числовых таблиц (матриц), состоящих из строк и столбцов. Строки отражают информацию об изучаемых объектах или явлениях, а столбцы отражают свойства (признаки, характеристики) этих объектов или явлений. Природа объектов может быть любой - это могут быть физические тела, живые организмы, сигналы, отдельные социальные процессы, заводы, виды спорта, месторождения и т. д. Понятно, что набор признаков, описывающих эти объекты, будет в каждом случае своим и должен отражать их наиболее важные свойства.

На пересечении -й строки и -го столбца указывается значение -го признака у -го объекта. Такой факт (например, что -й дом имеет высоту 12 м) считаем атомарной частью данных о конкретном -м объекте. Полные данные об -м объекте содержатся в совокупности всех элементов -й строки. Информация же о всех заданных свойствах всех изучаемых объектов, записанная в таблице «объект-свойство», и называется таблицей данных. Таким образом, данные представляют собой совокупность отдельных конкретных фактов.

Пусть в таблице данных представлены описания большого количества жилых домов, а нас интересуют только три свойства этих домов: из какого материала они построены, в какой цвет покрашены их стены и какой они высоты. После изучения таблицы данных мы можем обнаружить некоторые закономерности. Например, выясняется, что все панельные дома, окрашенные в серый цвет, имеют высоту от 15 до 25 м, панельные зеленые дома - от 8 до 16 м, а кирпичные, вне зависимости от цвета стен, имеют высоту меньше 10 м. Обозначим признак «вид строительного материала» через . Этот признак принимает два понятных значения: (панель) или (кирпич). Признак «цвет стен», обозначаемый через принимает значения: = серый, = зеленый или = любой. Признак «высота» может принимать любое числовое значение от нуля до 30 м. Тогда обнаруженные закономерности можно сжато записать в виде таких логических высказываний:

Эти высказывания не содержат информации в виде конкретных характеристик каждого отдельного дома, но зато отражают наши знания о некоторых обобщенных характеристиках всех домов, описанных в таблице данных.

Так выглядит переход от данных к знаниям. Знания представляют собой краткое обобщенное описание основного содержания информации, представленной в данных. Знания могут быть представлены в различной форме. В дальнейшем мы будем пользоваться приведенной выше формой в виде логических правил типа «если... то...».

Классификация знаний

Трактовки знаний

Представление знаний

Тема 1. Понятие знания

Знание – это проверенный практикой результат познания действительности, отражение в сознании человека.

Знание – закономерности предметной области (принципы, связи, законы), полученные в результате практической деятельности и профессионального опыта, позволяющие специалистам решать задачи в этой области.

Знания – это результат, полученный познанием.

Знания – это формализованная информация, на которую ссылаются когда делают различные заключения на основе имеющихся данных с помощью логических выводов.

Знаниями называют хранимую в ЭВМ информацию, формализованную в соответствии со структурными правилами, которую можно использовать при решении проблем.

· Психологическая : Знание – психологические образы или мысленные модели.

· Интеллектуальная : Знания – совокупность сведений о некоторой предметной области, включающих факты об объектах предметной области, о свойствах объекта, и связывающих их отношений, описаний процессов протекающих в данной предметной области и содержащих информацию о решении типовых задач.

· Формально логическая : Знание – формализованная информация, используемая для получения или вывода новых знаний с помощью специализированных процедур.

· Информационно -технологическая : Знание – структурированная информация, хранящаяся в памяти ЭВМ и используемая при работе интеллектуальных систем.

1. В зависимости от источника:

a. априорные

b. накапливаемые

i. экспертные

ii. наблюдаемые

iii. выводимые

2. В зависимости от характера использования при решении задач:

a. декларативные

b. процедурные

c. метазнания

3. В зависимости от степени достоверности:

a. четкие знания

b. нечеткие знания

4. В зависимости от глубины:

i. поверхностные:

b. знании-копии

c. знания-знакомства

i. глубинные:

1.1. Априорные – закладываются в базу знаний до начала функционирования ИИС включающую эту базу знаний. Кроме того, при работе с базой знаний достоверность содержащихся в ней априорных знании непереоценивается.

1.2. Накапливаемые знания – формируются в процессе работы базы знаний. Источниками этих знаний могут быть эксперты (экспертные), внешние искусственные устройства наблюдатели (наблюдаемые), правила и процедуры вывода и верификация знаний действующих в рамках интеллектуальной системы (выводимые).

2.2. Процедурные знания – информация о способах решения типовых задач в некоторой предметной области.

2.3. Метазнания – знания о знаниях, которые сдержат общие сведения о принципах использования знаний. К уровню метазнаний также относят стратегию управления выбором и применением процедурных знаний.


3. В основе классификации знания в зависимости от степени их достоверности лежат т.н. нефакторы присущие знаниям: неполнота информации о рассматриваемом фрагменте предметной области – это неточность количественных и качественных оценок, неоднозначность правил вывода новых знаний, несогласованность некоторых положений в базе знаний.

4. Поверхностные – знания о видимых взаимосвязях объектов и явлений. Глубинные знания основываются на абстрактных аналогиях позволяющих объяснять суть явлений.


Представление знаний – выражение на к\л формальном языке свойств различных объектов и закономерностей существенных для решения задач.

Основные направления исследований, связанные с представлением знаний:

· разработка методологии построения проблемно-ориентированных математических моделей;

· разработка формального аппарата для описания таких моделей;

· разработка теорий вычислений в таких моделях;

· разработка технологий реализации программной поддержки таких моделей.

При разработке модели представлений знаний могут быть поставлены вопросы: «Что представлять?» и «Как представлять?».

Первый вопрос связан с организацией или выбором структуры знаний.

Второй связан с представлением знаний в выбранной структуре.

Состав знаний ИИС зависит от предметной области от требований и целей пользователя и от назначения структуры системы. При разработке практически любой ИИС требуется иметь следующий минимальный набор знаний:

· знания о процессе решения задач;

· знания о языке общения и способах организации диалога системы с пользователем;

· знания о проблемной области и знания о способах представления и модификации знаний.


Данными называют информацию фактического характера, описывающую объекты, процессы и явления предметной области, а также их свойства.

Знания являются более сложной категорией по сравнению с данными. Знания описывают не только отдельные факты, но и взаимосвязи между ними, поэтому знания иногда называют структурированными данными. Знания представляют собой результат мыслительной деятельности человека, направленной на обобщение его опыта, полученного в результате практической деятельности.

Знания получаются в результате применения к исходным данным некоторых методов обработки, подключения внешних процедур.

ДАННЫЕ + ПРОЦЕДУРА ОБРАБОТКИ = ИНФОРМАЦИЯ

ИНФОРМАЦИЯ + ПРОЦЕДУРА ОБРАБОТКИ = ЗНАНИЯ

Характерная особенность знаний состоит в том, что они не содержаться в исходной системе. Знания возникают в результате сопоставления информационных единиц, нахождения и разрешения противоречий между ними, т.е. знания активны их появление или недостача приводит к реализации некоторых действий или появлению новых знания. Знания отличаются от данных наличием следующих свойств.


1. Внутренняя интерпретация – независимость знаний от интерпретирующей программы, возможность отвечать на вопросы, касающиеся содержимого памяти. Она позволяет соотнести данные хранящиеся в памяти с их смысловым содержанием. Ее наличие обеспечивает возможность построения процедур отвечающих от имени компьютера на вопросы человека о содержимом памяти.

2, 3. Наличие внутренних и внешних структур знания . Распространение принципа деления объектов на уже выделенные компоненты целого, позволяет строить многоуровневые иерархические представления. Объекты части могут интерпретироваться независимо друг от друга, т.е. как элементы множества. Если взаимосвязь отдельных элементов частей является существенной, то ее необходимо отражать в базе знаний. На множестве объектов предметной области, как целых, так и их частей вводятся различные семантические отношения (родовидовые отношения, временные. пространственные) описывающие структуру фрагмента предметной области. Такое структурное представление предметной области является очень важным аспектом знаний, т.к. принципы декомпозиции объектов предметной области и выделения системы отношений между ними базируются на подобных механизмах человеческого мышления.

4. Шкалирование. Позволяет сопоставлять и упорядочивать качественно одинаковые, но различающиеся в количественном плане свойства и отношения объектов предметной области. В памяти человека знания об окружающем мире упорядочены, что определяются различными шкалами. Шкала представляет собой последовательность меток с каждой из которых связано значение оценки или значение некоторой величины. Выделяют следующие виды шкал: 1) Метрические, которые делятся на Абсолютные и Относительные; 2) Порядковые шкалы, которые делятся на лингвистические и оппозиционные. В метрических шкалах по расположению точек можно определить степень отличия соответствующих информационных единиц. С помощью метрических шкал можно установить количественные отношения и порядок тех или иных оценок или величин. В абсолютных метрических шкалах начало отсчета никогда не меняется. В относительных шкалах, начало отсчета меняется в каждом случае и определяется ситуацией или текущим моментом времени. В порядковых шкалах фиксируется порядок информационных единиц в лингвистических порядковых шкалах используются квантификаторы, которые служат для введения количественных или качественных мер. Такие квантификаторы как никогда, очень редко, редко, часто и т.д. В оппозиционных порядковых шкалах концы шкалы соответствуют крайним или несовместимым свойствам и отношениям объектов, которые обозначаются парами антонимов, среднее положение считается нейтральным. Примерами таких антонимов могут служить такие пары: медленный – быстрый, сильный – слабый. Шкалы задаются тремя параметрами.

Лучшие статьи по теме