Инженерия знаний

Инженерия знаний — инженерная дисциплина, которая занимается интеграцией знаний с компьютерными системами для того чтобы решить сложные проблемы, обычно требующие высокого уровня человеческой экспертизы:

На высоком уровне, процесс инженерии знаний состоит из двух:

  1. Извлечение знаний — преобразование «сырых знаний» в организованные, процесс получения знаний из его источников, которыми могут быть материальные носители (файлы, документы, книги) и эксперты (группы экспертов). Является частью Инженерии знаний.
  2. Внедрение знаний — преобразование организованных знаний в реализованные, процесс преобразования организованных знаний в реализованные.

Технологии управления знаниями

Выделяют следующие технологии управления знаниями:

  • работающие с неявными знаниями (tacit knowledge) в головах экспертов (чаще всего именно они имеются ввиду, когда говорится об "управлении знаниями"). Когнитолог (роль):
    • помогает эксперту выявить и структурировать знания, необходимые для работы экспертной системы, извлекает из эксперта неформализованные знания;
    • осуществляет выбор той интеллектуальной системы, которая наиболее подходит для данной проблемной области, и определяет способ представления знаний в этой ИС;
    • выделяет и программирует стандартные функции, которые будут использоваться в правилах, вводимых экспертом.
  • работающие с письменным знанием ("управление знаниями" распространяется на компьютеры: управление корпоративными знаниями, Knowledge Management) — акцент на "полнотекстовый поиск", "семантический поиск", "автоматическое аннотирование".
    1. НЛП, как даталогическая дисциплина ("работа по форме"), техника взмаха, модальности восприятия, субмодальности, пространственное маркирование, калибровка
    2. использование web 2.0 (блоги и вики)
  • работающие с письменным формальным знанием (инженерия знаний, которую тоже включают в управление знаниями, но уже не так уверенно) — акцент на структурных БД, инженерных моделях, интеграции данных.
    Большинство технологий в инженерии знаний пошло по пути реализации так называемой "семантической сети", подход Гуссерля-Витгенштейна-Бунге о том, что знание представимо фактами (а факты — это отношения концептов). Из множества фактов возникает семантическая сеть (см. обзор John F.Sowa), в котором отношения-ребра связывают концепты-вершины. Реализацией идеи хранения и использования знаний в форме семантической занялось множество почти непересекающихся тусовок/школ (community of practice), отчего появилось огромное количество реализаций и стандартов, в которых ни одного слова не совпадает, но которые идейно и технологически совместимы.
    1. Моделирование данных + интеграция данных.
      Используют, когда нужно объединить данные множества САПР различных поставщиков при постройке крупного промышленного объекта.
      Ключевые слова: ISO 15926, Gellish, ISO 10303. Вместо слова "онтология" говорят "модель данных".
      Средства оперирования знаниями: практически нет, все запросы к данным. Со знаниями сражается каждый сам врукопашную. Никакой графики, сплошной XML, проприетарные форматы хранения Схемы данных в каждом отдельном САПР. В последнее время появляются и иные решения, нацеленные на интеграцию разнородных данных, например от CYC и [1] (на базе стандартизированной онтологии UMBEL, выражения в RDF и обеспечения доступа к данным через HTTP, см.).
      Проекты ISO 15926-7 сводятся к тому же: некая онтология + semantic web стандарты.
    2. Concept Map ([2])
      Используют для (часто коллаборативной через веб) учебной и творческой работы.
      Ключевые форматы (все на XML): XCT 3.0, но готовы кушать и Topic Map, и многое другое для редактирования и отображения.
      Средства оперирования знаниями: графическое отображение, объединение сетей, которые нарисовали два участника творческого процесса. Близкий родственник — MindMap, где вообще не граф, а красиво нарисованное дерево, а связи неименованы.
      Concept-map.jpg
    3. Conceptual Graphs
      Используют для академических занятий искусственным интеллектом, экспертные системы, агентские системы и прочая классика жанра. Опираются на работы философа и логика Pierce ("интеллектуальное индексирование"), ключевой человек — John F.Sowa.
      Ключевой формат хранения знаний: три синтаксиса, главный из которых — CGIF (XML).
      Средства оперирования знаниями: Common Logic (или ISO ISO/IEC IS 24707:2007, [3]).
    4. Topic Map
      Использут для Knowledge Management инициатив — а пришли они из каталожников (библиографов). Большие любители стандартизации (см.), но потеряли фокус (их неумолимо влечет к моделированию данных общего вида, в котором они проигрывают подходам Semantic Web).
      Ключевые форматы хранения знаний: ISO 13250, XTM 2.0, HyTM.
      Средства оперирования знаниями: используется topic map engine (десяток вариантов), ибо стандартизован TMAPI 2.0. Кроме того, на финишную прямую вышел специальный стандарт на задание констрейнтов для topic maps — ISO/IEC FCD 19756 (TMCL), а язык запросов Topic Map Query Language (проект ISO 18048), похоже, заглох.
    5. Semantic Web
      Самые разные инициатив на базе стека стандартов W3C.
      Ключевые форматы хранения знаний: RDF и OWL.
      Средства оперирования: язык запросов SPARQL, так называемые business rules, обобщенные затем до просто "правил" и огромное число самых разных частных разработок. Например, интерфейс DIG 2.0 позволяет самым разным редакторам онтологий работать с моделью вычислений Desctiption Logic. Все древние онтологии срочно переписываются на OWL, все редакторы знаний срочно переделываются на чтение/запись OWL, все системы представления знаний стремятся быть совместимыми.
    6. Частные инициативы — им несть числа:
      • CYC, который любит, когда его называют "Rolls Royce of formal ontologies"
      • всяческие "семантические поиски" пары десятков крупных фирм — проприетарное в разной степени, стандартизации там мало.
      • Formal Concept Analysis (homepage), используется для выведения иерархии типов и отношений "естественным способом", популярен в России, ибо это крутейшая математика, но в стандартизации пока не замечен.

Ссылки

См. также