Инженерия знаний
Инженерия знаний — инженерная дисциплина, которая занимается интеграцией знаний с компьютерными системами для того чтобы решить сложные проблемы, обычно требующие высокого уровня человеческой экспертизы:
- управление конфигурацией знаний (учёт);
- управление изменениями (эволюция);
- логистика (поиск и доставка по потребности).
На высоком уровне, процесс инженерии знаний состоит из двух:
- Извлечение знаний — преобразование «сырых знаний» в организованные, процесс получения знаний из его источников, которыми могут быть материальные носители (файлы, документы, книги) и эксперты (группы экспертов). Является частью Инженерии знаний.
- Внедрение знаний — преобразование организованных знаний в реализованные, процесс преобразования организованных знаний в реализованные.
Технологии управления знаниями
Выделяют следующие технологии управления знаниями:
- работающие с неявными знаниями (tacit knowledge) в головах экспертов (чаще всего именно они имеются ввиду, когда говорится об "управлении знаниями"). Когнитолог (роль):
- помогает эксперту выявить и структурировать знания, необходимые для работы экспертной системы, извлекает из эксперта неформализованные знания;
- осуществляет выбор той интеллектуальной системы, которая наиболее подходит для данной проблемной области, и определяет способ представления знаний в этой ИС;
- выделяет и программирует стандартные функции, которые будут использоваться в правилах, вводимых экспертом.
- работающие с письменным знанием ("управление знаниями" распространяется на компьютеры: управление корпоративными знаниями, Knowledge Management) — акцент на "полнотекстовый поиск", "семантический поиск", "автоматическое аннотирование".
- НЛП, как даталогическая дисциплина ("работа по форме"), техника взмаха, модальности восприятия, субмодальности, пространственное маркирование, калибровка
- использование web 2.0 (блоги и вики)
- работающие с письменным формальным знанием (инженерия знаний, которую тоже включают в управление знаниями, но уже не так уверенно) — акцент на структурных БД, инженерных моделях, интеграции данных.
- Большинство технологий в инженерии знаний пошло по пути реализации так называемой "семантической сети", подход Гуссерля-Витгенштейна-Бунге о том, что знание представимо фактами (а факты — это отношения концептов). Из множества фактов возникает семантическая сеть (см. обзор John F.Sowa), в котором отношения-ребра связывают концепты-вершины. Реализацией идеи хранения и использования знаний в форме семантической занялось множество почти непересекающихся тусовок/школ (community of practice), отчего появилось огромное количество реализаций и стандартов, в которых ни одного слова не совпадает, но которые идейно и технологически совместимы.
- Моделирование данных + интеграция данных.
- Используют, когда нужно объединить данные множества САПР различных поставщиков при постройке крупного промышленного объекта.
- Ключевые слова: ISO 15926, Gellish, ISO 10303. Вместо слова "онтология" говорят "модель данных".
- Средства оперирования знаниями: практически нет, все запросы к данным. Со знаниями сражается каждый сам врукопашную. Никакой графики, сплошной XML, проприетарные форматы хранения Схемы данных в каждом отдельном САПР. В последнее время появляются и иные решения, нацеленные на интеграцию разнородных данных, например от CYC и [1] (на базе стандартизированной онтологии UMBEL, выражения в RDF и обеспечения доступа к данным через HTTP, см.).
- Проекты ISO 15926-7 сводятся к тому же: некая онтология + semantic web стандарты.
- Concept Map ([2])
- Используют для (часто коллаборативной через веб) учебной и творческой работы.
- Ключевые форматы (все на XML): XCT 3.0, но готовы кушать и Topic Map, и многое другое для редактирования и отображения.
- Средства оперирования знаниями: графическое отображение, объединение сетей, которые нарисовали два участника творческого процесса. Близкий родственник — MindMap, где вообще не граф, а красиво нарисованное дерево, а связи неименованы.
- Conceptual Graphs
- Используют для академических занятий искусственным интеллектом, экспертные системы, агентские системы и прочая классика жанра. Опираются на работы философа и логика Pierce ("интеллектуальное индексирование"), ключевой человек — John F.Sowa.
- Ключевой формат хранения знаний: три синтаксиса, главный из которых — CGIF (XML).
- Средства оперирования знаниями: Common Logic (или ISO ISO/IEC IS 24707:2007, [3]).
- Topic Map
- Использут для Knowledge Management инициатив — а пришли они из каталожников (библиографов). Большие любители стандартизации (см.), но потеряли фокус (их неумолимо влечет к моделированию данных общего вида, в котором они проигрывают подходам Semantic Web).
- Ключевые форматы хранения знаний: ISO 13250, XTM 2.0, HyTM.
- Средства оперирования знаниями: используется topic map engine (десяток вариантов), ибо стандартизован TMAPI 2.0. Кроме того, на финишную прямую вышел специальный стандарт на задание констрейнтов для topic maps — ISO/IEC FCD 19756 (TMCL), а язык запросов Topic Map Query Language (проект ISO 18048), похоже, заглох.
- Semantic Web
- Самые разные инициатив на базе стека стандартов W3C.
- Ключевые форматы хранения знаний: RDF и OWL.
- Средства оперирования: язык запросов SPARQL, так называемые business rules, обобщенные затем до просто "правил" и огромное число самых разных частных разработок. Например, интерфейс DIG 2.0 позволяет самым разным редакторам онтологий работать с моделью вычислений Desctiption Logic. Все древние онтологии срочно переписываются на OWL, все редакторы знаний срочно переделываются на чтение/запись OWL, все системы представления знаний стремятся быть совместимыми.
- Частные инициативы — им несть числа:
- CYC, который любит, когда его называют "Rolls Royce of formal ontologies"
- всяческие "семантические поиски" пары десятков крупных фирм — проприетарное в разной степени, стандартизации там мало.
- Formal Concept Analysis (homepage), используется для выведения иерархии типов и отношений "естественным способом", популярен в России, ибо это крутейшая математика, но в стандартизации пока не замечен.