Инженерия знаний — различия между версиями

(Технологии управления знаниями)
м
 
(не показано 13 промежуточных версий этого же участника)
Строка 1: Строка 1:
'''[http://en.wikipedia.org/wiki/Knowledge_engineering Инженерия знаний]''' - инженерная дисциплина, которая занимается интеграцией знаний с компьютерными системами для того чтобы решить сложные проблемы, обычно требующие высокого уровня человеческой экспертизы:
+
'''[http://en.wikipedia.org/wiki/Knowledge_engineering Инженерия знаний]''' инженерная дисциплина, которая занимается интеграцией знаний с компьютерными системами для того чтобы решить сложные проблемы, обычно требующие высокого уровня человеческой экспертизы:
* управление конфигурацией знаний (учёт);
+
* [[управление конфигурацией]] знаний (учёт);
* управление изменениями (эволюция);
+
* [[управление изменениями]] (эволюция);
* логистика (поиск и доставка по потребности).
+
* [[логистика]] (поиск и доставка по потребности).
 
+
  
 
На высоком уровне, процесс инженерии знаний состоит из двух:
 
На высоком уровне, процесс инженерии знаний состоит из двух:
# '''Извлечение знаний''' преобразование «сырых знаний» в организованные, процесс получения знаний из его источников, которыми могут быть материальные носители (файлы, документы, книги) и эксперты (группы экспертов). Является частью Инженерии знаний.
+
# '''Извлечение знаний''' преобразование «сырых знаний» в организованные, процесс получения знаний из его источников, которыми могут быть материальные носители (файлы, документы, книги) и эксперты (группы экспертов). Является частью Инженерии знаний.
# '''Внедрение знаний''' преобразование организованных знаний в реализованные, процесс преобразования организованных знаний в реализованные.
+
# '''Внедрение знаний''' преобразование организованных знаний в реализованные, процесс преобразования организованных знаний в реализованные.
 
+
  
 
== Технологии управления знаниями ==
 
== Технологии управления знаниями ==
 
 
Выделяют следующие технологии управления знаниями:
 
Выделяют следующие технологии управления знаниями:
 
* '''работающие с неявными знаниями''' (tacit knowledge) '''в головах экспертов''' (чаще всего именно они имеются ввиду, когда говорится об "управлении знаниями"). Когнитолог (роль):
 
* '''работающие с неявными знаниями''' (tacit knowledge) '''в головах экспертов''' (чаще всего именно они имеются ввиду, когда говорится об "управлении знаниями"). Когнитолог (роль):
Строка 17: Строка 14:
 
** осуществляет выбор той [https://ru.wikipedia.org/wiki/%D0%98%D0%BD%D1%82%D0%B5%D0%BB%D0%BB%D0%B5%D0%BA%D1%82%D1%83%D0%B0%D0%BB%D1%8C%D0%BD%D0%B0%D1%8F_%D1%81%D0%B8%D1%81%D1%82%D0%B5%D0%BC%D0%B0 интеллектуальной системы], которая наиболее подходит для данной проблемной области, и определяет способ представления знаний в этой ИС;
 
** осуществляет выбор той [https://ru.wikipedia.org/wiki/%D0%98%D0%BD%D1%82%D0%B5%D0%BB%D0%BB%D0%B5%D0%BA%D1%82%D1%83%D0%B0%D0%BB%D1%8C%D0%BD%D0%B0%D1%8F_%D1%81%D0%B8%D1%81%D1%82%D0%B5%D0%BC%D0%B0 интеллектуальной системы], которая наиболее подходит для данной проблемной области, и определяет способ представления знаний в этой ИС;
 
** выделяет и программирует стандартные функции, которые будут использоваться в правилах, вводимых экспертом.
 
** выделяет и программирует стандартные функции, которые будут использоваться в правилах, вводимых экспертом.
* '''работающие с письменным знанием''' ("управление знаниями" распространяется на компьютеры: управление корпоративными знаниями, [http://en.wikipedia.org/wiki/Knowledge_management Knowledge Management]) - акцент на "полнотекстовый поиск", "семантический поиск", "автоматическое аннотирование".
+
* '''работающие с письменным знанием''' ("управление знаниями" распространяется на компьютеры: управление корпоративными знаниями, [http://en.wikipedia.org/wiki/Knowledge_management Knowledge Management]) акцент на "полнотекстовый поиск", "семантический поиск", "автоматическое аннотирование".
 
*# НЛП, как даталогическая дисциплина ("работа по форме"), техника взмаха, модальности восприятия, субмодальности, пространственное маркирование, калибровка
 
*# НЛП, как даталогическая дисциплина ("работа по форме"), техника взмаха, модальности восприятия, субмодальности, пространственное маркирование, калибровка
 
*# использование web 2.0 (блоги и вики)
 
*# использование web 2.0 (блоги и вики)
* '''работающие с письменным формальным знанием''' (инженерия знаний, которую тоже включают в управление знаниями, но уже не так уверенно) - акцент на структурных БД, инженерных моделях, интеграции данных.
+
* '''работающие с письменным формальным знанием''' (инженерия знаний, которую тоже включают в управление знаниями, но уже не так уверенно) акцент на структурных БД, инженерных моделях, интеграции данных.
*: Большинство технологий в инженерии знаний пошло по пути реализации так называемой "семантической сети", подход Гуссерля-Витгенштейна-Бунге о том, что знание представимо фактами (а факты - это отношения концептов). Из множества фактов возникает [http://en.wikipedia.org/wiki/Semantic_network семантическая сеть] (см. [http://www.jfsowa.com/pubs/semnet.htm обзор John F.Sowa]), в котором отношения-ребра связывают концепты-вершины. Реализацией идеи хранения и использования знаний в форме семантической занялось множество почти непересекающихся тусовок/школ (community of practice), отчего появилось огромное количество реализаций и стандартов, в которых ни одного слова не совпадает, но которые идейно и технологически совместимы.
+
*: Большинство технологий в инженерии знаний пошло по пути реализации так называемой "семантической сети", подход Гуссерля-Витгенштейна-Бунге о том, что знание представимо фактами (а факты это отношения концептов). Из множества фактов возникает [http://en.wikipedia.org/wiki/Semantic_network семантическая сеть] (см. [http://www.jfsowa.com/pubs/semnet.htm обзор John F.Sowa]), в котором отношения-ребра связывают концепты-вершины. Реализацией идеи хранения и использования знаний в форме семантической занялось множество почти непересекающихся тусовок/школ (community of practice), отчего появилось огромное количество реализаций и стандартов, в которых ни одного слова не совпадает, но которые идейно и технологически совместимы.
 
*# '''Моделирование данных + интеграция данных'''.
 
*# '''Моделирование данных + интеграция данных'''.
 
*#: Используют, когда нужно объединить данные множества САПР различных поставщиков при постройке крупного промышленного объекта.
 
*#: Используют, когда нужно объединить данные множества САПР различных поставщиков при постройке крупного промышленного объекта.
 
*#:  
 
*#:  
*#: ''Ключевые слова'': [[ISO 15926]], [https://en.wikipedia.org/wiki/Gellish Gellish], ISO 10303. Вместо слова "онтология" говорят "модель данных".
+
*#: ''Ключевые слова'': [[ISO 15926]], [[Gellish]], [[ISO 10303]]. Вместо слова "[[онтология]]" говорят "модель данных".
 
*#: ''Средства оперирования знаниями'': практически нет, все запросы к данным. Со знаниями сражается каждый сам врукопашную. Никакой графики, сплошной XML, проприетарные форматы хранения Схемы данных в каждом отдельном САПР. В последнее время появляются и иные решения, нацеленные на интеграцию разнородных данных, например от CYC и [http://www.zitgist.com/] (на базе стандартизированной онтологии UMBEL, выражения в RDF и обеспечения доступа к данным через HTTP, [http://www.zitgist.com/labs/linked_data.html см.]).
 
*#: ''Средства оперирования знаниями'': практически нет, все запросы к данным. Со знаниями сражается каждый сам врукопашную. Никакой графики, сплошной XML, проприетарные форматы хранения Схемы данных в каждом отдельном САПР. В последнее время появляются и иные решения, нацеленные на интеграцию разнородных данных, например от CYC и [http://www.zitgist.com/] (на базе стандартизированной онтологии UMBEL, выражения в RDF и обеспечения доступа к данным через HTTP, [http://www.zitgist.com/labs/linked_data.html см.]).
 
*#:  
 
*#:  
Строка 32: Строка 29:
 
*#: Используют для (часто коллаборативной через веб) учебной и творческой работы.  
 
*#: Используют для (часто коллаборативной через веб) учебной и творческой работы.  
 
*#: ''Ключевые форматы (все на XML)'': XCT 3.0, но готовы кушать и Topic Map, и многое другое для редактирования и отображения.
 
*#: ''Ключевые форматы (все на XML)'': XCT 3.0, но готовы кушать и Topic Map, и многое другое для редактирования и отображения.
*#: ''Средства оперирования знаниями'': графическое отображение, объединение сетей, которые нарисовали два участника творческого процесса. Близкий родственник - MindMap, где вообще не граф, а красиво нарисованное дерево, а связи неименованы.
+
*#: ''Средства оперирования знаниями'': графическое отображение, объединение сетей, которые нарисовали два участника творческого процесса. Близкий родственник — [[Ментальная карта|MindMap]], где вообще не граф, а красиво нарисованное дерево, а связи неименованы.
 +
*#: [[Файл:concept-map.jpg|center]]
 
*# '''[http://conceptualgraphs.org/ Conceptual Graphs]'''
 
*# '''[http://conceptualgraphs.org/ Conceptual Graphs]'''
*#: Используют для академических занятий искусственным интеллектом, экспертные системы, агентские системы и прочая классика жанра. Опираются на работы философа и логика Pierce ("интеллектуальное индексирование"), ключевой человек - John F.Sowa.
+
*#: Используют для академических занятий искусственным интеллектом, экспертные системы, агентские системы и прочая классика жанра. Опираются на работы философа и логика Pierce ("интеллектуальное индексирование"), ключевой человек John F.Sowa.
*#: Ключевой формат хранения знаний: три синтаксиса, главный из которых - CGIF (XML).
+
*#: ''Ключевой формат хранения знаний'': три синтаксиса, главный из которых CGIF (XML).
*#: Средства оперирования знаниями: Common Logic (или ISO ISO/IEC IS 24707:2007, [http://cl.tamu.edu/]).
+
*#: ''Средства оперирования знаниями'': Common Logic (или ISO ISO/IEC IS 24707:2007, [http://cl.tamu.edu/]).
 
*# '''[http://www.topicmap.com/ Topic Map]'''
 
*# '''[http://www.topicmap.com/ Topic Map]'''
*#: Использут для Knowledge Management инициатив -- а пришли они из каталожников (библиографов). Большие любители стандартизации ([http://www.isotopicmaps.org/ см.]), но потеряли фокус (их неумолимо [http://www.topic-maps.org/projects:rule_the_world влечет] к моделированию данных общего вида, в котором они проигрывают подходам Semantic Web).
+
*#: Использут для Knowledge Management инициатив а пришли они из каталожников (библиографов). Большие любители стандартизации ([http://www.isotopicmaps.org/ см.]), но потеряли фокус (их неумолимо [http://www.topic-maps.org/projects:rule_the_world влечет] к моделированию данных общего вида, в котором они проигрывают подходам Semantic Web).
 
*#: ''Ключевые форматы хранения знаний'': ISO 13250, XTM 2.0, HyTM.
 
*#: ''Ключевые форматы хранения знаний'': ISO 13250, XTM 2.0, HyTM.
*#: ''Средства оперирования знаниями'': используется topic map engine (десяток вариантов), ибо стандартизован TMAPI 2.0. Кроме того, на финишную прямую вышел специальный стандарт на задание констрейнтов для topic maps - ISO/IEC FCD 19756 (TMCL), а язык запросов [http://www.isotopicmaps.org/tmql/ Topic Map Query Language] (проект ISO 18048), похоже, заглох.
+
*#: ''Средства оперирования знаниями'': используется topic map engine (десяток вариантов), ибо стандартизован TMAPI 2.0. Кроме того, на финишную прямую вышел специальный стандарт на задание констрейнтов для topic maps ISO/IEC FCD 19756 (TMCL), а язык запросов [http://www.isotopicmaps.org/tmql/ Topic Map Query Language] (проект ISO 18048), похоже, заглох.
 
*# '''[http://en.wikipedia.org/wiki/Semantic_Web Semantic Web]'''
 
*# '''[http://en.wikipedia.org/wiki/Semantic_Web Semantic Web]'''
 
*#: Самые разные инициатив на базе стека стандартов W3C.
 
*#: Самые разные инициатив на базе стека стандартов W3C.
*#: ''Ключевые форматы хранения знаний'': RDF и OWL.
+
*#: ''Ключевые форматы хранения знаний'': RDF и [[OWL]].
*#: ''Средства оперирования'': язык запросов SPARQL, так называемые business rules, обобщенные затем до просто [http://www.ruleml.org/ "правил"] и огромное число самых разных частных разработок. Например, интерфейс DIG 2.0 позволяет самым разным редакторам онтологий работать с моделью вычислений [http://dl.kr.org/dig/interface.html Desctiption Logic]. Все древние онтологии срочно переписываются на OWL, все редакторы знаний срочно переделываются на чтение/запись OWL, все системы представления знаний стремятся быть совместимыми.  
+
*#: ''Средства оперирования'': язык запросов SPARQL, так называемые business rules, обобщенные затем до просто [http://www.ruleml.org/ "правил"] и огромное число самых разных частных разработок. Например, интерфейс DIG 2.0 позволяет самым разным редакторам [[Онтология|онтологий]] работать с моделью вычислений [http://dl.kr.org/dig/interface.html Desctiption Logic]. Все древние онтологии срочно переписываются на OWL, все редакторы знаний срочно переделываются на чтение/запись OWL, все системы представления знаний стремятся быть совместимыми.  
* Частные инициативы - им несть числа:
+
*# '''Частные инициативы''' — им несть числа:
 
*#* [http://blog.cyc.com/ CYC], который любит, когда его называют "Rolls Royce of formal ontologies"
 
*#* [http://blog.cyc.com/ CYC], который любит, когда его называют "Rolls Royce of formal ontologies"
*#* всяческие "семантические поиски" пары десятков крупных фирм - проприетарное в разной степени, стандартизации там мало.
+
*#* всяческие "семантические поиски" пары десятков крупных фирм проприетарное в разной степени, стандартизации там мало.
 
*#* [http://en.wikipedia.org/wiki/Formal_concept_analysis Formal Concept Analysis] ([http://www.fcahome.org.uk/fca.html homepage]), используется для выведения иерархии типов и отношений "естественным способом", популярен в России, ибо это крутейшая математика, но в стандартизации пока не замечен.
 
*#* [http://en.wikipedia.org/wiki/Formal_concept_analysis Formal Concept Analysis] ([http://www.fcahome.org.uk/fca.html homepage]), используется для выведения иерархии типов и отношений "естественным способом", популярен в России, ибо это крутейшая математика, но в стандартизации пока не замечен.
  
 
== Ссылки ==
 
== Ссылки ==
 
* https://sites.google.com/site/upravlenieznaniami/tehnologii-upravlenia-znaniami
 
* https://sites.google.com/site/upravlenieznaniami/tehnologii-upravlenia-znaniami
 
  
 
== См. также ==
 
== См. также ==
 
 
*[[Data Mining]]
 
*[[Data Mining]]
 
+
*[[База знаний]]
  
 
[[Категория:Дисциплины]]
 
[[Категория:Дисциплины]]

Текущая версия на 02:18, 22 мая 2022

Инженерия знаний — инженерная дисциплина, которая занимается интеграцией знаний с компьютерными системами для того чтобы решить сложные проблемы, обычно требующие высокого уровня человеческой экспертизы:

На высоком уровне, процесс инженерии знаний состоит из двух:

  1. Извлечение знаний — преобразование «сырых знаний» в организованные, процесс получения знаний из его источников, которыми могут быть материальные носители (файлы, документы, книги) и эксперты (группы экспертов). Является частью Инженерии знаний.
  2. Внедрение знаний — преобразование организованных знаний в реализованные, процесс преобразования организованных знаний в реализованные.

Технологии управления знаниями

Выделяют следующие технологии управления знаниями:

  • работающие с неявными знаниями (tacit knowledge) в головах экспертов (чаще всего именно они имеются ввиду, когда говорится об "управлении знаниями"). Когнитолог (роль):
    • помогает эксперту выявить и структурировать знания, необходимые для работы экспертной системы, извлекает из эксперта неформализованные знания;
    • осуществляет выбор той интеллектуальной системы, которая наиболее подходит для данной проблемной области, и определяет способ представления знаний в этой ИС;
    • выделяет и программирует стандартные функции, которые будут использоваться в правилах, вводимых экспертом.
  • работающие с письменным знанием ("управление знаниями" распространяется на компьютеры: управление корпоративными знаниями, Knowledge Management) — акцент на "полнотекстовый поиск", "семантический поиск", "автоматическое аннотирование".
    1. НЛП, как даталогическая дисциплина ("работа по форме"), техника взмаха, модальности восприятия, субмодальности, пространственное маркирование, калибровка
    2. использование web 2.0 (блоги и вики)
  • работающие с письменным формальным знанием (инженерия знаний, которую тоже включают в управление знаниями, но уже не так уверенно) — акцент на структурных БД, инженерных моделях, интеграции данных.
    Большинство технологий в инженерии знаний пошло по пути реализации так называемой "семантической сети", подход Гуссерля-Витгенштейна-Бунге о том, что знание представимо фактами (а факты — это отношения концептов). Из множества фактов возникает семантическая сеть (см. обзор John F.Sowa), в котором отношения-ребра связывают концепты-вершины. Реализацией идеи хранения и использования знаний в форме семантической занялось множество почти непересекающихся тусовок/школ (community of practice), отчего появилось огромное количество реализаций и стандартов, в которых ни одного слова не совпадает, но которые идейно и технологически совместимы.
    1. Моделирование данных + интеграция данных.
      Используют, когда нужно объединить данные множества САПР различных поставщиков при постройке крупного промышленного объекта.
      Ключевые слова: ISO 15926, Gellish, ISO 10303. Вместо слова "онтология" говорят "модель данных".
      Средства оперирования знаниями: практически нет, все запросы к данным. Со знаниями сражается каждый сам врукопашную. Никакой графики, сплошной XML, проприетарные форматы хранения Схемы данных в каждом отдельном САПР. В последнее время появляются и иные решения, нацеленные на интеграцию разнородных данных, например от CYC и [1] (на базе стандартизированной онтологии UMBEL, выражения в RDF и обеспечения доступа к данным через HTTP, см.).
      Проекты ISO 15926-7 сводятся к тому же: некая онтология + semantic web стандарты.
    2. Concept Map ([2])
      Используют для (часто коллаборативной через веб) учебной и творческой работы.
      Ключевые форматы (все на XML): XCT 3.0, но готовы кушать и Topic Map, и многое другое для редактирования и отображения.
      Средства оперирования знаниями: графическое отображение, объединение сетей, которые нарисовали два участника творческого процесса. Близкий родственник — MindMap, где вообще не граф, а красиво нарисованное дерево, а связи неименованы.
      Concept-map.jpg
    3. Conceptual Graphs
      Используют для академических занятий искусственным интеллектом, экспертные системы, агентские системы и прочая классика жанра. Опираются на работы философа и логика Pierce ("интеллектуальное индексирование"), ключевой человек — John F.Sowa.
      Ключевой формат хранения знаний: три синтаксиса, главный из которых — CGIF (XML).
      Средства оперирования знаниями: Common Logic (или ISO ISO/IEC IS 24707:2007, [3]).
    4. Topic Map
      Использут для Knowledge Management инициатив — а пришли они из каталожников (библиографов). Большие любители стандартизации (см.), но потеряли фокус (их неумолимо влечет к моделированию данных общего вида, в котором они проигрывают подходам Semantic Web).
      Ключевые форматы хранения знаний: ISO 13250, XTM 2.0, HyTM.
      Средства оперирования знаниями: используется topic map engine (десяток вариантов), ибо стандартизован TMAPI 2.0. Кроме того, на финишную прямую вышел специальный стандарт на задание констрейнтов для topic maps — ISO/IEC FCD 19756 (TMCL), а язык запросов Topic Map Query Language (проект ISO 18048), похоже, заглох.
    5. Semantic Web
      Самые разные инициатив на базе стека стандартов W3C.
      Ключевые форматы хранения знаний: RDF и OWL.
      Средства оперирования: язык запросов SPARQL, так называемые business rules, обобщенные затем до просто "правил" и огромное число самых разных частных разработок. Например, интерфейс DIG 2.0 позволяет самым разным редакторам онтологий работать с моделью вычислений Desctiption Logic. Все древние онтологии срочно переписываются на OWL, все редакторы знаний срочно переделываются на чтение/запись OWL, все системы представления знаний стремятся быть совместимыми.
    6. Частные инициативы — им несть числа:
      • CYC, который любит, когда его называют "Rolls Royce of formal ontologies"
      • всяческие "семантические поиски" пары десятков крупных фирм — проприетарное в разной степени, стандартизации там мало.
      • Formal Concept Analysis (homepage), используется для выведения иерархии типов и отношений "естественным способом", популярен в России, ибо это крутейшая математика, но в стандартизации пока не замечен.

Ссылки

См. также