Инженерия знаний — различия между версиями
Admin (обсуждение | вклад) |
Admin (обсуждение | вклад) м |
||
(не показано 10 промежуточных версий этого же участника) | |||
Строка 1: | Строка 1: | ||
− | '''[http://en.wikipedia.org/wiki/Knowledge_engineering Инженерия знаний]''' | + | '''[http://en.wikipedia.org/wiki/Knowledge_engineering Инженерия знаний]''' — инженерная дисциплина, которая занимается интеграцией знаний с компьютерными системами для того чтобы решить сложные проблемы, обычно требующие высокого уровня человеческой экспертизы: |
− | * управление конфигурацией знаний (учёт); | + | * [[управление конфигурацией]] знаний (учёт); |
− | * управление изменениями (эволюция); | + | * [[управление изменениями]] (эволюция); |
− | * логистика (поиск и доставка по потребности). | + | * [[логистика]] (поиск и доставка по потребности). |
− | + | ||
На высоком уровне, процесс инженерии знаний состоит из двух: | На высоком уровне, процесс инженерии знаний состоит из двух: | ||
− | # '''Извлечение знаний''' | + | # '''Извлечение знаний''' — преобразование «сырых знаний» в организованные, процесс получения знаний из его источников, которыми могут быть материальные носители (файлы, документы, книги) и эксперты (группы экспертов). Является частью Инженерии знаний. |
− | # '''Внедрение знаний''' | + | # '''Внедрение знаний''' — преобразование организованных знаний в реализованные, процесс преобразования организованных знаний в реализованные. |
− | + | ||
== Технологии управления знаниями == | == Технологии управления знаниями == | ||
− | |||
Выделяют следующие технологии управления знаниями: | Выделяют следующие технологии управления знаниями: | ||
* '''работающие с неявными знаниями''' (tacit knowledge) '''в головах экспертов''' (чаще всего именно они имеются ввиду, когда говорится об "управлении знаниями"). Когнитолог (роль): | * '''работающие с неявными знаниями''' (tacit knowledge) '''в головах экспертов''' (чаще всего именно они имеются ввиду, когда говорится об "управлении знаниями"). Когнитолог (роль): | ||
Строка 17: | Строка 14: | ||
** осуществляет выбор той [https://ru.wikipedia.org/wiki/%D0%98%D0%BD%D1%82%D0%B5%D0%BB%D0%BB%D0%B5%D0%BA%D1%82%D1%83%D0%B0%D0%BB%D1%8C%D0%BD%D0%B0%D1%8F_%D1%81%D0%B8%D1%81%D1%82%D0%B5%D0%BC%D0%B0 интеллектуальной системы], которая наиболее подходит для данной проблемной области, и определяет способ представления знаний в этой ИС; | ** осуществляет выбор той [https://ru.wikipedia.org/wiki/%D0%98%D0%BD%D1%82%D0%B5%D0%BB%D0%BB%D0%B5%D0%BA%D1%82%D1%83%D0%B0%D0%BB%D1%8C%D0%BD%D0%B0%D1%8F_%D1%81%D0%B8%D1%81%D1%82%D0%B5%D0%BC%D0%B0 интеллектуальной системы], которая наиболее подходит для данной проблемной области, и определяет способ представления знаний в этой ИС; | ||
** выделяет и программирует стандартные функции, которые будут использоваться в правилах, вводимых экспертом. | ** выделяет и программирует стандартные функции, которые будут использоваться в правилах, вводимых экспертом. | ||
− | * '''работающие с письменным знанием''' ("управление знаниями" распространяется на компьютеры: управление корпоративными знаниями, [http://en.wikipedia.org/wiki/Knowledge_management Knowledge Management]) | + | * '''работающие с письменным знанием''' ("управление знаниями" распространяется на компьютеры: управление корпоративными знаниями, [http://en.wikipedia.org/wiki/Knowledge_management Knowledge Management]) — акцент на "полнотекстовый поиск", "семантический поиск", "автоматическое аннотирование". |
*# НЛП, как даталогическая дисциплина ("работа по форме"), техника взмаха, модальности восприятия, субмодальности, пространственное маркирование, калибровка | *# НЛП, как даталогическая дисциплина ("работа по форме"), техника взмаха, модальности восприятия, субмодальности, пространственное маркирование, калибровка | ||
*# использование web 2.0 (блоги и вики) | *# использование web 2.0 (блоги и вики) | ||
− | * '''работающие с письменным формальным знанием''' (инженерия знаний, которую тоже включают в управление знаниями, но уже не так уверенно) | + | * '''работающие с письменным формальным знанием''' (инженерия знаний, которую тоже включают в управление знаниями, но уже не так уверенно) — акцент на структурных БД, инженерных моделях, интеграции данных. |
− | *: Большинство технологий в инженерии знаний пошло по пути реализации так называемой "семантической сети", подход Гуссерля-Витгенштейна-Бунге о том, что знание представимо фактами (а факты | + | *: Большинство технологий в инженерии знаний пошло по пути реализации так называемой "семантической сети", подход Гуссерля-Витгенштейна-Бунге о том, что знание представимо фактами (а факты — это отношения концептов). Из множества фактов возникает [http://en.wikipedia.org/wiki/Semantic_network семантическая сеть] (см. [http://www.jfsowa.com/pubs/semnet.htm обзор John F.Sowa]), в котором отношения-ребра связывают концепты-вершины. Реализацией идеи хранения и использования знаний в форме семантической занялось множество почти непересекающихся тусовок/школ (community of practice), отчего появилось огромное количество реализаций и стандартов, в которых ни одного слова не совпадает, но которые идейно и технологически совместимы. |
*# '''Моделирование данных + интеграция данных'''. | *# '''Моделирование данных + интеграция данных'''. | ||
*#: Используют, когда нужно объединить данные множества САПР различных поставщиков при постройке крупного промышленного объекта. | *#: Используют, когда нужно объединить данные множества САПР различных поставщиков при постройке крупного промышленного объекта. | ||
*#: | *#: | ||
− | *#: ''Ключевые слова'': [[ISO 15926]], [ | + | *#: ''Ключевые слова'': [[ISO 15926]], [[Gellish]], [[ISO 10303]]. Вместо слова "[[онтология]]" говорят "модель данных". |
*#: ''Средства оперирования знаниями'': практически нет, все запросы к данным. Со знаниями сражается каждый сам врукопашную. Никакой графики, сплошной XML, проприетарные форматы хранения Схемы данных в каждом отдельном САПР. В последнее время появляются и иные решения, нацеленные на интеграцию разнородных данных, например от CYC и [http://www.zitgist.com/] (на базе стандартизированной онтологии UMBEL, выражения в RDF и обеспечения доступа к данным через HTTP, [http://www.zitgist.com/labs/linked_data.html см.]). | *#: ''Средства оперирования знаниями'': практически нет, все запросы к данным. Со знаниями сражается каждый сам врукопашную. Никакой графики, сплошной XML, проприетарные форматы хранения Схемы данных в каждом отдельном САПР. В последнее время появляются и иные решения, нацеленные на интеграцию разнородных данных, например от CYC и [http://www.zitgist.com/] (на базе стандартизированной онтологии UMBEL, выражения в RDF и обеспечения доступа к данным через HTTP, [http://www.zitgist.com/labs/linked_data.html см.]). | ||
*#: | *#: | ||
Строка 32: | Строка 29: | ||
*#: Используют для (часто коллаборативной через веб) учебной и творческой работы. | *#: Используют для (часто коллаборативной через веб) учебной и творческой работы. | ||
*#: ''Ключевые форматы (все на XML)'': XCT 3.0, но готовы кушать и Topic Map, и многое другое для редактирования и отображения. | *#: ''Ключевые форматы (все на XML)'': XCT 3.0, но готовы кушать и Topic Map, и многое другое для редактирования и отображения. | ||
− | *#: ''Средства оперирования знаниями'': графическое отображение, объединение сетей, которые нарисовали два участника творческого процесса. Близкий родственник | + | *#: ''Средства оперирования знаниями'': графическое отображение, объединение сетей, которые нарисовали два участника творческого процесса. Близкий родственник — [[Ментальная карта|MindMap]], где вообще не граф, а красиво нарисованное дерево, а связи неименованы. |
+ | *#: [[Файл:concept-map.jpg|center]] | ||
*# '''[http://conceptualgraphs.org/ Conceptual Graphs]''' | *# '''[http://conceptualgraphs.org/ Conceptual Graphs]''' | ||
− | *#: Используют для академических занятий искусственным интеллектом, экспертные системы, агентские системы и прочая классика жанра. Опираются на работы философа и логика Pierce ("интеллектуальное индексирование"), ключевой человек | + | *#: Используют для академических занятий искусственным интеллектом, экспертные системы, агентские системы и прочая классика жанра. Опираются на работы философа и логика Pierce ("интеллектуальное индексирование"), ключевой человек — John F.Sowa. |
− | *#: ''Ключевой формат хранения знаний'': три синтаксиса, главный из которых | + | *#: ''Ключевой формат хранения знаний'': три синтаксиса, главный из которых — CGIF (XML). |
*#: ''Средства оперирования знаниями'': Common Logic (или ISO ISO/IEC IS 24707:2007, [http://cl.tamu.edu/]). | *#: ''Средства оперирования знаниями'': Common Logic (или ISO ISO/IEC IS 24707:2007, [http://cl.tamu.edu/]). | ||
*# '''[http://www.topicmap.com/ Topic Map]''' | *# '''[http://www.topicmap.com/ Topic Map]''' | ||
− | *#: Использут для Knowledge Management инициатив | + | *#: Использут для Knowledge Management инициатив — а пришли они из каталожников (библиографов). Большие любители стандартизации ([http://www.isotopicmaps.org/ см.]), но потеряли фокус (их неумолимо [http://www.topic-maps.org/projects:rule_the_world влечет] к моделированию данных общего вида, в котором они проигрывают подходам Semantic Web). |
*#: ''Ключевые форматы хранения знаний'': ISO 13250, XTM 2.0, HyTM. | *#: ''Ключевые форматы хранения знаний'': ISO 13250, XTM 2.0, HyTM. | ||
− | *#: ''Средства оперирования знаниями'': используется topic map engine (десяток вариантов), ибо стандартизован TMAPI 2.0. Кроме того, на финишную прямую вышел специальный стандарт на задание констрейнтов для topic maps | + | *#: ''Средства оперирования знаниями'': используется topic map engine (десяток вариантов), ибо стандартизован TMAPI 2.0. Кроме того, на финишную прямую вышел специальный стандарт на задание констрейнтов для topic maps — ISO/IEC FCD 19756 (TMCL), а язык запросов [http://www.isotopicmaps.org/tmql/ Topic Map Query Language] (проект ISO 18048), похоже, заглох. |
*# '''[http://en.wikipedia.org/wiki/Semantic_Web Semantic Web]''' | *# '''[http://en.wikipedia.org/wiki/Semantic_Web Semantic Web]''' | ||
*#: Самые разные инициатив на базе стека стандартов W3C. | *#: Самые разные инициатив на базе стека стандартов W3C. | ||
− | *#: ''Ключевые форматы хранения знаний'': RDF и OWL. | + | *#: ''Ключевые форматы хранения знаний'': RDF и [[OWL]]. |
*#: ''Средства оперирования'': язык запросов SPARQL, так называемые business rules, обобщенные затем до просто [http://www.ruleml.org/ "правил"] и огромное число самых разных частных разработок. Например, интерфейс DIG 2.0 позволяет самым разным редакторам [[Онтология|онтологий]] работать с моделью вычислений [http://dl.kr.org/dig/interface.html Desctiption Logic]. Все древние онтологии срочно переписываются на OWL, все редакторы знаний срочно переделываются на чтение/запись OWL, все системы представления знаний стремятся быть совместимыми. | *#: ''Средства оперирования'': язык запросов SPARQL, так называемые business rules, обобщенные затем до просто [http://www.ruleml.org/ "правил"] и огромное число самых разных частных разработок. Например, интерфейс DIG 2.0 позволяет самым разным редакторам [[Онтология|онтологий]] работать с моделью вычислений [http://dl.kr.org/dig/interface.html Desctiption Logic]. Все древние онтологии срочно переписываются на OWL, все редакторы знаний срочно переделываются на чтение/запись OWL, все системы представления знаний стремятся быть совместимыми. | ||
− | *# '''Частные инициативы''' | + | *# '''Частные инициативы''' — им несть числа: |
*#* [http://blog.cyc.com/ CYC], который любит, когда его называют "Rolls Royce of formal ontologies" | *#* [http://blog.cyc.com/ CYC], который любит, когда его называют "Rolls Royce of formal ontologies" | ||
− | *#* всяческие "семантические поиски" пары десятков крупных фирм | + | *#* всяческие "семантические поиски" пары десятков крупных фирм — проприетарное в разной степени, стандартизации там мало. |
*#* [http://en.wikipedia.org/wiki/Formal_concept_analysis Formal Concept Analysis] ([http://www.fcahome.org.uk/fca.html homepage]), используется для выведения иерархии типов и отношений "естественным способом", популярен в России, ибо это крутейшая математика, но в стандартизации пока не замечен. | *#* [http://en.wikipedia.org/wiki/Formal_concept_analysis Formal Concept Analysis] ([http://www.fcahome.org.uk/fca.html homepage]), используется для выведения иерархии типов и отношений "естественным способом", популярен в России, ибо это крутейшая математика, но в стандартизации пока не замечен. | ||
== Ссылки == | == Ссылки == | ||
* https://sites.google.com/site/upravlenieznaniami/tehnologii-upravlenia-znaniami | * https://sites.google.com/site/upravlenieznaniami/tehnologii-upravlenia-znaniami | ||
− | |||
== См. также == | == См. также == | ||
− | |||
*[[Data Mining]] | *[[Data Mining]] | ||
− | + | *[[База знаний]] | |
[[Категория:Дисциплины]] | [[Категория:Дисциплины]] |
Текущая версия на 02:18, 22 мая 2022
Инженерия знаний — инженерная дисциплина, которая занимается интеграцией знаний с компьютерными системами для того чтобы решить сложные проблемы, обычно требующие высокого уровня человеческой экспертизы:
- управление конфигурацией знаний (учёт);
- управление изменениями (эволюция);
- логистика (поиск и доставка по потребности).
На высоком уровне, процесс инженерии знаний состоит из двух:
- Извлечение знаний — преобразование «сырых знаний» в организованные, процесс получения знаний из его источников, которыми могут быть материальные носители (файлы, документы, книги) и эксперты (группы экспертов). Является частью Инженерии знаний.
- Внедрение знаний — преобразование организованных знаний в реализованные, процесс преобразования организованных знаний в реализованные.
Технологии управления знаниями
Выделяют следующие технологии управления знаниями:
- работающие с неявными знаниями (tacit knowledge) в головах экспертов (чаще всего именно они имеются ввиду, когда говорится об "управлении знаниями"). Когнитолог (роль):
- помогает эксперту выявить и структурировать знания, необходимые для работы экспертной системы, извлекает из эксперта неформализованные знания;
- осуществляет выбор той интеллектуальной системы, которая наиболее подходит для данной проблемной области, и определяет способ представления знаний в этой ИС;
- выделяет и программирует стандартные функции, которые будут использоваться в правилах, вводимых экспертом.
- работающие с письменным знанием ("управление знаниями" распространяется на компьютеры: управление корпоративными знаниями, Knowledge Management) — акцент на "полнотекстовый поиск", "семантический поиск", "автоматическое аннотирование".
- НЛП, как даталогическая дисциплина ("работа по форме"), техника взмаха, модальности восприятия, субмодальности, пространственное маркирование, калибровка
- использование web 2.0 (блоги и вики)
- работающие с письменным формальным знанием (инженерия знаний, которую тоже включают в управление знаниями, но уже не так уверенно) — акцент на структурных БД, инженерных моделях, интеграции данных.
- Большинство технологий в инженерии знаний пошло по пути реализации так называемой "семантической сети", подход Гуссерля-Витгенштейна-Бунге о том, что знание представимо фактами (а факты — это отношения концептов). Из множества фактов возникает семантическая сеть (см. обзор John F.Sowa), в котором отношения-ребра связывают концепты-вершины. Реализацией идеи хранения и использования знаний в форме семантической занялось множество почти непересекающихся тусовок/школ (community of practice), отчего появилось огромное количество реализаций и стандартов, в которых ни одного слова не совпадает, но которые идейно и технологически совместимы.
- Моделирование данных + интеграция данных.
- Используют, когда нужно объединить данные множества САПР различных поставщиков при постройке крупного промышленного объекта.
- Ключевые слова: ISO 15926, Gellish, ISO 10303. Вместо слова "онтология" говорят "модель данных".
- Средства оперирования знаниями: практически нет, все запросы к данным. Со знаниями сражается каждый сам врукопашную. Никакой графики, сплошной XML, проприетарные форматы хранения Схемы данных в каждом отдельном САПР. В последнее время появляются и иные решения, нацеленные на интеграцию разнородных данных, например от CYC и [1] (на базе стандартизированной онтологии UMBEL, выражения в RDF и обеспечения доступа к данным через HTTP, см.).
- Проекты ISO 15926-7 сводятся к тому же: некая онтология + semantic web стандарты.
- Concept Map ([2])
- Используют для (часто коллаборативной через веб) учебной и творческой работы.
- Ключевые форматы (все на XML): XCT 3.0, но готовы кушать и Topic Map, и многое другое для редактирования и отображения.
- Средства оперирования знаниями: графическое отображение, объединение сетей, которые нарисовали два участника творческого процесса. Близкий родственник — MindMap, где вообще не граф, а красиво нарисованное дерево, а связи неименованы.
- Conceptual Graphs
- Используют для академических занятий искусственным интеллектом, экспертные системы, агентские системы и прочая классика жанра. Опираются на работы философа и логика Pierce ("интеллектуальное индексирование"), ключевой человек — John F.Sowa.
- Ключевой формат хранения знаний: три синтаксиса, главный из которых — CGIF (XML).
- Средства оперирования знаниями: Common Logic (или ISO ISO/IEC IS 24707:2007, [3]).
- Topic Map
- Использут для Knowledge Management инициатив — а пришли они из каталожников (библиографов). Большие любители стандартизации (см.), но потеряли фокус (их неумолимо влечет к моделированию данных общего вида, в котором они проигрывают подходам Semantic Web).
- Ключевые форматы хранения знаний: ISO 13250, XTM 2.0, HyTM.
- Средства оперирования знаниями: используется topic map engine (десяток вариантов), ибо стандартизован TMAPI 2.0. Кроме того, на финишную прямую вышел специальный стандарт на задание констрейнтов для topic maps — ISO/IEC FCD 19756 (TMCL), а язык запросов Topic Map Query Language (проект ISO 18048), похоже, заглох.
- Semantic Web
- Самые разные инициатив на базе стека стандартов W3C.
- Ключевые форматы хранения знаний: RDF и OWL.
- Средства оперирования: язык запросов SPARQL, так называемые business rules, обобщенные затем до просто "правил" и огромное число самых разных частных разработок. Например, интерфейс DIG 2.0 позволяет самым разным редакторам онтологий работать с моделью вычислений Desctiption Logic. Все древние онтологии срочно переписываются на OWL, все редакторы знаний срочно переделываются на чтение/запись OWL, все системы представления знаний стремятся быть совместимыми.
- Частные инициативы — им несть числа:
- CYC, который любит, когда его называют "Rolls Royce of formal ontologies"
- всяческие "семантические поиски" пары десятков крупных фирм — проприетарное в разной степени, стандартизации там мало.
- Formal Concept Analysis (homepage), используется для выведения иерархии типов и отношений "естественным способом", популярен в России, ибо это крутейшая математика, но в стандартизации пока не замечен.