ПОНЯТИЕ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ
top of page
Volume 40 (2021)

УДК

656.05(075) +004.056(075)

DOI

10.53988 /24136573-2021-02-09

To cite the content of the article, please use the following description

To cite the content of the article, please use the following description

Салчак Я.Я. Понятие интеллектуального анализа данных // Управление рисками в АПК. 2021. Вып. 40 С. 94-101. DOI: 10.53988/24136573-2021-02-09

Salchak Ya. Ya. The concept of intelligent data analysis // Agricultural Risk Management, 2021, Vol. 40, pp. 94-101. DOI: 10.53988 /24136573-2021-02-09

ТЕХНИЧЕСКИЕ НАУКИ | TECHNICAL SCIENCES
САЛЧАК Я.Я.

ПОНЯТИЕ ИНТЕЛЛЕКТУАЛЬНОГО АНАЛИЗА ДАННЫХ

Салчак Яна Яковлевна – студент бакалавриата прикладной экономики, кафедра прикладной информатики, Институт экономики и управления в АПК, РГАУ-МСХА имени К.А. Тимирязева, Москва, Россия
E-mail: salchak@gmail.com

annotation

В статье рассмотрены подходы к понятию интеллектуального анализа данных. Представлены англоязычные термины, имеющие взаимные связи, в частности, Knowledge Discovery in Databases (KDD), Data Mining и Business intelligence (BI), в отношении которых проведен семантический анализ. Показана роль BI-решений в повышении эффективности деятельности предприятия. На основе библиометрического анализа установлено, что интеллектуальный анализ данных является междисциплинарной областью. Исследование выполнялось в рамках подготовки выпускной квалификационной работы автора.

Keywords

Интеллектуальный анализ данных, Knowledge Discovery in Databases, KDD, Data Mining, Business intelligence, BI, цифровая трансформация, прикладная информатика, управление данными, цифровые сервисы, аналитика

YA. SALCHAK

THE CONCEPT OF INTELLIGENT DATA ANALYSIS

Yana Salchak – Bachelor's student of Applied Economics, Department of Applied Informatics, Institute of Economics and Management in Agribusiness, RSAU-MTAA named after K.A. Timiryazev, Moscow, Russia.
E-mail: salchak@gmail.com

Annotation

The article considers approaches to the concept of data mining. English terms with mutual relations are presented, in particular, Knowledge Discovery in Databases (KDD), Data Mining and Business intelligence (BI), in respect of which a semantic analysis was carried out. The role of BI solutions in improving the efficiency of the enterprise is shown. Based on bibliometric analysis, it has been established that data mining is an interdisciplinary field. The study was carried out as part of the preparation of the final qualifying work of the author.

Keywords

Data mining, Knowledge Discovery in Databases, KDD, Data Mining, Business intelligence, BI, digital transformation, applied informatics, data management, digital services, analytics

Article text

Введение. Интеллектуальный анализ данных предприятия является актуальной темой в современном мире информационных технологий, особенно в части развития систем поддержки принятия решений. С каждым годом технологии интеллектуального анализа данных становятся важным направлением для изучения разных сфер: производственные предприятия, торговля, маркетинг, финансы, банковское дело, нефтегазовая отрасль, страховое дело и т.д. Данные в огромной количестве накапливаются различными учетными системами на всех уровнях: от пользовательских приложений на гаджетах обычных людей до гигантских дата-центров корпораций и государственных структур [1]. Эти данные накапливаются и генерируют еще больше данных. Чтобы «сырые» данные несли ценность для бизнеса, в том числе в сельскохозяйственном производстве и других индустриях агропромышленного комплекса необходимо их правильно обрабатывать и переносить в понятную для пользователей форму. Под пользователем мы в целях настоящей статьи понимаем бизнес-пользователей, то есть руководителей различных звеньев на предприятии. Автоматизация работы с данными позволяет быстро и своевременно принимать важные решения для бизнеса, помогая достигать бизнес-цели [8]. Для предприятий АПК в числе таких целей можно назвать: снижение себестоимость производства продукции, повышение доходности операций и бизнеса в целом, увеличение добавленной стоимости в конечной продукции для потребителей [2].

Результаты. По итогам работы с источниками [6] подобраны рабочие дефиниции, необходимые для достижения цели работы. Анализ данных (АД) – это система подходов и методов, ориентированная на выявление механизма порождения представленных данных в рамках имеющейся априорной модели этого механизма. Интеллектуальный анализ данных (ИАД) – это исследование данных, использующее методы искусственного интеллекта и ориентированное на придание системе свойств искусственного интеллекта.

С интеллектуальным анализом данных тесно связаны англоязычные термины – Knowledge Discovery in Databases (KDD), Data Mining и Business intelligence (BI). Они развиваются в рамках направления «бизнес-аналитика», которое можно рассматривать как инструменты, используемые для преобразования, хранения, анализа, моделирования и доставки информации в ходе работы над задачами, связанными с принятием решений на основе фактических данных. При этом с помощью этих средств лица, принимающие решения, должны при использовании подходящих технологий получать нужные сведения и в нужное время.

Термин KDD, что можно перевести как «обнаружение знаний в базах данных», подразумевает не конкретный алгоритм или математический аппарат, а последовательность действий, которую необходимо выполнить для обнаружения полезного знания. KDD включает в себя этапы подготовки данных, выбора информативных признаков, очистки, построения моделей, постобработки и интерпретации полученных результатов. Таким образом, KDD есть во многом процессуальное измерение ИАД.

Основу Data Mining составляет концепция шаблонов, представляющих собой закономерность. Цель поиска закономерностей - представление данных в виде, отражающем искомые процессы [3]. В результате обнаружения скрытых закономерностей в больших данных, недоступных для обработки человеческими ресурсами, решаются задачи Data Mining. В глобальном смысле технология Data Mining не может заменить аналитика, она дает мощный инструмент для улучшения и облегчения его работы. За построение моделей отвечают методы Data Mining - обнаружение и «сырых» данных ранее неизвестных, нетривиальных, практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности [12].

В свою очередь, близким к Data Mining понятием Business intelligence (BI) – это инструменты и методы для перевода исходной, необработанной, неструктурированной информации в осмысленную, удобную форму. Информация, полученная с помощью BI, может быть использована для бизнес-анализа. Технологии BI обрабатывают большие объемы неструктурированных данных, чтобы найти стратегические возможности для бизнеса [4]. BI может быть использован для поддержки широкого спектра бизнес-решений, начиная от операционной до стратегических. Основные операционные решения, для которых BI может быть использован, включают в себя позиционирование продукта или цен, а также смарт-контрактирование, другие операции, где идет накопление данных, нуждающихся в визуализации [1; 7].

Data Mining включает в себя широкий арсенал методов классификации, моделирования и прогнозирования, основанных на применении деревьев решений, искусственных нейронных сетей, генетических алгоритмов, эволюционного программирования, ассоциативной памяти, нечёткой логики [2]. Также к методам data mining нередко относят статистические методы (дескриптивный анализ, корреляционный и регрессионный анализ, факторный анализ, дисперсионный анализ, компонентный анализ, дискриминантный анализ, анализ временных рядов, анализ выживаемости, анализ связей).

Стратегические бизнес-решения включают в себя приоритеты, цели и направления на самом широком уровне. Использование BI-инструментов как средства цифровизации АПК является наиболее эффективным [9], когда он сочетает в себе данные, полученные от рынка, на котором работает компания (внешние данные) с данными из внутренних источников компании, таких как финансовые операции и операции с данными. Сочетая внешние и внутренние данные, можно получить более полную картину состояния того или иного бизнес-процесса и, следовательно, сформировать функциональные требования для его улучшения, реализуя проект оптимизации с использованием информационных технологий [5].

Business intelligence можно также описать совокупность методов и инструментов, используемых предприятиями для сбора данных из множественных источников, включая, например, киберфизические системы [11], формирования аналитики (аналитических данных) из первичных или вторичных учетных систем [10]. Это определение также включает в себя и то, как предприятия могут получать информацию из больших данных и использование интеллектуального анализа данных. Это означает, что ИАД не ограничивается технологиями, включая в себя анализ бизнес-процессов и постановку процедур в них, которые облегчают сбор больших данных.

В целях обобщения информации о имеющихся категориях в области ИАД проведен библиометрический анализ научной литературы на Web of Science по двум из представленных выше категорий: data mining и business intelligence. Поисковая система научной информации Web of Science (WoS) была выбрана в качестве релевантного источника, так как представляет собой обширную международную базу данных, с помощью которой осуществляется поиск научных материалов из разнообразных областей наук. WoS является основным источником информации о самых авторитетных изданиях со всего мира, где собраны знания из сферы науки и техники. Результат библиометрического анализа представлен на рисунке 1.

Из рисунка, очевидно, что технология ИАД, рассматриваемая в призме категорий: data mining и business intelligence, является междисциплинарной областью исследования. Она реализуется на методах таких дисциплин, как теория информации, системы искусственного интеллекта, теория вероятностей, математическая статистика, машинное обучение. Соответственно порождается обилие методов и алгоритмов, реализуемых в различных действующих системах Data Mining.

Выводы. Интеллектуальный анализ данных, на наш взгляд, максимально близок к общему термин «бизнес-аналитика» и может рассматриваться как форма BI. Интеллектуальный анализ данных можно рассматривать как функцию BI, используемую для сбора необходимой информации и получения ответов, в том числе с использованием классических учетных систем типа 1С [10]. Более того, бизнес-аналитика также может рассматриваться как результат интеллектуального анализа данных. Как уже говорилось, бизнес-аналитика предполагает использование данных для получения информации. Data Mining Business Intelligence – это сбор необходимых данных, которые в итоге приведут к ответам посредством глубокого анализа.

Связь между интеллектуальным анализом данных и бизнес-аналитикой можно рассматривать как причинно-следственную связь. Интеллектуальный анализ данных ищет «что» (соответствующие наборы данных), а процессы бизнес-аналитики раскрывают «как» и «почему» (понимание). Аналитики используют интеллектуальный анализ данных, чтобы найти нужную им информацию, а бизнес-аналитику он необходим, чтобы определить значимость тех или иных данных для описания бизнес-процессов и показателей его эффективности.

Sources:

1. Методические рекомендации по работе с аналитическими приложениями ЦИАС СГИО СХ. М.: ФГБНУ «Росинформагротех», 2019. – 156 с.
2. Моторин О.А. Анализ данных в информационных системах АПК. М.: РЕГУЛЯТОР, 2019. – C. 16. - ISBN 978-5-9908272-2-6.
3. Моторин О.А., Кушнарева М.Н., Худякова Е.В. Анализ бизнес-процессов в АПК. М.: РЕГУЛЯТОР, 2019. – С. 43-44. - ISBN 978-5-9908272-4-0.
4. Моторин О.А., Кушнарева М.Н., Худякова Е.В. Архитектура предприятия и информационных систем в АПК. М.: РЕГУЛЯТОР, 2019. – С. 25-27 - ISBN 978-5-9908272-9-5.
5. Моторин О.А., Кушнарева М.Н., Худякова Е.В. Управление ИТ-проектами в АПК. М.: РЕГУЛЯТОР, 2019. – С. 77. - ISBN 978-5-9908272-5-7.
6. Научная электронная библиотека. URL: https://www.elibrary.ru/ query_results.asp. Дата обращения: 21.06.2021.
7. Степанцевич М.Н., Горбачев М.И., Качалин М.А. Цифровая трансформация деятельности участников агропродовольственного рынка на основе смарт-контракта // Международный научный журнал, учредитель: ООО «Спектр». – 2021. – №3. – С. 50-60.
8. Худякова, Е.В., Кушнарёва, М.Н., Горбачев, М.И. Объектно-ориентированное моделирование бизнес-процессов в АПК: учебно-методическое пособие. – М.: ООО «Мегаполис», 2020. – №1. – 56 с.
9. Худякова Е.В., Кушнарёва М.Н., Горбачев, М.И. Эффективность внедрения цифровых технологий в соответствии с концепцией «Сельское хозяйство 4.0» // Международный научный журнал. – 2020. – №1. – С. 80-88.
10. Худякова Е.В., Степанцевич М.Н., Горбачев М.И., Череватова Т.Ф. Развитие цифровых компетенций специалистов агропромышленного комплекса на основе решений 1С // Материалы Национальной (Всероссийской) научной конференции Института агроинженерии. – Челябинск: Издательство: Южно-Уральский государственный аграрный университет (Троицк). – 2021. – С. 93-98.
11. Худякова Е.В., Худякова Х.К., Степанцевич М.Н., Горбачев М.И., Никаноров М.С. Технологии Интернета вещей в кормопроизводстве и их эффективность // Экономика сельскохозяйственных и перерабатывающих предприятий. – 2021. – №3. – С. 31-38.
12. Shmueli G., Bruce P.C., Gedeck P., Patel N.R. Data mining for business analytics. Concepts, Techniques, and Applications in Python. Wiley, 2020.

References:

1. Guidelines for working with analytical applications of CIAS. M.: FGBNU «Rosinformagrotech», 2019. - 156 p.
2. Motorin O.A. Data analysis in information systems of the agro-industrial complex. M.: REGULATOR, 2019. - P. 16. - ISBN 978-5-9908272-2-6.
3. Motorin O.A., Kushnareva M.N., Khudyakova E.V. Analysis of business processes in the agro-industrial complex. M.: REGULATOR, 2019. - Pp. 43-44. - ISBN 978-5-9908272-4-0.
4. Motorin O.A., Kushnareva M.N., Khudyakova E.V. Architecture of the enterprise and information systems in the agro-industrial complex. M.: REGULATOR, 2019. - Pp. 25-27 - ISBN 978-5-9908272-9-5.
5. Motorin O.A., Kushnareva M.N., Khudyakova E.V. IT project management in the agro-industrial complex. M.: REGULATOR, 2019. - P. 77. - ISBN 978-5-9908272-5-7.
6. Scientific electronic library. URL: https://www.elibrary.ru/query_ results.asp. Date of access: 06/21/2021.
7. Stepantsevich M.N., Gorbachev M.I., Kachalin M.A. Digital transformation of the activities of participants in the agro-food market based on a smart contract // International scientific journal, founder: Spektr LLC. - 2021. - No. 3. - Pp. 50-60.
8. Khudyakova, E.V., Kushnareva, M.N., Gorbachev, M.I. Object-oriented modeling of business processes in the agro-industrial complex: a teaching aid. - M.: Megapolis LLC, 2020. - No. 1. – 56 p.
9. Khudyakova E.V., Kushnareva M.N., Gorbachev, M.I. The effectiveness of the implementation of digital technologies in accordance with the concept of «Agriculture 4.0» // International scientific journal. - 2020. - No. 1. - PP. 80-88.
10. Khudyakova E.V., Stepantsevich M.N., Gorbachev M.I., Cherevatova T.F. Development of digital competencies of specialists of the agro-industrial complex based on 1C solutions // Proceedings of the National (All-Russian) Scientific Conference of the Institute of Agricultural Engineering. - Chelyabinsk: Publisher: South Ural State Agrarian University (Troitsk). - 2021. - Pp. 93-98.
11. Khudyakova E.V., Khudyakova H.K., Stepantsevich M.N., Gorbachev M.I., Nikanorov M.S. Internet of things technologies in fodder production and their efficiency // Economics of agricultural and processing enterprises. - 2021. - No. 3. - Pp. 31-38.
12. Shmueli G., Bruce P.C., Gedeck P., Patel N.R. Data mining for business analytics. Concepts, Techniques, and Applications in Python. Wiley, 2020.

All illustrations of the article:

bottom of page