Статья опубликована в рамках: LXXIV Международной научно-практической конференции «Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ» (Россия, г. Новосибирск, 11 февраля 2019 г.)
Наука: Информационные технологии
Скачать книгу(-и): Сборник статей конференции
дипломов
СТРАТЕГИЯ РАБОТЫ С ДАННЫМИ И МАШИННОЕ ОБУЧЕНИЕ: КАК ОНИ ПЕРЕСЕКАЮТСЯ?
В условиях огромного роста бизнес-данных с точки зрения объема, размера и сложности крайне важно, чтобы глобальные предприятия разработали сильную стратегию обработки данных для удовлетворения своих основных бизнес-потребностей. Тем не менее, реалистичная стратегия работы с данными должна включать в себя четкую дорожную карту с вехами, чтобы документы стратегии не превратились в цифровые активы, не имеющие реальной ценности.
Предприятия нуждаются в стратегии работы с данными, если они хотят оставаться конкурентоспособными в мире принятия решений на основе данных.
«Это всеобъемлющее видение и действенная основа для способности организации использовать связанные с данными или зависящие от данных возможности» [3]. Назначенное лицо, известное как архитектор данных, обычно наделено ответственностью за разработку стратегии данных. Как человек, уже знакомый с ИТ-архитектурами и обычно отвечающий за определение всех возможностей системы данных, он или она обладает уникальными возможностями для работы над планом стратегии данных. Обладая глубоким пониманием потребностей как ИТ, так и бизнеса, архитектор данных может создавать исполняемые стратегии.
Благодаря недавним дополнениям, таким как «Интернет вещей» (Internet of Things), «Большие данные» (Big Data) и «Облачные вычисления» (Cloud Computing) в глобальном ландшафте данных, организации серьезно заинтересовались управлением данными. По сравнению с устаревшими процессами принятия решений, доступными во многих компаниях Global 2000, машинное обучение в качестве ключевого фактора бизнеса способно предоставлять более точные, точные и интеллектуальные решения. Тем не менее, хотя «Большие данные» усилили мощь инструментов машинного обучения, среди лидеров бизнеса и операторов растет озабоченность по поводу качества данных и управления данными.
Сегодняшние бизнес-операторы понимают, что, если у организации нет надежной стратегии работы с данными, обеспечивающей безопасность данных, качество данных, управление данными и управление данными, инструменты машинного обучения не могут гарантировать превосходные бизнес-результаты.
«Исследования в области машинного обучения являются частью исследований в области искусственного интеллекта, направленных на предоставление знаний компьютерам посредством данных, наблюдений и взаимодействия с миром. Полученные знания позволяют компьютерам правильно обобщать новые параметры» [2].
Машинное обучение дает машинам возможность «учиться и совершенствоваться на собственном опыте. В процессе обучения машины начинают с изучения доступных данных для выявления закономерностей, а затем применяют это обучение для прогнозирования будущих результатов. Хотя учебный процесс изначально занимает много времени, в конечном итоге машины обеспечивают быстрые и точные результаты без какого-либо вмешательства человека. Машинное обучение становится очень полезным при обработке больших объемов данных.
Хорошее качество данных является обязательным условием для всех организаций. Алгоритмы машинного обучения на самом деле проверяют качество данных, обнаруживая несоответствия, ошибки или другие аномалии. Поскольку качество данных является фундаментальной проблемой в управлении данными предприятия, для реализации исполняемой организационной стратегии работы с данными требуется машинное обучение для обеспечения высокого качества бизнес-данных. Это одна из первых точек пересечения стратегии работы с данными и машинного обучения. Все чаще нормативные требования, такие как GDPR, будут требовать, чтобы все бизнес-данные проходили множество проверок и балансов, прежде чем они будут введены в любую Аналитическую систему.
Изучение пересечения машинного обучения и аналитики показывает, что машинное обучение открыло новую эру бизнес-аналитики, автоматизировав не только большинство задач аналитики, но и автоматизировав этап «Подготовка данных». Во время очистки и подготовки данных машинное обучение играет ключевую роль в обеспечении точности, согласованности и полноты данных для анализа.
Поскольку бизнес-аналитика является основным отличием в современном бизнесе, а данные являются сырьем для аналитики, как данные, так и аналитика являются основными активами организационной стратегии данных. Это, вероятно, вторая точка пересечения между стратегией данных и машинным обучением.
Машинное обучение помогает многим процессам обработки данных и задачам для повышения эффективности и производительности технологий данных. Машинное обучение полезно для работы с качеством данных предприятия и управлением данными, которые являются двумя основными частями стратегии работы с данными. Это третья точка пересечения стратегии данных и машинного обучения.
В большинстве случаев технологии данных работают лучше всего с помощью алгоритмов машинного обучения. Хороший способ понять это — рассмотреть науку о данных как дисциплину для управления данными и машинного обучения, а также технологию повышения производительности данных.
«Большие данные против машинного обучения» [1] подтверждают предсказание Forbes о том, что к 2020 году совокупность глобальных данных вырастет с 4,4 до 44 зеттабайт! Таким образом, работа с аналитикой больших данных является проблемой, с которой могут столкнуться только такие мощные технологии, как машинное обучение.
В мире будущего, наполненном данными, сильная организационная стратегия данных будет единственным конкурентным преимуществом для бизнеса. Для работы с аналитикой больших данных потребуется как стратегия работы с данными, так и машинное обучение для предоставления своевременных, действенных решений. Вероятно, это четвертая точка пересечения между машинным обучением и стратегией работы с данными.
Два основных типа аналитики, которые будущие компании будут использовать, чтобы оставаться конкурентоспособными, это «Прогнозная аналитика» (Predictive Analytics) и «Предписывающая аналитика» (Prescriptive Analytics). Успех таких сложных аналитических процессов во многом зависит от качества данных. Поскольку общая стратегия работы с данными будет регулировать качество данных, а машинное обучение будет играть ключевую роль в очистке данных и подготовке данных, большая часть будущей аналитики будет зависеть от организационной стратегии работы с данными и машинного обучения. В расширенной аналитике (advanced analytics) стратегия работы с данными и машинное обучение автоматически пересекаются.
Инструменты машинного обучения анализируют данные, делают предположения и учатся предлагать интеллектуальную информацию с точностью, непостижимой для аналитиков человеческих данных. Прогнозирующее понимание приобретет большую важность для будущих компаний, когда цифровые компании начнут использовать методы боевого маркетинга, чтобы отделить клиентов друг от друга.
В мире, управляемом данными, и стратегия работы с данными, и машинное обучение должны играть решающую роль в обеспечении того, чтобы данные приносили конкурентную ценность для бизнеса.
Список литературы:
- Difference Between Big Data and Machine Learning [Электронный ресурс] – Режим доступа. – URL: https://www.educba.com/big-data-vs-machine-learning/ (дата обращения: 04.02.2019)
- What is Machine Learning? [Электронный ресурс] – Режим доступа. – URL: https://emerj.com/ai-glossary-terms/what-is-machine-learning/ (дата обращения: 05.02.2019)
- Why organizations need a data strategy [Электронный ресурс] – Режим доступа. – URL: https://dataconomy.com/2014/11/why-organizations-need-a-data-strategy/ (дата обращения: 04.02.2019)
дипломов
Комментарии (1)
Оставить комментарий