Статья опубликована в рамках: LXXVIII Международной научно-практической конференции «Научное сообщество студентов XXI столетия. ТЕХНИЧЕСКИЕ НАУКИ» (Россия, г. Новосибирск, 10 июня 2019 г.)
Наука: Информационные технологии
Скачать книгу(-и): Сборник статей конференции
дипломов
Различия между Data Warehouse и OLAP кубами
DIFFERENCES BETWEEN DATA WAREHOUSE AND OLAP CUBES
Kostrikov Konstantin Andreevich
Student of the Department of Information Support of Innovation, National Research Tomsk State University,
Russia, Tomsk
Zaitsev Vladislav Vladimirovich
Student of the Department of Information Support of Innovation, National Research Tomsk State University,
Russia, Tomsk
Timofeeva Anna Vyacheslavovna
Student of the quality management department, National Research Tomsk State University,
Russia, Tomsk
Kudashkina Ekaterina Olegovna
Student of the quality management department, National Research Tomsk State University,
Russia, Tomsk
Frolenko Tatyana Nikolaevna
Student of the quality management department, National Research Tomsk State University,
Russia, Tomsk
АННОТАЦИЯ
Данные становятся все более популярной темой в мире бизнеса, поскольку объем данных, которые компания регистрирует, хранит, анализирует и использует, продолжает расти. Хранение и доступ к соответствующим данным является обязательным условием для представления отчетности о деятельности компании, планирования роста и развития в будущем. Тем не менее, если у вас нет опыта работы в области ИТ или программирования, понимание технологических возможностей для хранения данных может быть проблемой. Вариантов немного, но их функции различаются, и в зависимости от различных требований, продукту может потребоваться определенное решение для хранения данных. Эта статья будет посвящена обсуждению и сравнению двух наиболее распространенных вариантов: Data Warehouse (хранилище данных) и OLAP куба.
ABSTRACT
Data is becoming an increasingly popular topic in the business world, as the amount of data that a company registers, stores, analyzes, and uses continues to grow. Storage and access to relevant data is a prerequisite for reporting on the company's activities, planning for growth and development in the future. However, if you have no experience in IT or programming, understanding the technological capabilities for data storage can be a problem. The options are few, but their functions differ, and depending on different requirements, the product may require a specific solution for data storage. This article will be devoted to the discussion and comparison of the two most common options: Data Warehouse and OLAP cube.
Ключевые слова: хранилище данных; СУБД; базы данных; OLAP – серверы.
Keywords: Data Warehouse; Data Mart; Executive Information System; On-line Analytical Processing; OLAP.
Хранилище данных - это база данных, в которой хранится информация для поддержки принятия решений, управляемая отдельно от оперативной базы данных компании. Хранилище данных поддерживает обработку организационной информации, предлагая стабильную платформу консолидированных, транзакционных, организованных данных. С другой стороны, OLAP обозначает онлайн-аналитическую обработку, а куб - это еще одно слово для многомерного набора данных, поэтому куб OLAP - это промежуточное пространство для анализа информации. По сути, куб - это механизм, используемый для запроса данных в организованных, размерных структурах для анализа. Эти два варианта имеют разные требования к ИТ.
Хранилища данных исторически были проектом разработки, который может быть довольно дорогостоящим просто для постройки. Тем не менее, хранилища данных теперь также предлагаются в виде продукта - полностью построенного, конфигурируемого и способного вместить несколько типов данных. Некоторые решения для хранилищ данных могут управляться бизнес-пользователями. Куб OLAP не является открытым хранилищем данных SQL-сервера, поэтому для управления сервером требуется кто-то с техническими навыками и опытом работы с OLAP. Это соответствует конкретным требованиям к персоналу, но поскольку кубы OLAP используются во всем бизнес-секторе, в рабочей силе достаточно людей с навыками, необходимыми для управления кубом, - если бюджет учитывает расходы на эту должность. Хотя стоимость является важным фактором для рассмотрения, есть несколько характеристик, которые следует учитывать.
Лучшее понимание хранилищ данных и кубов OLAP чрезвычайно полезно для выбора вариантов реализации инструментов BI. Для некоторых, поскольку данные компании необходимы для такого регулярного анализа, хранение данных может очень хорошо определить путь, по которому организация пойдет для приобретения решений BI. Для других инвестиции в хранилище транзакционных данных могут быть вторичной покупкой в ответ на потребности обработки BI. В любом случае, различия важны при принятии решения о хранении данных.
Хранилище данных организовано с доступом бизнес-пользователей в центре дизайна. Это предметно-структурированный, что означает, что он организован вокруг таких тем, как продукт, продажи и клиент. Поскольку данные должны реплицироваться из планирования ресурсов предприятия (ERP), управления взаимоотношениями с клиентами (CRM) или любой другой системы организации данных, хранилища данных не используются для оперативного анализа. Вместо этого информация, хранящаяся в хранилищах данных, может использоваться для периодической отчетности; планирование, прогнозирование и моделирование; и в информационных панелях или графических оценочных карточках, где тренды и траектории данных компании могут быть визуально проанализированы. Кроме того, в хранилище могут храниться самые разные типы данных.
Хранилище данных создается таким образом, что оно может интегрировать несколько различных источников данных для создания консолидированной базы данных. Это делается с помощью методов очистки и интеграции данных, которые являются «умными» процессами, встроенными в хранилище данных. Следовательно, компания может хранить данные о персонале, финансовые операции и любую другую организационную информацию в одном месте - выходя за рамки цифр и денежных потоков. Это очень доступное хранилище, где данные реплицируются и преобразуются из операционной среды. Хранилища данных настолько эффективны с точки зрения доступности бизнес-пользователей благодаря своей структуре SQL-сервера. Однако их можно купить непосредственно уже построенными, или цена, связанная с разработкой собственного хранилища данных с течением времени программистами или другими ИТ-специалистами, может быть чрезмерной. Ценообразование хранилищ данных и проектов OLAP может стать основанием для отдельной статьи в блоге.
OLAP Cube в основном берет электронную таблицу и трехмерно анализирует опыт анализа. Разбивая его, OLAP означает аналитические данные, а не транзакционные, а кубическая часть номенклатуры относится к аспекту хранения. Кубы OLAP - это в основном многомерные базы данных. Они хранят данные для анализа, Многие продукты BI используют кубы OLAP для доступа к информации компании для отчетов, бюджетов или панелей мониторинга. Например, финансовый директор может захотеть отчитываться о финансовых данных компании по местоположению, по месяцам или по продуктам - эти элементы будут составлять измерения этого куба. Однако кубы OLAP не являются реляционными базами данных SQL-сервера, как хранилища данных.
Кубы OLAP не являются открытым хранилищем данных сервера SQL, поэтому для их обслуживания требуется кто-то, обладающий знаниями и опытом, в то время как хранилище данных сервера SQL может поддерживаться большинством ИТ-специалистов, которые регулярно проходят обучение работе с базами данных. К этому аспекту соответственно прикреплен ценник. Независимо от того, выделяете ли вы время и энергию от текущего сотрудника, чтобы сосредоточиться на управлении кубом OLAP, или ищете нового, возможно, штатного сотрудника, чтобы присоединиться к платежной ведомости для этой роли. Кроме того, OLAP-кубы имеют тенденцию быть более жесткими и ограниченными, когда речь заходит о разработке отчетов, из-за их табличных функций. Эстетика и возможности могут и, возможно, должны быть важны для компании, которая создает свой портфель решений для бизнес-аналитики.
Эта статья может быть взята за основу при поиске инструментов для бизнес-аналитики, чтобы определить, какой формат хранения данных использовать для анализа. Знание и понимание плюсов и минусов хранилищ данных (DATA WAREHOUSE) и кубов OLAP является основой для успешного анализа.
Список литературы:
- Эрик Спирли «Корпоративные хранилища данных. Планирование, разработка и реализация.» [Текст]/. Эрик Спирли - М.: Вильямс. ин-т, 2001. – 400 С.
- Хювёнен Э «Хранилища данных». [Текст]/ Хювёнен Э., Сеппянен Й. В 2-х т. / Пер. с финск.. — М.: Мир, 2000. - 534 с.
- Симонов В.Л., Храпченко М. В., Мартишин С. А. «Базы данных. Практическое применение СУБД SQL- и NoSOL-типа для применения проектирования информационных систем». [Текст]/ Симонов В.Л., Храпченко М. В., Мартишин С. А. / Форум, 2018. - 368 с.
дипломов
Оставить комментарий