5 шагов к качеству данных

В статье приведены основные шаги, которые направлены на обеспечение качества данных в информационных системах и основаны на проектном опыте эксперта Nancy Northrup. В реальности процесс своевременного обеспечения точной и качественной информацией, конечно же, может быть сложнее.

Нечеткие множества в хранилище данных

Нечёткое (или размытое, расплывчатое, туманное, пушистое) множество - понятие, введённое Лотфи Заде в 1965 г. в статье «Fuzzy Sets» (нечёткие множества) в журнале Information and Control. Л. Заде расширил классическое канторовское понятие множества, допустив, что характеристическая функция (функция принадлежности элемента множеству) может принимать любые значения в интервале [0,1], а не только значения 0 или 1.

Внедрение Microsoft SQL Server Parallel Data Warehouse с применением подхода Кимбалла

В данной статье описывается как подход Кимбалла к архитектуре и построению систем хранилищ данных/бизнес-аналитики (DW/BI) работает с Parallel Data Warehouse от Microsoft, и как этот новый продукт можно включить в Вашу DW/BI систему. В начале статьи кратко описан сам подход и его ключевые принципы. Затем рассматривается архитектура Parallel Data Warehouse (PDW) и обсуждается ее согласованность с подходом Кимбалла.

Захват изменений данных

Реализация процесса обнаружения в источнике данных новых, измененных или удаленных записей позволяет ускорить процесс загрузки данных в хранилище за счёт устранения необходимости полного их сравнения. В статье рассмотрены способы реализации захвата изменений (changed data capture).

Тест-драйв SAP HANA

Компания SAP организовала специальный ресурс www.experiencesaphana.com, посвященный решению SAP HANA – высокопроизводительной программно-аппаратной платформе обработки аналитических запросов.

РД 50-34.698-90 Руководство пользователя (пример оформления)

Представлен пример содержания документа «Руководство пользователя». В качестве основы для описания был использован BI-инструмент Oracle Discoverer применяемый в качестве пользовательского инструмента в корпоративном хранилище данных.

Технологии «Больших данных» вышли на битву с данными больших объемов и сложной структуры

Термин «большие данные» (Big Data) используется с постоянно увеличивающейся частотой. Он часто применяется для обозначения больших объемов структурированных данных (например, справочник клиентов), а также для описания частично структурированных данных (изображений, документов, сообщений электронной почты и так далее). В данной статье рассматриваются технологии, которые позволят нам хранить, управлять и анализировать в хранилищах данных большие данные обоих типов.

Аналитический комплекс IBM Netezza

IBM Netezza это программно-аппаратные аналитические комплексы, которые предоставляют широкий аналитический инструментарий для пользователей в любом отделе компании — продаж, маркетинга, разработок и кадров, а простота их применения делает эту технологию оптимальной для высококлассного анализа данных, не требуя при этом от пользователей глубоких знаний в области ИТ и системного администрирования.

Облако: перейти сейчас или подождать?

Тенденция рынка - лавинообразное увеличение объема данных, в результате чего повышаются требования к системам хранения данных. Кроме того давление со стороны регулирующих органов и клиентов, которые требуют обеспечить защиту конфиденциальной информации и персональных данных, ставит нас в затруднительное положение.

Страницы