Что такое Ключ-АСТРОМ Grail: различия между версиями

Материал из Документация Ключ-АСТРОМ
(Новая страница: «'''Центр данных Grail,''' лежащий в основе платформы Ключ-АСТРОМ, обеспечивает контекстную ан...»)
 
(Полностью удалено содержимое страницы)
 
Строка 1: Строка 1:
'''Центр данных Grail,''' лежащий в основе платформы Ключ-АСТРОМ, обеспечивает контекстную аналитику в рамках унифицированных данных о наблюдении, безопасности и бизнес-данных. Он специально разработан для данных, наблюдаемых и собираемых из цифровых сервисов в эксабайтном масштабе.


'''Grail''' — это хранилище данных, которое сочетает в себе преимущества экономической эффективности баз данных с аналитическими возможностями хранилищ данных и обеспечивает исключительную производительность за счет массивной параллельной обработки.
'''Grail''' обеспечивает:
* Ответы на вопросы, которые вы раньше не могли получить с помощью контекстной аналитики.
* Унифицированные данные о наблюдении, безопасности и бизнес-данных — экономически эффективно и в эксабайтном масштабе.
* Аналитика в режиме реального времени с возможностью задавать любые вопросы в любое время и с постоянно обновляемым хранилищем данных без задержки (холодное/горячее хранение).
* Повышение производительности за счет технологии искажения данных без индекса и схемы при чтении существенно сокращает усилия по подготовке данных.
* Упрощенное соответствие требованиям, поскольку '''Grail''' безопасно интегрируется с '''ИИ''', '''AppEngine''', '''AutomationEngine''' и другими решениями в рамках платформы Ключ-АСТРОМ.
== Контекстная аналитика ==
'''Grail''' даёт ответы на вопросы, которые раньше казались невозможными, объединяя наблюдаемость, безопасность и бизнес-данные, но, что ещё важнее, поддерживает графовую структуру с причинно-следственными зависимостями между данными. Это возможно только благодаря уникальному сочетанию подходов, основанных на графах, событиях, временных рядах и '''NoSQL'''-базах данных.
Контекстная аналитика одинаково эффективно обрабатывает разные данные, включая метрики, логи, трассировки, поведение пользователей, сеансы, профили, уязвимости, метаданные и многое другое, и помещает их в контекст. Контекстуализация данных выполняется полностью автоматически, без необходимости добавления тегов или определения схем при получении данных или во время хранения.
Контекстная аналитика использует причинно-следственный ИИ для отслеживания зависимостей и, следовательно, позволяет проводить уникальную аналитику, такую как:
* Понимание точной причины проблемы в распределенном микросервисном облачном приложении.
* Отслеживание пути атаки в ходе аналитики нарушений безопасности с целью оценки риска.
* Сегментация бизнес-данных по выручке.
* Автоматическое отображение и анализ окружающих данных логов и трассировки при аналитике таких проблем, как ухудшение работы пользователей при оформлении заказов.
== Масштаб эксабайт ==
'''Grail''' преодолевает ограничения обычных индексных баз данных и, таким образом, обладает уникальной способностью объединять все типы данных в одном месте и устранять проблемы разного формата информации, сохраняя при этом полную детализацию. Это достигается следующими способами:
* Обработка и хранение до 1000 ТБ данных в день в зависимости от каналов получения данных (например, ЕдиныйАгент или API) и характера сигналов. Для обеспечения оптимальной производительности необходима индивидуальная стратегия масштабирования. Чтобы узнать фактические ограничения, см. раздел [[Ограничения OpenPipeline]].
* Предоставление механизма запросов на основе массивной параллельной обработки ('''MPP'''), позволяющего быстро обрабатывать любые запросы в любое время, без необходимости каких-либо предварительных определений.
* Использование технологии datawarping для извлечения данных из постоянно обновляемого хранилища с нулевой задержкой (холодное/горячее хранение), при этом устраняя накладные расходы и ограничения масштабируемости индексов.
== Постоянно обновляемое хранилище с нулевой задержкой (холодное/горячее хранение) ==
'''Grail''' революционизирует управление данными, предоставляя нативной технологией бесшовный '''data-lake''', устраняя традиционные процессы и необходимость экспорта данных во внешние решения для хранения, такие как '''AWS S3''', что позволяет снизить затраты и оптимизировать операции.
'''Grail''' оснащён передовой автоматической системой управления холодными и горячими данными, которая обеспечивает полный доступ к данным с нулевой задержкой, фактически предлагая постоянно обновляемые данные.
* '''Always-hydrated''' означает, что данные всегда доступны с нулевой задержкой, устраняя необходимость регидратации.
* '''Grail''' не требует никаких индексов, что устраняет дорогостоящие накладные расходы и негибкость предопределённых схем.
* Пользователи не заметят разницы между холодными и горячими данными благодаря массово параллельной обработке и '''datawarping'''.
* '''Grail''' автоматически управляет данными на основе шаблонов доступа.
* '''Grail''' устраняет необходимость экспорта данных во внешнее облачное хранилище и выполнения длительных и дорогостоящих операций регидратации, тем самым исключая потребность в отдельном '''data lake'''.
== Возможности Grail ==
При использовании '''Grail''' вы получаете такие возможности, как:
* '''Интеграция данных''': объединение всех разнородных данных в одном хранилище.
* '''Обработка данных''' в режиме реального времени при массовом поступлении.
* '''Гибкое преобразование''' данных при загрузке через '''OpenPipeline'''.
* '''Простое управление''' хранением данных.
* '''Организация данных без схемы''': данные всегда хранятся в контексте без необходимости определения какой-либо схемы.
* '''Задавайте любые вопросы''' в любое время.
* '''Получение аналитической информации''' в режиме реального времени без накладных расходов на индексы, что позволяет искать и анализировать любые данные — текст, символы или шаблоны, независимо от того, проиндексированы они или нет.
* '''Аналитика и автоматизация''' на основе искусственного интеллекта с использованием '''AI''', '''Smartscape''' и '''AutomationEngine'''.
* '''Исследовательская аналитика данных''': выполнение сложных запросов в дашбордах или блокнотах с использованием оптимизированного механизма запросов.
* '''Управление данными''': контроль доступа к данным и приложениям с помощью единой унифицированной системы.
* '''Наблюдаемость данных''': обеспечение доступности, надёжности и качества данных.
== Соблюдение требований законодательства и конфиденциальности данных ==
В Ключ-АСТРОМ мы серьёзно относимся к своей ответственности по защите ваших данных. Мы реализовали различные уровни защиты данных и строго придерживаемся принципов «'''конфиденциальность через проектирование'''» и «'''конфиденциальность по умолчанию'''».
* '''Grail''' обеспечивает истинное безвозвратное удаление данных для соблюдения самых строгих требований конфиденциальности.
* '''Grail''' предлагает детальный контроль доступа на уровне таблиц, сегментов и логов, включая разрешения на основе полей, чтобы исключить отображение полей, содержащих конфиденциальную информацию.
* С помощью ЕдиногоАгента и OpenPipeline Ключ-АСТРОМ предоставляет маскировку и фильтрацию данных при сборе и загрузке.
* '''Grail''' гарантирует использование ключей, специфичных для среды, для изоляции данных и защиты от несанкционированного доступа.
* Прямой доступ пользователей к сохранённым данным не разрешён, что обеспечивает целостность и безопасность данных. Вместо этого извлечение данных и запросы могут проводиться только с помощью запросов '''DQL''' через слой обработки запросов, который выступает в качестве безопасного шлюза, гарантируя эффективность, сверхбыструю скорость и безопасность извлечения данных.
== Неизменяемое хранилище данных ==
Неизменяемое хранилище данных в '''Grail''' разработано на основе принципиально неизменяемой архитектуры данных. Это означает, что после получения данные не могут быть изменены. Все данные — будь то логи, события, интервалы или метрики — хранятся в виде записей, каждая из которых рассматривается как атомарная, неизменяемая единица.
Эти записи группируются в упорядоченные по времени пакеты данных, каждый размером примерно 1 ГБ. Эти пакеты хранятся в облачном объектном хранилище, таком как '''Amazon S3''', '''Azure Blob''' или '''Google Cloud Storage'''. При запросе данных '''Grail''' загружает весь пакет в память и анализирует отдельные записи оттуда.
Благодаря этой архитектуре:
* Изменение отдельной записи невозможно.
* Для удаления записи необходимо переписать весь пакет.
* Только авторизованные пользователи могут использовать API удаления для удаления отдельных записей или целых пакетов.
* Каждая операция удаления полностью протоколируется и регистрируется.
* Сам Ключ-АСТРОМ не изменяет и не удаляет данные клиентов. Удаление данных Ключ-АСТРОМ может происходить только по явным запросам службы поддержки клиентов, и даже в этом случае могут быть удалены только целые пакеты, но не отдельные записи внутри них. Такой подход обеспечивает целостность данных, возможность аудита и соответствие требованиям, делая '''Grail''' безопасной и надёжной основой для мониторинга и аналитики.
== Руководство: использование Grail вместо традиционных баз данных ==
'''Grail''' оптимизирован для экстремальной пропускной способности и больших объёмов неизменяемых данных, собранных в едином хранилище для экономичного хранения и высокопроизводительных запросов. Он включает в себя элементы '''ACID''' и '''BASE''', обеспечивая полную гибкость и контекстную аналитику.
{| class="wikitable"
!Сценарий
!Grail
!Другие базы данных
|-
|От тера- до эксабайтного масштаба неизменяемых данных
|Да
|
|-
|Для разных данных в контексте
|Да
|
|-
|Для мгновенного запроса в режиме реального времени по любому вопросу в любое время
|Да
|
|-
|Наблюдаемость, данные безопасности и бизнес-данные из цифровых систем
|Да
|
|-
|Для экономической эффективности в качестве data lake
|Да
|
|-
|Минимизируйте интерфейсы данных и потоки данных
|Да
|
|-
|ACID транзакционные гарантии
|
|Да
|-
|Когда вам нужны очень частые обновления записей данных
|
|Да
|}
Традиционные базы данных либо созданы для обработки транзакционных данных небольшого объема в соответствии с парадигмой '''ACID''', либо реализуют парадигму '''BASE''', известную по базам данных '''NoSQL'''.
'''ACID''' означает:
* '''Атомарность''': гарантирует, что транзакция либо полностью завершится, либо полностью прервётся. Частичные изменения не происходят.
* '''Согласованность''': гарантирует, что данные остаются согласованными, соблюдая все ограничения даже во время транзакционных изменений.
* '''Изоляция''': предотвращает взаимные помехи между параллельными транзакциями. Каждая транзакция воспринимается как выполняемая последовательно.
* '''Долговечность''': после завершения транзакции ее изменения регистрируются навсегда.
Базы данных '''ACID''' используются в сценариях, где целостность и надёжность данных имеют первостепенное значение. Большинство реляционных систем управления базами данных (таких как '''Oracle''', '''MySQL''' и '''PostgreSQL''') поддерживают парадигму '''ACID'''.
'''BASE''' является альтернативой '''ACID''' и особенно подходит для распределенных систем, где требуется высокая доступность, отказоустойчивость и масштабируемость.
'''BASE''' означает:
* '''Всегда доступно''': система продолжает работать даже в случае сбоев, хотя ее функциональность может быть ограничена.
* '''Софт состояние''': состояние системы может меняться со временем из-за конечной согласованности.
* '''Согласованность''': обновления распространяются по системе в своевременно, но не обязательно немедленно.
Базы данных '''NoSQL''', такие как '''Cassandra''', '''Redis''' и '''Amazon''' '''DynamoDB''', являются примерами систем хранения, разработанных на основе парадигмы '''BASE'''.

Текущая версия на 01:35, 27 февраля 2026