Решение InfraOps - современная инфраструктура для Highload сред

Наши партнеры
Мы предлагаем комплекс услуг по модернизации ИТ-инфраструктуры для highload проектов компаний уровня enterprise – крупных российских сетевых компаний и госкорпораций
Infrastructure and Operation (InfraOps) - набор технических и организационных подходов и практик (по аналогии с DevOps, как части Agile-подхода), применяемые к задачам классического системного администрирования.

Когда данный подход принесет максимальный результат:
  • Инфраструктура требует значительных изменений (внедрение новых решений)
  • Инфраструктура потеряла управляемость, попытки модернизации приводят к авариям
  • Требуется разовое применение инженеров редкой квалификации:
    • внедрение импортозамещающих системных продуктов
    • построение комплексных систем проактивного мониторинга и алертинга

Компоненты решения InfraOps

Аудит инфраструктуры
1. Удалённый мониторинг текущей инфраструктуры с помощью Prometheus/Grafana
2. Анализ данных мониторинга и поиск проблем/уязвимостей/багов
3. Аудит существующей архитектуры, выявление бутылочных горлышек, построение плана улучшений
4. Оценка существующей инфраструктуры и требований к системе безопасности, выявление уязвимых мест
5. Оценка того, что необходимо сделать, чтобы ваши ИС адаптировались к новым требованиям, например, увеличению объемов данных или числа пользователей с точки зрения оптимизации работы или необходимости внедрения нового системного ПО
6. Профессиональная оценка рисков и снижение вероятности их возникновения, построение модели угроз
Мониторинг и резервное копирование
Выстраиваем централизованную систему превентивного мониторинга для контроля функционирования серверов конкретных АИС и процессов сетевого взаимодействия между АИС, систем безопасности функционирования серверов.

Внедряем централизованный мониторинг событий информационной безопасности и проводим работы по настройке операционных систем.

Система охватывает все приложения и стеки ПО, серверы, низкоуровневые метрики, бизнес метрики и имеет алерты. У нас лучшие эксперты по мониторингу IT-инфраструктуры с использованием инструментов Prometheus и Grafana
Описание инфраструктуры кодом IAC (infrastructure as a code)
Настройку вычислительной инфраструктуры удобнее, быстрее и безопаснее выполнять декларативно, а не редактировать серверные конфигурации вручную.
Для этого наши специалисты используют Ansible.
Отказоустойчивая СУБД
В рамках нашего решения мы осуществим кластеризацию PostgreSQL с помощью Patroni, обеспечим переход со standalone MySQL на более производительную Percona XtraDB Cluster (PXC) для MySQL. Обеспечим отказоустойчивость Tarantool – СУБД разработки vk.cloud, а также Aerospike/Cassandra.
Система сбора логов (ELK stack)
Если у вас множество разных информационных систем, которые генерируют огромное количество служебной информации, то встает резонный вопрос, где её хранить.

Для решения этой задачи есть хранилище для логов на базе Elasticsearch, Logstash и Kibana или ELK Stack. Мы настраиваем отправку всех логов из всех систем в это хранилище, настраиваем и осуществляем мониторинг.
ИТ-инфраструктура в облаке
Поможем осуществить миграцию серверных инфраструктур любого масштаба, как с физических окружений на облачные, так и обратно, с облачных – на физические.

Кроме того, мы являемся официальными Managed Services партнёрами Vk. Cloud Solutions, Yandex Cloud и Корус Консалтинг CPM, также имеем собственные мощности для оказания IaaS в Public Cloud.
Консультации
Мы консультируем заказчика и, при необходимости, подрядчиков, обслуживающих АИС, в части эксплуатации серверного БПО, ПО виртуализации, ПО СУБД и другого серверного ПО
Импортозамещение серверного ПО
Организация антисанкционной инфраструктуры:
  • Обеспечим переход от проприетарных систем (Microsoft, Oracle, Amazon и т.д. на свободное ПО на базе Linux
  • Развернем автономные серверные инсталляции
  • Настроим зеркала для обеспечения доступности к репозиториям
  • Настраиваем контроль обновлений пакетов
  • Переключим на российские DNS-сервера с кешированием
  • Разворачиваем системы на Astra Linux
В качестве системных интеграторов поможем осуществить переход с Windows Server на Astra Linux, с MS Active Directory на AstraLinux Directory (ALD Pro), с VMWare на zVirt и т.д.

Мы являемся официальными партнёрами компаний ГК Astra и Орион Софт.
Лицензии ФСТЭК России
При оказании услуг мы соблюдаем требования законодательства Российской Федерации в области защиты информации, установленные для АИС и организационно-распорядительными документами заказчика. Git in Sky имеет действующую лицензию на право осуществления видов деятельности по предмету закупки:
  • Лицензия ФСТЭК России на право осуществления деятельности по технической защите конфиденциальной информации в части услуг, предусмотренных подпунктом «в» пункта 4 Положения о лицензировании деятельности по технической защите конфиденциальной информации, утвержденного постановлением Правительства Российской Федерации от 03.02.2012 № 79 «О лицензировании деятельности по технической защите конфиденциальной информации», а именно: «услуги по мониторингу информационной безопасности средств и систем информатизации»
  • Лицензия ФСТЭК России на право осуществления деятельности по технической защите конфиденциальной информации в части услуг, предусмотренных подпунктом «е» пункта 4 Положения о лицензировании деятельности по технической защите конфиденциальной информации, утвержденного постановлением Правительства Российской Федерации от 03.02.2012 № 79 «О лицензировании деятельности по технической защите конфиденциальной информации», а именно: «услуги по установке, монтажу, наладке, испытаниям, ремонту средств защиты информации»

Эффекты от внедрения

Отказоустойчивость
99.9% — недоступность сервера не более 5 минут в неделю
99.99% — недоступность сервера не более 5 минут в месяц
99.999% — недоступность сервера не более 5 минут в год
Производительность
Мы сможем обеспечить до 30% роста производительности, оптимизируем мощности инфраструктуры

Какие решения мы применяем

Виртуализация: Orionsoft: zVirt, AstraLinux: Брест, Proxmox, VMware vSphere
Служба централизованного управления: Astra Linux ALD PRO, MS Active Directory, FreeIPA
Мониторинг и алертинг: Zabbix, Prometheus/Grafana
СУБД: Postgresql, MySQL/Percona/Mariadb, ClickHouse, MongoDB, Redis
Сеть: Cisco, MicroTik, Eltex и всевозможные аналоги
Вычислительное оборудование: все ныне существующие серверные платформы, СХД, оборудование NAS.

Кейсы

Клиент:
Крупная компания с собственным ЦОД, несколькими десятками блейд-серверов, и несколькими СХД. Количество виртуальных машин в кластере Vmware vSphere более тысячи. Количество пользователей информационных систем - более 4 000 человек.

Проблема:
Периодическое зависание отдельных гипервизоров, до состояния «не отвечает в физической консоли». Зависаниям были подвержены все гипервизоры, вне зависимости от размещенных на них виртуальных машин.

Разумеется, отказы 10-25% аппаратного парка в сутки для бизнеса было огромной проблемой, которую и было поручено решать нам.

Решение:
Была проведена диагностика всей аппаратной части инфраструктуры – без замечаний.

СХД аналогично – без замечаний.

Подняли версию гипервизоров до максимально возможной – безрезультатно.

Параллельно обвязали аппаратную часть инфраструктуры мониторингом, получили первую зацепку: зависание хоста вызывает 100% утилизация CPU на i/o wailt. Логично было предположить, что это поведение связано с системой хранения, но, несмотря на ошибки в журналах гипервизора о потере доступа к одной конкретной системе хранения данных, мониторинг самой СХД, как встроенный, так и внешний, говорили о ее полном здравии.

Сеть хранения была так же проверена – никаких отказов на ней не фиксировалось.

Второй зацепкой стало наблюдение: при обновлении версий гипервизоров мы брали даунтайм у клиентского подразделения информационной безопасности на их виртуальные машины, на которых размещался, в том числе, сканер уязвимостей, и пока виртуальные машины мигрировали на новый гипервизор, отказы гипервизоров временно прекратились.

Опрос сотрудников подразделения ИБ показал, что они занимаются сканированием только рабочих станций и виртуальных машин (но не аппаратного оборудования), и не используют потенциально опасные методы, типа брутфорса или попыток DoS-атак. Во что мы, конечно же, не поверили, и стали средствами vSphere собирать дамп трафика со сканера уязвимостей, направленный в сторону сетевого сегмента, где размещены интерфейсы физического оборудования.

Буквально за несколько часов наблюдений была поймана попытка подбора пароля на ISCSI-интерфейс той самой "проблемной" системы хранения данных, которая, спустя несколько неудачных попыток авторизации, включала режим противодействия брутфорс-атаке и блокировала попытки подключения к ней на несколько минут. Разумеется, в этот момент гипервизор, работавший с данными на СХД, терял к ней связь, получал ошибку ввода-вывода, а далее утилизация процессора стопорила аппаратный хост намертво.

Проблема была сдана заказчику, и в последствии решена блокировкой определенного вида трафика на межсетевом экране сервисного сегмента локальной сети.
Клиенты

Облачная инфраструктура

Решение InfraOps - это не только услуги по переводу эксплуатационных задач (ТП и обработка инцидентов) на современные рельсы, но это и создание эффективной среды для построения этих процессов. Благодаря синергии: доступная облачная инфраструктура наших партнёров + наши технологии Вы получаете быстрый ROI в горизонте 6-12 месяцев.
  • Популярная платформа бизнес-класса для компаний, которые строят ИТ-решения в облаке. VK Cloud помогает компаниям строить и модернизировать ИТ-инфраструктуру для большей надёжности, ускорения разработки и оптимизации расходов. Безопасная и масштабируемая платформа облачных сервисов от VK позволяет строить надежные ИТ-системы для обслуживания бизнеса, разработки и предоставления сервисов.
  • Публичная облачная платформа от интернет-компании «Яндекс». Yandex.Cloud предоставляет частным и корпоративным пользователям инфраструктуру и вычислительные ресурсы в формате as a service.

    В состав Yandex.Cloud входят инфраструктурные сервисы, сервисы для управления данными, инструменты для разработки облачных приложений и моделей машинного обучения и собственные сервисы на основе ML.
  • Российская технологическая компания, предоставляющая облачные инфраструктурные сервисы и услуги дата-центров. По данным на 27 июня 2022 года, площадь серверных помещений Selectel составляет 8,8 тыс. кв.м., общее количество серверных стоек в эксплуатации - 3458, совокупная подведенная мощность ко всем ЦОД- 30 МВт


  • Одна из крупнейших российских ИТ-компаний, предоставляющая услуги по ИТ-консалтингу, оптимизации и автоматизации бизнес-процессов, созданию ИТ-инфраструктуры и ИТ-аутсорсингу. С 2000 года реализовано более 1100 проектов. Входит в топ-50 крупнейших ИТ-компаний страны.
  • Системный интегратор полного цикла и российский производитель оборудования для ИТ-инфраструктуры. Более 30 лет работает для коммерческих организаций и государственных структур. Команда Тринити обладает богатым опытом и знаниями в области проектирования, построения и технического сопровождения ИТ-инфраструктуры любого уровня сложности.

Стек технологий

Системы мониторинга и слежения за событиями сети

Оставить заявку для модернизации ИТ-инфраструктуры для highload проектов
Наш специалист свяжется с вами для детального обсуждения задачи

Не пропустите последние новости. Подписывайтесь!