InfraOps - системная интеграция с применением DevOps практик

Мы предлагаем комплексное решение в области системной интеграции, внедрения современных информационных систем и построения импортонезависимой ИТ-инфраструктуры с применением DevOps и SRE практик
Infrastructure and Operation (InfraOps) - набор технических и организационных подходов и практик (по аналогии с DevOps, как части Agile-подхода), применяемые к задачам классического системного администрирования.

Когда данный подход принесет максимальный результат:
  • Инфраструктура требует значительных изменений (внедрение новых решений)
  • Инфраструктура потеряла управляемость, попытки модернизации приводят к авариям
  • Требуется разовое применение инженеров редкой квалификации:
    • внедрение импортозамещающих системных продуктов
    • построение комплексных систем проактивного мониторинга и алертинга

Компоненты решения InfraOps

Импортозамещение серверного ПО
Организация антисанкционной инфраструктуры:

1. Обеспечим переход от проприетарных систем (Microsoft, Oracle, Amazon и т.д. на свободное ПО на базе Linux
2. Развернем автономные серверные инсталляции
3. Настроим зеркала для обеспечения доступности к репозиториям
4. Настраиваем контроль обновлений пакетов
5. Переключим на российские DNS-сервера с кешированием
6. Разворачиваем системы на Astra Linux

В качестве системных интеграторов поможем осуществить переход с Windows Server на Astra Linux, с MS Active Directory на AstraLinux Directory (ALD Pro), с VMWare на zVirt и т.д.

Мы являемся официальными партнёрами компаний ГК Astra и Орион Софт.
Аудит инфраструктуры
1. Удалённый мониторинг текущей инфраструктуры с помощью Prometheus/Grafana
2. Анализ данных мониторинга и поиск проблем/уязвимостей/багов
3. Аудит существующей архитектуры, выявление бутылочных горлышек, построение плана улучшений
4. Оценка существующей инфраструктуры и требований к системе безопасности, выявление уязвимых мест
5. Оценка того, что необходимо сделать, чтобы ваши ИС адаптировались к новым требованиям, например, увеличению объемов данных или числа пользователей с точки зрения оптимизации работы или необходимости внедрения нового системного ПО
6. Профессиональная оценка рисков и снижение вероятности их возникновения, построение модели угроз
Мониторинг и резервное копирование
Выстраиваем централизованную систему превентивного мониторинга для контроля функционирования серверов конкретных АИС и процессов сетевого взаимодействия между АИС, систем безопасности функционирования серверов.

Внедряем централизованный мониторинг событий информационной безопасности и проводим работы по настройке операционных систем.

Система охватывает все приложения и стеки ПО, серверы, низкоуровневые метрики, бизнес метрики и имеет алерты. У нас лучшие эксперты по мониторингу IT-инфраструктуры с использованием инструментов Prometheus и Grafana
Описание инфраструктуры кодом IAC (infrastructure as a code)
Настройку вычислительной инфраструктуры удобнее, быстрее и безопаснее выполнять декларативно, а не редактировать серверные конфигурации вручную.
Для этого наши специалисты используют Ansible.
Отказоустойчивая СУБД
В рамках нашего решения мы осуществим кластеризацию PostgreSQL с помощью Patroni, обеспечим переход со standalone MySQL на более производительную Percona XtraDB Cluster (PXC) для MySQL. Обеспечим отказоустойчивость Tarantool – СУБД разработки vk.cloud, а также Aerospike/Cassandra.
Система сбора логов (ELK stack)
Если у вас множество разных информационных систем, которые генерируют огромное количество служебной информации, то встает резонный вопрос, где её хранить.

Для решения этой задачи есть хранилище для логов на базе Elasticsearch, Logstash и Kibana или ELK Stack. Мы настраиваем отправку всех логов из всех систем в это хранилище, настраиваем и осуществляем мониторинг.
ИТ-инфраструктура в облаке
Поможем осуществить миграцию серверных инфраструктур любого масштаба, как с физических окружений на облачные, так и обратно, с облачных – на физические.

Кроме того, мы являемся официальными Managed Services партнёрами Vk. Cloud Solutions, Yandex Cloud и Корус Консалтинг CPM, также имеем собственные мощности для оказания IaaS в Public Cloud.
Консультации
Мы консультируем заказчика и, при необходимости, подрядчиков, обслуживающих АИС, в части эксплуатации серверного БПО, ПО виртуализации, ПО СУБД и другого серверного ПО
Наши партнеры
Лицензии ФСТЭК России
При оказании услуг мы соблюдаем требования законодательства Российской Федерации в области защиты информации, установленные для АИС и организационно-распорядительными документами заказчика. Git in Sky имеет действующую лицензию на право осуществления видов деятельности по предмету закупки:
  • Лицензия ФСТЭК России на право осуществления деятельности по технической защите конфиденциальной информации в части услуг, предусмотренных подпунктом «в» пункта 4 Положения о лицензировании деятельности по технической защите конфиденциальной информации, утвержденного постановлением Правительства Российской Федерации от 03.02.2012 № 79 «О лицензировании деятельности по технической защите конфиденциальной информации», а именно: «услуги по мониторингу информационной безопасности средств и систем информатизации»
  • Лицензия ФСТЭК России на право осуществления деятельности по технической защите конфиденциальной информации в части услуг, предусмотренных подпунктом «е» пункта 4 Положения о лицензировании деятельности по технической защите конфиденциальной информации, утвержденного постановлением Правительства Российской Федерации от 03.02.2012 № 79 «О лицензировании деятельности по технической защите конфиденциальной информации», а именно: «услуги по установке, монтажу, наладке, испытаниям, ремонту средств защиты информации»

Эффекты от внедрения

Отказоустойчивость
99.9% — недоступность сервера не более 5 минут в неделю
99.99% — недоступность сервера не более 5 минут в месяц
99.999% — недоступность сервера не более 5 минут в год
Производительность
Мы сможем обеспечить до 30% роста производительности, оптимизируем мощности инфраструктуры

Какие решения мы применяем

Виртуализация: Orionsoft: zVirt, AstraLinux: Брест, Proxmox, VMware vSphere
Служба централизованного управления: Astra Linux ALD PRO, MS Active Directory, FreeIPA
Мониторинг и алертинг: Zabbix, Prometheus/Grafana
СУБД: Postgresql, MySQL/Percona/Mariadb, ClickHouse, MongoDB, Redis
Сеть: Cisco, MicroTik, Eltex и всевозможные аналоги
Вычислительное оборудование: все ныне существующие серверные платформы, СХД, оборудование NAS.

Кейсы

Клиент:
Крупная компания с собственным ЦОД, несколькими десятками блейд-серверов, и несколькими СХД. Количество виртуальных машин в кластере Vmware vSphere более тысячи. Количество пользователей информационных систем - более 4 000 человек.

Проблема:
Периодическое зависание отдельных гипервизоров, до состояния «не отвечает в физической консоли». Зависаниям были подвержены все гипервизоры, вне зависимости от размещенных на них виртуальных машин.

Разумеется, отказы 10-25% аппаратного парка в сутки для бизнеса было огромной проблемой, которую и было поручено решать нам.

Решение:
Была проведена диагностика всей аппаратной части инфраструктуры – без замечаний.

СХД аналогично – без замечаний.

Подняли версию гипервизоров до максимально возможной – безрезультатно.

Параллельно обвязали аппаратную часть инфраструктуры мониторингом, получили первую зацепку: зависание хоста вызывает 100% утилизация CPU на i/o wailt. Логично было предположить, что это поведение связано с системой хранения, но, несмотря на ошибки в журналах гипервизора о потере доступа к одной конкретной системе хранения данных, мониторинг самой СХД, как встроенный, так и внешний, говорили о ее полном здравии.

Сеть хранения была так же проверена – никаких отказов на ней не фиксировалось.

Второй зацепкой стало наблюдение: при обновлении версий гипервизоров мы брали даунтайм у клиентского подразделения информационной безопасности на их виртуальные машины, на которых размещался, в том числе, сканер уязвимостей, и пока виртуальные машины мигрировали на новый гипервизор, отказы гипервизоров временно прекратились.

Опрос сотрудников подразделения ИБ показал, что они занимаются сканированием только рабочих станций и виртуальных машин (но не аппаратного оборудования), и не используют потенциально опасные методы, типа брутфорса или попыток DoS-атак. Во что мы, конечно же, не поверили, и стали средствами vSphere собирать дамп трафика со сканера уязвимостей, направленный в сторону сетевого сегмента, где размещены интерфейсы физического оборудования.

Буквально за несколько часов наблюдений была поймана попытка подбора пароля на ISCSI-интерфейс той самой "проблемной" системы хранения данных, которая, спустя несколько неудачных попыток авторизации, включала режим противодействия брутфорс-атаке и блокировала попытки подключения к ней на несколько минут. Разумеется, в этот момент гипервизор, работавший с данными на СХД, терял к ней связь, получал ошибку ввода-вывода, а далее утилизация процессора стопорила аппаратный хост намертво.

Проблема была сдана заказчику, и в последствии решена блокировкой определенного вида трафика на межсетевом экране сервисного сегмента локальной сети.

Кейс:

Оптимизация работы 1С-инфраструктуры и улучшение доступности портала интернет-магазина автозапчастей


Решения и услуги:

InfraOps - системная интеграция и DevOps практики

Оптимизация 1С-инфраструктур

Техническая поддержка серверов


Отрасль: e-commerce

Клиент: Крупный российский интернет-магазин автозапчастей для грузовиков, со штатом более чем 200 сотрудников.


Проблема клиента:

Медленная работа 1С-приложения и низкая скорость работы интернет-магазина в периоды высоких нагрузок, и как результат - сбои в работе сотрудников, простои персонала. Также происходили задержки в бизнес-процессах: скорость выставления счетов была низкая, были заметны пробелы в безопасности, случалась остановка работы кассовых аппаратов («зависания»). Более того, происходила частая потеря данных, например, однажды в результате случайного удаления из базы компания потеряла 7000 документов.

Текущий подрядчик-интегратор 1С-решений не смог помочь и порекомендовал компании оптимизировать архитектуру.


IT-инфраструктура заказчика:

4-5 физических сервера (гипервизора) расположенных в ЦОДе Public Cloud, а также несколько десятков виртуальных машин.

Программное обеспечение состояло из продуктов семейства 1C:Предприятие 8.x — 1C:Бухгалтерия, 1С:Торговля, 1С:Виртуальный склад и подобные.

Интернет-магазин на момент обращения клиента имел нагрузку около 15 тысяч уникальных посетителей в день, 40-50 тысяч просмотров.

Сайт располагался на ASP.NET, СУБД — MS SQL, в качестве веб-сервера — IIS, размер БД — около 200 ГБ, рост базы данных более-менее стабильный, основан на расширении ассортимента и контента по ассортименту.


Задачи для подрядчика:

  • Провести аудит ИТ-инфраструктуры;
  • Осуществить перенос инфраструктуры на собственные мощности, размещенные в новом центре обработки данных;
  • Оптимизировать производительность работы 1С-приложений;
  • Наладить администрирование web-серверов и 1С-серверов.


Решение Git in Sky:

На базе работающей инфраструктуры заказчика наши InfraOps-инженеры реализовали следующие решения:

Выстроили тонкий мониторинг 1С-процессов изнутри через Prometheus.

Выполнили профилирование кода 1С. Отметим, что обычно анализ кода выполняют не DevOps- или SRE-инженеры, не системные интеграторы, а программисты на стороне заказчика или 1С-франчайзи. Но с учётом того, что у наших инженеров есть такие компетенции, они могут хорошо выполнять профилирование кода 1С и иногда берут на себя эту работу.

Выстроили новую модульную архитектуру решения, оптимизировали производительность 1С-приложений.

Помогли с переездом из облака на физический сервер.

Устранили проблемы информационной безопасности (ИБ).

Организовали процесс администрирования компонентов инфраструктуры 24/7.


Результаты работы Git in Sky:

Выстроенный мониторинг позволил видеть процессы 1С-сервера: количество пользователей в базе, время нагрузки на сервер;

Производительность 1С-инфраструктуры увеличилась на 70%;

Простои персонала сократились на 90%;

Доступность сервисов достигла значения 99.9;

Количество ИБ-уязвимостей снизилось почти до 0.


Вместо заключения:

Услуга была оказана на основе соглашения о неразглашении (NDA), поэтому мы не упоминаем название компании-заказчика в этом кейсе.

Инженеры Git in Sky работали на стыке системной интеграции и DevOps — то есть того, что в компании называют InfraOps.

Сегодня InfraOps при тесном взаимодействии с системной интеграцией, DevOps и SRE (Site Reliability Engineering — обеспечение бесперебойной работы высоконагруженных сервисов) играет ключевую роль в обеспечении стабильности и надёжности IT-инфраструктуры. Это происходит за счёт грамотной настройки инфраструктуры и своевременного, высокопрофессионального реагирования на инциденты. Рассмотренные выше подходы позволяют бизнесу функционировать более эффективно и быстрее достигать своих целей, не терять данные, не подвергать риску репутацию и, соответственно, не терять доходы.
Клиенты

Облачная инфраструктура

Решение InfraOps - это не только услуги по переводу эксплуатационных задач (ТП и обработка инцидентов) на современные рельсы, но это и создание эффективной среды для построения этих процессов. Благодаря синергии: доступная облачная инфраструктура наших партнёров + наши технологии Вы получаете быстрый ROI в горизонте 6-12 месяцев.
  • Популярная платформа бизнес-класса для компаний, которые строят ИТ-решения в облаке. VK Cloud помогает компаниям строить и модернизировать ИТ-инфраструктуру для большей надёжности, ускорения разработки и оптимизации расходов. Безопасная и масштабируемая платформа облачных сервисов от VK позволяет строить надежные ИТ-системы для обслуживания бизнеса, разработки и предоставления сервисов.
  • Публичная облачная платформа от интернет-компании «Яндекс». Yandex.Cloud предоставляет частным и корпоративным пользователям инфраструктуру и вычислительные ресурсы в формате as a service.

    В состав Yandex.Cloud входят инфраструктурные сервисы, сервисы для управления данными, инструменты для разработки облачных приложений и моделей машинного обучения и собственные сервисы на основе ML.
  • Российская технологическая компания, предоставляющая облачные инфраструктурные сервисы и услуги дата-центров. По данным на 27 июня 2022 года, площадь серверных помещений Selectel составляет 8,8 тыс. кв.м., общее количество серверных стоек в эксплуатации - 3458, совокупная подведенная мощность ко всем ЦОД- 30 МВт


  • Одна из крупнейших российских ИТ-компаний, предоставляющая услуги по ИТ-консалтингу, оптимизации и автоматизации бизнес-процессов, созданию ИТ-инфраструктуры и ИТ-аутсорсингу. С 2000 года реализовано более 1100 проектов. Входит в топ-50 крупнейших ИТ-компаний страны.
  • Системный интегратор полного цикла и российский производитель оборудования для ИТ-инфраструктуры. Более 30 лет работает для коммерческих организаций и государственных структур. Команда Тринити обладает богатым опытом и знаниями в области проектирования, построения и технического сопровождения ИТ-инфраструктуры любого уровня сложности.

Стек технологий

Системы мониторинга и слежения за событиями сети

Оставить заявку на комплексное решение по системной интеграции
Наш специалист свяжется с вами для детального обсуждения задачи

Не пропустите последние новости. Подписывайтесь!