Как стать автором
Обновить

Администрирование

Сначала показывать
Порог рейтинга
Уровень сложности

Небольшое сравнение gpt4all и alpaca.cpp

Уровень сложности Средний
Время на прочтение 4 мин
Количество просмотров 1.5K
DevOps *Искусственный интеллект
Обзор

Все тестировалось на очень тупеньких запросах о написании python кода, написании рассказа на русском, cоздания playbook для Ansible c дефолтовыми threads = 4 и number of tokens to predict = 200

Читать далее
Рейтинг 0
Комментарии 0

Новости

Первые беспилотники Джона Нортропа

Уровень сложности Простой
Время на прочтение 7 мин
Количество просмотров 2.7K
Научно-популярное Инженерные системы *
Ретроспектива

Немецкое «чудо-оружие»: крылатые ракеты «Фау-1» и баллистические «Фау-2» – в годы войны показало себя «сырым» и неэффективным. Тем не менее, когда информация о нём просочилась к союзникам, те сразу увидели в пока ещё несовершенных «вундерваффе» предвестников будущего и, кто раньше, кто позже, взялись за создание аналогов.

Озаботилось ими и командование Армейской авиации США: получив первые сведения по «Фау-1» от британцев, оно инициировало создание ракет серии JB (jet bomb – реактивная бомба). Больше всего названию соответствовала JB-4 – оснащённая пульсирующим воздушно-реактивным двигателем (ПуВРД) планирующая бомба GB-4. JB-2 представляла собой «реверс-инжиниринг» «Фау-1». Она даже постояла на вооружении, правда, в боях не участвовала. JB-3 относилась к классу «воздух-воздух», а JB-8 была зенитной ракетой.

Но самыми интересными из этой плеяды оказались самолёты-снаряды JB-1 и JB-10 – нигде и никогда больше ничего подобного не делали. Что неудивительно, ведь возглавил их разработку Джон Кнудсен «Джек» Нортроп.

Читать далее
Всего голосов 18: ↑18 и ↓0 +18
Комментарии 0

Сравнение SQL- и NoSQL-баз данных

Уровень сложности Простой
Время на прочтение 11 мин
Количество просмотров 2.8K
Блог компании RUVDS.com SQL *NoSQL *Администрирование баз данных *
Обзор

SQL и NoSQL — две популярные модели баз данных, которые используют для решения различных задач. Чтобы понять, какая из них подойдёт в вашем случае, необходимо разобраться в их различиях, преимуществах и недостатках.

В этой статье я рассмотрю основные характеристики SQL- и NoSQL-баз данных и сравню их, чтобы помочь выбрать лучший вариант для вашего проекта.
Читать дальше →
Всего голосов 29: ↑25 и ↓4 +21
Комментарии 5

Рекомендации по архитектуре программного обеспечения

Время на прочтение 11 мин
Количество просмотров 2.1K
Блог компании Издательский дом «Питер» Программирование *Исследования и прогнозы в IT *Распределённые системы *
Перевод
Марк Ричардс — спикер GSAS, профессор Академии Apium и опытный практикующий архитектор программного обеспечения, занимающийся, проектированием, выстраиванием и внедрением микросервисов, сервис-ориентированных архитектур и распределенных систем с применением различных технологий. Он работает в отрасли с 1983 года и обладает значительным опытом и знаниями в области архитектуры приложений, интеграции и архитектуры предприятия. Марк — основатель DeveloperToArchitect.com, бесплатного веб-сайта, помогающего разработчику дорасти до архитектора программного обеспечения. Он является автором многочисленных технических книг и видеоматериалов, включая "Фундаментальный подход к программной архитектуре", серию видеоматериалов «Основы архитектуры программного обеспечения», а также нескольких книг и видеоматериалов по микросервисам и корпоративной передаче сообщений. Помимо практических консультаций, Марк также является докладчиком и преподавателем, выступал на сотнях конференций и митапов по всему миру по различным техническим темам, связанным с корпоративными системами. Давайте рассмотрим, каковы его основные рекомендации по архитектуре программного обеспечения.
Читать дальше →
Всего голосов 11: ↑10 и ↓1 +9
Комментарии 0

Истории

Как создать таблицы в БД ClickHouse на основе CSV

Уровень сложности Простой
Время на прочтение 2 мин
Количество просмотров 892
Хранение данных *Хранилища данных *Data Engineering *
Туториал

Когда я впервые начал знакомиться с колоночно-ориентированной СУБД ClickHouse, я не смог найти подходящий инструмент (кроме встроенного в веб-интерфейс ClickHouse Cloud) для создания таблиц с нужными столбцами и типами данных на основе CSV файлов или Pandas датафреймов. Ни clickhouse-connect, ни clickhouse-driver не обладали такой функциональностью, как метод to_sql в SQLAlchemy.

Я хотел загрузить свой любимый набор данных о чемпионатах мира по автогонкам класса Формула-1 в ClickHouse, но вручную создавать 15 таблиц было слишком лениво. Хотелось просто скормить нужные CSV файлы скрипту и на выходе получить БД с нужными таблицами и данными внутри.

Когда я ранее знакомился с PySpark, я заметил, что многие data-профессионалы используют Pandas для определения схемы данных перед загрузкой файлов CSV в PySpark. И я подумал, почему бы не использовать Pandas для определения типов данных по столбцам?

Так я создал этот скрипт, которым хочу поделиться. Я надеюсь, что он поможет вам сэкономить немного времени, а мне даст возможность получить от вас пару фидбеков и идей для улучшения.

Я не уверен в полной совместимости типов данных между Pandas и ClickHouse: быстрый поиск дал противоречивые результаты, поэтому поправьте меня, если найдете какие-либо расхождения.

И будьте осторожны с replace_flag - если установлено значение True, то скрипт пересоздаст таблицы с тем же именем, если они уже существуют, поэтому вы можете потерять существующие данные в своей базе данных. Чтобы избежать этого, но также избежать дублирования данных, я рекомендую указать несуществующее имя базы данных в качестве database_name. Если установлено значение False в replace_flag, данные из ваших файлов CSV будут добавляться в существующие таблицы с тем же именем (конечно же, число столбцов и их типы данных должны совпадать).

Читать далее
Всего голосов 2: ↑2 и ↓0 +2
Комментарии 1

7 фич корпоративной почты VK WorkMail (on-premise)

Уровень сложности Простой
Время на прочтение 13 мин
Количество просмотров 602
Блог компании Сиссофт Системное администрирование *

Материал данной статьи будет полезен, в первую очередь, инженерам, которые еще не сталкивались с продуктами экосистемы VK WorkSpace. Под катом постараюсь простым языком рассказать об установке ПО и ответить на некоторые вопросы, которые могут возникнуть в процессе. Ну, и в конце выделил 7 важных фич VK WorkMail, без которых сложно представить современную почтовую систему. Также, опишу перечень функциональностей, которые предлагает VK WorkMail + WorkDisk для администраторов продукта. Думаю, что данный текст будет полезен для разных категорий пользователей и сэкономит вам массу времени при работе с описываемым ПО. Поехали! 

Читать далее
Всего голосов 7: ↑7 и ↓0 +7
Комментарии 4

Облако с государственной аттестацией: как пользоваться гибкостью виртуализации и сответствовать приказам ФСТЭК

Уровень сложности Простой
Время на прочтение 4 мин
Количество просмотров 544
Блог компании Selectel IT-инфраструктура *Облачные вычисления *Законодательство в IT

Миграция в облако для госструктур и бизнеса, работающего с государственными проектами, — задача с большим числом неизвестных. Таким компаниям хочется использовать облака из-за гибкого масштабирования ресурсов и быстрого развертывания сервисов. Решение также не требует капитальных затрат, если сравнивать его с построением собственной инфраструктуры. Но преимущества облака часто ломаются о перечень требований безопасности к государственным информационным системам (ГИС).
Читать дальше →
Всего голосов 26: ↑25 и ↓1 +24
Комментарии 2

DataHub: как делиться структурированными данными и получать за них донаты?

Уровень сложности Простой
Время на прочтение 4 мин
Количество просмотров 558
Data Mining *Big Data *Открытые данные *Хранение данных *Хранилища данных *
Туториал

Привет! Меня зовут Андрей Шмиг, я основатель и разработчик платформы DataHub - Crowd Data Sourcing at Hand, своего рода GitHub для данных. В этой статье речь пойдёт о том, как создать FREE и SPONSORED репозитории данных, а так же в чем их отличия.

Читать далее
Всего голосов 2: ↑2 и ↓0 +2
Комментарии 0

Snapshots в Cassandra — как пользоваться и восстанавливать данные?

Время на прочтение 9 мин
Количество просмотров 368
Блог компании Лига Цифровой Экономики NoSQL *Восстановление данных *Распределённые системы *IT-компании

Привет, Хабр! Меня зовут Евгений Абрамкин, я руководитель поддержки третьего уровня в направлении омниканальных решений Лиги Цифровой Экономики. Моя команда — последняя «инстанция» во флоу по решению инцидентов. Мы пишем доработки и фиксы, чтобы победить проблему клиента, а еще предоставляем оптимальную конфигурацию для системы, которая передана в эксплуатацию или требует масштабирования. Это может быть кластер Elasticsearch, балансировщики nginx или что поинтереснее — распределенная NoSQL СУБД Apache Cassandra.

Читать далее
Всего голосов 2: ↑2 и ↓0 +2
Комментарии 0

Kubernetes-валидаторы и где они обитают

Уровень сложности Средний
Время на прочтение 24 мин
Количество просмотров 478
Блог компании SimbirSoft DevOps *Kubernetes *
Обзор

Ступая по тропе изучения новой технологии, порой полезно обернуться назад и оценить, насколько тернист был этот путь, сделать выводы и только после этого уверенно двигаться дальше. Так как Kubernetes — довольно сложная система, то и требования к уверенному знанию своего устройства и бережному отношению к конфигурациям у нее соответствующие. Как опытный путешественник не покоряет горные вершины без инструментов первой необходимости, так и работающий с Kubernetes инженер не обходится без приложений, страхующих его в повседневной работе. 

В этой статье мы протестируем несколько утилит для валидации Kubernetes манифестов и, сравнив их между собой, попробуем ответить на вопрос — возможно ли избавиться от мисконфигураций на разных этапах подготовки деплоя приложения.

Читать далее
Всего голосов 4: ↑4 и ↓0 +4
Комментарии 0

Потоковый проект в режиме реального времени с использованием данных смартфона

Время на прочтение 18 мин
Количество просмотров 569
Блог компании Southbridge Программирование *IT-инфраструктура *Интернет вещей
Перевод

Девайсы повсюду. Смартфоны, холодильники, дверные звонки, часы, медицинские датчики, системы безопасности и фитнес-трекеры — все это лишь некоторые из них, которые в стали обычным явлением. Они постоянно записывают потенциально высокочастотную информацию и образуют сеть, известную как «Интернет вещей», или IoT, представляя обширные источники данных.

Хотя ресурсов по этой теме достаточно, немногие приводят примеры с реальными данными, доступными любому желающему. Переходя от статьи к статье, чтобы узнать о системах, управляемых событиями, и потоковых технологиях, таких как Apache Kafka, Harrison Hoffman наткнулся на приложение для смартфонов Sensor Logger, которое позволяет пользователям передавать данные с датчиков движения на свои телефоны. Такой вариант показался идеальным способом обучения, поэтому родился проект «smartphone_sensor_stream». Этот проект использует FastAPI, Kafka, QuestDB и Docker для визуализации данных датчиков в реальном времени на информационной панели.

В этой статье мы рассмотрим все основные компоненты этого проекта на продвинутом уровне. Все необходимое для локального запуска проекта доступно на GitHub, а краткая демонстрация доступна на YouTube. 

Читать далее
Всего голосов 5: ↑5 и ↓0 +5
Комментарии 1

Что такое модерация контента? Типы модерации и инструменты

Уровень сложности Средний
Время на прочтение 7 мин
Количество просмотров 330
Спам и антиспам Машинное обучение *Управление медиа *Искусственный интеллект Социальные сети и сообщества
Туториал
Перевод

Цифровой мир находится в состоянии постоянного движения, и одной из его мощных движущих сил является генерируемый контент. Сегодня люди охотнее поверят мнению, высказанному другими людьми онлайн, чем информации, предоставляемой компаниями и государственными органами. В этой статье мы расскажем, что такое модерация контента.

Ежедневно публикуются невообразимые объёмы текста, изображений и видео, поэтому компаниям необходимо отслеживать контент, хранящийся на их платформах. Это критически важно для обеспечения безопасной и надёжной среды для клиентов, а также для мониторинга социальных влияний на восприятие брендов и соответствия государственным требованиям.

Наиболее эффективным способом достижения всех этих целей является модерация контента.


Под модерацией контента понимается отсев недопустимого контента, публикуемого пользователями на платформе. Этот процесс включает в себя применение заранее установленных правил мониторинга контента. Если контент не соответствует требованиям, он помечается и удаляется. Причины этого могут быть разными: насилие, оскорбления, экстремизм, нагота, враждебные высказывания, нарушения авторских прав и тому подобное.

Задача модерации контента — обеспечение безопасности платформы и её соответствия политике компании по обеспечению доверия и защиты. Модерация контента широко применяется в социальных сетях, на веб-сайтах и в приложениях для онлайн-знакомств, на торговых площадках, форумах и других подобных платформах.
Читать дальше →
Всего голосов 2: ↑0 и ↓2 -2
Комментарии 3

Стандарты безопасности в Kubernetes (обзор и видео доклада)

Уровень сложности Средний
Время на прочтение 14 мин
Количество просмотров 1K
Блог компании VK Блог компании Флант Информационная безопасность *DevOps *Kubernetes *

С этим докладом я выступал на недавней конференции VK Kubernetes Conf 2023. В нем рассказывается, какие правила безопасности в Kubernetes действительно необходимы, и разбираются пять шагов, которые помогают улучшить безопасность.

Читать далее
Всего голосов 25: ↑25 и ↓0 +25
Комментарии 0

Некоторые особенности переноса почты с Яндекс.ПДД на VK WorkMail

Время на прочтение 5 мин
Количество просмотров 1.2K
Системное администрирование *

С 17 апреля яндексовская почта для домена стала платной для тех, у кого на домене больше трёх ящиков (хотя они и накинули несколько дней на выбор тарифа). В связи с этим многие ломанулись на VK WorkMail (оно же "Почта mail.ru для бизнеса") - там пока ещё остаётся бесплатный тариф, да и на платном цены в несколько раз ниже, чем у яндекса.

Я не стал исключением. Впрочем, свой персональный домен я вернул на gmail, благо google передумал свой бесплатный тариф убирать. Но вот рабочие почты я переносил именно на mail.ru, о чём хочется немного написать с технической точки зрения - какие особенности встретились при переезде.

Впечатления от почты и сам процесс я описывать не буду, он достаточно прямолинейный, документация вполне понятная, а если хочется посмотреть, как выглядит сам почтовик - заведите себе ящик на mail.ru.

Читать далее
Всего голосов 5: ↑4 и ↓1 +3
Комментарии 15

Сдать Астру. Что нужно знать об экзамене ALCSA-1.7

Время на прочтение 8 мин
Количество просмотров 1.3K
Блог компании Инфосистемы Джет Настройка Linux *IT-инфраструктура *Учебный процесс в IT

Приветствую всех! В этой статье я бы хотел поделиться опытом подготовки и сдачи экзамена ALCSA-1.7: Сертифицированный системный администратор Astra Linux Special Edition 1.7. Вопросов от коллег (и не только) по нему было много, а информации в открытом доступе до обидного мало. Итак, пойдем по порядку.

Читать далее
Всего голосов 6: ↑4 и ↓2 +2
Комментарии 3

Захватывающая ловля багов, которые портили работу Unbound

Уровень сложности Сложный
Время на прочтение 38 мин
Количество просмотров 1.9K
Блог компании Яндекс Высокая производительность *Серверное администрирование *DNS *

Привет, меня зовут Сергей Качеев, я старший разработчик в отделе сетевой инфраструктуры Яндекса. Сегодня я расскажу целый сетевой детектив о том, как мы искали баг, который убивал DNS сервер Unbound. Приготовьтесь, он будет долгим.

Всё началось с того, что мне предложили помочь ребятам из команды DNS найти такие метрики и наборы запросов, по которым будет однозначно понятно, какие настройки влияют на производительность Unbound и какие запросы вызывают у него проблемы.

В самом начале на графиках нагрузочного тестирования я увидел очень плохие результаты: случайным образом абсолютно все запросы нагрузочного теста таймаутились, но сервер, который был под нагрузкой, никак не реагировал на проблему. Как выяснилось позже, по чистой случайности я допустил ошибку в конфигурации нашего плагина Pandora, и в итоге он сам ходил в DNS на каждый запрос, чтобы узнать ip адрес тестируемого сервера. Возможно, это сыграло мне на руку и помогло найти первую из проблем, а потом и вовсе задало вектор поисков остальных багов. А в Unbound их накопилось достаточно.

Читать далее
Всего голосов 43: ↑43 и ↓0 +43
Комментарии 0

Обзор Arachni: фреймворк для поиска уязвимостей в веб-приложениях

Время на прочтение 6 мин
Количество просмотров 615
Блог компании FirstVDS Информационная безопасность *Open source *Системное администрирование *

Чтобы просканировать веб-сайт или веб-приложение на наличие всевозможных уязвимостей, существует довольно обширный список программ. Такие программы называются сканеры уязвимостей. Главная цель таких утилит – найти уязвимости, собрать информацию о сайте, а также проверить, может ли сайт быть подвергнут сетевым атакам. Для таких целей отлично подойдет сканер под названием Arachni.

Читать далее
Всего голосов 4: ↑4 и ↓0 +4
Комментарии 0

Простой способ развернуть телеграмм бота с Aiogram + Webhook на хостинг

Уровень сложности Простой
Время на прочтение 4 мин
Количество просмотров 1.7K
Хостинг Мессенджеры *Python *DevOps *
Из песочницы

Расскажу самый простой и бесплатный способ развернуть на хостинге телеграмм бота, написанного на aiogram и перевести на webhook. Посмотреть видео-версию, которую я разместил, можно на https://youtu.be/Gw-cVvsaOGE .

Бот будет работать 24/7 пожизненно.

Без использования VPS, фреймворка (django, flask, fastapi,..), pythonanywhere и heroku.

Краткое содержание действий:

Пункт 1. Сохранить пример к себе, регистрация на хостинге.

Пункт 2. Через FTP поместить наш файл бота на хостинге.

Пункт 3. Через SSH установить библиотеку aiogram.

Пункт 4. Настроить сервис бота на хостинге.

Пункт 5. Настроить веб-сайт на переадресацию всех запросов на сервис бота.

Пункт 6. Отредактировать файл запуска бота с учетом наших настроек.

Пункт 7. Перезапуск сервиса бота, проверка бота. Просмотр логов.

________________________________________________________

Пункт 1. Сохранить пример к себе, регистрация на хостинге.

Идем на страницу официальной документации:

https://docs.aiogram.dev/en/latest/examples/webhook_example.html

Копируем содержимое webhook_example.py к себе в файл webhook.py и сохраняем.

Читать далее
Всего голосов 8: ↑7 и ↓1 +6
Комментарии 6

Ещё эпические фейлы при открытии в Казахстане (почему мы так задержались)

Уровень сложности Простой
Время на прочтение 10 мин
Количество просмотров 3.1K
Блог компании RUVDS.com Хостинг Хранение данных *Хранилища данных *Управление проектами *
Кейс
ЦОД в Астане, где мы встали

В прошлый раз я рассказал про то, как «учёный изнасиловал журналиста». Кратко: мы выпустили релиз, что встаём в ЦОДы «Транстелекома», «Форбс Казахстан» написал, что мы совместно открываем два ЦОДа, дальше наши «новообретённые» партнёры узнали много нового о себе и своих стратегических партнёрствах и очень удивились. Про эти приключения в прошлом посте.

Это не первый опыт наших эпик фейлов в Казахстане.

Оставалось купить железо, настроить оплаты и заехать в ЦОДы.

Естественно, кое-что пошло не так.
Читать дальше →
Всего голосов 38: ↑36 и ↓2 +34
Комментарии 7

Подробная история развития облачных технологий

Уровень сложности Простой
Время на прочтение 8 мин
Количество просмотров 1.1K
Блог компании Serverspace IT-инфраструктура *Облачные вычисления *Читальный зал История IT
Ретроспектива


Многие родившиеся в XXI веке люди считают, что облачные технологии появились при их поколении. На самом деле, история «облаков» насчитывает уже как минимум шесть десятилетий, причем в ней случались как периоды застоя, так и этапы бурного развития. Основу для них заложили, как это происходило с целым рядом других технологических инноваций, военные. И все-таки, при каких обстоятельствах зародились облачные технологии и как они развивались? Об этом — в нашей сегодняшней статье.
Читать дальше →
Всего голосов 19: ↑18 и ↓1 +17
Комментарии 2