Как стать автором
Обновить
170.65
Рейтинг

Open source *

Открытое программное обеспечение

Сначала показывать
Порог рейтинга

Преобразование данных на TiDB стало проще

Блог компании FirstVDS Open source *Системное администрирование *Администрирование баз данных *
Перевод

Средство формирования данных (Data build tool, dbt) — это популярный инструмент с открытым исходным кодом, который позволяет инженерам-аналитикам преобразовывать данные в своих хранилищах с помощью операторов SQL. Совсем недавно участники профильного соощества выпустили плагин dbt-tidb, который позволит TiDB-распределённой базе данных SQL работать с dbt. Благодаря плагину dbt-tidb инженеры-аналитики, работающие с TiDB, могут напрямую создавать формы и сопоставлять данные через SQL без необходимости думать о процессе создания таблиц или представлений. Теперь можно использовать Jinja, язык шаблонов dbt для написания SQL, тестирования, управления пакетами и других функций, что значительно повышает эффективность работы с данными.
Читать дальше →
Рейтинг 0
Просмотры 172
Комментарии 0

Новости

В новом релизе Kubernetes-платформы Deckhouse 1.33 появился модуль Cilium

Блог компании Флант Open source *Системное администрирование *DevOps *Kubernetes *

За время, прошедшее с момента предыдущего стабильного релиза Deckhouse, наша Kubernetes-платформа успела получить сертификацию CNCF для версий Kubernetes v1.22 и v1.23, появилась в списках adopters у Prometheus Operator, а еще — в числе пользователей Cilium. Как раз с Cilium связано главное улучшение в новом стабильном релизе платформы.

Читать далее
Всего голосов 21: ↑21 и ↓0 +21
Просмотры 1.1K
Комментарии 5

Как управлять программным обеспечением в корпоративной ИТ-инфраструктуре?

Блог компании HOSTKEY Open source *Серверная оптимизация *Серверное администрирование *Управление продуктом *

Многим компаниям приходится решать вопросы управления жизненным циклом собственных или сторонних продуктов. Расскажем, как это реализовано у нас в HOSTKEY, а также изучим альтернативные системы.

Читать далее
Всего голосов 11: ↑7 и ↓4 +3
Просмотры 3.1K
Комментарии 1

Rust 1.62.0: cargo add, #[default] для перечислений, быстрые мьютексы на Linux и поддержка bare metal x86_64 платформ

Open source *Программирование *Системное программирование *Компиляторы *Rust *
Перевод

Команда Rust рада сообщить о новой версии языка — 1.62.0. Rust — это язык программирования, позволяющий каждому создавать надёжное и эффективное программное обеспечение.


Если у вас есть предыдущая версия Rust, установленная через rustup, то для обновления до версии 1.62.0 вам достаточно выполнить команду:


rustup update stable

Если у вас ещё нет rustup, то можете установить его со страницы на нашем веб-сайте, а также ознакомиться с подробным описанием выпуска 1.62.0 на GitHub.


Если вы хотите помочь нам протестировать будущие выпуски, вы можете использовать beta (rustup default beta) или nightly (rustup default nightly) канал. Пожалуйста, сообщайте обо всех встреченных вами ошибках.

Читать дальше →
Всего голосов 36: ↑36 и ↓0 +36
Просмотры 3.6K
Комментарии 2

Краткий обзор библиотеки so5extra с дополнениями для SObjectizer-5

Open source *Программирование *C++ *

О проекте SObjectizer-5 мы рассказываем на Хабре уже давно и более-менее регулярно. А вот о сопутствующем ему проекте so5extra речь заходит гораздо реже и вскользь. Между тем so5extra развивается уже пять лет (как же быстро летит время) и на днях мы зафиксировали очередную версию. Что представляется хорошим поводом представить вашему вниманию обзор библиотеки so5extra, с акцентом на разнообразие реализованных в ней типов почтовых ящиков (mbox-ов в нашей терминологии).

Читать далее
Всего голосов 8: ↑6 и ↓2 +4
Просмотры 439
Комментарии 0

Эй-Яй, крипта, MLOps и командный пет-проджект

Блог компании Open Data Science Open source *Data Mining *Машинное обучение *Управление проектами *

В этой статье я расскажу, как мы командой пилили пет-проджект в рамках курса ODS по MLOps. Покажу не только финальный результат, но и немного расскажу про процесс работы, какие были сложности, как организовывали эффективную работу в команде. Может оказаться полезным для тех, кто хочет окунуться в Machine Learning и сделать свой пет-проджект, но пока чего-то не хватало. Также будет полезно тем, кто уже работает в области Data Science, но пока не окунулся в атмосферу DS, нет крутых коллег и разгвооров про фреймворки у кофемашины, а опыт командной работы именно в области DS получить хочется.

Сразу про то, что получилось на выходе: https://cryptobarometer.org/

Читать далее
Всего голосов 21: ↑20 и ↓1 +19
Просмотры 2.1K
Комментарии 9

KnownReader. Читалка и словари

Open source *Разработка мобильных приложений *Разработка под Android *

Всем привет!

Уже который год идёт, а мы все ещё пишем читалку со словарями под Android. Настало время для очередной статьи о том, что у нас появилось нового.

Читать далее
Всего голосов 15: ↑15 и ↓0 +15
Просмотры 3.5K
Комментарии 4

Параллельные оболочки с xargs: Используем все процессорные ядра в UNIX и Windows

Блог компании RUVDS.com Open source *Системное администрирование *Программирование *
Перевод

▍ Введение


Одним из наиболее неприятных моментов в работе с оболочкой UNIX является невозможность легко запланировать несколько параллельных задач, которые бы полностью использовали ядра процессора, представленные в большинстве современных системах. В данной статье в качестве примера рассматривается сжатие файлов, но проблема также возникает и при выполнении многих задач с интенсивными вычислениями, таких как: обработка изображений/аудио/медиа, подбор паролей и анализ хэшей, резервное копирование, а также извлечение, преобразование и загрузка баз данных. Вполне понятно, что ждать, когда gzip * выполнится на одном ядре процессора, довольно утомительно, в то время как большая часть вычислительной мощности машины простаивает.
Читать дальше →
Всего голосов 33: ↑32 и ↓1 +31
Просмотры 3.7K
Комментарии 2

Представляем glaball для управления множеством GitLab-инстансов

Блог компании Флант Open source *Системное администрирование *Git *

В наиболее популярном случае иметь множество инсталляций GitLab — это антипаттерн. Однако обстоятельства бывают разными: специализация нашего бизнеса привела к тому, что мы администрируем десятки self-hosted GitLab-инстансов обслуживаемых клиентов. Периодически у нас возникает потребность проделать какие-то действия на всех GitLab’ах сразу, чтобы не тратить время на многократное повторение рутинных операций. Все началось с необходимости мониторинга за критическими обновлениями для GitLab. Но аппетиты росли: со временем нам уже хотелось искать по содержимому файлов во всех инсталляциях или даже создавать пользователей.

Расскажем о том, как мы решили эти задачи в рамках внутренней разработки, которую теперь публикуем как Open Source-проект под названием glaball.

Читать далее
Всего голосов 43: ↑42 и ↓1 +41
Просмотры 2K
Комментарии 5

Воспроизводимость ML экспериментов с помощью MLflow project

Блог компании Digital Design Open source *Python *Машинное обучение *
Tutorial

Всем привет! Меня зовут Игорь Дергунов и я руководитель инновационной лаборатории Digital Design, которая занимается оптимизацией бизнес-процессов с помощью методов машинного обучения. В процессе работы над проектами в данной сфере быстро приходит осознание необходимости учета и структурирования проводимых экспериментов. В нашем случае мы воспользовались инструментом MLflow, который предоставляет функциональность для отслеживания экспериментов и управления жизненным циклом моделей машинного обучения.

И все шло хорошо, результаты проверки гипотез (параметры обучения, метрики, артефакты и модели) сохранялись, их было удобно наглядно сравнивать, и все были довольны. Так продолжалось достаточно долгое время, пока не возникла необходимость вернуться к эксперименту, который выполнялся какое-то время назад и был приостановлен.

Читать далее
Всего голосов 1: ↑1 и ↓0 +1
Просмотры 1.2K
Комментарии 0

Специальный календарь на 13 месяцев

Open source *Занимательные задачки

Календари это давнее моё увлечение.

Тысячелетиями люди пользуются календарями. В разные времена и у разных народов календари были разными.

Календари обычно требовались для планирования сельхоз работ и проведения религиозных обрядов.

Календари основывались на каких-то природных периодических процессах. Лунный календарь имел в основе изменение вида Луны на небосводе. Солнечный календарь опирался на период обращения Земли вокруг Солнца – год. Год делили на промежутки в виде периода от новолуния до новолуния – месяц. Месяц делили на недели, а недели на дни. Получался лунно-солнечный календарь.

У шумеров недели не было. Месяц делили на дни.

У Майя в неделе было в одном календаре 13 дней, а месяцев в году восемнадцать. Это бытовой календарь. Был у Майя также религиозный календарь содержавший 260 дней, 20 месяцев и 13 дневных недель содержащих по 13 дней.

Не буду утомлять примерами календарей прошлого.

Постепенно официальным календарём в мире стал григорианский календарь, который всем хорошо известен. В этом календаре 365 – 366 дней, 12 месяцев, семидневная неделя. В России остался в употреблении и юлианский календарь (старый стиль), который применяется в церкви.

Календари создавались каменными, бумажными, механическими. Один из старейших механических календарей известен как антикитерский механизм.

Создавались «вечные» календари, представляющие собой бумажную таблицу, по которой можно было отслеживать даты в интервале 100 лет.

В наше время компьютерная техника позволяет создавать цифровые календари.

Читать далее
Всего голосов 15: ↑12 и ↓3 +9
Просмотры 3.3K
Комментарии 28

Как мы пытались подружить VictoriaMetrics и Thanos (и у нас почти получилось)

Блог компании Сравни Open source *IT-инфраструктура *DevOps *

Привет! Меня зовут Григорий, я техлид в Cloud Infrastructure Team в Сравни. Моя команда отвечает за observability системы и облачную инфраструктуру. Не так давно мы полностью обновили наш стек мониторинга. Хочу рассказать, как у нас организовано хранение long-term метрик без использования Object Storage.

Мы в Сравни долгое время использовали связку Prometheus + Thanos для мониторинга и хранения данных. Для Thanos мы использовали схему с sidecar’ом. Эта схема работала довольно неплохо, но с ростом проекта — росло и потребление ресурсов. Со временем задачи по scrape samples уже потребляли значительные ресурсы. Когда только на Prometheus стало уходить больше 30 ядер vCPU и 100 гигабайт RAM, мы начали искать способы оптимизации потребления ресурсов. 

Первым делом определили требования, которые необходимы для системы мониторинга:
- должно поддерживаться развертывание в Kubernetes;
- система должна быть способна переезжать из одного Kubernetes-кластера в другой без потери данных;
- нужна поддержка downsampling;
- возможность построить high availability систему;
- в идеале, чтобы система требовала очень мало внимания на обслуживание ;)

Мы поизучали варианты, и сперва показалось, что будет хорошей идеей взять стек VMAgent + Thanos receiver. Как несложно угадать из названия статьи, этого у нас не получилось. Недавно я увидел в одном профессиональном чате, что коллеги захотели использовать такой же стек и по тем же причинам, что и мы. Поэтому решил поделиться нашим опытом и рассказать, к чему мы в итоге пришли.

Читать далее
Всего голосов 5: ↑5 и ↓0 +5
Просмотры 1.4K
Комментарии 2

Яндекс выложил YaLM 100B — сейчас это крупнейшая GPT-подобная нейросеть в свободном доступе. Вот как удалось её обучить

Блог компании Яндекс Open source *Алгоритмы *Машинное обучение *Natural Language Processing *

Больше примеров — в конце поста

В последние годы большие языковые модели на архитектуре трансформеров стали вершиной развития нейросетей в задачах NLP. С каждым месяцем они становятся всё больше и сложнее. Чтобы обучить подобные модели, уже сейчас требуются миллионы долларов, лучшие специалисты и годы разработки. В результате доступ к современным технологиям остался лишь у крупнейших IT-компаний. При этом у исследователей и разработчиков со всего мира есть потребность в доступе к таким решениям. Без новых исследований развитие технологий неизбежно снизит темпы. Единственный способ избежать этого — делиться с сообществом своими наработками.

Год назад мы впервые рассказали Хабру о семействе языковых моделей YaLM и их применении в Алисе и Поиске. Сегодня мы выложили в свободный доступ нашу самую большую модель YaLM на 100 млрд параметров. Она обучалась 65 дней на 1,7 ТБ текстов из интернета, книг и множества других источников с помощью 800 видеокарт A100. Модель и дополнительные материалы опубликованы на Гитхабе под лицензией Apache 2.0, которая допускает применение как в исследовательских, так и в коммерческих проектах. Сейчас это самая большая в мире GPT-подобная нейросеть в свободном доступе как для английского, так и для русского языков.

В этой статье мы поделимся не только моделью, но и нашим опытом её обучения. Может показаться, что если у вас уже есть суперкомпьютер, то с обучением больших моделей никаких проблем не возникнет. К сожалению, это заблуждение. Под катом мы расскажем о том, как смогли обучить языковую модель такого размера. Вы узнаете, как удалось добиться стабильности обучения и при этом ускорить его в два раза. Кстати, многое из того, что будет описано ниже, может быть полезно при обучении нейросетей любого размера.
Читать дальше →
Всего голосов 164: ↑163 и ↓1 +162
Просмотры 66K
Комментарии 134

Пробуем Chaos Mesh, или Гармония хаоса и есть порядок

Блог компании Флант Open source *Системное администрирование *DevOps *Kubernetes *

В продолжение наших статей про Chaos Engineering расскажу про недавний опыт проверки на прочность приложений в кластере Kubernetes с помощью Open Source-оператора Chaos Mesh.

Читать далее
Всего голосов 30: ↑28 и ↓2 +26
Просмотры 1.9K
Комментарии 2

Со скрипта на «верфь»

Open source *IT-инфраструктура *Системы сборки *DevOps *Kubernetes *

Использование того или иного продукта в проекте - это всегда попытка найти лучшее решение, балансируя между ограниченным бюджетом, возможностями роста практически по любому сценарию и высотой "порога входа". Существует много продуктов, которые связаны с контейнерами, что выбрать подходящий инструмент становится всё сложнее и сложенее, а community с "промытыми мозгами" и мышлением "ёжиков жрущих кактус" только добавляет сложности (хотя в противовес оным есть хейтеры, которые наоборот обгадят решение, просто потому что в своё время оно им не подошло).

В целом, чтобы выбрать нужное решение чаще всего приходится поднять лабу, которая покроет 90% задач, чтобы понять насколько решение подходящее, а это значит пройти какую-то боль, потратить время и деньги. Но ещё помогают статьи, в которых рассматриваются частные случаи внедрения и подбор инструментов, чтобы научиться на чужих ошибках через объективный взгляд со стороны. Надеюсь, эта статья о том, почему и как мы пришли к решению с werf, поможет кому-то подобрать инструмент для своих нужд.

Читать далее
Всего голосов 29: ↑27 и ↓2 +25
Просмотры 3.6K
Комментарии 0

Go, Allure и HTTP, или Как мило тестировать HTTP-сервисы на Go

Блог компании Ozon Tech Open source *Программирование *Go *Тестирование веб-сервисов *

Привет! Меня зовут Сергей, я старший разработчик в Ozon и раньше вообще не был замечен в QA.

Все мы привыкли к лёгкому написанию тестов на Python и Java — это основные языки автотестировщиков с богатым инструментарием утилит и всего, что упрощает жизнь. Что нужно для написания автотестов для HTTP-сервиса на Python или Java? Гугл, бутылочка крафта и два часа времени. 

А как быть в случае с Go? Как раз на нём мы в большинстве случаев пишем микросервисы. И если тесты написаны на другом языке, разработчики не могут внести в них свой вклад или отревьюить их. Поэтому внутри Ozon активно развивается Go-сообщество QA, и этим ребятам тоже нужно тестировать HTTP-сервисы и проверять отчёты в Allure. Как настоящие сварщики мы подумали: «Если чего-то не хватает, нужно написать своё». Сказано — сделано: встречайте опенсорс-библиотеку CUTE в BDD-стиле, которая облегчает тяготы создания автотестов и упрощает переход на Go. Главные фичи: создание HTTP-тестов, возможность реализовывать проверки из коробки, Allure-отчёты и низкий порог входа. Инструкция — под катом.

Читать далее
Всего голосов 36: ↑34 и ↓2 +32
Просмотры 6.1K
Комментарии 4

13 лучших игр с открытым кодом на Gamedev.js Jam 2022

Блог компании SkillFactory Разработка веб-сайтов *Open source *Разработка игр *Игры и игровые консоли
Перевод

В 2022 году в сообществе Gamedev.js прозвучал призыв делиться исходниками игр на GitHub. Подборку игр с открытым кодом представляем к старту курса по Fullstack-разработке на Python. Автор этого материала — основатель Enclave Games и конкурса js13kGames.

Читать далее
Всего голосов 4: ↑2 и ↓2 0
Просмотры 3.5K
Комментарии 1

Про настройку гиперпараметров ансамблей моделей машинного обучения

Open source *Python *Алгоритмы *Машинное обучение *Искусственный интеллект

Привет Хабр!

Под катом хочется затронуть тему настройки гиперпараметров в моделях машинного обучения, получаемых при помощи блендинга. В таких ансамблях предсказания из одной модели машинного обучения становятся предикторами для другой (следующего уровня). На рисунке ниже представлены некоторые варианты ансамблей, где данные передаются слева направо. Называть такие ансамбли мы будем в рамках поста также пайплайнами или композитными моделями (композитные пайплайны). 

А мемы про гиперпараметры?
Всего голосов 4: ↑4 и ↓0 +4
Просмотры 1.1K
Комментарии 0

Дерево комиксов на D3.js из API Marvel

Open source *JavaScript *API *Визуализация данных *Инфографика

Интерактивное дерево комиксов с связями и обложками, написанное на d3.js 6.
Данные берутся динамически по API Marvel.

Как я это сделал?
Всего голосов 8: ↑8 и ↓0 +8
Просмотры 2.5K
Комментарии 0

Ретро про участие в Tinkoff Invest Robot Contest

Open source *JavaScript *Программирование *Node.JS *Финансы в IT
Из песочницы

История про конкурс разработки торговых роботов, ожидания и реальность участников, про важность фидбека и даже тема психологии по касательной прошла. Завариваем чаек, усаживаемся и обо всем по порядку.

Читать далее
Всего голосов 8: ↑7 и ↓1 +6
Просмотры 1.3K
Комментарии 9

Вклад авторов