Администрирование

Статьи Посты Новости Хабы Авторы Компании

sensei_developer 1 час назад

Быстрый старт: Docker + SMTP + Java/Go

Простой

3 мин

400

Java*Go*DevOps*

Туториал

Не так давно у меня появилась необходимость на нескольких проектах сделать регистрацию с подтверждением email, так же хотелось минимизировать затраты и исключить лишние телодвижения, так сказать методом ctrl+c ctrl+v, без танцев с бубном. Так же нам не нужно принимать почту и прочее, просто отправка, не более

P.s. Для прожженных отцов разработки ничего нового тут не будет

Итак, поехали ;-)

-2

AstraLinux_Group 2 часа назад

Разработка через Termidesk: утопия или рабочая реальность разработчика

Простой

6 мин

388

Блог компании Группа АстраНастройка Linux*Системное администрирование*IT-инфраструктура*Софт

Кейс

Для того чтобы лучше понимать продукт, нужно его использовать. Звучит вполне логично. Но бывают ситуации, когда продукт, который вы разрабатываете, определяет ваше взаимодействие с инструментами для разработки. То есть он буквально доставляет ваше рабочее место с удаленной машины на локальный компьютер.

Может ли формат доставки рабочих мест в виде Termidesk VDI быть рабочим решением для разработки? В статье будем разбираться, утопия это или вполне себе приятная реальность.

Falcon_eye 4 часа назад

Как установить Apache Spark за 10 минут

Средний

2 мин

385

Big Data*Data Engineering*

Туториал

Установка Apache Spark займет немного времени и позволит изучить этот инструмент еще глубже прямо на своем компьютере!

-2

PaskalEnotov 4 часа назад

Авито мертв для бизнеса в 2024?

12 мин

1.7K

Блог компании МойСкладУправление e-commerce*Управление продажами*Бизнес-модели*Облачные сервисы*

Авито — самая большая доска объявлений в мире. Кто-то продает здесь старый холодильник, кто-то ищет квартиру в Минводах, а кто-то строит целую бизнес-империю.

В статье расскажем, как работает Авито в 2024 году. Поговорим о том, за что на самом деле платят продавцы, какие товары сейчас хорошо продаются, и как сделать объявление, которое привлечет покупателей.

ru_vds 5 часов назад

Красота и изящество таблицы ASCII

Средний

7 мин

1.9K

Блог компании RUVDS.comПрограммирование*Хранение данных*Стандарты связи*История IT

Ретроспектива

Перевод

Если вы программист или хотя бы немного связаны с программированием¹, то без сомнения сталкивались с таблицей ASCII.

Таблица ASCII полезна. Но знали ли вы, что она ещё красива и изящна?

Сегодня даже не близкие к программированию люди могут знать об ASCII благодаря книгам и фильмам наподобие «Марсианина»²

ASCII по-прежнему с нами; даже если вы передаёте современный Unicode³, то должны знать, что самый популярный формат кодировки UTF-8 специально спроектирован как обратно совместимый с ASCII! Декодировав эту статью как ASCII, вы в целом поймёте её смысл… если закроете глаза на мусорные символы в конце предложений (прим. ред.: имеет смысл только для оригинальной статьи на английском).

Читать дальше →

+27

ph_piter 5 часов назад

Сила gRPC в облачных окружениях

7 мин

440

Блог компании Издательский дом «Питер»Мессенджеры*Облачные сервисы*Распределённые системы*

Перевод

При разработке исходно облачных (cloud-native) приложений требуется наладить гладкую и эффективную коммуникацию между различными компонентами. Для начала давайте рассмотрим весь спектр инструментов от XML до gRPC, которые обеспечивают и улучшают эти критически важные взаимодействия.

XML (часто с применением SOAP):

<order>
    <bookID>12345</bookID>
    <quantity>2</quantity>
    <user>JohnDoe</user>
</order>

Читать дальше →

cvaynex 6 часов назад

Data Science в travel-tech. Часть 1. Поиск и бронирование

Простой

9 мин

200

Блог компании Островок!Программирование*Data Engineering*

Обзор

Привет! Меня зовут Иван Елфимов, я Developer Advocate в Островке. В прошлом месяце мы опубликовали пост о том, чем занимаются ML-инженеры в Островке. В этот раз рассказываем про Machine Learning (ML) и Data Science (DS) с точки зрения продукта.

Команда Data Science появилась в Островке в 2014 году, задолго до расцвета больших языковых моделей. За это время она успела сделать десятки проектов с computer vision, NLP и сложными классическими моделями.

Ажиотаж вокруг языковых моделей заставил многих из нас забыть, что Data Science — это не только трансформеры (General Pretrained Transformers, GPT). Мы используем картинки, текстовые и табличные данные для построения моделей, которые работают в реальном времени или обрабатывают статистические данные. Они помогают нам подбирать лучшие отели для вашего следующего путешествия.

Хороший DS-продукт не заметен — он просто работает. Давайте сыграем в игру: мы показываем скриншот страницы сайта, а вы пробуете отгадать, сколько на этой странице DS-продуктов. И не забывайте, что DS-продукт — это не только нейронные сети, но и классические модели, а также различные эвристики. Надеюсь, результаты вас удивят!

CyberPaul 7 часов назад

Memex: как мы можем мыслить? Гипертекстовое устройство из 1945 года

Простой

7 мин

695

Блог компании ServerspaceСетевые технологии*Читальный залИстория IT

Ретроспектива

В прошлой статье мы рассказали о проекте гипертекстового интернета, который разработал американский исследователь Тед Нельсон еще в 60-х годах прошлого века. Однако сама идея гипертекста родилась намного раньше — ее озвучил еще в 1945 году Ванневар Буш.

Читать дальше →

+15

DKolesnikov 9 часов назад

Введение в Apache Flink: архитектура и основные концепции. Часть 1

Сложный

23 мин

615

Блог компании Холдинг Т1Apache*DevOps*

Туториал

Будучи DevOps-инженером и работая с масштабируемыми облачными решениями, мне часто приходится глубоко погружаться в механизмы работы потоковых платформ. Трудно переоценить важность подробного изучения архитектуры и оптимизации обработки данных, когда речь идёт о системах вроде Apache Flink. Эта технология стала неотъемлемой частью моего инструментария благодаря её возможностям по реализации потоковых приложений.

Мы рассмотрим ключевые аспекты функционирования Apache Flink, от распределённой обработки данных до обеспечения надёжности системы в условиях возможных сбоев. Все эти элементы лежат в основе производительности и масштабируемости приложений, работающих с потоками данных.

Ещё мы подробно рассмотрим использование Apache Flink в задачах, где требуется высокая скорость обработки и точность управления данными. Особое внимание уделим изучению архитектурных основ и методов разработки высокоэффективных потоковых систем.

Материал объёмный, и поэтому я разделил его на две части. Запаситесь чаем и печеньками =)

ru_vds 9 часов назад

Установка LLM на скромном VPS

Средний

6 мин

1.8K

Блог компании RUVDS.comХостингOpen source*Серверное администрирование*Искусственный интеллект

Туториал

«Я тебя завалю, если ещё раз упомянешь AI», — писал автор нашумевшей статьи. В самом деле, хайп вокруг ИИ всем надоел. Но мы всё-таки рискнём поговорить о том, какую LLM поставить на своём сервере и зачем.

Сразу упомянем, что на серверах RUVDS установлены видеокарты NVIDIA Quadro P4000 (на фото). Карты довольно слабенькие, так что подойдут скорее для проектов в образовательных целях и т. д. Тем более что под VPS выделяется максимум 1 ГБ видеопамяти. Но даже в таких спартанских условиях можно запустить LLM.

Кстати, о VPS с видеокартой. Несколько лет назад мы уже писали о сферах их применения и даже проводили тесты. Всё это можно найти здесь.

Читать дальше →

+23

MaxRokatansky 9 часов назад

Работа с TCP IP на IBM Mainframe

3 мин

687

Блог компании OTUSСетевые технологии*

Не так давно я проводил корпоративное обучение на тему того, как работать с мейнфреймом IBM. Хочу рассказать об этом в нескольких статьях.

TCP/IP (Transmission Control Protocol/Internet Protocol) представляет собой набор сетевых протоколов, обеспечивающих связь между компьютерами и другими устройствами в сети. Его внедрение в мейнфреймы IBM значительно расширяет возможности этих мощных систем, позволяя им эффективно взаимодействовать в современных сетевых средах, интегрироваться с разнообразными приложениями и системами, а также поддерживать высокие уровни безопасности и производительности.

В этой статье мы рассмотрим основные аспекты работы с TCP/IP на IBM Mainframe.

-1

kucev 9 часов назад

Что такое supervised fine-tuning?

7 мин

191

Data Mining*Big Data*Машинное обучение*Искусственный интеллектData Engineering*

Перевод

Supervised fine-tuning (SFT) — это методика, применяемая для адаптации предварительно обученных Large Language Model (LLM) под конкретную задачу при помощи размеченных данных.

В процессе SFT предварительно обученные LLM подвергаются fine-tuning на основе размеченного датасета при помощи методик обучения с учителем. Веса модели выравниваются на основании градиентов, полученных из функции потерь конкретной задачи, измеряющей разность между прогнозами LLM и эталонной разметкой.

Этот процесс позволяет модели обучаться паттернам и нюансам конкретной задачи, адаптируя её параметры в соответствии с распределением конкретных данных и требований задачи.

SFT, обычно выполняемый после предварительного обучения модели, применяется для того, чтобы научить модель следовать переданным пользователем инструкциям. Он более вычислительно затратен, чем fine-tuning без учителя, но и имеет больше шансов достичь повышенной точности.

Объём необходимого дообучения зависит от сложности задачи и размера датасета. В случае простого переноса стиля с использованием моделей OpenAI наподобие GPT-3.5 или GPT-4 для получения превосходных результатов обычно достаточно 30-50 высококачественных примеров.

Чтобы преобразовать базовую Large Language Model (LLM) в выполняющую инструкции LLM (например, превратить Mistral в Mistral Instruct), обычно требуется обучение на десятках тысяч примеров.

Дообучение Zephyr 7b выполнялось на 16 GPU Nvidia A100 в течение примерно четырёх часов. Это можно считать примером отправной точки для модели с 7 миллиардами параметров.

Читать дальше →

Theillear 10 часов назад

Почему иногда лучше оценить задачу в размерах майки, чем в часах

Простой

8 мин

2.1K

Блог компании SelectelIT-инфраструктура*Управление персоналом*Читальный залIT-компании

Привет! Я Игорь, фронтенд-разработчик в Selectel. Когда-то давно я был проектным менеджером в небольшой компании, где было принято работать по модели Waterfall. Все этапы разработки были определены заранее, а на каждый этап отводилось определенное время.

Задачи были оценены строго по часам, ни о каких спринтах мы не знали. Когда что-то не учитывалось — все планы и сроки срывались из-за невозможности адаптировать разработку под изменение среды. В общем, у нас были четкие временные отрезки, немного хаоса и пузырек валерьянки на столе…

Почасовая оценка задач мне всегда казалась неэффективной. Но в то время не было опыта взаимодействия с другими методологиями. Сейчас я счастлив, ведь работаю с относительной оценкой задач в Story Points. 🙂 Добро пожаловать под кат, если тоже хотите добавить в ваш рабочий процесс немного гибкости!

Читать дальше →

+28

vasiliev_a_v 11 часов назад

Как реализовать и оптимизировать UPSERT в Greenplum 6

Средний

6 мин

439

Блог компании ArenadataВысокая производительность*PostgreSQL*Распределённые системы*

Привет! Меня зовут Антон Васильев, я работаю инженером технической поддержки компании Arenadata и нередко сталкиваюсь с довольно каверзными задачами и багами. Одной из них была проблема оптимизации механизма UPSERT в Greenplum 6. В этой статье я хочу рассказать, как эта задача может быть решена.

+10

k0rsakov 13 часов назад

Кто такой Data Engineer | Дата Инженер

Простой

4 мин

Big Data*Хранение данных*Хранилища данных*Карьера в IT-индустрииData Engineering*

Туториал

В статье вы узнаете кто такой Data Engineer | Дата Инженер. Какие бывают направления и куда можно посмотреть, чтобы развиваться в дата-инженерии

-3

MoeImya 13 часов назад

Квантовый искусственный интеллект: пересечение квантовых вычислений и машинного обучения

Средний

4 мин

429

Анализ и проектирование систем*Компиляторы*Инженерные системы*

Аналитика

Recovery Mode

Квантовые вычисления и машинное обучение — две из самых передовых и захватывающих областей современной науки и технологий. Квантовые вычисления, основанные на принципах квантовой механики, обещают революционизировать подход к обработке информации, предлагая возможности, недостижимые для классических компьютеров. В то же время машинное обучение уже преобразовало многие сферы деятельности человека, от анализа данных до создания интеллектуальных систем. Пересечение этих двух областей открывает новые горизонты для инноваций и значительных прорывов.

-2

MaxRokatansky вчера в 20:05

Деплоим Grafana Dashboard через ArgoCD

5 мин

932

Блог компании OTUSПрограммирование*IT-инфраструктура*

В современном мире DevOps автоматизация и контроль версий играют ключевую роль в управлении инфраструктурой. Одной из важнейших задач является эффективное развёртывание мониторинговых решений, таких как Grafana.

В этой статье мы рассмотрим, как использовать ArgoCD для автоматизации деплоя дашбордов Grafana.

-2

dikar8 вчера в 19:42

Как визуальные головоломки помогут выявить AGI

Простой

9 мин

1.1K

Машинное обучение*Искусственный интеллектData Engineering*

Обзор

Крупные языковые модели (LLM) вошли в число самых многообещающих изобретений в области искусственного интеллекта (ИИ). Впечатляющие возможности GPT-4 заставили многих восторженно говорить о появлении сильного искусственного интеллекта (AGI). При этом GPT-4 и другие LLM пока показывают очень слабые результаты на наборе данных ARC, состоящем из визуальных головоломок. Почему тест Тьюринга - плохой инструмент для определения AGI? В чем разница между узким и общим интеллектом? Насколько люди умнее GPT-4 по результатам тестов на ARC? В статье ответы на эти и другие вопросы.

Читать

SicYar вчера в 17:14

Технологии, с которыми работает VK: Kubernetes и не только

Сложный

9 мин

2.8K

Блог компании VKDevOps*Kubernetes*

VK — одна из ведущих ИТ-корпораций России, сервисами которой пользуется около 95% аудитории Рунета. В нашем продуктовом портфеле более 200 проектов, созданием и развитием которых занимается большое количество команд. Для решения продуктовых задач мы используем широкий стек инструментов и технологий, в том числе активно работаем с Kubernetes. Причем наши подходы и паттерны к работе с K8s нередко отличаются от типовых решений.

gss7 вчера в 15:48

Совместимость серверов Тринити с платформами виртуализации: «Росплатформа»

Простой

7 мин

501

Блог компании ТринитиВиртуализация*

Не вся виртуализация одинаково полезна, поэтому мы тестируем известные на рынке и появляющиеся решения на совместимость с нашим железом, а затем рассказываем вам о результатах. В прошлой статье из серии о тестировании мы мучили систему виртуализации «Рустэк». Теперь проверили «Росплатформу» на трёх наших серверах. В статье — пошаговое развёртывание ВМ нашим инженером Эриком Игнатовым и всякие ухищрения по ломанию нормального процесса с описанием результатов тестирования.

2 3 ...

49 50

Администрирование

Быстрый старт: Docker + SMTP + Java/Go

Новости

Разработка через Termidesk: утопия или рабочая реальность разработчика

Как установить Apache Spark за 10 минут

Авито мертв для бизнеса в 2024?

Истории

Красота и изящество таблицы ASCII

Сила gRPC в облачных окружениях

XML (часто с применением SOAP):

Data Science в travel-tech. Часть 1. Поиск и бронирование

Memex: как мы можем мыслить? Гипертекстовое устройство из 1945 года

Введение в Apache Flink: архитектура и основные концепции. Часть 1

Установка LLM на скромном VPS

Работа с TCP IP на IBM Mainframe

Что такое supervised fine-tuning?

Почему иногда лучше оценить задачу в размерах майки, чем в часах

Ближайшие события

Как реализовать и оптимизировать UPSERT в Greenplum 6

Кто такой Data Engineer | Дата Инженер

Квантовый искусственный интеллект: пересечение квантовых вычислений и машинного обучения

Деплоим Grafana Dashboard через ArgoCD

Как визуальные головоломки помогут выявить AGI

Технологии, с которыми работает VK: Kubernetes и не только

Совместимость серверов Тринити с платформами виртуализации: «Росплатформа»

Хабы

Вклад авторов