Яндекс, Москва - Как мы делаем Яндекс / Статьи / Хабр

Как стать автором

Профиль Статьи 1.9KПосты 13Новости 41Подписчики 210K

NatalieVT 5 июл в 10:00

Как в Яндекс Еде помогли курьерам, или Рассказ о маленьком стартапе в большой компании. Доклад Яндекса

6 мин

2.1K

Блог компании ЯндексАнализ и проектирование систем*Управление e-commerce*Распределённые системы*

Денис Терехов, тимлид в Яндекс Еде, рассказал на митапе для разработчиков в Новосибирске о том, как его команда помогла курьерам быстрее доставлять заказы.

В 2024 году начал ощущаться дефицит курьеров, особенно зимой. Чтобы сервис работал как обычно, нужно было привлечь новых или повысить эффективность уже существующих — то есть сделать так, чтобы они могли доставлять больше заказов за меньшее время. Так команда Дениса решила дать курьерам велосипеды, и вот что из этого вышло.

Читать далее

+5

20 ноя 2023 в 10:02

Что ты такое, dhclient?

19 мин

43K

Кейс

Лучший Техноавтор 2023

+221

27 сен 2023 в 10:00

Хороший ретрай, плохой ретрай, или История одного падения

Средний

17 мин

41K

+152

14 мар в 10:00

Как работает кнопка Mute на Яндекс Станции. Подробный разбор логики и схем

Средний

7 мин

41K

+108

Limows 27 июн в 10:00

Atari: от рассвета аркад до заката легенды

Простой

18 мин

3.5K

Блог компании ЯндексРазработка игр*История ITСтарое железоИгры и игровые консоли

Ретроспектива

Американская компания Atari внесла огромный вклад в историю аркадных игровых автоматов, игровых консолей, домашних персональных компьютеров и самих игр. Такие игры, как Pong, Asteroids, Breakout и Missile Command, стали легендами и до сих пор любимы миллионами людей во всём мире. И мы, в преддверии очередного дня рождения компании, хотим вспомнить сами и напомнить вам основные вехи её развития.

До наших музейных полок добрались некоторые игры и устройства, которые создавались в компании в разные годы. И в любой день вы можете прийти и познакомиться с ними в Яндекс Музеях Москвы и Санкт-Петербурга. Надеемся, что после прочтения у вас действительно появится желание прикоснуться к этой очень важной части истории игропрома, — даже для тех, кто уже знаком с темой, найдутся новые интересные факты.

Читать далее

+30

VladimirVerstov 21 июн в 10:05

Как эволюционировала платформа управления данными в Яндекс Go. Доклад Яндекса

10 мин

3K

Блог компании ЯндексАнализ и проектирование систем*Администрирование баз данных*Хранилища данных*

С 2017 года мы строим и постоянно адаптируем к меняющимся требованиям и внешним факторам платформу управления данными. Для нас это инфраструктура, которая живёт и переиспользуется внутри разных сервисов, которые входят в Яндекс Go: Такси, Еда, Лавка и Доставка.

Сначала мы обсудим скоуп того, что мы считаем платформой и чем занимаемся. Дальше расскажу про архитектуру YTsaurus (YT), предназначенную для обработки и хранения данных, и как она развивалась на стороне Яндекс Go. Про YT я буду рассказывать с точки зрения того, какие возможности он даёт разработчикам хранилища и платформы, аналитикам и другим пользователям, которые активно работают с данными.

Читать далее

+13

xitren 18 июн в 10:00

Test Driven Development в Embedded, или Как увеличить производительность команды на 37%

Средний

10 мин

2.7K

Блог компании ЯндексУправление разработкой*Разработка робототехники*Управление проектами*Agile*

Современное развитие в области встроенной разработки и электроники с учётом бизнес-процессов ускоряется, часто следуя принципам Agile и Scrum. Применение этих методик требует осторожности из-за длительного производственного цикла встроенной разработки, который затрудняет быстрые изменения.

Меня зовут Арсентий Гусев, я руководитель группы embedded-разработки в отделе робототехники Яндекс Маркета. И мне бы хотелось рассказать об опыте, который приобрела наша команда в рамках работы над проектом складского робота. В этой статье определим критерии, предпосылки и предложим инструменты для ускорения разработки и снижения её стоимости.

Читать далее

+19

MichaelEk 11 июн в 12:00

Яндекс разработал и выложил в опенсорс YaFSDP — инструмент для ускорения обучения LLM и сокращения расходов на GPU

12 мин

17K

Блог компании ЯндексOpen source*Алгоритмы*Машинное обучение*Natural Language Processing*

Сегодня мы выкладываем в опенсорс наш новый инструмент — алгоритм YaFSDP, который помогает существенно ускорить процесс обучения больших языковых моделей.

В этой статье мы расскажем о том, как можно организовать обучение больших языковых моделей на кластере и какие проблемы при этом возникают. Рассмотрим альтернативные методы ZeRo и FSDP, которые помогают организовать этот процесс. И объясним, чем YaFSDP отличается от них.

Читать далее

+111

margasova09 10 июн в 12:00

Гайд по ICLR 2024: тренды и лучшие доклады

Средний

15 мин

2.6K

Блог компании ЯндексМашинное обучение*КонференцииИскусственный интеллектNatural Language Processing*

Обзор

Привет! Меня зовут Света Маргасова, и я руковожу бригадой моделей с внешней информацией в Яндексе. В этом году в большой компании коллег впервые побывала на конференции ICLR (Learning Representations (ICLR) — обучение представлений), которая проходила в Вене. Масштаб и формат ICLR 2024 подтверждаюет её статус — A*. Конференция продолжалась 5 дней, на неё подали больше 7000 статей, 2260 из которых приняли. Участников тоже было очень много — все старались успеть познакомиться с авторами на постер-сессиях, послушать доклады и попасть на воркшопы.

В этой статье я расскажу о самом интересном по моему мнению и по отзывам коллег — над постом также работали Илья Удалов и Максим Кузин, которые занимаются ML в рекламе. Здесь же вы найдёте нашу коллективную подборку полезных статей.

Читать далее

+21

eucariot 6 июн в 10:30

TACACS in da Сloud

Сложный

25 мин

6.9K

Блог компании ЯндексБлог компании Yandex Cloud & Yandex InfrastructureИнформационная безопасность*Серверное администрирование*Сетевое оборудование

Вот есть у вас сотня коммутаторов или маршрутизаторов. Это много или мало?

Ну вроде как мало. А если надо на всех разом нового сотрудника добавить? А потом удалить уволившегося? А потом поротировать скомпрометированные пароли и ключи?

И тут приходит служба безопасности, которая, во-первых, хочет централизованно контролировать, у кого какие доступы, во-вторых, актуальны ли они на железках, в-третьих, ещё и смотреть, кто что когда запускал, да ещё и разрешать или запрещать это делать («Просто продолжай, не останавливайся» © СИБ).

Ну вот совсем уже и не мало. Чувствуете, чем это пахнет? Даааа, TACACS-ом.

Сегодня мы разберём, как сделать аутентификацию и авторизацию на сетевом оборудовании на основе TACACS, сделать работу сервиса отказоустойчивой, обеспечить себе запасной ход на случай глобальных проблем и осчастливить безопасников.

Читать далее

+55

alekseimorozov743 5 июн в 11:00

Как мы строили BDUI: опыт Яндекс Маркета

11 мин

3.4K

Блог компании ЯндексРазработка под iOS*Разработка мобильных приложений*Интерфейсы*Разработка под Android*

Привет! Меня зовут Алексей Морозов. Я уже несколько лет работаю в инфраструктурной команде Яндекс Маркета. Наша команда делает проекты, которые должны были улучшить скорость приложения, его качество и скорость разработки. Однако раньше такие проекты решали эти проблемы только на время, приложение снова деградировало. Всё это напоминает древнегреческий миф, в котором Сизиф толкает в гору камень, он скатывается вниз, и всё начинается по новой.

Такое положение дел нас не устраивало, поэтому было принято решение изменить подход. И мы построили BDUI (Backend Driven UI). В этой статье я расскажу о том, как это случилось, что сделали и какой в итоге получили результат.

Читать далее

+14

cydoroga 28 мая в 12:00

Как мы готовим RL для Alignment в больших языковых моделях: опыт команды YandexGPT

28 мин

11K

Блог компании ЯндексАлгоритмы*Машинное обучение*Искусственный интеллектNatural Language Processing*

Сегодня через API стала доступна новая модель YandexGPT 3 Lite. Одним из ключевых этапов её обучения, как и в случае с другими недавними моделями, стал этап выравнивания (Alignment), включающий в том числе стадию обучения с подкреплением (RL). Пожалуй, без этого этапа мы бы не смогли добиться такого роста в качестве, который был необходим для запуска новых возможностей и сервисов (например, Нейро). Поэтому эту статью мы полностью посвятим особенностям выравнивания моделей.

На тему Alignment и RL было написано уже немало статей. Кажется, любой ML-инженер уже, так или иначе, сталкивался или читал о них. Поэтому мы хоть и напомним базовую информацию, но всё же сфокусируемся на тех деталях реализации, которые не на слуху.

Читать далее

+60

NatalieVT 24 мая в 10:18

Как устроен рекомендательный сервис, который выдерживает 700 тысяч запросов в секунду. Доклад Яндекса

11 мин

13K

Блог компании ЯндексВысокая производительность*Анализ и проектирование систем*Машинное обучение*

«Баннерная крутилка» — один из самых высоконагруженных сервисов в Яндексе. Он умеет переживать 700 тысяч RPS, а иногда и больше. Каждый раз, когда приходит запрос, крутилка должна просмотреть базу из миллиарда документов и выбрать из них самые релевантные для пользователя. При этом выдерживаются весьма жесткие временные рамки: 99% всех запросов обрабатываются менее чем за 200 миллисекунд.

Какими принципами стоит руководствоваться при построении подобных высоконагруженных систем? Как устроены стадии отбора документов? Какое участие в ранжировании принимает ML? Обо всём этом на недавнем мероприятии для разработчиков в Ереване рассказал Артём Ваншулин, руководитель разработки ранжирования в команде баннерной системы. Сегодня мы делимся с сообществом текстовой версией его доклада. Передаём ему слово.

Читать далее

+35

antoshkka 16 мая в 11:02

userver 2.0 — большой релиз фреймворка для IO-bound программ

6 мин

7.1K

Блог компании ЯндексВысокая производительность*Open source*C++*Микросервисы*

С момента прошлого релиза фреймворка 🐙 userver для С++ прошло чуть больше полугода. За это время мы многое сделали:

сильно оптимизировали работу фреймворка и обогнали основных конкурентов в бенчмарках высокопроизводительных фреймворков;
значительно упростили конфигурирование;
обзавелись install, докер-образами, Yandex Cloud-образом и DEB-пакетами;
обросли новой функциональностью, включая серверные мидлвари для HTTP, и YDB-драйвером;
перешли на новую ежемесячную схему релизов и упростили версионирование.

Добро пожаловать под кат за подробностями

+57

mana-y 15 мая в 15:26

DivKit теперь и для Flutter. Рассказываем об особенностях BDUI-фреймворка Яндекса

Средний

14 мин

6.6K

Блог компании ЯндексOpen source*Разработка мобильных приложений*Интерфейсы*Flutter*

Обзор

Полтора года назад мы выпустили в опенсорс DivKit — фреймворк для отрисовки интерфейсов из ответа сервера. На тот момент он уже прошёл проверку временем внутри компании и применялся в приложении Яндекс, Алисе, Маркете, Едадиле и других сервисах. С тех пор инструмент прошёл длинный путь. И сегодня у нас по-настоящему важная новость: мы выпускаем в свободный доступ долгожданный клиент для Flutter.

В статье расскажем об особенностях вёрстки в DivKit и нашей реализации UI. Вы узнаете, какие фичи и компоненты Flutter поддерживаются во фреймворке на текущий момент. Покажем, как начать пользоваться клиентом уже сейчас.

Читать далее

+29

YandexCloudEditor 8 мая в 10:00

Удалённое исполнение кода в ML: подходы и инструменты. Доклад Яндекса

9 мин

2.1K

Блог компании ЯндексБлог компании Yandex Cloud & Yandex InfrastructureOpen source*IT-инфраструктура*Машинное обучение*

Всем привет. На связи Артём Гойлик @ArtoLord и Владислав Волох @Chillintano из команды DataSphere в Yandex Cloud. Мы создаём инфраструктуру для ML-разработчиков. И сегодня расскажем про одну задачу, которая, как и многие другие, начиналась с болей наших пользователей.

Читать далее

+13

bobermaniac 27 апр в 12:45

«Когда будет готово?». Декомпозируем задачи и оцениваем сроки без фатальных ошибок

Средний

11 мин

14K

Блог компании ЯндексБлог компании Яндекс 360Управление разработкой*Управление проектами*

Мнение

Всем привет! Я Виктор Брыксин, руковожу разработкой Яндекс Телемоста. В статье поговорим про декомпозицию задач в проекте и как можно получить реальные сроки его выполнения.

Спойлер: вы все равно ошибетесь, прогнозируя сроки. Но что можно сделать? Минимизировать шанс на ошибки и сделать их менее фатальными. Я расскажу про рабочие инструменты, которые помогли мне в свое время, — брать их на вооружение или нет, решайте сами. Если вы не знаете, как подступиться к декомпозиции сложного проекта и с чего начать, — эта статья вам в помощь.

Читать далее

+41

aozeritsky 24 апр в 10:00

Эволюция обработки данных: от MapReduce к стриминговому движку

7 мин

6.8K

Блог компании ЯндексБлог компании Yandex Cloud & Yandex InfrastructureSQL*Администрирование баз данных*Хранение данных*

Кейс

Yandex Query Language (YQL) — универсальный декларативный язык запросов к системам хранения и обработки данных, разработанный в Яндексе. А ещё это один из самых нагруженных сервисов: YQL ежедневно обрабатывает около 800 петабайт данных и 600 000 SQL-запросов, и эти показатели постоянно растут.

Изначально YQL основывался на операциях MapReduce, которые эффективны для больших данных. Но для средних объёмов данных (до 50 Гб, которые составляют около 60% запросов) этот подход оказался неоптимальным, потому что нужно было обмениваться данными между операциями через диск. Поэтому разработчики создали новый более гибкий стриминговый движок, который значительно ускоряет обработку данных за счёт выполнения всех вычислений в памяти.

В этой статье я хочу рассказать о подходах и технологиях в разработке систем для обработки данных на примере YQL. Основное внимание я уделил переходу от MapReduce к стриминговому движку, который обеспечивает более эффективную обработку данных, вмещающихся в память, и который доступен в опенсорсе.

Читать далее

+39

Strannii 23 апр в 10:02

Домик Алисы, светлячки и огурчики. Какие пасхалки есть в Яндекс Станциях

Простой

5 мин

24K

Блог компании ЯндексСхемотехника*Производство и разработка электроники*ГаджетыКомпьютерное железо

Привет! Это Алексей Фоменко, инженер-электронщик Алисы и умных устройств. Я руковожу группой аппаратной разработки, но время от времени делаю платы и своими руками.

Наши инженеры с огромным трепетом относятся к каждой плате, которую они создают, уделяя внимание мельчайшим деталям. Можно сказать, вкладывают в каждую Станцию частичку себя. Проведя с проектом платы огромное количество часов, хочется оставить какое-то невинное и милое послание прямо от создателя к самому искушённому пользователю. Такие послания ещё называют «пасхалками». И да, они есть и в наших Станциях. Покажу несколько под катом.

Читать далее

+92

aldrchist 19 апр в 11:01

Как мы тестируем беспилотные автомобили с помощью симуляций

Простой

12 мин

4.8K

Блог компании ЯндексБлог компании Конференции Олега Бунина (Онтико)Машинное обучение*Искусственный интеллектТранспорт

Всем привет! Это Александр Чистяков из команды беспилотных автомобилей Яндекса. Мой доклад посвящён симуляторам: что это, зачем, как это устроено изнутри и какие в симуляции есть подводные камни, неожиданные парадоксы. Также расскажу, с помощью каких алгоритмических или архитектурных решений мы со всеми этими парадоксами боремся.

Читать далее

+27

zergood 18 апр в 13:00

Как найти баланс между интересами покупателей и продавцов: опыт разработчиков Яндекс Маркета

7 мин

2.4K

Блог компании ЯндексАлгоритмы*Машинное обучение*Интернет-маркетинг*Контекстная реклама*

Привет, Хабр! Меня зовут Илья Ненахов, я руковожу разработкой платформы для продвижения товаров на Яндекс Маркете. Предлагаю взглянуть на площадку немного с другой стороны, а именно — как на механизм, который пытается найти оптимальную точку в пространстве с тремя измерениями: интересы пользователя, интересы магазинов и интересы самого сервиса.

В этой статье я расскажу о том, как мы поддерживаем этот баланс с помощью технологий Яндекса. Поговорим про метрики, ранжирование и устройство рантайма. Наш опыт может быть полезен тем разработчикам, которые работают над похожими задачами в других компаниях.

Читать далее

+16

sipayrt 18 апр в 10:00

Testplane в опенсорсе: автоматизируем пользовательские сценарии в веб-интерфейсах

5 мин

5.6K

Блог компании ЯндексВеб-разработка*Open source*Интерфейсы*Тестирование веб-сервисов*

Привет! Меня зовут Евгений Константинов. Я занимаюсь разработкой инструментов автоматического тестирования в Яндексе. В этой статье хочу рассказать про историю создания инструмента Testplane

Testplane поможет вам:

- протестировать разные сценарии в любом браузере;

- проверить вёрстку с помощью скриншотного тестирования;

- выполнить тестирование ваших React-компонентов;

- запустить клиентские unit-тесты в контексте браузера.

Читать далее

+33

hommforever 16 апр в 13:01

Яндекс запустил Нейро. Рассказываем, как он работает

Средний

14 мин

58K

Блог компании ЯндексПоисковые технологии*Алгоритмы*Машинное обучение*Искусственный интеллект

Сегодня мы запустили новый сервис Нейро — новый способ поиска ответов на вопросы. Пользователь может задать Нейро любой вопрос, а тот сам подберёт подходящие материалы в Поиске, проанализирует их и соберёт найденную информацию в одном ответе, подкрепив его ссылками на источники. Нейро объединил опыт Яндекса в создании поисковых технологий и больших языковых моделей.

Меня зовут Андрей Сюткин, и я отвечаю за ML-трек в Нейро. В этой статье покажу, как выглядит архитектура Нейро и как формируются ответы на технологическом уровне. Ну и, конечно же, поговорим о нейросетях, в том числе о YandexGPT 3, без обучения которых новый сервис просто не увидел бы свет.

Читать далее

+91

1

2 3 ...