Как стать автором
Обновить
Сначала показывать
  • Новые
  • Лучшие

Как мы фронтиры науки с помощью тематического моделирования искали

Блог компании Сбер Машинное обучение *Искусственный интеллект Natural Language Processing *

Некоторое время назад перед нашей NLP-командой была поставлена необычная задача: построения системы определения фронтиров науки. Некоторые из нас до постановки задачи ни разу даже не слышали слово «фронтир», и мы начали с того, что стали разбираться, что оно значит. Буквальное историческое определение слова frontier – это граница между освоенными и неосвоенными поселенцами свободными землями на Диком Западе. Естественно, от этого буквального определения нам была интересна только часть про границу между освоенным и неосвоенным, она же «передний край науки». Получается, перед нами была поставлена задача автоматически определить, где проходит этот передний край.
Читать дальше →
Всего голосов 6: ↑5 и ↓1 +4
Просмотры 937
Комментарии 0

Спутниковый функционал нового iPhone: прогноз

Блог компании Сбер Исследования и прогнозы в IT Смартфоны

Д.Б. Пайсон, Ю.И. Дюгованец, С.А. Гавриш, Управление исследований и инноваций Сбера

Дисклеймер: изложенное является аналитическим материалом, подготовленным группой сотрудников Управления исследований и инноваций на основании информации, имеющейся в открытом доступе. Выводы авторов не являются официальным прогнозом ПАО Сбербанк.

В преддверии презентации нового iPhone (запланирована на 14 сентября 2021 г., 20:00 МСК; ссылка на трансляцию) в сеть просочились слухи о введении в функционал смартфона спутниковой связи. Хотя Apple не представила спутникового функционала в презентации своих новых продуктов 14 сентября, наши оценки технических возможностей и потенциала подобных решений остаются в силе, вопрос в том, посчитает ли компания целесообразным внедрить что-то подобное в одной из следующих версий iPhone.

Читать далее
Всего голосов 6: ↑6 и ↓0 +6
Просмотры 3.8K
Комментарии 8
Что, если бы мысли могли унести нас к звездам? Мы со Сбером подготовили тест специально ко Дню разработчика и Дню тестировщика. В нашей альтернативной реальности человечество ищет новые планеты для освоения, а топливо для кораблей — это продукт интеллектуальной деятельности. Чтобы топлива для исследований хватило, реши несколько задач под катом. Каждый правильный ответ даёт + 1 литр топлива. В космос отправляются две команды: конструкторов (или разработчиков) и испытателей (то есть тестировщиков). Выбирай свою — и отправляйся на поиск новых планет. Итак, миссия начинается. Но сперва определимся: за кого играем?
Полетели!
Всего голосов 21: ↑21 и ↓0 +21
Просмотры 17K
Комментарии 6

Нет, это не скучно! Или 5 мифов о работе тестировщика

Блог компании Сбер Тестирование IT-систем *Тестирование веб-сервисов *Тестирование мобильных приложений *Тестирование игр *
Recovery mode

Для тех, кто хочет войти в профессию

В 1947-м 9 сентября зарегистрировали первый баг в истории IT. Это было забавно: Гарвард, учёные тестируют вычислительную машину Mark II Aiken Relay Calculator и вдруг видят застрявшего между контактами электромеханического реле мотылька. «Bug» (англ. «жук»)! — сказала Грейс Хоппер, одна из первых писавшая программы для предыдущей версии гарвардской ЭВМ Mark I. Уснувшее навеки насекомое извлекли из реле и вклеили в технический дневник, сопроводив надписью: «First actual case of bug being found (первый случай в практике, когда был обнаружен жучок)». Так багами стали называть ошибки в программах, а процесс их исправления — debugging (отладка). И так 9 сентября стало Днём тестировщика.

Читать далее
Всего голосов 17: ↑14 и ↓3 +11
Просмотры 5.2K
Комментарии 23

PFM, модель Дэвида Колба и образованность взрослого населения – где взаимосвязь?

Блог компании Сбер Финансы в IT

Вот представьте: есть компания, которая накопила много ценных знаний в своей сфере. Мы про Сбер, увлекаться отвлечёнными моделями не будем. А в качестве сферы здесь рассматриваем финансовую и банковскую. 

И есть 71,9 млн трудоспособного населения в России. Ну, ещё не есть, но будет на конец 2021-го. И у большинства из этих людей знания в упомянутой сфере поверхностны. Поверхностны не потому, что людям не надо в этом разбираться. А просто – так вышло. Этому не учат.

Диссонанс. И ведь здорово бы его устранить, так? Нужно же просто взять и научить.

Отступление для тех, кому проще не верить в благие намерения банка. Сформулируем так: трудно развивать технологически-сервисную финансовую компанию в стране с низким уровнем финансовой грамотности трудоспособного населения. Отличная вышла формулировка – специально для тех, кто всё ещё видит в Сбере всё тот же СберБанк. 

Так вот. Нужно учить людей и повышать уровень финансовой грамотности. От этого растёт карма и ВВП. Но есть сложности. 

Читать далее
Всего голосов 10: ↑7 и ↓3 +4
Просмотры 2.1K
Комментарии 8

Как работает FaceSwap?

Блог компании Сбер Обработка изображений *Машинное обучение *Искусственный интеллект


Привет, Хабр!


Сегодня мы, команда Sber AI, расскажем про различные подходы к FaceSwap с помощью нейросетей. Также мы хотим разобраться, какие у разных подходов есть преимущества и недостатки? И главное — как же все это работает?

Читать дальше →
Всего голосов 10: ↑10 и ↓0 +10
Просмотры 2.3K
Комментарии 1

Видеосказки от ИИ: разбор бейзлайна трека Creative AI в рамках AIIJC

Блог компании Сбер Машинное обучение *Искусственный интеллект Natural Language Processing *

Привет, Хабр!

Сегодня мы, команда Sber AI, расскажем про бейзлайн генерации сказок с озвучкой и картинками, который мы предложили в рамках трека по Creative AI международного соревнования для школьников Artificial Intelligence International Junior Contest (AIIJC): рассмотрим аспекты обучения conditional ruGPT-3, генерацию музыки, генерацию изображения по текстовой строке, а также обсудим некоторые проблемы, с которыми пришлось столкнуться во время обучения и дообучения моделей.

В этом посте мы хотим разобрать (и разобраться сами), как можно использовать и объединять генеративные (и не только) модели для решения одной большой задачи — генерации контента. Мы подобрали большое количество материалов про каждую конкретную модель, чтобы ими можно было пользоваться сразу.

Читать далее
Всего голосов 9: ↑8 и ↓1 +7
Просмотры 1.2K
Комментарии 7

Зачем роботам делать выбор за вас

Блог компании Сбер Анализ и проектирование систем *Data Mining *Управление проектами *

Как только мы слышим про массовую персонализацию, мы сразу представляем себе тонну рекламы, которая нам не нужна. На самом деле, это история про то, как алгоритмы уронили цену для персонализации продукта. Раньше вы могли себе позволить персонального менеджера, персональные договоры и условия только для очень крупных клиентов. Сейчас это можно предложить каждому.

У вас в почте лежит бронь на отель, а в календаре деловые встречи? Вот координаты ближайших удобных мест с бизнес-ланчами, где можно провести встречи. И скидка. Железяка по нескольким метрикам вычислит деловую цель поездки и не будет предлагать вам конные прогулки вместе с билетами в кино. В идеальном варианте робот отберёт у вас выбор, но вам это понравится. Приложение вовремя подсунет кнопку для вызова такси и за день до встречи предложит услуги экспресс-глажки костюма в ближайшей химчистке. Система адаптируется к вашим паттернам и предлагает вам именно то, что лучше укладывается в ваш поведенческий профиль. Например, провести платёж по ипотеке в нужную дату с напоминанием или при снятии денег в банкомате предложить вам ровно сумму на две пинты Гиннесса, которые вы берёте в баре каждую пятницу.

Читать далее
Всего голосов 19: ↑15 и ↓4 +11
Просмотры 2.4K
Комментарии 9

Путешествие туда и обратно, или как IT Bootcamp помогает новым сотрудникам

Блог компании Сбер Карьера в IT-индустрии IT-компании

Привет! Меня зовут Олеся, я аналитик в Сбере. И я тот самый человек, который смог на своей шкуре сравнить все тонкости онбординга новых сотрудников с разницей почти в 7 лет.

Штука в том, что сначала я работала в Сбере с 2014 по 2019, соответственно, проходила онбординг для новичков в 2014. А потом в 2019 ушла из Сбера, и вернулась уже в апреле 2021.

Под катом я расскажу вам про то, как (и чему) обучали новичков в Сбере в 2014-м, и как это делают сейчас.

Читать далее
Всего голосов 5: ↑3 и ↓2 +1
Просмотры 1.9K
Комментарии 3

ruT5, ruRoBERTa, ruBERT: как мы обучили серию моделей для русского языка

Блог компании Сбер Блог компании SberDevices Машинное обучение *Искусственный интеллект Natural Language Processing *


В зоопарке русскоязычных моделей прибавление: в открытом доступе появилась модель text2text-генерации ruT5 и модели-энкодеры ruRoBERTa и ruBERT, формирующие семантическое пространство текста. Модели можно использовать для создания классификаторов текстов, кластеризации, извлечения информации, суммаризации и многих других NLP-задач.

Ещё в начале пути создания виртуальных ассистентов Салют мы, команда NLP R&D SberDevices, поняли, что нужно обучать базовые языковые модели для русского языка, ориентируясь на успешные модели для английского. Опыта в этом, надо сказать, у нас было немного. Прошло два года, и сейчас мы обучили множество моделей, которыми хотим поделиться с вами.

С нашими «гптшками» вы уже знакомы, и про них мы уже рассказывали. Сейчас мы решили расширить наш открытый зоопарк и остальными моделями. Их все легко дообучать и использовать в проме на одной GPU, в том числе в Colab. Мы надеемся, что эти модели будут полезны русскому NLP-сообществу и помогут родиться многим интересным решениям.

В этой статье мы поделимся общими характеристиками и результатами замеров моделей на разных задачах.

Все модели размещены в формате PyTorch-Transformers. Вы можете скачать их в HF transformers.

Colab с примерами.
Читать дальше →
Всего голосов 15: ↑15 и ↓0 +15
Просмотры 3.2K
Комментарии 11

Как мы переписывали сервер-сайд СберБанк Онлайн на микросервисы

Блог компании Сбер Микросервисы *
Из песочницы

Вы, наверное, в последнее время часто слышите о новых продуктах Сбера, со многими из них сталкиваетесь как клиенты.

А есть в Сбере крупные и сложные технологические проекты, которые напрямую не видны для клиентов, но от их запуска сильно зависит успех клиентских продуктов. Сложность связана с необходимостью трансформировать приложения, которые каждую секунду обеспечивают непрерывность текущего бизнеса Сбера, а масштаб обусловлен большим количеством функционала, который востребован 68 млн клиентов. В статье я расскажу об одном из таких очень больших изменений — запуске новой платформы для СберБанк Онлайн.

Читать далее
Всего голосов 17: ↑9 и ↓8 +1
Просмотры 9K
Комментарии 36

Обучение с подкреплением: как работают новые возможности библиотеки SberPM

Блог компании Сбер Анализ и проектирование систем *Data Mining *Управление проектами *

Что такое Process Mining и как его применять, мы рассказывали в первом посте. Во второй части мы представили краткое руководство пользования библиотекой для интеллектуального анализа процессов SberPM. В данной статье мы подробнее раскроем функционал библиотеки и расскажем о новом модуле оптимизации процессов и клиентских путей, использующем обучение с подкреплением для поиска оптимального пути.  

Оптимизация бизнес-процессов играет важнейшую роль в повышении операционной эффективности компании. В SberPM обучение с подкреплением используется для реконструкции процесса в соответствии с заданными критериями:

·         Отсутствие зацикленности.

·         Минимальное время выполнения этапов.

·         Минимальное число этапов.

·         Успешное завершение процесса.

Читать далее
Всего голосов 8: ↑8 и ↓0 +8
Просмотры 2.7K
Комментарии 0

Недоумение про ещё один корпоративный чат или как сделать приятно всем

Блог компании Сбер Мессенджеры *

На рынке мессенджеров сейчас есть примерно всё, как на Привозе. Есть решения на открытом коде, есть мессенджеры с миллиардом пользователей (или даже двумя). Но четкого понимания, что же взять с прилавка, чтоб все сотрудники огромного банка (и его 300+ дочек) с улыбкой открывали какой-то один и это всё проходило бы под требования по безопасности, у меня не сложилось.

Но жаловаться на несовершенство этого мира, недостижимость идеалов и тщетность бытия – бесполезно. Поэтому перейдём к требованиям. Что хочет очень большая организация?

Чтоб было безопасно. Т.е. чтоб не просто data scientist модный в шортиках из одной американской/китайской/российской компании не мог в рамках своих задач узнать что-то полезное, а даже рядовой админ банка не смог увидеть или унести переписку одного уважаемого человека с другим. Даже в качестве картинки. Даже на свой админский супер-защищённый комп. Следовательно, оно должно быть self-hosted – разворачиваемо отдельно и полностью контролируется исключительно теми, кому положено следить и зарплату за это платят. Ещё нужно подключиться к системам, отвечающим за безопасность передаваемого контента. Ещё нужно иметь в руках команды сопровождения все возможные рычаги, чтобы нерадивого пользователя можно было ограничить в желании другому пользователю передавать то, что не положено.

Чтобы было удобно. Сейчас на дворе 2021 год. Но даже закачать справочник пользователей или синтегрить с корпоративной телефонией банка что-то – это уже подвиг на грани фантастики. И удивлению моему не было предела – тот же slack обладает пользовательским интерфейсом, который физически невозможно объяснить курьеру из доставки – подавай ему пользовательский интерфейс a’la telegram. И желательно с видео конференциями встроенными. И прям очень нужен голосовой виртуальный ассистент, голосом удобнее. Ещё невозможно объяснить человеку, у которого есть одновременно два телефона, планшет и два компьютера – почему ему нужно выбрать, где же можно работать с этим мессенджером, а где – остаться без мессенджера. Ну и зачем каждый раз свой номер телефона светить – не ясно.

Читать далее
Всего голосов 13: ↑1 и ↓12 -11
Просмотры 4.1K
Комментарии 16

Как начать думать про клиента на этапе разработки, а не адаптировать продукт после

Блог компании Сбер Управление проектами *Agile *Управление продуктом *
image
На рисунке — прототип продукта для Сбербанк Онлайн.

Есть разные методики для исследования и улучшения клиентского опыта (Customer experience, CX). Сегодня расскажем про одну из них — дизайн-мышление, и поможет в этом Ирина Баженова — эксперт по исследованию клиентского опыта в Сбере.

До CX Ирина работала в розничном отделении ещё того самого Сбербанка, когда в ходу были сберкнижки, без которых не мог существовать вклад. Бумажную книжку клиент мог случайно испортить — намочить, например, тогда её нужно было менять. Она могла просто закончиться, и тогда, если вдруг кто-то помнит, ставился штампик, и владельцу нужно было от руки писать прописью сумму, на которой закончилась его книжка, чтобы перенести всё до копеечки на новую. Конечно, кто-то ошибался, пенсионерам так вообще было очень сложно писать от руки. Главный вопрос, который возник тогда у Ирины: зачем я как специалист прошу сделать это нашего клиента? Ведь ему это сложно делать. И какая от этого практическая польза? Подобных ситуаций было довольно много. Но тогда и банк был другой, и законодательство.

В 2016 году в Сбере началась Agile-трансформация. Тогда же стали активно внедрять методологию дизайн-мышления для проектирования клиентского опыта. Первые годы почти все проекты были направлены не на исследование новых продуктов, а на исправление каких-то особенностей старых. Ну, знаете, типа той, что «где карту открывали, в то отделение и идите».
Так что проверено на практике: чем раньше провести исследование и поговорить с клиентом, тем меньше затрат будет дальше на стадии разработки и запуска продукта. И, собственно, именно поэтому есть смысл встраивать процессы по изучению клиентского опыта в саму разработку. Если же задуматься о клиенте, только когда уже есть прототип, то это уже неэффективно потраченные ресурсы.
Читать дальше →
Всего голосов 10: ↑8 и ↓2 +6
Просмотры 3.5K
Комментарии 10

Новый интерфейс банкоматов Сбера

Блог компании Сбер Usability *Управление проектами *
В прошлом посте я рассказывала про дизайн новых банкоматов. Они сильно поменялись по железу, в частности, их экраны стали куда больше, а процессоры позволяют показывать больше графики и анимации — без тормозов. Вы много спрашивали про изменения интерфейсов, поэтому я хочу рассказать о работе в этом направлении.

image
Новый главный экран. Здесь отображены наиболее часто используемые суммы и операции на основе истории и привычек клиента

Прежде чем я покажу конкретные примеры, хочу, чтобы вы обратили внимание на следующее:

  1. Речь про интерфейсы новых банкоматов, которые пока что введены в Москве, Санкт-Петербурге и Хабаровске в небольшом количестве, и мы будем их вводить в эксплуатацию по всей России в этом году. Важно помнить, что в нашей сети много предыдущих моделей устройств с прежней версией интерфейса. На всех устройствах мы обновили иллюстрации и анимации в новом бренде и сделали интерфейс чище, убрав основной шум. Но полностью новый интерфейс с обновлёнными сценариями и новым дизайном выкатили только на банкоматах нового поколения.
  2. Текущий интерфейс решает главную задачу — упрощение работы с банкоматом. Это означает уменьшение количества шагов внутри операций, более короткие и понятные тексты, реалистичные анимации, привязанные к расположению оборудования в банкомате и персонализацию под частые действия конкретного пользователя.
  3. Это не адаптация текущего интерфейса: мы с нуля разработали новый, проектируя от актуальных потребностей пользователя, то есть тех, что появляются с появлением запросов со стороны клиентов.

И да, мы вынесли самые популярные услуги (снять, внести, оплатить) на экран приветствия, т. е. на тот экран, который пользователь видит в момент, когда ещё не приложил/не вставил карту. А кнопку баланса на главный экран — который появляется после авторизации человека в устройстве (приложил или вставил карту, ввёл ПИН-код).
Читать дальше →
Всего голосов 23: ↑16 и ↓7 +9
Просмотры 12K
Комментарии 84

Открываем доступ к Platform V для рынка

Блог компании Сбер Open source *Программирование *Управление разработкой *Управление проектами *
image

У нас примерно три тысячи команд разработки, поэтому, очевидно, нам нужна была платформа, которая позволит быстро выпускать новые приложения, делать изменения в существующих, а так же обеспечивать надежное и безопасное исполнение созданных приложений. Спустя несколько поколений эволюции мы собрали вообще всё, что было разработано в банке, в единую систему. Можно, условно, постучать по API для доступа к любому нужному сервису — и получить кусочек конструктора. Сейчас мы даём доступ для разработки на этой Платформе.

Platform V в первую очередь полезна для разработки энтерпрайз-хайлоада, но это не значит, что ей не могут воспользоваться независимые разработчики. Это проект национального уровня, поэтому мы рассчитываем, что поможем компаниям, которым нужно автоматизировать бизнес-процессы с нуля либо перевести свою текущую автоматизацию на современный технологический стек. Первое, с чего мы начали, — это стали вести все новые разработки с использованием новых инструментов Платформы и инициировали проекты по переводу Legacy-приложений.

image

Платформа собрана на базе готовых опенсорсных решений. Мы берём какой-то наиболее зрелый опенсорс, коммитим свои изменения или создаём собственный plugin, не забывая отдавать ключевые фиксы в комьюнити. Цель — максимально переиспользовать поддерживаемый код. Большинство доработок и форков касаются поддержки для энтерпрайз-задач — средств обеспечения надёжности, мониторинга, кибербезопасности и самое главное нагрузки.

То есть у нас есть максимально открытый комбайн, который можно использовать для разработки и который будет поддерживаться далеко не только нами.
Читать дальше →
Всего голосов 28: ↑16 и ↓12 +4
Просмотры 9.2K
Комментарии 6

ДНК (Деление на команды) – визуализация взаимосвязей людей и команд

Блог компании Сбер Алгоритмы *Управление проектами *Agile *
image
На рисунке – граф, визуализирующий межкомандное взаимодействие в Дивизионе развития и сопровождения производственного процесса (SberWorks) Сбера

Мы решили разобраться, как выглядит общение участников команд в цифровых каналах Сбера, а точнее, в трех ключевых инструментах производственного процесса:

  1. Jira – тикет-системе для управления задачами
  2. Confluence – вики-системе для управления требованиями
  3. Bitbucket – системе управления кодом

И попробовать понять по цифровым следам, как на самом деле взаимодействуют команды и люди между собой, определить соответствующие зависимости. Иными словами, увидеть настоящую структуру работы, которая отражается в инструментах производственного процесса.
Мы изучили каждый источник, определили, какие связи он иллюстрирует, как люди работают совместно, как именно они общаются и решают поставленные задачи.

Изучив связи, мы присвоили веса самому источнику данных, конкретным видам связи и на базе данных построили граф взаимодействий. При формировании графа по источникам, которые были упомянуты выше, все-таки принимается во внимание, что сотрудники обсуждают именно рабочие вопросы, а не котиков.

В итоге, получили следующую визуализацию коммуникаций:

  • Точка – это человек или команда.
  • Линия между точками – свидетельствует о наличии связи, которая является агрегатом взаимодействий, найденных в источниках данных, которые мы определили у людей. У линии связи есть свой вес, начало и конец.
Читать дальше →
Всего голосов 17: ↑15 и ↓2 +13
Просмотры 2.4K
Комментарии 4

Рассказываем про библиотеку для Process Mining: теперь SberPM в открытом доступе

Блог компании Сбер Анализ и проектирование систем *Data Mining *Управление проектами *
Process Mining – это подход к извлечению, анализу и оптимизации процессов на основе данных из так называемых журналов событий (event logs), доступных в корпоративных ИТ-системах. Являясь своеобразным мостиком между Data Mining и Process Management, он выводит исследование бизнес-процессов на принципиально новый уровень. Подробнее о том, чем полезен такой подход и как мы его применяем вот здесь .

В конце 2020 года в открытый доступ вышла разработанная Сбером python-библиотека SberPM – первая в России мультифункциональная библиотека для интеллектуального анализа процессов и клиентских путей. Ниже про то, как она устроена и как ей пользоваться.

image

Читать дальше →
Всего голосов 24: ↑24 и ↓0 +24
Просмотры 5.4K
Комментарии 10

Встречи планирования разработки в пандемию, или Как устроить электро PIP

Блог компании Сбер Управление проектами *Agile *
Сегодня мне хотелось бы с помощью моих коллег Agile-коучей Ани Родионовой, Макса Зотова и владельца продукта в Трайбе «Розничное взыскание и урегулирование» Свята Божухина рассказать о практике применения интересного инструмента. Итак, речь пойдёт о Program Increment Planning Meeting aka PI Planning.

Это метод планирования из SAFe (Scaled Agile Framework) — гибкого фреймворка для крупных компаний. Ну, знаете, это когда люди стоят у стены, оклеенной стикерами, лепят всякие ниточки от одного стикера к другому, но при этом в городе не орудует маньяк.

Ниже — пример места встречи одной из команд для PI в Сбере (обратите внимание на ту самую стену на заднем плане):

image

Все мы помним, что в марте 2020 года всё стало иначе: пандемия и режим самоизоляции внесли свои коррективы. Мы «переобувались на лету» за неделю, а то, что ранее, как нам казалось, было возможно только оффлайн, переместилось в онлайн.
Читать дальше →
Всего голосов 7: ↑7 и ↓0 +7
Просмотры 615
Комментарии 1

Всё, что нам нужно — это генерация

Блог компании Сбер Блог компании SberDevices Машинное обучение *Искусственный интеллект Natural Language Processing *
Tutorial

Применяем ruGPT-3 в популярных задачах и показываем, зачем языковым моделям триллион параметров


С наступлением 2021 в NLP продолжается гонка «больше — лучше», захватывая новые архитектуры. Пальма первенства самой большой языковой модели в 2020 году принадлежала GPT-3 от OpenAI с 175 миллиардами параметров — но недолго. Модель GShard с помощью Mixture-of-Experts повысила планку до 600 миллиардов параметров, а затем и Google Brain заявил о разработке архитектуры Switch Transformer с 1,6 триллионами параметров (и тоже является MoE). Насколько повышение результатов за счет объема полезно для индустрии? Тот же Switch Transformer с его триллионом параметров далеко не на 1 месте в лидербордах.

Огромные языковые модели (Enormous Language Models, теперь это термин, им посвящен отдельный воркшоп конференции ICLR 2021) показывают действительно интересные результаты — не только в традиционных задачах ML, но и в новых сферах применения: генерации всего того, что раньше генерировать без ошибок было нельзя — музыку, изображения попиксельно, программный код и т.д. Из всех традиционных форм NLP-задач — классификация, классификация элементов последовательности, seq2seq, — по сути, у нас остается только одна: seq2seq. С приходом больших языковых моделей все задачи NLP сводятся теперь к форме генерации, при должном качестве этой самой генерации.

Seq2seq — самая «человеческая» форма решения задач: человек использует тот же формат,  отвечая на сообщения в чате, общаясь устно, сортируя имейлы в почте.  

  • Лично нам в SberDevices не терпелось поскорее применить такой формат к различным задачам — поэтому мы открываем доступ к самой большой русскоязычной нейросети ruGPT-3 XL с 1,3 млрд параметров. 

Инженерный запал вылился в кропотливую работу по распараллеливанию обучения, очистке данных и тестированию. Но зато… теперь в open-source модель ruGPT-3 XL с 1,3 млрд параметров!



А также ее публичное API:


Читать дальше →
Всего голосов 21: ↑21 и ↓0 +21
Просмотры 9.8K
Комментарии 79

Информация

Дата основания
Местоположение
Россия
Сайт
www.sber.ru
Численность
свыше 10 000 человек
Дата регистрации