Все публикации подряд / Хабр

Kouki_RUS сегодня в 08:18

Трансферное обучение с Т5

Машинное обучение

Перевод

За последние несколько лет трансферное обучение дало толчок новой волне state-of-the-art результатов в обработке естественного языка (NLP). Эффективность трансферного обучения заключается в предварительном обучении модели на большом доступном неразмеченном корпусе текстов для одной из задач самообучения (self-supervised learning): например, языкового моделирования или заполнения пропусков в тексте. Затем модель может быть дообучена на меньших наборах данных и зачастую показывает (значительно) лучшие результаты, чем в случае обучения на одних только размеченных данных. Об успехах трансферного обучения стало известно еще в 2018 году, когда были представлены такие модели, как GPT, ULMFiT, ELMo, BERT, а в 2019 году успешность такого подхода стала еще более очевидна с разработкой новых моделей вроде XLNet, RoBERTa, ALBERT, Reformer и MT-DNN. Скорость, с которой эта сфера развивается, не позволяет, однако, с уверенностью сказать, какие из разработок оказали наибольшее влияние и насколько эффективно их можно комбинировать.

Читать дальше →

Polina_Averina сегодня в 05:00

Доступны бесплатные уроки видеокурса по Apache Kafka

Мы открыли доступ к базовым темам курса по Apache Kafka, начать учиться можно уже сейчас.

В программе две теоретические темы «Введение» и «Базовые основы технологии» и практическая тема «Установка Kafka». В ней поработаем с технологией руками:

Развернём Kafka в самом простом её варианте — с одним брокером и одной нодой ZooKeeper.
Запишем и прочитаем сообщения, посмотрим в конфиги и увидим, как данные хранятся на диске.

Читать дальше →

4p4 сегодня в 04:30

Умный print для C

C

Для тех кто пишет на С, возможно, будет интерсно как мне удалось создать умную функцию print(), в которую можно кидать переменные любого типа -- дженерик print.

show me the code

xshura сегодня в 02:05

Переделка CNC 3018 Pro на рельсы. Личный опыт. Часть 2

DIY или Сделай сам

Здравствуйте, продолжаю описание доработки оси Y.

Первая часть тут.

Один из посылов этой части: учитесь читать чертежи/искизы/картинки, и обращать внимание на мелочи.

Я сам не токарь и не фрезеровщик. Повторюсь, что пишу только о своём опыте.

В первой части я сделал:

- обрезку профилей (и по X оси тоже) и их торцевание (кстати, лишнее я пилил ручной ножовкой, и затем на станке доводил);

- нарезка резьбы в профилях;

- сверление отверстий в передней/задней планках;

- сборка (и не забудьте в "серединные" профили вложить Т гайки (по 12шт.) для рельс, и по боковым профилям гайки для крепления штатной оси X);

По сборке вроде вопросов быть не должно.

Всё же опишу один нюанс, который покажется смешным, но мне реально звонили двое коллег из разных контор где я работал, и они спрашивали: "я собираю диван/тумбу и тут две шайбы, одна какая-то кривая и она не цельная, а другая нормальная, и я не знаю, что ставить вначале на болт". Грустно, но в своих областях они "шарят" очень хорошо. Речь конечно о гровер шайбах и обычных.

Скажу кратко: гайки и шляпки болтов очень любят гроверы, они прям таки их ищут, и хотят слиться с ними в экстазе, без всяких посредников :) Всё!

Пластина, на которую крепятся две каретки (чертеж из исходной статьи).

tw_community сегодня в 01:09

Бонус работы аналитиком данных: Как я нашел свой новый дом в Дублине

Перевод

Наш сегодняшний перевод посвящен Data Science. Аналитик данных из Дублина рассказал, как искал себе жилье на рынке с высоким спросом и низким предложением.

Я всегда завидовал тем профессионалам, которые могут применить свои рабочие навыки в повседневной жизни. Взять к примеру сантехника, стоматолога или шеф-повара: их умения полезны не только на работе.

У аналитика данных и инженера-программиста такие преимущества обычно менее ощутимы. Конечно, я разбираюсь в технологиях, но по работе мне в основном приходится иметь дело с бизнес-сектором, поэтому сложновато подобрать интересные случаи применения своих навыков для решения задач семейного масштаба.

Когда мы с женой решили приобрести новый дом в Дублине, я сразу увидел возможность использовать знания!

Читать дальше →

Audioman вчера в 23:48

«Подкаст» с марсохода: новые записи красной планеты

На днях замдиректора научного подразделения НАСА поделился с общественностью новостью о выходе новых записей с борта Perseverance. Он предположил, что звуки Марса заинтересуют не только ученых и широкую аудиторию, но и станут основой для творчества музыкантов.

f15 вчера в 23:48

Compaq Contura 410C: неигровое ретро

До недавнего времени все портативные компьютеры в моей коллекции относились к «поздней» эпохе, имея на борту как минимум процессор Pentium MMX. Хотелось чего-то более древнего, но такие артефакты сложнее найти: речь идет об устройствах, которым минимум 25 лет. Чем дальше мы отправляемся в прошлое, тем дороже стоили ноутбуки, когда были новыми, тем меньше их покупали, а уж до наших времен дожили и вовсе немногие. Просто сохраниться до 2020 года, да еще в рабочем состоянии — уже достижение. К сожалению, любимые мной ноутбуки IBM ThinkPad на 486-м процессоре сейчас совсем трудно найти, но они были не единственные. Недавно мне попался недорогой артефакт из 1995 года, ноутбук Compaq Contura 410C. На сегодняшний день это самый древний лаптоп в моей коллекции.

Хотя подождите, в 1995 году уже два года как была доступны процессоры Pentium. Как так вышло, что в ноутбуках 486-й процессор задержался? Ну, во-первых времена были, по сравнению с нынешними, неторопливые. Во-вторых, в начале 95-го Intel только анонсировала «мобильные» версии Pentium с частотой от 75 мегагерц с рабочим напряжением 2.9 вольта. В августе 1995 года журнал PC Magazine проводит большой тест сотни лаптопов, из которых четверть имеют на борту Pentium 75, 90 или 100. Все это — десктопные версии процессора в переносном корпусе, с крайне небольшим временем автономной работы.

Между тем, 486-го процессора в те времена было более чем достаточно для всех задач, особенно если не увлекаться играми. В моем новом-старом Compaq Contura это и не получится. Ладно звуковой карты нет — при желании это поправимо. Я впервые встретился с настоящим цветным дисплеем, сделанным по технологии DSTN. Осознал на практике весь тот уровень страданий, с которым четверть века назад сталкивались владельцы таких портативных компьютеров. Но выбора особо не было: TFT-матрицы были совершенно недоступны большинству людей, если покупать за свои.

Читать дальше →

AdBlock похитил этот баннер, но баннеры не зубы — отрастут

Подробнее

0x1000000 вчера в 23:43

Кодогенерацию с использованием Roslyn можно использовать и без перехода на .Net 5

.NET,
C#

Перевод

Недавно, когда я просматривал новые возможности, которые будут включены в .Net 5, я натолкнулся на одну весьма интересную — генераторы исходного кода. Этот функционал меня особенно заинтересовал, так как я использую аналогичный подход в течение последних… 5 лет, и то, что предлагает Microsoft — это просто более глубокая интеграция этого подхода в процесс сборки проектов.

Примечание: Оригинал был написан в момент, когда релиз .Net 5 только-только собирался выйти, но актуальности этот текст, на мой взгляд, не потерял, поскольку переход на новую версию платформы занимает какое-то время, да и принципы работы с Roslyn никак не поменялись.

Далее я поделюсь своим опытом использования Roslyn при генерации кода, и надеюсь, что это поможет вам лучше понять, что именно предлагает Microsoft в .Net 5 и в каких случаях это можно использовать.

Читать дальше →

SLY_G вчера в 21:40

Математики воскресили 13-ю проблему Гильберта

Перевод

Вопрос Давида Гильберта о многочленах седьмой степени, долгое время считавшийся решённым, открыл исследователям новую сеть математических связей

Успех в математике достигается редко. Спросите хотя бы Бенсона Фарба.

«Проблема математики в том, что в 90% случаев вас ждёт неудача, и вам нужно быть человеком, умеющим это принимать», — сказал однажды Фарб за ужином с друзьями. Когда один из гостей, также математик, удивился тому, что Фарбу удаётся достигать успеха в целых 10% случаев, Фарб признал: «Нет, нет, я сильно преувеличил процент своих успехов».

Фарб, тополог из Чикагского университета, с радостью встретил последнюю свою неудачу – хотя, честно говоря, это не только его заслуга. Вопрос связан с задачей, парадоксальным образом одновременно решённой и нерешённой, открытой и закрытой.

Читать дальше →

Tati_dr вчера в 19:18

Ресайклинг по-норвежски: ЦОДам предложили направлять излишки тепла на обогрев помещений

В Норвегии изучают вопрос вторичного использования тепла, выделяемого ЦОД. Предполагается, что тепло можно направить на бытовые и общественные нужды — обогрев зданий, производств, для рыбных хозяйств.

Предложение поступило от Министра энергетики Норвегии — Тины Бру (Tina Bru). Инициатива распространяется на все компании с установленными крупными энергетическими установками.

Читать дальше →

ovi вчера в 19:04

Почему язык Go стал стандартом для DevOps-инженеров

Иногда вещи находят себе применение неожиданно и не в том, для чего их задумывали.

В 1960-е годы Кен Томпсон — легенда программирования — написал компьютерную игру Space Travel для операционной системы Multics. Система была проектом компании Bell Lab, где он работал вместе с Денисом Ритчи. Позже проект закрыли, и чтобы продолжать играть в свою Space Travel, Томпсон решил портировать ее на компьютер PDP-7. Инструменты, которые он создал для порта, затем легли в основу операционной системы Unix.

Томпсон написал в одиночку первые три версии. Для Unix был нужен системный язык — так появился B. Позже Денис Ритчи, коллега и друг Томпсона, подхватил разработку и написал язык C. Вот так в основе почти всего, на чем построены современные технологии, лежало желание поиграть в компьютерную игру и пет-проекты для забавы.

Кен Томпсон построил блестящую карьеру исследователя в области computer science. В середине 2000-х он устроился в Google, где вместе с Робом Пайком и Робертом Грейсмером создал Golang — один из самых популярных языков последнего времени.

MaxRokatansky вчера в 18:55

Использование Google Protocol Buffers (protobuf) в Java

Перевод

Недавно вышло третье издание книги "Effective Java" («Java: эффективное программирование»), и мне было интересно, что появилось нового в этой классической книге по Java, так как предыдущее издание охватывало только Java 6. Очевидно, что появились совершенно новые разделы, связанные с Java 7, Java 8 и Java 9, такие как глава 7 "Lambdas and Streams" («Лямбда-выражения и потоки»), раздел 9 "Prefer try-with-resources to try-finally" (в русском издании «2.9. Предпочитайте try-с-ресурсами использованию try-finally») и раздел 55 "Return optionals judiciously" (в русском издании «8.7. Возвращайте Optional с осторожностью»). Но я был слегка удивлен, когда обнаружил новый раздел, не связанный с нововведениями в Java, а обусловленный изменениями в мире разработки программного обеспечения. Именно этот раздел 85 "Prefer alternatives to Java Serialization" (в русском издании «12.1 Предпочитайте альтернативы сериализации Java») и побудил меня написать данную статью об использовании Google Protocol Buffers в Java.

dzigoro вчера в 18:34

Как выбрать мобильную кросс-платформу в 2021 году

Перевод

Кросс-платформенные решения - тренд в мобильной разработке. Уже есть различные технологии от PWA до Flutter и Kotlin Multiplatform. Как выбрать среди них?

Новый развивающийся бизнес зачастую в первую очередь ориентируется на мобильные технологии: социальные сети, необанкинговые решения, приложения для электронной коммерции, такси и другие. Новый бизнес ориентирован на экономическую эффективность, поэтому переход на кросс-платформенность для разработки мобильного приложения кажется правильным выбором. Посмотрим, что будет в 2021 году и как выбрать правильную технологию.

Далее

Seleditor вчера в 18:13

Одноплатник Pimoroni Tiny 2040 — улучшенный аналог Raspberry Pi Pico, размером всего в треть «малинки»

В январе мы публиковали обзор одноплатника Raspberry Pi Pico. В целом, соотношение цена/качество на высоте. Но многим пользователям платы не хватает дополнительных функций.

И вот сейчас появилась альтернатива, причем на основе SoC Raspberry RP2040, но с большим набором возможностей (забегая наперед — это не модуль беспроводной связи). Плюс ко всему, размер новинки всего третья часть от Raspberry Pi Pico. Называется это чудо технической мысли Pimoroni Tiny 2040.

Читать дальше →

ptsecurity вчера в 18:02

Как атаковали промышленную инфраструктуру на The Standoff: анализ трафика с помощью PT ISIM

На прошедшем The Standoff эксперты PT Expert Security Center, в данном случае представляющие команду глобального SOC киберполигона, мониторили действия команд атакующих и защитников цифровой копии мегаполиса FF, противостояние проходило в режиме реального времени и длилось 123 часа. Ранее мы писали о том, как глобальный SOC следил за всем происходящим в инфраструктуре виртуального города, как отдел обнаружения вредоносного ПО вылавливал и исследовал троянские программы «редтимеров» с помощью песочницы PT Sandbox и как мы следили за всеми веб-ресурсами киберполигона с помощью PT Application Firewall. Теперь поговорим о защищенности технологических сетей объектов виртуального города и результатах мониторинга, проведенного с помощью системы глубокого анализа технологического трафика PT Industrial Security Incident Manager (PT ISIM).

В этой статье мы расскажем о том, какие атаки на технологический сегмент сети объектов города детектировала система, и отметим, насколько эти угрозы соответствуют реальному уровню защищенности промышленных систем.

BaturinConsult вчера в 17:50

Что такое процессное управление

Бизнес-модели

Recovery Mode

В статье описаны наиболее распространенные модели управления, которые используются в российских в компании. В частности, дан сравнительный анализ характеристик функциональному и процессному подходу к организации системы управления.

Процессный подход был сформулирован во второй половине прошлого века и до сих пор остается одним из наиболее эффективных методов организации системы управления в компании. Краеугольным камнем данной методологии является понятие «процесс». Процесс — это совокупность взаимосвязанных видов деятельности, преобразующая входы в выходы, которые имеют ценность для потребителя. Таким образом, концепция процессного подхода, как системы управления, заключается в выделении конкретных бизнес-процессов компании, определении одного из участников в качестве владельца бизнес-процесса и делегировании ему полномочий и ответственности по управлению данным процессом.

В данном случае компания рассматривается, как система отдельных видов деятельности (бизнес-процессов), направленных на достижение конкретного результата и осуществляющих взаимодействие друг с другом посредством входов и выходов. В качестве входов в процессной методологии могут выступать: информация, документация, материалы, оборудование, человеческие ресурсы и так далее. Выходами бизнес-процессов является результат деятельности, который имеет ценность как для внешнего заказчика, так и для внутреннего. Стоит отметить, что важной отличительной особенностью процессного подхода от других моделей управления является не только выделение бизнес-процессов, но и постоянное их совершенствование.

К сожалению, несмотря на все достоинства и преимущества процессной методологии до сих пор в большинстве отечественных компаний используется функциональная модель управления. В отличие от процессного, в основе концепции функционального подхода к управлению делегирование полномочий и ответственности осуществляется через выполняемые функции. Другими словами, функциональный подход заключается в объединении сотрудников в отдельные структурные бизнес-единицы (отделы, департаменты и прочее) по принципу однообразия выполняемой деятельности с жесткой вертикальной иерархией.

setaniel вчера в 17:48

Рамка (граница) окон в windows 10 и server 2016+

Наверно я не один такой, кто столкнулся с проблемой отсутствия границ окон в новых системах windows, ведь зачем-то их убрали с одним из обновлений. Спрашивают многие, а вот ответа нет однозначного нигде. С данной неожиданной неприятностью легко справиться, сменив руками настройки системы, а если это терминальный сервер и пользователей много? По умолчанию, пользователям выставляется наилучшее быстродействие, что отключает тени, в придачу по умолчанию в системе отключены границы окон, что приводит к полному сливанию окон друг с другом, в итоге невозможно отличить где кончается одно и начинается другое окно. Когда я решил централизованно решить эту проблему для всех пользователей, оказалось что найти решение не так уж и просто, поскольку нет ни одного ответа в интернете, дающего однозначное решение. В итоге перелопатив весь RU и EN сегменты сети, перепробовав разные варианты, я решил проблему. Если вас беспокоит та же проблема, прошу под кат.

Unclead вчера в 17:38

Run, config, run: как мы ускорили деплой конфигов в Badoo

Файлы конфигурации (конфиги) — неотъемлемая часть большинства приложений, но, как показывает практика, это не самая популярная тема для обсуждения. Чаще всего разговоры о конфигах ограничиваются обсуждением работы с ними непосредственно в коде: как их структурировать, использовать переменные окружения или нет, где хранить пароли и т. п.

На мой взгляд, есть и другая сторона работы с конфигами, которая заслуживает внимания, — развёртывание (деплой). За свою карьеру я видел довольно много способов деплоя конфигов и уверен, что каждый может узнать об этом что-то новое.

Несколько лет назад я работал над системой, которая позволила нам ускорить процесс деплоя конфигов на 1000+ серверов с минуты до нескольких секунд.

Если вам интересно узнать, как устроен процесс деплоя конфигов в Badoo и какие инструменты мы для этого используем, добро пожаловать под кат.

vikusti вчера в 17:06

«Осторожно, печеньки!»: советы начинающим тестировщикам в сфере безопасности

Привет, меня зовут Вика Бегенчева, я QA-инженер в Redmadrobot. Я расскажу, как злоумышленники крадут наши данные, и что можно сделать, чтобы от этого защититься. Статья написана для начинающих тестировщиков безопасности и тех, кому непонятно, что за «фрукты» эти хакеры и чем они там занимаются.

SellerDen вчера в 16:56

Аналитики изучили продавцов маркетплейсов и их успехи в 2020 году. Зоотовары, косметика и металлоискатели сделали кассу

На днях исследовательское агентство Data Insight решило посмотреть не на отдельные части отрасли торговли, а на самих продавцов без которых торговли просто бы не было. Учитывая, ограничительные меры, которые захватили страну в 2020 году, особую роль в торговле сыграли маркетплейсы. На них вышли и представители офлайн-бизнеса и крупные сети. Зачем и почему?

Мы внимательно изучили детали исследования и добавили к нему собственные замечания, которые удалось получить с помощью сервисов аналитики. Мы рассмотрели категории товаров, которым удалось вырасти в 2020 году сильнее всего и узнали что за товары в них кроются.

Статьи

Новости

Хабы

Авторы

Компании

Трансферное обучение с Т5

Новости

Доступны бесплатные уроки видеокурса по Apache Kafka

Умный print для C

Переделка CNC 3018 Pro на рельсы. Личный опыт. Часть 2

Минуточку внимания

Бонус работы аналитиком данных: Как я нашел свой новый дом в Дублине

«Подкаст» с марсохода: новые записи красной планеты

Compaq Contura 410C: неигровое ретро

Кодогенерацию с использованием Roslyn можно использовать и без перехода на .Net 5

Математики воскресили 13-ю проблему Гильберта

Вопрос Давида Гильберта о многочленах седьмой степени, долгое время считавшийся решённым, открыл исследователям новую сеть математических связей

Ресайклинг по-норвежски: ЦОДам предложили направлять излишки тепла на обогрев помещений

Почему язык Go стал стандартом для DevOps-инженеров

Использование Google Protocol Buffers (protobuf) в Java

Как выбрать мобильную кросс-платформу в 2021 году

Одноплатник Pimoroni Tiny 2040 — улучшенный аналог Raspberry Pi Pico, размером всего в треть «малинки»

Как атаковали промышленную инфраструктуру на The Standoff: анализ трафика с помощью PT ISIM

Что такое процессное управление

Рамка (граница) окон в windows 10 и server 2016+

Run, config, run: как мы ускорили деплой конфигов в Badoo

«Осторожно, печеньки!»: советы начинающим тестировщикам в сфере безопасности

Аналитики изучили продавцов маркетплейсов и их успехи в 2020 году. Зоотовары, косметика и металлоискатели сделали кассу

Спонсоры сообщества

Лучшие компании

Читают сейчас

Самое читаемое

Минуточку внимания

Ваш аккаунт

Разделы

Информация

Услуги

Статьи

Новости

Хабы

Авторы

Компании

Минуточку внимания

Вопрос Давида Гильберта о многочленах седьмой степени, долгое время считавшийся решённым, открыл исследователям новую сеть математических связей

Средняя зарплата в IT

Спонсоры сообщества

Лучшие компании

Читают сейчас

Самое читаемое

Минуточку внимания

Ваш аккаунт

Разделы

Информация

Услуги