Как стать автором
Обновить

Разработка

Сначала показывать
  • Новые
  • Лучшие
Порог рейтинга
  • Все
  • ≥0
  • ≥10
  • ≥25
  • ≥50
  • ≥100

Как писать посты в стиле Артемия Лебедева? Подробный анализ телеграм-канала и кое-что еще

Serverless *Визуализация данных Искусственный интеллект Машинное обучение *

Дисклеймер номер один: 18+. В этой статье присутствует ненормативная лексика, так как автор текстов, которые мы анализируем, не стесняется в выражениях. Мы не хотим никого задеть или оскорбить чьи-то чувства, присутствие мата объясняется лишь объектом нашего исследования.

Все знают телеграм-канал Артемия Лебедева, в котором очень часто можно увидеть хлесткое матерное слово, а некоторые его посты и вовсе неоднозначны. Я и мой коллега Егор решили как следует разобраться в семантике текстов Артемия, скачали все посты телеграм-канала и проанализировали его словарный диапазон. Сегодня мы обсудим важные этапы исследования и, что самое главное, обсудим аналитические выводы о телеграм-канале Артемия Лебедева

Изначально, мы поставили перед собой следующие задачи: собрать тексты всех постов и метаинформацию о них, получить динамику подписчиков на канале, а после провести описательный и семантический анализы собранных данных. Но нам удалось сделать даже больше — в результате мы смогли обучить нейронную сеть на текстах Артемия Лебедева.
Теперь мы можем писать тексты для тг-канала Лебедева без него самого. Правда-правда.
Хотите узнать как?

Читать дальше →
Всего голосов 2: ↑2 и ↓0 +2
Просмотры 482
Комментарии 0

Новости

Хранители данных: как устроена работа с DWH в Lamoda

Блог компании Lamoda Oracle *IT-инфраструктура *Хранение данных *Хранилища данных *

Всем привет! Меня зовут Юлия Скогорева, я системный аналитик в команде Center of excellence в Lamoda, которая входит в дирекцию данных и аналитики.

Если бизнесу нужны какие-то данные для принятия важных решений, то на помощь приходит наша команда. Мы тщательно изучаем множество микросервисов, чтобы определить, какие же данные нужны для решения бизнес-целей, формируем архитектуру хранилища, пишем скрипты запросов и витрин данных, строим юниверсы, делаем отчеты и дашборды. Большая часть работы не обходится без участия команды DWH-разработки.

В статье я расскажу, как устроено хранилище данных в Lamoda, что находится на каждом его слое, с помощью каких инструментов мы визуализируем данные, сколько у нас отчетов и зачем используем APEX.

Читать далее
Всего голосов 8: ↑7 и ↓1 +6
Просмотры 328
Комментарии 3

Дыра в безопасности, похожая на Log4Shell, обнаружена в популярном Java SQL движке базы данных H2

Информационная безопасность *Java *
Перевод
Tutorial

«Это Log4Shell, Джим, но не в том виде, в каком мы его знаем» — так никогда не говорил Commander Spock.

Это краткий обзор ошибки CVE-2021-42392дыры в системе безопасности, о которой недавно сообщили исследователи из компании по управлению цепочками поставок программного обеспечения Jfrog.

На этот раз ошибка находится не в осажденном наборе инструментов Apache Log4j, а в популярном Java SQL сервере под названием H2 Database Engine.

H2 не похож на традиционную SQL систему, такую ​​как MySQL или Microsoft SQL server.

Хотя вы можете запускать H2 как отдельный сервер для подключения других приложений, он главным образом известен из-за его скромных размеров и автономном характере работы.

В результате вы можете встраивать код H2 SQL базы данных прямо в свои собственные Java-приложения и запускать свои базы данных полностью в памяти без необходимости в отдельных серверных процессах.

Как и в случае с Log4j, это означает, что в вашей организации могут быть неявно запущенные экземпляры кода H2 Database Engine, если вы используете какие-либо приложения или компоненты разработки, которые сами по себе незаметно включают его.

Читать далее
Всего голосов 1: ↑1 и ↓0 +1
Просмотры 699
Комментарии 0

Как устроен звуковой чип легендарного синтезатора

Блог компании Аудиомания Реверс-инжиниринг *Старое железо Звук Электроника для начинающих

Энтузиаст изучил устройство аудиочипа Yamaha DX7 по фотографиям интегральной схемы. Далее, поговорим о его особенностях. Кстати, ранее мы уже рассказывали про карту Sound Blaster 1.0 и усилитель звука в Game Boy.

Читать далее
Всего голосов 3: ↑3 и ↓0 +3
Просмотры 734
Комментарии 0

Golang-дайджест № 12 (1 – 31 декабря  2021)

Go *

Свежая подборка новостей и материалов

Интересное в этом выпуске

Выпущены Go 1.17.5 и Go 1.16.12, GoLand 2021.3, доступна первая бета-версия Go 1.18 (с дженериками), monovania 2D платформер-головоломка, созданный с помощью Ebiten, zinc альтернатива Elasticsearch, Map-Reduce в Go

Приятного чтения!

Читать далее
Всего голосов 3: ↑3 и ↓0 +3
Просмотры 542
Комментарии 3

Cloudera Streaming Analytics: унификация пакетной и потоковой обработки в SQL

Блог компании Cloudera Big Data *Хранилища данных *Hadoop *Data Engineering *

Cloudera Streaming Analytics: унификация пакетной и потоковой обработки в SQL

В октябре 2020 года Cloudera приобрела компанию Eventador, а в начале 2021 года был выпущен продукт Cloudera Streaming Analytics (CSA) 1.3.0. Это был первый релиз, который включал в себя SQL Stream Builder (SSB), полученный в результате интеграции наработок Eventador в продукт для аналитики потоквых данных на базе Apache Flink.

SQL Stream Builder (SSB) - это новый компонент со своим дружелюбным веб-интерфейсом, позволяющий анализировать потоковые и исторические данные в режиме реального времени в SQL, под капотом которого работает Apache Flink.

Читать далее
Рейтинг 0
Просмотры 86
Комментарии 0

RecyclerView Adapter in Android, сделай быстрее и проще

Разработка под Android *Kotlin *
Из песочницы
Перевод

Здравствуйте дорогие хабрчане. Это статья основана на статье https://blog.iamsuleiman.com/recyclerview-adapter-android-made-fast-easy/#clicklistener написанной в 2017 году на Java. А статью которую вы читаете, уже на Kotlin.

Каждый раз, когда мы думаем о создании RecyclerView, нас пугает объем кода, который должен войти в адаптер. Кроме того, если у этого адаптера много ViewHolder-ов, то спаси нас Бог!

Конечно, все мы знакомы с шаблонным кодом RecyclerView.Adapter. Но писать один и тот же код снова и снова — пустая трата времени.

Наверняка должен быть лучший способ?

Поздоровайтесь с FastAdapter!

Читать далее
Рейтинг 0
Просмотры 312
Комментарии 0

Нестандартное применение программирования в реальной жизни

Блог компании FirstVDS Программирование *Java *Читальный зал Лайфхаки для гиков

С каждым днём информатизация нашего общества увеличивается, и роль программистов и программного обеспечения в нём растёт. У всех на слуху крупные проекты, которые существенно повлияли на жизнь множества людей и которые успешно разрабатываются и поддерживаются лишь небольшими командами разработчиков.

Однако программное обеспечение — это не только проекты компьютерных игр класса ААА или корпоративных проектов, предлагающих программное обеспечение по модели SaaS, это и использование его в обычной жизни, порой весьма неожиданным образом. О чём мы и поговорим в этой статье.
Читать дальше →
Всего голосов 14: ↑10 и ↓4 +6
Просмотры 1.8K
Комментарии 1

Градиентный бустинг с CatBoost (часть 2/3)

Программирование *Алгоритмы *Машинное обучение *

В первой части статьи я рассказал про понятие градиентного бустинга, библиотеки, с помощью которых можно реализовать данный алгоритм и углубились в одну из этих библиотек. Сегодня продолжим разговор о CatBoost и рассмотрим Cross Validation, Overfitting Detector, ROC-AUC, SnapShot и Predict. Поехали!

До этого момента мы мерили качество на каком-то конкретном fold’e (конкретной выборке), то есть взяли разделили нашу выборку на обучающую и тестовую, это не совсем корректно, вдруг мы взяли какой-то непрезентативный кусок нашего датасета, на этом самом куске мы получим хорошее качество, а когда модель будет работать с реальными данными, то с качеством все будет крайне грустно. Дабы избежать этого, необходимо использовать Cross Validation.

Разобьём наш датасет на кусочки и дальше будем обучать модель столько раз, сколько у нас будет кусочков. Сначала обучаем модель на все кусках кроме первого, нам нем будет происходить валидация, потом на втором будет происходить такая же ситуация и все это дело будет повторяться до последнего кусочка нашей выборки:

Читать далее
Всего голосов 2: ↑2 и ↓0 +2
Просмотры 539
Комментарии 0

Ruby-Дайджест за неделю (3 янв — 10 янв)

Ruby *Ruby on Rails *

В этом дайджесте:

Обновление популярных гемов.

Сборник гайдов и статей (RU/ENG) #1.

Интересные open-source проекты на GitHub #3.

Подборка полезных гемов #3.

Интересный видео/аудио контент, связанный с Ruby.

Читать RubyDigest
Всего голосов 7: ↑7 и ↓0 +7
Просмотры 349
Комментарии 0

Описание бизнес-процессов Как есть (AS IS) и Как должно быть (TO BE)

Анализ и проектирование систем *Терминология IT Бизнес-модели

Если вы занимаетесь бизнес анализом или являетесь бизнес-аналитиком, вы скорее всего сталкивались с требованием описать бизнес процесс в формате AS IS. Что это такое и практический пример использования подхода вы найдете в этой статье.

Когда я сам изучал моделирование бизнес-процессов при реинжиниринге, то во всех учебниках встречал два понятия — AS IS и TO BE. И все авторы писали, что сначала необходимо составить нотацию AS IS (буквальный перевод — “как есть”), т.е. как система работает в настоящее время, и только потом приступать к процессу модернизации, т.е. создавать нотацию TO BE (Как должно быть).

Проще говоря, сначала следует изучить, как работает предприятие или отдел сейчас, сделать описание бизнес процесса, и только потом, на основе нотации AS IS, начинать оптимизацию. Но все эти теории хороши, когда есть что описывать по схеме «Как есть». В реальности ситуация чаще всего иная.

Читать далее
Всего голосов 9: ↑5 и ↓4 +1
Просмотры 1.9K
Комментарии 5

NestJS + GraphQL + Lambda

JavaScript *TypeScript *
Tutorial

Цель данной статьи - создать GraphQL приложение, построенное на фреймворке NestJS. А также загрузить его в Лямбда-функцию при помощи Terraform. Надеюсь данный пример поможет многим сэкономить много времени.

Читать далее
Всего голосов 3: ↑3 и ↓0 +3
Просмотры 1.3K
Комментарии 4

Разработка приложения редактирования отзывов в Power Apps на базе связанных списков Sharepoint

Разработка для Office 365 *Облачные сервисы
Tutorial

В данной работе создадим приложение с вложенным списком и на его примере рассмотрим функционал и возможности Power Apps при наличии связей между таблицами с данными. Для удобства пользователей данные из двух списков будут одновременно отображаться на одном экране.

В качестве решаемой задачи будет реализовано приложение для редактирования отзывов оставленных клиентами ReviewSP для наших специалистов AccountSP.

Читать далее
Всего голосов 1: ↑1 и ↓0 +1
Просмотры 223
Комментарии 2

Букварь материалиста. Пространственная логика

Алгоритмы *Киберпанк Научно-популярное Мозг Логические игры

Эта статья является продолжением серии статей "Букварь материалиста", где в первой части мы разобрались с понятиями ничто и нечто, количества и качества, сути и формы и прочими, однако это содержало в себе лишь элементы статичной логики, когда диалектика содержит в себе как раз ту жизнь, которой не хватает в "логике".

В первой части статьи мы описывали диалектику, не используя движение и пространство. В статической логике диалектики описывается лишь материя и её логическое становление, обоснование её существования. В этой части статьи будут описаны понятия, существование которых бессмысленно без статической логики, однако дающие им определенность в своих качествах.

Учитывая, что неизменная определенность нечто это его качество - практически все дальнейшие понятия будут являтся качествами частей материи, в разной степени относящейся друг к другу.

Пространственная логика.
Всего голосов 10: ↑3 и ↓7 -4
Просмотры 2.1K
Комментарии 30

Dependency Injection в системе автоматизации сборок NUKE. Ответы на вопросы «зачем?» и «как?»

.NET *ASP *C# *Системы сборки *DevOps *
Tutorial

Всем привет, сегодня поговорим о внедрении Dependency Injection (далее - DI) в Nuke и рассмотрим моё видение. Кто не знаком с Nuke вы можете ознакомиться или на официальном сайте или посмотреть вот эту презентацию, если коротко - то это очень удобная система автоматизации сборок, которая по факту консольное приложение на C#.

Читать далее
Всего голосов 1: ↑1 и ↓0 +1
Просмотры 498
Комментарии 2

Дайджест свежих материалов из мира фронтенда за последнюю неделю №501 (2 — 9 января 2022)

Разработка веб-сайтов *CSS *JavaScript *HTML *
Предлагаем вашему вниманию подборку с ссылками на новые материалы из области фронтенда и около него.

Читать дальше →
Всего голосов 17: ↑17 и ↓0 +17
Просмотры 2.6K
Комментарии 0

PyQt6 — полное руководство для новичков

Блог компании SkillFactory Python *Программирование *Графические оболочки *Qt *
Перевод
Tutorial

К старту курса по разработке на Python делимся детальным руководством по работе с PyQt 6 для новичков. Чтобы читать было удобнее, мы объединили несколько статей в одну:

1. Первое приложение

2. Слоты и сигналы

3. Виджеты

За подробностями приглашаем под кат.

Читать далее
Всего голосов 23: ↑22 и ↓1 +21
Просмотры 6.7K
Комментарии 3

Девять кругов объективности: Пешка — это не фигура? (нет)

Разработка игр *
Из песочницы

Буквально на днях на Хабре вышло две статьи про шахматы от @andyshark1974. Первая называлась "Изучаем пешку (часть 5)" и была, собственно, про пешку. В самой статье, Андрей назвал пешку фигурой и в комментариях сразу появилось уточнение, что пешка - не фигура. Автор статьи отвечал на подобные комментарии довольно резко, но во всех его ответах чувствуется практически неуловимая неопределенность, хотя видно, что он склонен считать пешку фигурой. Сейчас попробуем объективно разобраться и ответить на этот вопрос. Но теперь как цивилизованные люди, т. е. с прувами и портянкой скучных документов.

Читать далее
Всего голосов 22: ↑13 и ↓9 +4
Просмотры 3.7K
Комментарии 35

AASIST: Аудио защита с использованием сети с интегрированным спектро-временным графом внимания

Информационная безопасность *Алгоритмы *Машинное обучение *Искусственный интеллект Natural Language Processing *
Перевод

Артефакты, которые отличают подделку от реальных данных, могут находиться в спектральной или временной областях. Их надежное обнаружение обычно зависит от ансамбля сложных систем, где каждая подсистема настроена на определенные артефакты. Мы стремимся разработать единую, эффективную систему, которая может обнаруживать широкий спектр различных атак с использованием спуфинга без использования групп баллов. Мы предлагаем новый слой внимания с гетерогенным наложением графа, который моделирует артефакты, охватывающие разнородные временные и спектральные области с гетерогенным механизмом внимания и узлом стека. С новой операцией максимального графа, которая включает конкурентный механизм и расширенную схему считывания, наш подход, названный AASIST, превосходит текущее состояние дел в данной области примерно на 20%. Даже облегченный вариант, AASIST-L, всего с 85 тыс. параметров, превосходит все конкурирующие системы.

Читать далее
Всего голосов 1: ↑1 и ↓0 +1
Просмотры 522
Комментарии 2