Звук

Это «ж-ж-ж» неспроста

Статьи Посты Новости Авторы Компании

the_homeless_god 1 час назад

Как заставить говорить по-русски World Of Warcraft с помощью AI

Сложный

18 мин

243

Ненормальное программирование**nix*Искусственный интеллектИгры и игровые консолиЗвук

Туториал

Здравствуйте-здравствуйте, играю я значит в классический World of Warcraft и понимаю, что игра тосклива из-за отсутствия более-менее озвученных квестов. Конечно, инди-студия Метелица не способна озвучить всю свою игру, да и понятно, что сюжет развивается, а люди имеют свойство менять работу или, да это печально, физической гибели, как например случилось с озвучкой Артаса Менетила в Warcraft III: Frozen Throne.

В общем, заваривайте чай, как и все мои предыдущие публикации, эта статья в формате (б|в)лога.

SPbU 24 мая в 12:53

Два способа извлечь звуки из данных: как и зачем

12 мин

919

Блог компании СПбГУПрограммирование*Научно-популярноеЗвукАстрономия

Мнение

В рамках проекта «Лаборатория цифровой философии» специалисты из СПбГУ занимаются разработками в сфере сонификации данных. Сонификация данных — относительно новая дисциплина, которая занимается преобразованием различных текстовых данных в звук.

Такие преобразования позволяют, например, людям с различными проблемами зрения услышать, как звучат научные достижения, открытия и даже исторические события. Кроме того, преобразование данных в звук упрощает анализ научных данных.

limpwinter 24 мая в 11:16

Опыт дистилляции моделей распознавания речи

Средний

5 мин

957

Машинное обучение*Звук

Из песочницы

Небольшая история про наш опыт дистилляции моделей для распознавания речи. Как у нас получилось уменьшить модель в 160 раз и не проиграть по качеству.

3DSound 23 мая в 11:52

Стереогарнитура с бинауральным звуком, часть 2. Профессиональная звукозапись

Средний

4 мин

697

Звук

Кейс

Продолжение первой статьи, в котором я хочу рассказать о звукозаписи с гарнитуры при помощи полевого рекордера Zoom F3.

Irkin 22 мая в 13:13

Настройка bluetooth микрофона с шумоподавлением в PipeWire

Средний

13 мин

984

Настройка Linux*Разработка под Linux*Умный домЗвукГолосовые интерфейсы*

Кейс

В череде дней «длинных» майских праздников решил развернуть голосовой помощник на сервере домашней автоматизации Home Assistant. Мой домашний сервер работает под управлением ОС Ubuntu Server 23.10 и не имеет никаких предустановленных источников или приемников аудио и видео информации. В Ubuntu были установлены аудиосервер PipeWire и менеджер сеансов WirePlumber. Такой выбор был продиктован тем, что эти приложения являются стандартным ПО по обработке аудио и видео потоков в Linux. В сети мне не удалось обнаружить какого-либо полного описания процесса настройки, и эта статья, в некоторой степени, восполняет этот пробел.

Ariman 21 мая в 12:57

Новый Век или Парадокс Моравека

3 мин

2.3K

Искусственный интеллектЗвук

Добрый день, уважаемые хабровчане!

Этот пост немного нестандартный для меня, потому что в нем я не буду рассказывать вам про код, а вместо этого расскажу вам про дебютный киберпанк‑альбом «Новый Век или Парадокс Моравека» от нашего небольшого творческого коллектива «Тандем Модемов».

Я думаю, ни для кого не секрет, что последнее время технология генеративного ИИ развивается ошеломительными темпами. Совсем недавно стали публично доступны такие сервисы как Udio которые позволяют по заданному тексту и промпту сгенерировать вполне достойное музыкальное произведение.

Так как мы с друзьями периодически пишем стихи на волнующие нас темы, было бы странно не воспользоваться таким шансом и не превратить их в песни.

А так как помимо Udio есть еще Midjourney и Dall‑e для генерации графики, а также бесплатный (пока) Haiper для анимации, мы решили собрать полноценный альбом, состоящих из четырех музыкальных видео.

Надеюсь, в эти нелегкие времена наши песни передадут вам частичку нашего оптимизма и уверенности в светлом будущем всего человечества.

Приятного просмотра!

+21

stargrave2 20 мая в 14:27

Vo(IP) Really Simple: пишем простое VoIP решение

Средний

13 мин

1.6K

Криптография*Программирование*Go*Звук

Будучи поклонником suckless философии, минимализма и простоты в программном обеспечении, я не нахожу простых и маленьких VoIP решений. Программ связанных с VoIP очень много. Но это либо колоссальные системы для построения SIP-based экосистемы, либо что-то из мира WebRTC. Особняком выделяю Mumble -- популярное решение среди геймеров: централизованный сервер, указываешь его адрес и вот уже слышишь в наушниках другого человека. А нет ли чего ещё попроще?

GARFILD1000 20 мая в 12:41

Как создать аудиоплеер. Часть 1. Что под капотом

Средний

6 мин

4.9K

Блог компании HiFi-стриминг ЗвукРазработка мобильных приложений*Разработка под Android*Звук

Всем привет! Меня зовут Дмитрий Булгаков, я Android-разработчик в HiFi-стриминге Звук, и я расскажу, как можно создать аудиоплеер в приложении. Поговорим об инструментах разработки и устройстве плеера — разберем его «анатомию», компоненты и их применение, а также способы улучшения звука с помощью эквалайзера.

Для вашего удобства гайд разделён на несколько основных частей. В первой расскажу об актуальных инструментах разработки плеера и о том, что у него «под капотом».

Поехали!

+11

ru_vds 17 мая в 12:00

Как сделать виртуальную АТС на базе VPS

Простой

6 мин

8.3K

Блог компании RUVDS.comНастройка Linux*Серверное администрирование*Asterisk*Звук

Туториал

Несмотря на популярность мессенджеров и телеконференций, ни один офис ещё не отказался от телефонной связи. Люди такие существа, что иногда предпочитают общаться голосом.

В каждом офисе установлена мини-АТС, которая коммутирует внутренние звонки. Телефоны сотрудников подключаются к коммуникационному шкафу или коробочке с Asterisk (как на КДПВ), а она подключена к телефонной сети общего пользования (PSTN или ТСОП). Таким образом, сотню офисных телефонов можно повесить на один внешний номер. В общем, мини-АТС — совершенно необходимая вещь.

Виртуальная или облачная АТС (hosted PBX) — это услуга для компаний, которая заменяет им обычную офисную АТС. Вместо того, чтобы покупать специализированное телекоммуникационное оборудование или выделять отдельный компьютер с Asterisk, они заказывают услугу на удалённом хостинге. И этот компьютер с Asterisk (IP-АТС) физически размещается у провайдера. Таким образом, виртуализация добралась и до АТС, всё в русле современных тенденций.

Читать дальше →

+30

aabzel 16 мая в 20:12

Обзор AудиоКодека NAU8814YG

Простой

10 мин

3.3K

Программирование микроконтроллеров*Производство и разработка электроники*Компьютерное железоЗвук

Обзор

Аудио кодек по сути это цифро-аналоговое устройство, где есть пара ADC + DAC. На входе обычно есть сумматор на операционных усилителях для подмешивания аналогово сигнала с разных проводов, есть еще аналоговые усилители. Высокоскоростной многоканальный интерфейс: I2S или TDM. И интерфейс I2C для того чтобы всем этим добром управлять.

В этой заметке я написал о своём опыте работы с ASIC аудиокодеком NAU8814.

+17

Lunathecat 16 мая в 12:00

В погоне за звуком Билли Гиббонса. Часть 1: Purple Plexi

Простой

7 мин

3.3K

Блог компании RUVDS.comСхемотехника*DIY или Сделай самЗвукЭлектроника для начинающих

Ретроспектива

Привет, Хабр! Purple Plexi — это педаль гитарного эффекта искажения (дисторшн), повторяющая характер звучания усилителя Marshall Super Lead 1959 модели. Материал его передней панели выглядел как оргстекло (плексиглас), за что усилитель получил в среде музыкантов прозвище «Плекси».

Читать дальше →

+35

timonin 16 мая в 11:01

Создание музыки в нейросети Udio, подробная инструкция с примерами от сообщества

Простой

17 мин

10K

Блог компании Timeweb CloudИскусственный интеллектЗвукБудущее здесь

Туториал

Друзья, всем привет! Меня зовут Илья, я основатель онлайн-нейросети для создания изображений ArtGeneration.me, техноблогер и нейро-евангелист. С самого детства я мечтал научиться играть на каком-нибудь музыкальном инструменте. Я делал много попыток: были две гитары (акустическая и электро), клавиши и даже электронные барабаны. Но мне всегда не хватало усидчивости, и я не чувствовал удовлетворения от освоения инструмента, поэтому забрасывал его. Пробовал также освоить Ableton и FL Studio, но они казались мне слишком сложными. В итоге, к 35 годам я научился играть только на варгане, хотя душа требовала большего — я очень люблю музыку и слушаю ее буквально 24/7.

Нейросети уже дали мне возможность создавать прекрасные изображения, и я думал, как было бы здорово, если бы можно было так же легко создавать музыку. И действительно, около 10 месяцев назад появились такие инструменты, как MusicGen и AudioCraft от Meta*.

Читать дальше →

+34

Lunathecat 8 мая в 12:00

Хороший кроссовер и необычный сабвуфер

Простой

7 мин

Блог компании RUVDS.comДизайнDIY или Сделай самЗвукЭлектроника для начинающих

Кейс

Привет, Хабр! Сегодня я расскажу про свою новую самоделку. Это компактная моноблочная стереоколонка с сабвуфером и 5-вольтовым питанием от USB.

Роль звукоизлучателя сабвуфера выполняет сам корпус устройства, благодаря применению вибрационного громкоговорителя.

Читать дальше →

+54

F5Habr 7 мая в 12:01

Прикладной ИИ: синтез звука

9 мин

1.2K

Блог компании Factory5Научно-популярноеЗвук

Научпоп от дата-сайентиста Factory5 Кирилла Абросимова: рассказываем о том, как развиваются нейронные сети для синтеза звука, и какие ИИ-технологии применяются в этой сфере сегодня.

odmin227 7 мая в 12:00

Откуда Deezer знает, какая музыка нравится новым пользователям?

Сложный

9 мин

3.2K

Алгоритмы*Big Data*Машинное обучение*Научно-популярноеЗвук

Обзор

Привет, Хабр! Меня зовут Данил Картушов. 👋

В этом посте я расскажу, как музыкальная платформа Deezer, используя метаданные, с первых секунд научилась рекомендовать персонализированные треки новым пользователям!

▶️ Начнем!

ru_vds 6 мая в 16:00

Записываем музыку при помощи CSS Grid

Средний

8 мин

6.6K

Блог компании RUVDS.comCSS*HTML*Визуализация данных*Звук

Кейс

Перевод

Слишком часто я наблюдал за тем, как импровизирующий музыкант трясущимися руками пытается увеличить pdf размером A4 на крошечном экране телефона в самом разгаре исполнения. Мы обязаны создать плавный и отзывчивый рендеринг музыки для веба!

В вебе нотная запись должна быть столь же доступной и плавной, как текст; однако пока это не так, и это уязвляет мои чувства. Давайте решим эту актуальную проблему.

Прототип Scribe

SVG, отрендеренный Scribe 0.2

Несколько лет назад я создал прототип рендерера музыки, который назвал Scribe. Он выполняет преобразование JSON в SVG. Изначально я стремился к созданию адаптивного рендерера музыки. Это было хорошее демо, но для дальнейшего развития пришлось бы писать сложный многопроходный движок генерации макетов, а у меня тогда возникли другие дела.

Вскоре после этого я занялся адаптированием Grid под проекты компании, и тут мне почудилось нечто знакомое: я задался вопросом, а не станет ли он решением некоторых проблем, с которыми я столкнулся при разработке Scribe?

Читать дальше →

+62

kkxen 21 апр в 11:08

Как запустить IT-подкаст: прошли этот путь и расскажем обо всех подводных камнях

7 мин

3.4K

Блог компании SelectelИнтернет-маркетинг*Карьера в IT-индустрииЗвукIT-компании

Кейс

Привет! На связи Ксюша Калинина, менеджер команды Influence Marketing и SMM в Selectel. Недавно мы запустили подкаст «Сегодня на ретро» — это было очень интересно, но сложно. Например, мы не знали, что жаркие споры в начале эпизода можно получить, только если разговорить гостей перед записью. Или что нельзя загрузить аудиоверсию подкаста с YouTube на другие площадки. Под катом расскажу о нашем пути и поделюсь подводными камнями, которых мы не ждали.

Читать дальше →

+45

3DSound 20 апр в 07:16

3DStereo, как старый новый формат объёмного звука

Средний

2 мин

1.7K

Звук

Мнение

В этой статье я хочу поделиться со своим видением формата объёмного звука, за которым по моему мнению будущее.

Lunathecat 11 апр в 12:00

EP Booster — гитарная педаль со «вкусом» магнитофона

Простой

8 мин

3.7K

Блог компании RUVDS.comСтарое железоDIY или Сделай самЗвукЭлектроника для начинающих

Ретроспектива

Привет, Хабр! Тем из нас, кто постарше и имели дело с электрогитарой, наверняка доводилось включать её в ламповый магнитофон или радиолу вместо специализированного усилителя. Последнего, скорее всего, просто не было в распоряжении и приходилось обходиться тем, что имелось в наличии.

Несмотря на совсем не гитарный громкоговоритель, нередко получалось звучание, не лишённое красоты, хотя и сильно отличавшееся от фирменного звука наших музыкальных кумиров.

Дело не только в лампах, но и в особенностях передаточной характеристики бытовой звуковоспроизводящей аппаратуры тех лет. И не только мы, но и зарубежные именитые музыканты играли через усилители магнитофонов, по мотивам которых созданы педали эффектов. Сегодня я соберу одну из них.

Читать дальше →

+35

snakers4 11 апр в 06:26

Мы опубликовали датасет для детекции речи размером более 150 тысяч часов на 6000+ языках

Простой

2 мин

2.6K

Big Data*Открытые данные*Машинное обучение*ЗвукNatural Language Processing*

Обзор

Мы выложили в публичный доступ гигантский датасет для детекции речи (voice activity detection).

Датасет содержит порядка 150 тысяч часов аудио более чем на 6,000 языках. Количество уникальных ISO-кодов данного датасета не совпадает с фактическим количеством языков, так как близкие языки могут кодироваться одним и тем же кодом.

Данные были размечены для задачи детекции голоса при временной дискретизации примерно в 30 миллисекунд (или 512 семплов при частоте дискретизации 16 килогерц).

Данный датасет распространяется под лицензией CC BY-NC-SA 4.0.

Давайте смотреть датасет

+18

2 3 ...

118 119

Звук

Как заставить говорить по-русски World Of Warcraft с помощью AI

Новости

Два способа извлечь звуки из данных: как и зачем

Опыт дистилляции моделей распознавания речи

Стереогарнитура с бинауральным звуком, часть 2. Профессиональная звукозапись

Истории

Настройка bluetooth микрофона с шумоподавлением в PipeWire

Новый Век или Парадокс Моравека

Vo(IP) Really Simple: пишем простое VoIP решение

Как создать аудиоплеер. Часть 1. Что под капотом

Как сделать виртуальную АТС на базе VPS

Обзор AудиоКодека NAU8814YG

В погоне за звуком Билли Гиббонса. Часть 1: Purple Plexi

Создание музыки в нейросети Udio, подробная инструкция с примерами от сообщества

Хороший кроссовер и необычный сабвуфер

Ближайшие события

Прикладной ИИ: синтез звука

Откуда Deezer знает, какая музыка нравится новым пользователям?

Записываем музыку при помощи CSS Grid

Прототип Scribe

Как запустить IT-подкаст: прошли этот путь и расскажем обо всех подводных камнях

3DStereo, как старый новый формат объёмного звука

EP Booster — гитарная педаль со «вкусом» магнитофона

Мы опубликовали датасет для детекции речи размером более 150 тысяч часов на 6000+ языках

Вклад авторов