Как стать автором
Обновить
53.84

Звук

Это «ж-ж-ж» неспроста

Сначала показывать
Порог рейтинга
Уровень сложности

Как заставить говорить по-русски World Of Warcraft с помощью AI

Уровень сложностиСложный
Время на прочтение18 мин
Количество просмотров243

Здравствуйте-здравствуйте, играю я значит в классический World of Warcraft и понимаю, что игра тосклива из-за отсутствия более-менее озвученных квестов. Конечно, инди-студия Метелица не способна озвучить всю свою игру, да и понятно, что сюжет развивается, а люди имеют свойство менять работу или, да это печально, физической гибели, как например случилось с озвучкой Артаса Менетила в Warcraft III: Frozen Throne.

В общем, заваривайте чай, как и все мои предыдущие публикации, эта статья в формате (б|в)лога.

Читать далее
Всего голосов 2: ↑2 и ↓0+2
Комментарии2

Новости

Два способа извлечь звуки из данных: как и зачем

Время на прочтение12 мин
Количество просмотров919

В рамках проекта «Лаборатория цифровой философии» специалисты из СПбГУ занимаются разработками в сфере сонификации данных. Сонификация данных — относительно новая дисциплина, которая занимается преобразованием различных текстовых данных в звук.

Такие преобразования позволяют, например, людям с различными проблемами зрения услышать, как звучат научные достижения, открытия и даже исторические события. Кроме того, преобразование данных в звук упрощает анализ научных данных.  

Читать далее
Всего голосов 5: ↑5 и ↓0+9
Комментарии16

Опыт дистилляции моделей распознавания речи

Уровень сложностиСредний
Время на прочтение5 мин
Количество просмотров957

Небольшая история про наш опыт дистилляции моделей для распознавания речи. Как у нас получилось уменьшить модель в 160 раз и не проиграть по качеству.

Читать далее
Всего голосов 5: ↑5 и ↓0+7
Комментарии3

Стереогарнитура с бинауральным звуком, часть 2. Профессиональная звукозапись

Уровень сложностиСредний
Время на прочтение4 мин
Количество просмотров697

Продолжение первой статьи, в котором я хочу рассказать о звукозаписи с гарнитуры при помощи полевого рекордера Zoom F3.

Читать далее
Всего голосов 1: ↑1 и ↓0+3
Комментарии4

Истории

Настройка bluetooth микрофона с шумоподавлением в PipeWire

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров984

В череде дней «длинных» майских праздников решил развернуть голосовой помощник на сервере домашней автоматизации Home Assistant. Мой домашний сервер работает под управлением ОС Ubuntu Server 23.10 и не имеет никаких предустановленных источников или приемников аудио и видео информации. В Ubuntu были установлены аудиосервер PipeWire и менеджер сеансов WirePlumber. Такой выбор был продиктован тем, что эти приложения являются стандартным ПО по обработке аудио и видео потоков в Linux. В сети мне не удалось обнаружить какого-либо полного описания процесса настройки, и эта статья, в некоторой степени, восполняет этот пробел.

Читать далее
Всего голосов 1: ↑1 и ↓0+1
Комментарии2

Новый Век или Парадокс Моравека

Время на прочтение3 мин
Количество просмотров2.3K

Добрый день, уважаемые хабровчане!

Этот пост немного нестандартный для меня, потому что в нем я не буду рассказывать вам про код, а вместо этого расскажу вам про дебютный киберпанк‑альбом «Новый Век или Парадокс Моравека» от нашего небольшого творческого коллектива «Тандем Модемов».

Я думаю, ни для кого не секрет, что последнее время технология генеративного ИИ развивается ошеломительными темпами. Совсем недавно стали публично доступны такие сервисы как  Udio которые позволяют по заданному тексту и промпту сгенерировать вполне достойное музыкальное произведение.

Так как мы с друзьями периодически пишем стихи на волнующие нас темы, было бы странно не воспользоваться таким шансом и не превратить их в песни.

А так как помимо Udio есть еще Midjourney и Dall‑e для генерации графики, а также бесплатный (пока) Haiper для анимации, мы решили собрать полноценный альбом, состоящих из четырех музыкальных видео.

Надеюсь, в эти нелегкие времена наши песни передадут вам частичку нашего оптимизма и уверенности в светлом будущем всего человечества.

Приятного просмотра!
Всего голосов 16: ↑13 и ↓3+21
Комментарии3

Vo(IP) Really Simple: пишем простое VoIP решение

Уровень сложностиСредний
Время на прочтение13 мин
Количество просмотров1.6K

Будучи поклонником suckless философии, минимализма и простоты в программном обеспечении, я не нахожу простых и маленьких VoIP решений. Программ связанных с VoIP очень много. Но это либо колоссальные системы для построения SIP-based экосистемы, либо что-то из мира WebRTC. Особняком выделяю Mumble -- популярное решение среди геймеров: централизованный сервер, указываешь его адрес и вот уже слышишь в наушниках другого человека. А нет ли чего ещё попроще?

Читать далее
Всего голосов 5: ↑4 и ↓1+3
Комментарии4

Как создать аудиоплеер. Часть 1. Что под капотом

Уровень сложностиСредний
Время на прочтение6 мин
Количество просмотров4.9K

Всем привет! Меня зовут Дмитрий Булгаков, я Android-разработчик в HiFi-стриминге Звук, и я расскажу, как можно создать аудиоплеер в приложении. Поговорим об инструментах разработки и устройстве плеера —  разберем его «анатомию», компоненты и их применение, а также способы улучшения звука с помощью эквалайзера.

Для вашего удобства гайд разделён на несколько основных частей. В первой расскажу об актуальных инструментах разработки плеера и о том, что у него «под капотом».

Поехали!

Читать далее
Всего голосов 15: ↑12 и ↓3+11
Комментарии7

Как сделать виртуальную АТС на базе VPS

Уровень сложностиПростой
Время на прочтение6 мин
Количество просмотров8.3K


Несмотря на популярность мессенджеров и телеконференций, ни один офис ещё не отказался от телефонной связи. Люди такие существа, что иногда предпочитают общаться голосом.

В каждом офисе установлена мини-АТС, которая коммутирует внутренние звонки. Телефоны сотрудников подключаются к коммуникационному шкафу или коробочке с Asterisk (как на КДПВ), а она подключена к телефонной сети общего пользования (PSTN или ТСОП). Таким образом, сотню офисных телефонов можно повесить на один внешний номер. В общем, мини-АТС — совершенно необходимая вещь.

Виртуальная или облачная АТС (hosted PBX) — это услуга для компаний, которая заменяет им обычную офисную АТС. Вместо того, чтобы покупать специализированное телекоммуникационное оборудование или выделять отдельный компьютер с Asterisk, они заказывают услугу на удалённом хостинге. И этот компьютер с Asterisk (IP-АТС) физически размещается у провайдера. Таким образом, виртуализация добралась и до АТС, всё в русле современных тенденций.
Читать дальше →
Всего голосов 23: ↑21 и ↓2+30
Комментарии45

Обзор AудиоКодека NAU8814YG

Уровень сложностиПростой
Время на прочтение10 мин
Количество просмотров3.3K

Аудио кодек по сути это цифро-аналоговое устройство, где есть пара ADC + DAC. На входе обычно есть сумматор на операционных усилителях для подмешивания аналогово сигнала с разных проводов, есть еще аналоговые усилители. Высокоскоростной многоканальный интерфейс: I2S или TDM. И интерфейс I2C для того чтобы всем этим добром управлять.

В этой заметке я написал о своём опыте работы с ASIC аудиокодеком NAU8814.

Читать далее
Всего голосов 18: ↑15 и ↓3+17
Комментарии17

В погоне за звуком Билли Гиббонса. Часть 1: Purple Plexi

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров3.3K


Привет, Хабр! Purple Plexi — это педаль гитарного эффекта искажения (дисторшн), повторяющая характер звучания усилителя Marshall Super Lead 1959 модели. Материал его передней панели выглядел как оргстекло (плексиглас), за что усилитель получил в среде музыкантов прозвище «Плекси».
Читать дальше →
Всего голосов 25: ↑25 и ↓0+35
Комментарии2

Создание музыки в нейросети Udio, подробная инструкция с примерами от сообщества

Уровень сложностиПростой
Время на прочтение17 мин
Количество просмотров10K


Друзья, всем привет! Меня зовут Илья, я основатель онлайн-нейросети для создания изображений ArtGeneration.me, техноблогер и нейро-евангелист. С самого детства я мечтал научиться играть на каком-нибудь музыкальном инструменте. Я делал много попыток: были две гитары (акустическая и электро), клавиши и даже электронные барабаны. Но мне всегда не хватало усидчивости, и я не чувствовал удовлетворения от освоения инструмента, поэтому забрасывал его. Пробовал также освоить Ableton и FL Studio, но они казались мне слишком сложными. В итоге, к 35 годам я научился играть только на варгане, хотя душа требовала большего — я очень люблю музыку и слушаю ее буквально 24/7.


Нейросети уже дали мне возможность создавать прекрасные изображения, и я думал, как было бы здорово, если бы можно было так же легко создавать музыку. И действительно, около 10 месяцев назад появились такие инструменты, как MusicGen и AudioCraft от Meta*.


Читать дальше →
Всего голосов 25: ↑24 и ↓1+34
Комментарии13

Хороший кроссовер и необычный сабвуфер

Уровень сложностиПростой
Время на прочтение7 мин
Количество просмотров6K


Привет, Хабр! Сегодня я расскажу про свою новую самоделку. Это компактная моноблочная стереоколонка с сабвуфером и 5-вольтовым питанием от USB.

Роль звукоизлучателя сабвуфера выполняет сам корпус устройства, благодаря применению вибрационного громкоговорителя.
Читать дальше →
Всего голосов 44: ↑44 и ↓0+54
Комментарии11

Ближайшие события

Антиконференция X5 Future Night
Дата30 мая
Время11:00 – 23:00
Место
Онлайн
OTUS CONF: GameDev
Дата30 мая
Время19:00 – 20:30
Место
Онлайн
Конференция «IT IS CONF 2024»
Дата20 июня
Время09:00 – 19:00
Место
Екатеринбург
Summer Merge
Дата28 – 30 июня
Время11:00
Место
Ульяновская область

Прикладной ИИ: синтез звука

Время на прочтение9 мин
Количество просмотров1.2K

Научпоп от дата-сайентиста Factory5 Кирилла Абросимова: рассказываем о том, как развиваются нейронные сети для синтеза звука, и какие ИИ-технологии применяются в этой сфере сегодня.

Читать далее
Всего голосов 2: ↑2 и ↓0+3
Комментарии2

Откуда Deezer знает, какая музыка нравится новым пользователям?

Уровень сложностиСложный
Время на прочтение9 мин
Количество просмотров3.2K

Привет, Хабр! Меня зовут Данил Картушов. 👋

В этом посте я расскажу, как музыкальная платформа Deezer, используя метаданные, с первых секунд научилась рекомендовать персонализированные треки новым пользователям!

▶️ Начнем!
Всего голосов 7: ↑4 и ↓3+2
Комментарии8

Записываем музыку при помощи CSS Grid

Уровень сложностиСредний
Время на прочтение8 мин
Количество просмотров6.6K
Слишком часто я наблюдал за тем, как импровизирующий музыкант трясущимися руками пытается увеличить pdf размером A4 на крошечном экране телефона в самом разгаре исполнения. Мы обязаны создать плавный и отзывчивый рендеринг музыки для веба!

В вебе нотная запись должна быть столь же доступной и плавной, как текст; однако пока это не так, и это уязвляет мои чувства. Давайте решим эту актуальную проблему.

Прототип Scribe


SVG, отрендеренный Scribe 0.2

Несколько лет назад я создал прототип рендерера музыки, который назвал Scribe. Он выполняет преобразование JSON в SVG. Изначально я стремился к созданию адаптивного рендерера музыки. Это было хорошее демо, но для дальнейшего развития пришлось бы писать сложный многопроходный движок генерации макетов, а у меня тогда возникли другие дела.

Вскоре после этого я занялся адаптированием Grid под проекты компании, и тут мне почудилось нечто знакомое: я задался вопросом, а не станет ли он решением некоторых проблем, с которыми я столкнулся при разработке Scribe?
Читать дальше →
Всего голосов 54: ↑54 и ↓0+62
Комментарии17

Как запустить IT-подкаст: прошли этот путь и расскажем обо всех подводных камнях

Время на прочтение7 мин
Количество просмотров3.4K

Привет! На связи Ксюша Калинина, менеджер команды Influence Marketing и SMM в Selectel. Недавно мы запустили подкаст «Сегодня на ретро» — это было очень интересно, но сложно. Например, мы не знали, что жаркие споры в начале эпизода можно получить, только если разговорить гостей перед записью. Или что нельзя загрузить аудиоверсию подкаста с YouTube на другие площадки. Под катом расскажу о нашем пути и поделюсь подводными камнями, которых мы не ждали.
Читать дальше →
Всего голосов 40: ↑35 и ↓5+45
Комментарии5

3DStereo, как старый новый формат объёмного звука

Уровень сложностиСредний
Время на прочтение2 мин
Количество просмотров1.7K

В этой статье я хочу поделиться со своим видением формата объёмного звука, за которым по моему мнению будущее.

Читать далее
Всего голосов 5: ↑2 и ↓3+3
Комментарии0

EP Booster — гитарная педаль со «вкусом» магнитофона

Уровень сложностиПростой
Время на прочтение8 мин
Количество просмотров3.7K


Привет, Хабр! Тем из нас, кто постарше и имели дело с электрогитарой, наверняка доводилось включать её в ламповый магнитофон или радиолу вместо специализированного усилителя. Последнего, скорее всего, просто не было в распоряжении и приходилось обходиться тем, что имелось в наличии.

Несмотря на совсем не гитарный громкоговоритель, нередко получалось звучание, не лишённое красоты, хотя и сильно отличавшееся от фирменного звука наших музыкальных кумиров.

Дело не только в лампах, но и в особенностях передаточной характеристики бытовой звуковоспроизводящей аппаратуры тех лет. И не только мы, но и зарубежные именитые музыканты играли через усилители магнитофонов, по мотивам которых созданы педали эффектов. Сегодня я соберу одну из них.
Читать дальше →
Всего голосов 29: ↑29 и ↓0+35
Комментарии6

Мы опубликовали датасет для детекции речи размером более 150 тысяч часов на 6000+ языках

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров2.6K

Мы выложили в публичный доступ гигантский датасет для детекции речи (voice activity detection).

Датасет содержит порядка 150 тысяч часов аудио более чем на 6,000 языках. Количество уникальных ISO-кодов данного датасета не совпадает с фактическим количеством языков, так как близкие языки могут кодироваться одним и тем же кодом.

Данные были размечены для задачи детекции голоса при временной дискретизации примерно в 30 миллисекунд (или 512 семплов при частоте дискретизации 16 килогерц).

Данный датасет распространяется под лицензией CC BY-NC-SA 4.0.

Давайте смотреть датасет
Всего голосов 17: ↑15 и ↓2+18
Комментарии13
1
23 ...

Вклад авторов