Как стать автором
Обновить
92.41
Рейтинг

Звук

Это «ж-ж-ж» неспроста

Сначала показывать
Порог рейтинга

Как нативно визуализировать голос в iOS

Блог компании Surf Программирование *Разработка под iOS *Разработка мобильных приложений *Звук

Реализовать запись и проигрывание аудиофайлов в iOS несложно. Но если к этому добавляется задача визуализировать звук в момент записи с микрофона, это может вызвать сложности даже у опытного программиста, который мало работал с AVFoundation — мультимедийным фреймворком для работы с аудиовизуальными носителями.

В статье расскажу, как в iOS нативно визуализировать голос в процессе записи и проведу краткий экскурс в физику звукозаписи.

Читать далее
Всего голосов 6: ↑6 и ↓0 +6
Просмотры 765
Комментарии 0

Новости

Как создаются роботы-аватары: а будет ли погружение полным?

Дизайн Робототехника Научно-популярное DIY или Сделай сам Звук

В данной статье хочу рассказать о нашем опыте подготовки и выступления на полуфинале 4-летнего соревнования $10M XPRIZE ANA Avatar по созданию аватар-систем, а также о планах на финал. Конкурс посвящен созданию удаленно-управляемых аватаров, позволяющих человеку физически присутствовать в любой точке пространства, где есть интернет. 

Читать далее
Всего голосов 4: ↑4 и ↓0 +4
Просмотры 672
Комментарии 1

Цифровая линия задержки аудиосигнала PT2399

Блог компании RUVDS.com Научно-популярное DIY или Сделай сам Звук Электроника для начинающих

Привет, Хабр! Сегодня расскажу про очень доступную, дешёвую и популярную микросхему, ставшую и продолжающую становиться основой для множества звуковых эффектов. Соберу на её основе эффект эхо (delay) и ревербератор — имитацию помещения или пространства.
Здесь ждут подробности, с видео и примерами звучания.
Всего голосов 46: ↑45 и ↓1 +44
Просмотры 5.3K
Комментарии 9

Немного примеров/мыслей навеянных датой 1 Мая…

Прототипирование *Дизайн DIY или Сделай сам Звук Электроника для начинающих

Вчера прилетела "напоминалка" с одного "нынче в опале" ресурса, о том, что два года назад я поделился с друзьями/подписчиками своим свежим опытом общения с современными "производственниками"...

Выполняю их рекомендации-пожелания (поделиться на HABR), примерно в ключе "лучше поздно, чем никогда" :)

Те кто связан с производством-разработкой в этой статье вряд ли найдут для себя нечто новое, ну а тем, кто только начинает "раскрывать глаза", возможно и пригодиться ...

Текст будет скопирован почти 1:1, там где надо, возможно будут вставки-пояснения [выделение прямыми скобками+курсивом].

Поехали ! (С)

много букв и немного фото/картинок
Всего голосов 25: ↑19 и ↓6 +13
Просмотры 4.3K
Комментарии 2

«Утренний аудиокофе»: обсуждаем микроподкасты

Блог компании Аудиомания Медийная реклама Контент-маркетинг Звук

Разговорные аудиошоу набирают обороты, и на них все чаще обращают внимание стриминговые площадки. Но особый интерес они проявляют к компактными передачам продолжительностью не более десяти минут. Рассказываем, в чем тут дело.

Читать далее
Всего голосов 4: ↑4 и ↓0 +4
Просмотры 1.3K
Комментарии 0

«Синхронизируй это»: компактный обзор примечательных решений и протоколов для передачи звука по Ethernet

Блог компании Аудиомания IT-стандарты *Звук

На неделе один из участников Hacker News запустил тематический тред с целью узнать, как «связать» компьютер, колонки и другую акустику в единую звуковую систему.

Мы решили рассмотреть несколько стандартов, которые используют музыканты в студиях, а также open source решения, доступные для развертки любому аудиоману.

Читать далее
Всего голосов 6: ↑5 и ↓1 +4
Просмотры 2.6K
Комментарии 2

Музыка как код — опробовать концепцию можно прямо в браузере

Блог компании Аудиомания Программирование *Облачные сервисы Софт Звук

Существует множество языков для музыкального программирования. О некоторых из них, например, Sporth или ORCA, мы рассказывали в блоге. Сегодня поговорим о проекте Harmonicon — браузерном DAW, реализующем концепцию music-as-code.

Читать далее
Всего голосов 9: ↑9 и ↓0 +9
Просмотры 3.3K
Комментарии 4

Аудиодайджест — материалы из «Мира Hi-Fi»: муз. сервисы для свободного творчества, технологии и подборки для чтения

Блог компании Аудиомания Читальный зал Гаджеты Звук

На выходных мы решили вновь поделиться избранными материалами из нашего «Мира Hi-Fi». Обсуждаем примечательные технологии, сервисы и аудиоконтент.

Читать далее
Всего голосов 4: ↑4 и ↓0 +4
Просмотры 1.1K
Комментарии 0

Сам себе орнитолог — нейросеть поможет распознать птиц по их пению

Блог компании Аудиомания Open source *Периферия Звук Экология

Расскажем о проекте, который используют орнитологи-любители и ученые, и библиотеках с записями тысяч песен пернатых — в том числе для коммерческого использования.

Читать далее
Всего голосов 7: ↑7 и ↓0 +7
Просмотры 1.6K
Комментарии 6

Музыка на удаленке — утилита для джема с друзьями по сети с нестандартным подходом к работе с задержками

Блог компании Аудиомания Облачные сервисы Софт Лайфхаки для гиков Звук

Мы уже рассказывали об утилите FarPlay, которая позволяет передавать аудио с минимальными задержками и писать музыку с коллегами по цеху, находящимся за сотни километров. Сегодня продолжим тему и поговорим о Ninjam, авторы которого нашли интересный подход к проблеме рассинхронизации звука.

Читать далее
Всего голосов 7: ↑7 и ↓0 +7
Просмотры 2.3K
Комментарии 0

Как мы слушаем и разбираем каждый звонок в банк

Блог компании Home Credit Bank Управление проектами *Звук Natural Language Processing *


Сначала DSS LAB делает голос-текст, потом LSTM-классификаторы, сущности Spacy + Yargy (Natasha), лемматизация Pymorphy2, правки Fasttext и Word2Vec, 3 разных суммаризатора и наши решения. Мы можем анализировать ваш голос не только для того, чтобы понимать, о чём ведётся диалог, но и для того, чтобы искать места улучшений банковских продуктов после диалога.

Например, по распознаванию некоторых ключевых слов в речи вроде «аккредитив» или «эскроу» оператору показывается справка, по названиям депозитов — их точные тарифы и так далее. Нажимать при этом ничего не надо. Возможность сейчас обкатывается в бете.

Пример:

На входе: «…почему мне откапывает банкомат с переводом в другой банк».
Коррекция: «почему мне отказывает банкомат с переводом в другой банк».
Выделенное ключевое сообщение: «отказывает банкомат».
Действие: оператору предлагается маршрутизация звонка, звонок классифицируется для статистики.

Само распознавание устроено следующим образом:

  1. Голос раскладывается на фонемы. Фонемы собираются в слова тем же решением.
  2. Из собираемых данных удаляются различные клиентские данные: номера карт, кодовые слова и так далее.
  3. Затем полученный поток слов снабжается пунктуацией (точками и запятыми) и заглавными буквами: это нужно для нейросетей, очень чувствительных к такому. Исправляются опечатки, корректируются термины (география).
  4. И на выходе получаются текстовые диалоги, как в чате: их анализирует уже нейросеть, пытающаяся привязать смысл в реальном времени.
  5. После окончания звонка тексты также анализируются нейросетями, отвечающими за сбор разных метрик по голосовой и чат-поддержке.

Давайте покажу реальные (обезличенные) примеры диалогов, чтобы было понятнее.
Читать дальше →
Всего голосов 34: ↑27 и ↓7 +20
Просмотры 6.1K
Комментарии 24

“Сигма дельта” или как сделать хорошую звуковую карту из STM32F401

Open source *Программирование микроконтроллеров *Старое железо DIY или Сделай сам Звук
Tutorial

Жене мешают смотреть последние новости из телефона и телевизора, приходящие поесть (первично ?) и поиграть на компьютере (вторично?) внуки. Она их конечно любит , но звуки их взаимодействия с компьютером ее сильно раздражают. Пришлось надеть на внуков наушники. А звуковой выход у компа в неудобном месте и каждый хочет со своей громкостью. Ну пришлось разработать внешнюю USB звуковую карточку. Хочется и красиво и качественно. Впрочем, внуки скорее , только повод для поностальгировать по своей старой специальности радиоконструктора и вообще, так как последние двадцать с лишним лет я далеко от нее и пишу заклинания программы реконструкции изображений для медицинских томографов в больших и не очень фирмах , то есть энжинер-погромист по специальности. Хотел написать статью на эту очень интересную и важную тему (компьютерная томография), но выяснилось что мне нельзя по условиям контракта ...

Итак вернемся к нашим баранам внукам и звуковым карточкам, у нас есть в нескольких экземплярах(овер дофига,купил пока были дешевые) модули из Китая:

1. Stm32f401ccu6 black pill – сейчас $3 за штучку

2. I2S DAC Decoder GY-PCM5102 ->$3.5 за штучку

3 .SPI display ips 1.3 inch 240x240 (controller st7789) ->$7 за два

Сначала построим максимальную конфигурацию из двух экранов и I2S GY-PCM5102.

Конфигурируем куб, разбавляем его говно код своим г. кодом, добавляем ФАПЧ ( фазовой автоматической подстройки частоты или PLL на ихнем ) , для согласования скоростей приходящих от компьютера данных и выдачи на i2s внешний ЦАП (DAC). Хмм , звучит очень неплохо, явно лучше большинства встроенных звуковушек. PCM5102 – весьма и весьма качественный ЦАП за свою цену в пару- тройку долларов за модуль с чипом. Добавляем отображение индикаторов уровня на паре неплохих дисплеев st7789 ...

Итак вернемся
Всего голосов 42: ↑41 и ↓1 +40
Просмотры 9.9K
Комментарии 60

Настроить программный модем — поможет minimodem

Блог компании Аудиомания Гаджеты Старое железо Периферия Звук

Можно сказать, что модемы перешли в разряд ретротехнологий. Но чтобы поработать с ними сегодня, необязательно приобретать физический девайс. Для установки соединения по аудиоканалу достаточно звуковой карты и open source утилиты minimodem.

Читать далее
Всего голосов 18: ↑16 и ↓2 +14
Просмотры 5.1K
Комментарии 30

Как сделать звукозаписывающую студию в домашних условиях. Интервью с SERZH — музыкантом и звукорежиссёром

Лайфхаки для гиков Звук Интервью

Год назад в Ютубе мне попался видеоклип на песню «Катарсис». Песня, скажем так, неплохая, но в мой плейлист она не попала. Меня заинтересовал, в первую очередь, тот факт, что там снялся писатель-фантаст и видеоблогер Сурен Цормудян, поклонником коего я являюсь. А недавно мне довелось связаться с самим автором песни — музыкантом по имени SERZH, и взять у него интервью.
Читать дальше →
Всего голосов 15: ↑14 и ↓1 +13
Просмотры 4.1K
Комментарии 2

Как перенести треки из Spotify в Яндекс.Музыку (полное руководство)

Смартфоны Звук
Из песочницы
Tutorial

Недавно компания Spotify заявила о временном уходе с рынка РФ. Сейчас не понятно, что будет с аккаунтами российских пользователей и сохраненной ими музыкой, поэтому самое время позаботиться о переносе своих любимых треков в другой сервис.

Читать далее
Всего голосов 20: ↑16 и ↓4 +12
Просмотры 11K
Комментарии 53

Свести дорожки, добавить эффекты в браузере — поможет TwistedWave

Блог компании Аудиомания Облачные сервисы Звук

На прошлой неделе мы рассказали о компактном инструменте AudioMass. Он позволяет «нарезать» звуковую дорожку прямо в браузере. Сегодня поговорим о другом аудиоредакторе, который тоже не требует установки специальных приложений.

Читать далее
Всего голосов 9: ↑8 и ↓1 +7
Просмотры 1.4K
Комментарии 1

Немного о 35 мм кинопленке и цифровом аудио

Блог компании RUVDS.com Работа с видео *Обработка изображений *Видеотехника Звук
Перевод

Вспомним, что это была за 35 мм киноплёнка, и какими способами на ней кодировались аудиоданные. В частности, обратим внимание на технологию Dolby Digital и попутно заглянем в патент, который поможет прояснить некоторые детали.
Читать дальше →
Всего голосов 59: ↑56 и ↓3 +53
Просмотры 6K
Комментарии 11

Пишем аудио-разведчик своими руками

Программирование *C *Разработка под Linux *Разработка под Windows *Звук
Tutorial

Было бы здорово иногда иметь под рукой программку, которая в наше отсутствие умеет записывать звук со встроенного микрофона нашего ноутбука и передавать его по сети на другой наш комьютер. А тот, в свою очередь, этот звук умел бы воспроизводить в режиме реального времени. Давай попробуем самостоятельно написать такую программу, тем более что это, как оказывается, не так уж и сложно.

Что мы в итоге хотим получить и какой алгоритм работы реализовать:

1. Сервер, который запускается на той машине, пространство вокруг которой мы хотим прослушивать. Он тихо ждёт, пока к нему не подключится клиент. Затем он открывает устройство записи звука, настроенное по умолчанию в системе, и начинает передавать аудио поток на машину клиента. При отключении клиента от сервера, звуковое устройство закрывается, чтобы не тратить ресурсы зря.

2. Клиент, который подключается к серверу и начинает принимать аудио поток и воспроизводить его в режиме реального времени. Для того, чтобы клиент мог правильно (в нужном формате) открыть устройство воспроизведения звука, он получает нужную мета информацию от сервера в Hello сообщении.

Читать далее
Всего голосов 5: ↑5 и ↓0 +5
Просмотры 3.5K
Комментарии 3

Теперь наш публичный синтез в супер-высоком качестве, в 10 раз быстрее и без детских болячек

Машинное обучение *DIY или Сделай сам Звук Natural Language Processing *Голосовые интерфейсы

hero_image


В нашей прошлой статье про синтез речи мы дали много обещаний: убрать детские болячки, радикально ускорить синтез еще в 10 раз, добавить новые "фишечки", радикально улучшить качество.


Сейчас, вложив огромное количество работы, мы наконец готовы поделиться с сообществом своими успехами:


  • Снизили размер модели в 2 раза;
  • Научили наши модели делать паузы;
  • Добавили один высококачественный голос (и бесконечное число случайных);
  • Ускорили наши модели где-то примерно в 10 раз (!);
  • Упаковали всех спикеров одного языка в одну модель;
  • Наши модели теперь могут принимать на вход даже целые абзацы текста;
  • Добавили функции контроля скорости и высоты речи через SSML;
  • Наш синтез работает сразу в трех частотах дискретизации на выбор — 8, 24 и 48 килогерц;
  • Решили детские проблемы наших моделей: нестабильность и пропуск слов, и добавили флаги для контроля ударения;

Это по-настоящему уникальное и прорывное достижение и мы не собираемся останавливаться. В ближайшее время мы добавим большое количество моделей на разных языках и напишем целый ряд публикаций на эту и смежные темы, а также продолжим делать наши модели лучше (например, еще в 2-5 раз быстрее).


Попробовать модель как обычно можно в нашем репозитории и в колабе.

Читать дальше →
Всего голосов 157: ↑156 и ↓1 +155
Просмотры 17K
Комментарии 90

Build.prop — улучшение качества звука

Разработка под Android *Гаджеты Звук

Почти каждый, кто хоть раз ставил ROOT-права на Android, слышал про такой файл как build.prop и твики для него. В этой статье мы рассмотрим все строки данного файла с помощью которых можно улучшить качество звучания смартфона и включить полезные функции, которые были отключены по умолчанию в системе.

Читать далее
Всего голосов 5: ↑4 и ↓1 +3
Просмотры 2K
Комментарии 5

Вклад авторов