Звук

Это «ж-ж-ж» неспроста

Как нативно визуализировать голос в iOS

Блог компании Surf Программирование *Разработка под iOS *Разработка мобильных приложений *Звук

Реализовать запись и проигрывание аудиофайлов в iOS несложно. Но если к этому добавляется задача визуализировать звук в момент записи с микрофона, это может вызвать сложности даже у опытного программиста, который мало работал с AVFoundation — мультимедийным фреймворком для работы с аудиовизуальными носителями.

В статье расскажу, как в iOS нативно визуализировать голос в процессе записи и проведу краткий экскурс в физику звукозаписи.

765

DragonTreeLabs 4 мая в 16:54

Как создаются роботы-аватары: а будет ли погружение полным?

Дизайн Робототехника Научно-популярное DIY или Сделай сам Звук

В данной статье хочу рассказать о нашем опыте подготовки и выступления на полуфинале 4-летнего соревнования $10M XPRIZE ANA Avatar по созданию аватар-систем, а также о планах на финал. Конкурс посвящен созданию удаленно-управляемых аватаров, позволяющих человеку физически присутствовать в любой точке пространства, где есть интернет.

672

Lunathecat 3 мая в 12:00

Цифровая линия задержки аудиосигнала PT2399

Блог компании RUVDS.com Научно-популярное DIY или Сделай сам Звук Электроника для начинающих

Привет, Хабр! Сегодня расскажу про очень доступную, дешёвую и популярную микросхему, ставшую и продолжающую становиться основой для множества звуковых эффектов. Соберу на её основе эффект эхо (delay) и ревербератор — имитацию помещения или пространства.

Здесь ждут подробности, с видео и примерами звучания.

+44

5.3K

TVExpert 2 мая в 08:27

Немного примеров/мыслей навеянных датой 1 Мая…

Прототипирование *Дизайн DIY или Сделай сам Звук Электроника для начинающих

Вчера прилетела "напоминалка" с одного "нынче в опале" ресурса, о том, что два года назад я поделился с друзьями/подписчиками своим свежим опытом общения с современными "производственниками"...

Выполняю их рекомендации-пожелания (поделиться на HABR), примерно в ключе "лучше поздно, чем никогда" :)

Те кто связан с производством-разработкой в этой статье вряд ли найдут для себя нечто новое, ну а тем, кто только начинает "раскрывать глаза", возможно и пригодиться ...

Текст будет скопирован почти 1:1, там где надо, возможно будут вставки-пояснения [выделение прямыми скобками+курсивом].

Поехали ! (С)

много букв и немного фото/картинок

+13

4.3K

mirhifi 25 апреля в 17:10

«Утренний аудиокофе»: обсуждаем микроподкасты

Блог компании Аудиомания Медийная реклама Контент-маркетинг Звук

Разговорные аудиошоу набирают обороты, и на них все чаще обращают внимание стриминговые площадки. Но особый интерес они проявляют к компактными передачам продолжительностью не более десяти минут. Рассказываем, в чем тут дело.

1.3K

mirhifi 24 апреля в 20:20

«Синхронизируй это»: компактный обзор примечательных решений и протоколов для передачи звука по Ethernet

Блог компании Аудиомания IT-стандарты *Звук

На неделе один из участников Hacker News запустил тематический тред с целью узнать, как «связать» компьютер, колонки и другую акустику в единую звуковую систему.

Мы решили рассмотреть несколько стандартов, которые используют музыканты в студиях, а также open source решения, доступные для развертки любому аудиоману.

2.6K

mirhifi 23 апреля в 21:47

Музыка как код — опробовать концепцию можно прямо в браузере

Блог компании Аудиомания Программирование *Облачные сервисы Софт Звук

Существует множество языков для музыкального программирования. О некоторых из них, например, Sporth или ORCA, мы рассказывали в блоге. Сегодня поговорим о проекте Harmonicon — браузерном DAW, реализующем концепцию music-as-code.

3.3K

Audioman 23 апреля в 14:29

Аудиодайджест — материалы из «Мира Hi-Fi»: муз. сервисы для свободного творчества, технологии и подборки для чтения

Блог компании Аудиомания Читальный зал Гаджеты Звук

На выходных мы решили вновь поделиться избранными материалами из нашего «Мира Hi-Fi». Обсуждаем примечательные технологии, сервисы и аудиоконтент.

1.1K

mirhifi 23 апреля в 00:01

Сам себе орнитолог — нейросеть поможет распознать птиц по их пению

Блог компании Аудиомания Open source *Периферия Звук Экология

Расскажем о проекте, который используют орнитологи-любители и ученые, и библиотеках с записями тысяч песен пернатых — в том числе для коммерческого использования.

1.6K

mirhifi 22 апреля в 21:58

Музыка на удаленке — утилита для джема с друзьями по сети с нестандартным подходом к работе с задержками

Блог компании Аудиомания Облачные сервисы Софт Лайфхаки для гиков Звук

Мы уже рассказывали об утилите FarPlay, которая позволяет передавать аудио с минимальными задержками и писать музыку с коллегами по цеху, находящимся за сотни километров. Сегодня продолжим тему и поговорим о Ninjam, авторы которого нашли интересный подход к проблеме рассинхронизации звука.

2.3K

sergey_serov 21 апреля в 14:01

Как мы слушаем и разбираем каждый звонок в банк

Блог компании Home Credit Bank Управление проектами *Звук Natural Language Processing *

Сначала DSS LAB делает голос-текст, потом LSTM-классификаторы, сущности Spacy + Yargy (Natasha), лемматизация Pymorphy2, правки Fasttext и Word2Vec, 3 разных суммаризатора и наши решения. Мы можем анализировать ваш голос не только для того, чтобы понимать, о чём ведётся диалог, но и для того, чтобы искать места улучшений банковских продуктов после диалога.

Например, по распознаванию некоторых ключевых слов в речи вроде «аккредитив» или «эскроу» оператору показывается справка, по названиям депозитов — их точные тарифы и так далее. Нажимать при этом ничего не надо. Возможность сейчас обкатывается в бете.

Пример:

На входе: «…почему мне откапывает банкомат с переводом в другой банк».
Коррекция: «почему мне отказывает банкомат с переводом в другой банк».
Выделенное ключевое сообщение: «отказывает банкомат».
Действие: оператору предлагается маршрутизация звонка, звонок классифицируется для статистики.

Само распознавание устроено следующим образом:

Голос раскладывается на фонемы. Фонемы собираются в слова тем же решением.
Из собираемых данных удаляются различные клиентские данные: номера карт, кодовые слова и так далее.
Затем полученный поток слов снабжается пунктуацией (точками и запятыми) и заглавными буквами: это нужно для нейросетей, очень чувствительных к такому. Исправляются опечатки, корректируются термины (география).
И на выходе получаются текстовые диалоги, как в чате: их анализирует уже нейросеть, пытающаяся привязать смысл в реальном времени.
После окончания звонка тексты также анализируются нейросетями, отвечающими за сбор разных метрик по голосовой и чат-поддержке.

Давайте покажу реальные (обезличенные) примеры диалогов, чтобы было понятнее.

Читать дальше →

+20

6.1K

Sdima1357 20 апреля в 20:42

“Сигма дельта” или как сделать хорошую звуковую карту из STM32F401

Open source *Программирование микроконтроллеров *Старое железо DIY или Сделай сам Звук

Tutorial

Жене мешают смотреть последние новости из телефона и телевизора, приходящие поесть (первично ?) и поиграть на компьютере (вторично?) внуки. Она их конечно любит , но звуки их взаимодействия с компьютером ее сильно раздражают. Пришлось надеть на внуков наушники. А звуковой выход у компа в неудобном месте и каждый хочет со своей громкостью. Ну пришлось разработать внешнюю USB звуковую карточку. Хочется и красиво и качественно. Впрочем, внуки скорее , только повод для поностальгировать по своей старой специальности радиоконструктора и вообще, так как последние двадцать с лишним лет я далеко от нее и пишу ~~заклинания~~ программы реконструкции изображений для медицинских томографов в больших и не очень фирмах , то есть энжинер-погромист по специальности. Хотел написать статью на эту очень интересную и важную тему (компьютерная томография), но выяснилось что мне нельзя по условиям контракта ...

Итак вернемся к нашим ~~баранам~~ внукам и звуковым карточкам, у нас есть в нескольких экземплярах(овер дофига,купил пока были дешевые) модули из Китая:

1. Stm32f401ccu6 black pill – сейчас $3 за штучку

2. I2S DAC Decoder GY-PCM5102 ->$3.5 за штучку

3 .SPI display ips 1.3 inch 240x240 (controller st7789) ->$7 за два

Сначала построим максимальную конфигурацию из двух экранов и I2S GY-PCM5102.

Конфигурируем куб, разбавляем его ~~говно~~ код своим г. кодом, добавляем ФАПЧ ( фазовой автоматической подстройки частоты или PLL на ихнем ) , для согласования скоростей приходящих от компьютера данных и выдачи на i2s внешний ЦАП (DAC). Хмм , звучит очень неплохо, явно лучше большинства встроенных звуковушек. PCM5102 – весьма и весьма качественный ЦАП за свою цену в пару- тройку долларов за модуль с чипом. Добавляем отображение индикаторов уровня на паре неплохих дисплеев st7789 ...

Итак вернемся

+40

9.9K

mirhifi 16 апреля в 22:47

Настроить программный модем — поможет minimodem

Блог компании Аудиомания Гаджеты Старое железо Периферия Звук

Можно сказать, что модемы перешли в разряд ретротехнологий. Но чтобы поработать с ними сегодня, необязательно приобретать физический девайс. Для установки соединения по аудиоканалу достаточно звуковой карты и open source утилиты minimodem.

+14

5.1K

TilekSamiev 16 апреля в 19:12

Как сделать звукозаписывающую студию в домашних условиях. Интервью с SERZH — музыкантом и звукорежиссёром

Лайфхаки для гиков Звук Интервью

Год назад в Ютубе мне попался видеоклип на песню «Катарсис». Песня, скажем так, неплохая, но в мой плейлист она не попала. Меня заинтересовал, в первую очередь, тот факт, что там снялся писатель-фантаст и видеоблогер Сурен Цормудян, поклонником коего я являюсь. А недавно мне довелось связаться с самим автором песни — музыкантом по имени SERZH, и взять у него интервью.

Читать дальше →

+13

4.1K

mihailgok 16 апреля в 15:30

Как перенести треки из Spotify в Яндекс.Музыку (полное руководство)

Смартфоны Звук

Из песочницы

Tutorial

Недавно компания Spotify заявила о временном уходе с рынка РФ. Сейчас не понятно, что будет с аккаунтами российских пользователей и сохраненной ими музыкой, поэтому самое время позаботиться о переносе своих любимых треков в другой сервис.

+12

11K

mirhifi 16 апреля в 00:57

Свести дорожки, добавить эффекты в браузере — поможет TwistedWave

Блог компании Аудиомания Облачные сервисы Звук

На прошлой неделе мы рассказали о компактном инструменте AudioMass. Он позволяет «нарезать» звуковую дорожку прямо в браузере. Сегодня поговорим о другом аудиоредакторе, который тоже не требует установки специальных приложений.

1.4K

Bright_Translate 15 апреля в 12:00

Немного о 35 мм кинопленке и цифровом аудио

Блог компании RUVDS.com Работа с видео *Обработка изображений *Видеотехника Звук

Перевод

Вспомним, что это была за 35 мм киноплёнка, и какими способами на ней кодировались аудиоданные. В частности, обратим внимание на технологию Dolby Digital и попутно заглянем в патент, который поможет прояснить некоторые детали.

Читать дальше →

+53

simonzolin 14 апреля в 11:05

Пишем аудио-разведчик своими руками

Программирование *C *Разработка под Linux *Разработка под Windows *Звук

Tutorial

Было бы здорово иногда иметь под рукой программку, которая в наше отсутствие умеет записывать звук со встроенного микрофона нашего ноутбука и передавать его по сети на другой наш комьютер. А тот, в свою очередь, этот звук умел бы воспроизводить в режиме реального времени. Давай попробуем самостоятельно написать такую программу, тем более что это, как оказывается, не так уж и сложно.

Что мы в итоге хотим получить и какой алгоритм работы реализовать:

1. Сервер, который запускается на той машине, пространство вокруг которой мы хотим прослушивать. Он тихо ждёт, пока к нему не подключится клиент. Затем он открывает устройство записи звука, настроенное по умолчанию в системе, и начинает передавать аудио поток на машину клиента. При отключении клиента от сервера, звуковое устройство закрывается, чтобы не тратить ресурсы зря.

2. Клиент, который подключается к серверу и начинает принимать аудио поток и воспроизводить его в режиме реального времени. Для того, чтобы клиент мог правильно (в нужном формате) открыть устройство воспроизведения звука, он получает нужную мета информацию от сервера в Hello сообщении.

3.5K

snakers4 12 апреля в 20:58

Теперь наш публичный синтез в супер-высоком качестве, в 10 раз быстрее и без детских болячек

Машинное обучение *DIY или Сделай сам Звук Natural Language Processing *Голосовые интерфейсы

hero_image

В нашей прошлой статье про синтез речи мы дали много обещаний: убрать детские болячки, радикально ускорить синтез еще в 10 раз, добавить новые "фишечки", радикально улучшить качество.

Сейчас, вложив огромное количество работы, мы наконец готовы поделиться с сообществом своими успехами:

Снизили размер модели в 2 раза;
Научили наши модели делать паузы;
Добавили один высококачественный голос (и бесконечное число случайных);
Ускорили наши модели где-то примерно в 10 раз (!);
Упаковали всех спикеров одного языка в одну модель;
Наши модели теперь могут принимать на вход даже целые абзацы текста;
Добавили функции контроля скорости и высоты речи через SSML;
Наш синтез работает сразу в трех частотах дискретизации на выбор — 8, 24 и 48 килогерц;
Решили детские проблемы наших моделей: нестабильность и пропуск слов, и добавили флаги для контроля ударения;

Это по-настоящему уникальное и прорывное достижение и мы не собираемся останавливаться. В ближайшее время мы добавим большое количество моделей на разных языках и напишем целый ряд публикаций на эту и смежные темы, а также продолжим делать наши модели лучше (например, еще в 2-5 раз быстрее).

Попробовать модель как обычно можно в нашем репозитории и в колабе.

Читать дальше →

+155

17K

albus_owl29 11 апреля в 11:35

Build.prop — улучшение качества звука

Разработка под Android *Гаджеты Звук

Почти каждый, кто хоть раз ставил ROOT-права на Android, слышал про такой файл как build.prop и твики для него. В этой статье мы рассмотрим все строки данного файла с помощью которых можно улучшить качество звучания смартфона и включить полезные функции, которые были отключены по умолчанию в системе.

2 3 ...

49 50

Звук

Как нативно визуализировать голос в iOS

Новости

Как создаются роботы-аватары: а будет ли погружение полным?

Цифровая линия задержки аудиосигнала PT2399

Немного примеров/мыслей навеянных датой 1 Мая…

«Утренний аудиокофе»: обсуждаем микроподкасты

«Синхронизируй это»: компактный обзор примечательных решений и протоколов для передачи звука по Ethernet

Музыка как код — опробовать концепцию можно прямо в браузере

Аудиодайджест — материалы из «Мира Hi-Fi»: муз. сервисы для свободного творчества, технологии и подборки для чтения

Сам себе орнитолог — нейросеть поможет распознать птиц по их пению

Музыка на удаленке — утилита для джема с друзьями по сети с нестандартным подходом к работе с задержками

Как мы слушаем и разбираем каждый звонок в банк

“Сигма дельта” или как сделать хорошую звуковую карту из STM32F401

Настроить программный модем — поможет minimodem

Как сделать звукозаписывающую студию в домашних условиях. Интервью с SERZH — музыкантом и звукорежиссёром

Как перенести треки из Spotify в Яндекс.Музыку (полное руководство)

Свести дорожки, добавить эффекты в браузере — поможет TwistedWave

Немного о 35 мм кинопленке и цифровом аудио

Пишем аудио-разведчик своими руками

Теперь наш публичный синтез в супер-высоком качестве, в 10 раз быстрее и без детских болячек

Build.prop — улучшение качества звука

Вклад авторов

Ваш аккаунт

Разделы

Информация

Услуги