При записи интервью микрофон, стоящий на столе, часто улавливает низкочастотные стуки (60–600 Гц) от касаний стола, рук, локтей, ручек или стаканов. Простое срезание частот до 600 Гц портит голос, так как основная энергия речи лежит в диапазоне 100–500 Гц. В этой статье мы рассмотрим, как использовать нейронные сети и инструменты для разделения аудио на стемы (голос, барабаны, бас и др.), чтобы изолировать голос и убрать стуки, а также классические методы обработки звука.
Table of Contents
Проблема и подход к решению
Низкочастотные стуки, или “thumps”, передаются через корпус микрофона и мешают качеству записи. Эти звуки по спектру могут напоминать перкуссию (например, бас-барабан или томы), что позволяет использовать AI-инструменты для разделения аудио на стемы, где стуки могут быть выделены в отдельную дорожку (Drums или Other). Альтернативно, можно применить шумоподавление с использованием профиля шума.
AI-инструменты для автоматической очистки звука
Эти инструменты используют машинное обучение для удаления шумов, включая стуки, без необходимости выделять сэмпл шума. Они подходят для подкастов и интервью:
- LALAL.AI Voice Cleaner: Онлайн-сервис с AI, удаляет фоновый шум, реверберацию и стуки. Имеет три уровня агрессивности (Mild, Normal, Aggressive). Бесплатно до 10 минут обработки. Ссылка: www.lalal.ai.
- Cleanvoice AI: Специализируется на подкастах, убирает шум, звуки рта и стуки. Быстрая обработка (10 минут). Бесплатная проба доступна. Ссылка: cleanvoice.ai.
- Adobe Podcast Enhance Speech: Бесплатный онлайн-инструмент от Adobe, улучшает речь, убирая шумы, включая низкочастотные стуки. Идеален для устных записей. Ссылка: podcast.adobe.com/enhance.
- Descript Studio Sound: AI-инструмент для видео и аудио, удаляет шум, эхо и стуки. Поддерживает предварительный просмотр. Бесплатная проба. Ссылка: www.descript.com.
- ElevenLabs Voice Isolator: Бесплатный AI для изоляции голоса, убирает уличный шум, фидбэк и стуки. Прост в использовании. Ссылка: elevenlabs.io.
Инструменты с использованием профиля шума
Если вы хотите указать фрагмент стука для анализа, эти инструменты позволяют создать профиль шума и удалить его:
- Audacity: Бесплатный редактор. Выделите фрагмент стука, создайте “Noise Profile”, затем примените Noise Reduction. Для спорадических стуков используйте De-click или Spectral Edit (удаление пиков в 60–600 Гц). Ссылка: www.audacityteam.org.
- iZotope RX: Профессиональный инструмент с AI. Используйте Voice De-noise или De-click/De-rumble, указав профиль шума. Repair Assistant автоматически предлагает решения. Пробная версия доступна. Ссылка: www.izotope.com.
- Adobe Audition: Захватите Noise Print из сэмпла стука и примените шумоподавление. Spectral Frequency Display помогает вручную удалять пики. Ссылка: www.adobe.com/products/audition.
Инструменты для разделения аудио на стемы
Эти AI-инструменты разделяют аудио на голос, барабаны, бас и другие дорожки. Низкочастотные стуки могут быть выделены в Drums или Other stem, что позволяет изолировать голос:
- LALAL.AI: Использует нейронку Perseus (2025) для разделения на голос, барабаны, бас и др. Поддерживает Enhanced Processing и De-Echo. Бесплатно до 10 минут. Ссылка: www.lalal.ai.
- MVSEP: Бесплатный сервис с моделями Demucs4 HT и BS Roformer. Разделяет на 6 стемов, включая голос и барабаны. Высокое качество, но без предварительного прослушивания. Ссылка: mvsep.com.
- Moises: Разделяет на голос, барабаны, бас и др. Бесплатный план: 5 разделений в месяц. Поддерживает YouTube-ссылки. Ссылка: moises.ai.
- Soundverse AI: Бесплатный, быстрый инструмент для разделения на голос, барабаны и др. Простой интерфейс. Ссылка: www.soundverse.ai.
- PhonicMind: Высококачественное разделение на голос, барабаны, бас. Бесплатная проба. Ссылка: phonicmind.com.
- AudioSourceRE DeMIX Pro: Профессиональный инструмент с тонкой настройкой. Пробная версия на 7 дней. Ссылка: www.audiosourcere.com.
- Fadr: Бесплатный, но менее точный для не-музыкальных записей. Подходит для простых задач. Ссылка: fadr.com/stems.
Рекомендации по использованию
Для достижения лучшего результата следуйте этим шагам:
- Начните с MVSEP: Бесплатный и мощный инструмент, стуки обычно попадают в Drums stem. Используйте BS Roformer SW.
- Попробуйте LALAL.AI: Высокое качество, preview и настройки. Используйте Aggressive режим и De-Echo.
- Для профессионалов: AudioSourceRE DeMIX Pro или iZotope RX для сложных записей.
- Дополнительная очистка: Если стуки остаются в Vocal stem, используйте LALAL.AI Voice Cleaner или Audacity Spectral Edit для удаления пиков в 60–600 Гц.
- Формат и качество: Используйте MP3 высокого качества (320 kbps) для лучшего распознавания.
- Тестирование: Загрузите короткий фрагмент (10–20 секунд), чтобы сэкономить лимиты платных сервисов.
Заключение
AI-инструменты для разделения аудио на стемы и шумоподавления позволяют эффективно убрать низкочастотные стуки из записей интервью, сохраняя качество голоса. MVSEP и LALAL.AI — лучшие стартовые точки благодаря балансу качества и доступности. Для сложных случаев используйте профессиональные инструменты вроде iZotope RX или AudioSourceRE. Если стуки редкие, ручная обработка в Audacity может быть проще. Выберите инструмент, соответствующий вашему бюджету и задаче, и начните с тестового фрагмента!
