Текст
                    Ирина АЛДОШИНА
Рой ПРИТТС
МУЗЫКАЛЬНАЯ
АКУСТИКА
УЧЕБНИК
ДЛЯ ВЫСШИХ УЧЕБНЫХ ЗАВЕДЕНИЙ
Допущено Министерством образования и науки
Российской Федерации в качестве учебника
для студентов высших учебных заведений,
обучающихся по специальностям:
«Музыкальная звукорежиссера»;
«Звукорежиссура театрализованных
представлений и праздников»;
«Звукорежиссура кино и телевидения»
Издательство «Композитор • Санкт-Петербург»
2006


ББК 85.315.3 А 45 Издано при финансовой поддержке Федерального агентства по печати и массовым коммуникациям в рамках Федеральной целевой программы «Культура России» Издание выпущено при поддержке Комитета по печати и взаимодействию со средствами массовой информации Санкт-Петербурга Алдошина Ирина Аркадьевна — доктор технических наук, профессор Санкт-Петербургской государственной консерватории им. Н. А. Римского-Корсакова, Санкт-Петербургского университета телекоммуникаций им. М. А. Бонч-Бруевича (дисциплина — «Му- зыкальная акустика»), член Координационного совета РАН, член Совета директоров Audio Engineering Society (AES), председатель Санкт-Петербургской секции AES. Приттс Рой (Pritts Roy) — председатель Международного ко- митета по образованию Audio Engineering Society (AES), профессор университета в Денвере, штат Колорадо, США (дисциплины — «Музыкальная акустика», «Компьютерная музыка», «Современные компьютерные музыкальные технологии»). ISBN 5-7379-0298-6 О И А. Алдошина, P Приттс, 2006 © Издательство «Композитор • Санкт-Петербург», 2006
Содержание Введение 7 Глава 1. Предмет «музыкальная акустика». История развития 11 1.1. Музыкальная акустика: определение, роль, основные задачи 11 1.2. История музыкальной акустики 17 1.3. Музыкальная акустика в России 30 Список литературы 36 Глава 2. Физические свойства звука 39 2.1. Механические колебания. Простые гармонические колебания. Затухающие колебания. Спектры. Резонанс 39 2.2. Звуковые волны. Скорость звука. Звуковое давление 57 2.3. Звуковые поля. Звуковые явления 64 2.4. Акустические сигналы. Динамический диапазон. Частотный диапазон 77 Контрольные вопросы 94 Список литературы 95 Глава 3. Восприятие звука. Основы психоакустики 96 3.1. Структура слуховой системы и ее основные функции 98 3.2. Абсолютные и дифференциальные слуховые пороги 108 3.2.1. Абсолютные слуховые пороги 109 3.2.2. Дифференциальные слуховые пороги 114 3.3. Громкость. Критические полосы слуха 119 3.4. Маскировка звука 131 3.5. Нелинейные свойства слуха 141 3.6. Бинауральный слух. Пространственная локализация 145 3.7. Высота звука 154 3.8. Музыкальные шкалы и интервалы 166 3.8.1. Музыкальные интервалы и интервальные коэффициенты 168
4 Содержание 3.8.2 Принципы построения музыкальных шкал (шкала Пифагора, чистая шкала, равномерно темперированная шкала) 172 3.8.3. Стандартная высота тона 180 3.9. Тембр 181 3.10. Некоторые общие закономерности восприятия музыкальных и речевых сигналов 192 Контрольные вопросы 197 Список литературы 198 Глава 4. Акустика музыкальных инструментов. Акустика речи и пения 200 4.1. Состав и классификация музыкальных инструментов ....201 4.2. Акустика духовых музыкальных инструментов 206 4.2.1. Лабиальные духовые инструменты. Флейта 208 4.2.2. Тростевые духовые инструменты. Кларнет. Гобой. Фагот. Саксофон 226 4.2.3. Амбушюрные духовые инструменты. Труба. Тромбон. Валторна. Туба 245 4.2.4. Орган 262 4.3. Акустика струнных музыкальных инструментов 281 4.3.1. Струнные смычковые инструменты. Скрипка 282 4.3.2. Струнные щипковые инструменты. Гитара. Арфа 300 4.3.3. Струнные ударные (клавишные) инструменты. Фортепиано 317 4.4. Акустика ударных музыкальных инструментов 342 4.4.1. Мембранофоны. Литавры. Барабаны 343 4.4.2. Идиофоны. Ксилофоны. Тарелки 354 4.4.3. Идиофоны. Колокола 369 4.5. Акустические характеристики оркестра 381 4.6. Акустика речи и пения 389 4.6.1. Основные механизмы звукообразования речи 390 4.6.2. Классификация звуков речи 405 4.6.3. Акустические характеристики речи 411 4.6.4. Субъективные и объективные методы оценки разборчивости речи 416 4.6.5. Особенности звукообразования и акустические характеристики вокальной речи (пения) 426 4.6.6. Связь акустических параметров с эмоцио- нальной выразительностью речи и пения. Обратная связь. Эффект Томатиса 441 4.6.7. Акустика хорового пения 455
Содержание 5 Контрольные вопросы 463 Список литературы 465 Глава 5. Акустика помещений (концертно-театральных залов и студий) 471 5.1. Объективные и субъективные акустические параметры помещения 471 5.1.1. Физические процессы формирования звуко- вого поля в помещении. Методы расчета 474 5.1.2. Связь объективных параметров и субъективной оценки акустики помещений 492 5.2. Акустика концертных и театральных залов 506 5.2.1. Акустика лекционных залов (аудиторий) и театральных залов драматических театров 508 5.2.2. Акустика залов оперных театров 514 5.2.3. Акустика концертных залов 519 5.3. Компьютерное моделирование акустики помещений. Аурализация 527 5.4. Акустика залов многоцелевого назначения. Системы озвучивания и звукоусиления 535 5.5. Акустика студий и контрольных комнат 547 Контрольные вопросы 558 Список литературы 559 Глава 6. Принципы построения систем звукозаписи, звукопередачи и звуковоспроизведения 562 6.1. История звукозаписи 563 6.2. Аналоговое и цифровое представление музыкальных и речевых сигналов 571 6.3. Структура студии звукозаписи. Основные виды оборудования 578 6.3.1. Микрофоны. Стереомикрофоны 578 6.3.2. Студийные микшерные пульты. Процессоры спецэффектов 603 6.3.3. Студийные контрольные агрегаты 617 6.3.4. Устройства записи и воспроизведения звука (проигрыватели, магнитофоны) 633 6.4. Системы пространственной звукопередачи и звуко- воспроизведения 648 6.4.1. История создания систем «пространственного» звука 648
6 Содержание 6.4.2. Общая структура систем пространственной звукопередачи и звуковоспроизведения 653 Контрольные вопросы 660 Список литературы 661 Глава 7. Электромузыкальные инструменты и компьютерные технологии создания звука 664 7.1. Электромузыкальные инструменты. Принципы звукообразования 664 7.1.1. История создания электромузыкальных инструментов 666 7.1.2. Электрогитара 671 7.1.3. Электропианино (Rhodes Piano) 685 7.1.4. Орган Хаммонда. Электрические и цифровые органы 694 7.1.5. Терменвокс. Волны Мартено 699 7.2. Электронные музыкальные инструменты. Синтезаторы 703 7.3. Компьютерные музыкальные программы 711 Контрольные вопросы 715 Список литературы 716 Приложение 718
Введение Музыкальная акустика — это одно из самых интенсивно раз- вивающихся в настоящее время направлений акустики. Задача музыкальной акустики — исследование вопросов создания, распространения и восприятия музыкальных звуковых сигналов. Она является синтетической наукой, использующей различные на- учные и технические направления: акустику музыкальных инстру- ментов и певческого голоса, акустику концертных залов и помеще- ний прослушивания, психоакустику (акустику слуха), технику звукозаписи, компьютерные музыкальные технологии и др. В последние десятилетия в музыкальной акустике произошли принципиальные изменения за счет широкого использования компьютерных музыкальных технологий, развития систем мульти- медиа и появления нового поколения электронных музыкальных инструментов. Научно-техническая компьютерная революция открыла принци- пиально новые возможности в научных исследованиях, в исполни- тельском творчестве и в системе музыкального образования. Научные исследования в области музыкальной акустики прово- дятся в крупнейших научно-исследовательских и университетских мировых центрах: IRCAM (Франция), Stanford University — CCRA (США), McGiIl University (Канада), Royal Institute of Technology — KTH (Швеция), Institute for Musical Acoustics — IWK (Австрия) и др., и регулярно представляются на международных конгрессах и конференциях SMAC, ISMA, AES Convention, Meeting of the ASA и др. Подготовка специалистов XXI века во всех видах музыкального творчества (музыковедов, звукорежиссеров, исполнителей, дири- жеров, композиторов и др.) без учета достижений научно-техни- ческой революции, позволившей получить принципиально новые результаты и открыть новые возможности в музыкальных науках и искусстве, оказалась невозможной. В связи с этим в последние десятилетия происходит перестройка системы мирового музыкально- го образования. В большинстве консерваторий мира и университетов, имеющих музыкальные факультеты, произошли изменения цикла учебных дисциплин. В учебные планы введены дисциплины естественно- научного цикла — музыкальная акустика, психоакустика; техни- ческие предметы — системы звукозаписи и звуковоспроизведения, музыкальная информатика, компьютерное музыкальное програм- мирование и др. Произведено переоснащение учебных заведений: созданы учебные мультимедийные компьютерные классы, студии
8 Введение звукозаписи; разработано соответствующее учебное программное обеспечение; открыта подготовка по целому ряду новых специаль- ностей (композиторы компьютерной музыки, звукорежиссеры, аудиодизайнеры, аудиоинженеры, аудиопродюсеры и др.). В нашей стране в настоящее время музыкальная акустика вхо- дит в качестве обязательной дисциплины в обр;*зовательные стан- дарты по специальности «Звукорежиссура» 051500, 053200, 053800. В стандарте по специальности «Дирижер» 051100 введе- но требование обязательных знаний в облхсти музыкальной аку- стики, в стандарте по специальности «Музыковедение» введен предмет «Основы информатики», куда частично включены вопро- сы музыкальной акустики и т. д. Все вышеизложенное настоятельно требует введения музыкаль- ной акустики в образовательные стандарты и учебные планы под- готовки специалистов по широкому профилю музыкальных специ- альностей и подтверждает необходимость издания учебника «Музыкальная акустика», отражающего современный уровень на- уки в данной области. На русском языке учебники по этому направлению не издава- лись почти тридцать лет. Изданные учебники (под ред. Гарбузо- ва Н. А. — «Музыкальная акустика», 1954; Аллон С. M., Макси- мов Н. И. — «Музыкальная акустика», 1971; Георгиев Е. — «Музыкальная акустика», 1975), естественно, не отражают прин- ципиальных изменений, которые произошли в музыкальной аку- стике за прошедшие четверть века. В системе зарубежного образования звукорежиссеров, аудио- инженеров, композиторов, музыковедов и др. широко используют- ся такие известные учебники как: Backus J. The acoustical foundation of Music (1969); Benade A. Fundamentals of Musical Acoustics (1995); Campbell M., Greated C. The musician's Guide to Acoustics (1988); Howard D., Angus J. Acoustics and Psychoacoustics (1996); Hall D. Musical Acoustics (2001); Rossing T., Moore E and Wheeler P. The Science of Sound (2002) и др. Целью написания данной книги было создание современного учебника на основе достижений зарубежной музыкальной акус- тики (изложенных в многочисленных монографиях, учебниках, статьях и трудах международных конференций, постоянно про- водимых по этому направлению), а также работ отечественных специалистов в этой области и результатов собственных исследо- ваний и опыта педагогической деятельности авторов. Учитывая, что дисциплина «Музыкальная акустика» может быть полезна не только для вышеуказанных специальностей, но и для подготовки широкого круга специалистов, в том числе аудиовидеоинженеров, музыкантов, архитекторов и др., и может использоваться ими в научной и практической работе, предлага-
Введение 9 емый учебник может быть рекомендован аспирантам, научным работникам, инженерам, широкому кругу аудиофилов, любителей музыки и компьютерного музыкального творчества. Данный учебник включает в себя следующие основные разделы. Глава 1 — определение предмета музыкальной акустики, ее роли в общей системе музыкальных знаний, а также в качестве научной основы для современной звукорежиссуры; история ее развития в различные периоды от античности до начала XXI века. Глава 2 — анализ физических свойств музыкальных звуков, включающий такие разделы, как: гармонические колебания; простые и сложные колебательные системы; звуковые волны, физические законы их распространения в пространстве; спект- ральный, статистический и корреляционный анализ звуковых сиг- налов (динамический и частотный диапазоны) и др. Глава 3 — вопросы восприятия музыкальных звуков (основы психоакустики), включающие в себя: структуру слуховой системы, пороги слуха, восприятие громкости, восприятие высоты, крити- ческие полосы, эффекты маскировки, консонансы и диссонансы, бинауральную локализацию, нелинейные свойства слуха, субъек- тивные гармоники и комбинационные тоны, тембр, музыкальные шкалы и интервалы. Глава 4 — проблемы создания натуральных музыкальных зву- чаний, а именно классификация, анализ системы звукообразования и акустические характеристики основных групп музыкальных ин- струментов: духовых (аэрофонов) — лабиальных, тростевых, ам- бушюрных; струнных (хордофонов) — смычковых, щипковых, клавишных; ударных — мембранофонов, идиофонов; а также аку- стические параметры оркестра. Кроме того, в главе 4 приведен анализ системы звукообразования и акустических характеристик речи и вокальной речи (пения). Глава 5 — проблемы распространения музыкальных и рече- вых сигналов, в том числе: анализ объективных и субъективных параметров залов и их влияние на качество звучания; требования к акустике концертных залов, залов оперных и драматических театров; студий звукозаписи; многопрофильных залов с система- ми звукоусиления; а также компьютерное моделирование акусти- ки помещений (аурализация). Глава 6 — принципы построения систем записи, передачи и воспроизведения звука, включая аналоговое и цифровое представ- ление звуковых сигналов, структуру и оборудование современных студий звукозаписи, основные принципы цифровой звукозаписи, системы пространственной звукопередачи и звуковоспроизведения. Глава 7 — анализ современных средств электронного создания музыки, в том числе принципы построения электромузыкальных инструментов и основы электронных музыкальных технологий.
10 Введение Учитывая, что учебник предназначен в первую очередь для студентов и специалистов гуманитарных специальностей, авторы старались излагать материал без привлечения сложного матема- тического аппарата, хотя современная музыкальная акустика, на- пример, при создании физических компьютерных моделей музы- кальных инструментов, разработке алгоритмов компьютерного распознавания тембров и др. широко использует достаточно сложные математические методы (по этим вопросам требуется подготовка специальной литературы). Содержание учебника соответствует требованиям образователь- ных стандартов по специальности «Звукорежиссура» 051500, 053200, 053800 и утвержденным программам курса «Музыкаль- ная акустика», читаемого в настоящее время в Университете кино и телевидения (Санкт-Петербург), РАТИ (ГИТИС) и Музыкальной академии им. Гнесиных (Москва) и др., а также авторами в Санкт- Петербургской государственной консерватории им. Н. А. Римско- го-Корсакова, Гуманитарном университете профсоюзов (Санкт-Пе- тербург) и Университете Колорадо (Денвер, США). В образовательных стандартах для звукорежиссеров вопросы, рассматриваемые в главах 5, 6, 7, вынесены в отдельные дисцип- лины, однако учитывая, что данный учебник может быть исполь- зован при обучении студентов и аспирантов других специально- стей (музыковедов, композиторов, дирижеров и т. д.), а также практику создания наиболее известных зарубежных учебников по музыкальной акустике (см. гл. 1), авторы сочли необходимым включить краткое изложение основных результатов и по этим вопросам (хотя детальное изложение материала требует создания отдельных учебников по этим дисциплинам). Материалы введения, глав 1-4 написаны проф. Алдошиной И. А., глав 5, 6, 7 — совместно проф. Алдошиной И. А. и проф. Притт- сом Р. Авторы считают необходимым выразить свою глубокую при- знательность коллегам из Санкт-Петербургской государственной консерватории им. Н. А. Римского-Корсакова, Гуманитарного университета профсоюзов, Университета телекоммуникаций им. М. А. Бонч-Бруевича и др. за помощь и ценные замечания при просмотре рукописи: Герцману Е. В., Осколкову А. С, Мартыню- ку С. E., Процюку Д. Б., Двас М. С, Шугалю С. Г., Пучкову С. В., Галембо А. С, Ковалгину Ю. А., Никамину В. А., Кацнельсону Л. H., Игнатову П. В. и др. Следует отметить, что в учебнике принята международная си- стема обозначения нот. Перевод из принятой в отечественной практике системы в международную приведен в Приложении.
Глава 1. ПРЕДМЕТ «МУЗЫКАЛЬНАЯ АКУСТИКА». ИСТОРИЯ РАЗВИТИЯ 1.1. МУЗЫКАЛЬНАЯ АКУСТИКА: ОПРЕДЕЛЕНИЕ, РОЛЬ, ОСНОВНЫЕ ЗАДАЧИ Акустика — это наука о звуке, название которой происходит от греческого слова ri^ou'co (акуо) — «слышу» [1-7]. Оно было введено в науку в 1701 году французским ученым Ж. Совёром. Музыкальная акустика представляет собой одно из направлений этой науки. Задачей акустики является изучение физической природы зву- ка и проблем, связанных с его возникновением, распространени- ем и восприятием [7, 19]. Звук имеет двойственную природу: — с одной стороны, это объективный процесс передачи энер- гии механических колебаний частиц в упругой среде (воздухе, жид- кости, твердом теле); — с другой стороны, это только те виды механических колеба- ний среды, которые воспринимаются слуховой системой. Таким образом, звук — это особый вид механических коле- баний, способный вызывать слуховые ощущения [7, 15, 18, 19-21]. Можно дать и такое определение звука: «звук — слуховые ощущения, обусловленные изменениями давления в окружающей упругой среде, вызванными механическими колебаниями упругих тел» [22]. Поэтому акустика, как наука о звуке, является, с одной сторо- ны, наряду с оптикой, термодинамикой, электромагнетизмом и т. д., одним из направлений физики (точнее — механики), которое за- нимается проблемами создания и распространения механических колебаний; с другой стороны, поскольку занимается и проблема- ми восприятия звука, она тесно связана с психофизикой, музы- кальной психологией, теорией музыки и др. Три главные проблемы входят в сферу интересов современной акустики: — возникновение звука, что требует изучения физической природы звука, а также методов и средств его создания. Этими вопросами занимается акустика музыкальных инструментов, аку- стика речи, электроакустика и др;
12 Глава 1 — передача звука от источника к слушателю — это задачи архитектурной акустики, электроакустики и др.; — восприятие звука слуховой системой и связь слуховых ощущений с объективными параметрами звука — это задачи пси- хоакустики. Акустика является междисциплинарной наукой, использующей для решения своих проблем широкий круг дисциплин: математику, физику, психологию, архитектуру, электронику, биологию, теорию музыки и др. Современный человек погружен в мир информации, значи- тельная часть которой поступает ему в звуковом виде. Отсутствие звуковой информации затрудняет социальные, психологические контакты и снижает шансы на выживание. Примерно 25% инфор- мации об окружающем мире человек получает от слуховых анали- заторов, 60% — от зрительных и 15% — от остальных. Слуховая система человека воспринимает только ограничен- ный класс механических колебаний среды, находящихся в опреде- ленных пределах по уровню громкости (изменение уровня звуково- го давления от 0 дБ до 120 дБ) и по высоте (изменение частоты от 20 Гц до 20000 Гц) (см. гл. 3). В этом отношении человек силь- но уступает другим биологическим субъектам (например, диапазон слышимых частот дельфина достигает 110 кГц и т. д.). Все окружающие звуки можно условно разделить по различным признакам, например: — по способу создания — на натуральные и искусственные (природный шум, речь, музыка, биосигналы, электронные звуки); — по информационному признаку — на звуки для передачи семантической (смысловой) и эмоциональной информации (речь, пение и музыка); для передачи информации об окружающей сре- де (шум, сигнальные звуки и др.); — по физическим параметрам, таким как: частотный диапазон (инфразвук, ультразвук, гиперзвук и др.); степень предсказуемости (случайные сигналы, например белый шум; детерминированные сигналы; квазислучайные сигналы, в т. ч. музыка и речь); времен- ная структура (периодические, непериодические, импульсные и др.) и т. д. Всеми этими видами сигналов занимаются различные направ- ления акустики. В одном из обзоров знаменитой фирмы «Брюэль и Кьер» было предложено условно разделить историю взаимоотношения челове- ка со звуком (а следовательно, и историю акустики) на три крупных этапа: — от начала эпохи человека разумного до начала XX века — когда звук из чисто сигнального средства, необходимого для выжи- вания, вырос в средство коммуникации (речь), и, наконец, отдель- ные виды звуков начали использоваться как средство эмоциональ-
Предмет «музыкальная акустика». История развития 13 ного и эстетического воздействия (музыка). К началу XX века му- зыка стала мощным средством передачи величайших глубин чело- веческой мысли и эмоций, гениальные композиторы подняли музы- кальное творчество на необыкновенную высоту, разработали особый музыкальный язык, способный передавать не меньшее богатство мыслей и нюансов, чем письменная и устная речь. Че- ловечество создало огромную палитру музыкальных инструментов, отработало вокальную технику, построило великолепные концерт- ные залы, театры, соборы и др. Однако эти величайшие достиже- ния искусства были доступны очень ограниченному кругу людей (доли процента могли слушать хорошую музыку в акустически со- вершенных залах); — от начала XX века до 1960-х годов — с момента изобрете- ния радио и телевидения музыкальное и вокальное искусство стало доступно миллионам, но, как всегда при массовом тиражи- ровании, качество звука резко упало, отставали технические средства. Главной задачей была передача смысловой (семанти- ческой) информации. К середине века техника звукозаписи, вос- произведения и звукопередачи значительно усовершенствова- лась, и это позволило обеспечить новый уровень передачи эмоциональной и эстетической информации: зародилось движе- ние Hl-Fl («высокой верности воспроизведения»), идеология ко- торого состояла в том, чтобы создаваемая акустическая аппара- тура могла воспроизводить звук максимально приближенным к оригиналу. Это движение зародилось в Англии (фирмы KEF, Таппоу и др). Постановка такой задачи дала мощный толчок к развитию науки (акустики) и созданию индустрии производства звукотехнической аппаратуры; — в конце 1980-х годов были сформулированы проблемы третьего этапа развития — переноса пространственной атмосфе- ры первичного поля в любое вторичное помещение прослуши- вания. Сама постановка такого вопроса была бы в принципе невозможна без создания новой научной и технической базы — развития цифровых компьютерных технологий обработки звука и соответствующих технических средств: звуковых процессоров; цифровых станций для обработки, монтажа, редактирования, ар- хивирования и т. д; цифровых лазерных проигрывателей; магни- тофонов и др. Разработка этой проблемы продолжается, но она уже привела к созданию пространственных систем звукозаписи и звуковоспроизведения (систем Surround Sound, бинауральной стереофонии и др.), появлению адаптивных цифровых процессо- ров, систем аурализации и др. Она потребовала решения целого ряда принципиально новых научных задач в различных направ- лениях акустики и аудиотехники — например, таких как: расшиф- ровка механизмов слухового восприятия звукового образа; созда- ние виртуальных трехмерных звуковых и видеопространств,
14 Глава 1 разработка новых алгоритмов синтеза музыкальных звуков (в част- ности, компьютерных физических моделей музыкальных инстру- ментов и голоса) и др. Все это послужило стимулом в развитии всех направлений акустики. Современная акустика представляет собой мощное и развитое направление науки и имеет огромную промышленную базу в боль- шинстве стран мира: сотни научных институтов, тысячи фирм, разрабатывающих и производящих огромное разнообразие аудио- технической аппаратуры, в том числе студийное оборудование (пульты, микрофоны, контрольные агрегаты и др.); передающее оборудование (передатчики, усилители, кодеры, и др.); воспроиз- водящее оборудование (акустические системы, проигрыватели, магнитофоны и др.). В XX веке в акустике выделилось более двадцати самосто- ятельных направлений, важнейшие из которых перечислены ниже [19]. Общая (физическая) акустика — теория излучения и распро- странения звука в различных средах, теория дифракции, интерфе- ренции и рассеяния звуковых волн. Линейные и нелинейные про- цессы распространения звука. Архитектурная акустика — законы распространения звука в закрытых (полузакрытых, открытых) помещениях, методы управ- ления структурой поля в помещении и т. д. Строительная акустика — защита от шума зданий, промыш- ленных предприятий и др. (расчет конструкций и сооружений, вы- бор материалов и т. д.). Психоакустика — основные законы слухового восприятия, определение связи объективных и субъективных параметров звука, определение законов расшифровки «звукового образа». Музыкальная акустика — проблемы создания, распростране- ния и восприятия музыкальных звуков, точнее — звуков, использу- емых в музыке. Биоакустика — теория восприятия и излучения звука биологи- ческими объектами, изучение слуховой системы различных видов животных и др. Электроакустика — теория и практика конструирования излу- чателей и приемников, преобразующих электрическую энергию в акустическую и наоборот, а также всех элементов современных звуковых трактов записи, передачи и воспроизведения звука. Аэроакустика (авиационная акустика) — излучение и распро- странение шумов в авиационных конструкциях; методы звукоизо- ляции и звукопоглощения, теория распространения ударных звуко- вых волн и т. д. Гидроакустика — распространение, поглощение, затухание звука в воде, теория гидроакустических преобразователей, теория
Предмет «музыкальная акустика». История развития 15 антенн и гидроакустических эхолокаторов, распознавание движу- щихся объектов и др. Акустика транспорта — анализ шумов, разработка методов и средств звукопоглощения и звукоизоляции в различных видах транспорта (самолеты, поезда, автомобили и др.). Медицинская акустика — разработка медицинской аппаратуры, основанной на обработке и передаче звуковых сигналов (слуховые аппараты, диагностические приборы-анализаторы шумов сердца, легких и др.). Ультразвуковая акустика — теория ультразвука, создание уль- тразвуковой аппаратуры, в т. ч. ультразвуковых преобразователей для промышленного применения в гидроакустике, измерительной технике и др. Квантовая акустика (акустоэлектроника) — теория гипер- звука, создание фильтров на поверхностных акустических волнах и т. д. Акустика речи — теория и синтез речи, выделение речи на фоне шумов, автоматическое распознавание речи и т. д. Цифровая акустика — активно развивается в последние годы, постепенно выделяется в самостоятельное направление в связи с созданием нового поколения микропроцессорной (аудиопроцес- сорной) и компьютерной техники. Кроме вышеупомянутых, интенсивно развиваются и другие на- правления акустики. Специалисты-акустики в настоящее время могут заниматься широчайшим кругом иногда очень далеких друг от друга проблем: это могут быть физики, изучающие распространение звуковых волн в разных средах; аудиоинженеры, проектирующие электро- акустические преобразователи; инженеры-строители и архитек- торы; медики, занимающиеся патологией слуха; психологи, изучающие проблемы восприятия музыки и речи; программисты, решающие задачи компьютерной обработки звука, и др. Музыкальная акустика является одним из направлений акус- тики и занимается всем комплексом проблем, связанных с созда- нием звуков, используемых в музыке и пении; передачей их к слу- шателю и их слуховым восприятием [1, 4, 7, 12-18, 23]. Современная музыкальная акустика представляет собой в ши- роком смысле слова синтез различных направлений науки и тех- ники: акустики речи и пения, акустики музыкальных инструментов (в т. ч. электронных); электроакустики (в т. ч. систем звукозаписи, звукопередачи и звуковоспроизведения); архитектурной акустики (в т. ч. акустики концертных залов, театров, студий и т. д., а так- же техники звукоусиления и озвучивания в них); психоакустики и др.
16 Глава 1 Учитывая, что современные компьютерные технологии открыли принципиально новые возможности в развитии музыкальной аку- стики, она все больше углубляется в решение таких проблем как: расшифровка «слухового образа», т. е. целостное восприятие музыки и речи; создание физических компьютерных моделей музыкальных инструментов, голоса, слуховой системы и др.; создание нового музыкального компьютерного инструментария; других вопросов, традиционно изучаемых в музыкальной психо- логии, теории музыки, инструментоведении. Такой синтез музыкальных наук и акустики создает современ- ную научную базу для решения проблем развития и совершенство- вания музыкального искусства. Музыкальная акустика является научной основой образования представителей музыкального искусства: композиторов, музыкове- дов, исполнителей и т. д., поскольку она служит базой для понима- ния основ теории музыки, музыкальной психологии, компьютерных музыкальных технологий, принципов создания электронной музы- ки и т. д.; для развития инструментоведения (анализ механизмов звукообразования в различных музыкальных инструментах, созда- ние их компьютерных физических моделей, развитие нового ком- пьютерного инструментария и т. д.); для совершенствования во- кального и музыкального исполнительства и др. Музыкальная акустика является основой базового естественно- научного образования звукорежиссеров. Современный звукорежис- сер — это посредник между языком техники и языком искусства, профессионально владеющий тем и другим. Он должен обладать серьезными научными познаниями в различных направлениях акустики и аудиотехники, глубоко понимать физическую природу звука, законы его создания, распространения и восприятия. Зву- корежиссер должен владеть компьютерными технологиями рабо- ты со звуком, знать технологию записи в кино, на телевидении, системы озвучивания и звукоусиления, владеть всей современной звукозаписывающей и звуковоспроизводящей техникой. Он должен обладать высокой музыкальной культурой, понимать и ценить му- зыку, чувствовать стиль и направления ее развития, понимать за- мысел композитора и манеру исполнения музыканта, постоянно поддерживать высокий уровень свои слушательских эталонов звучания, опираясь на опыт восприятия музыкальных произведе- ний в условиях концертных залов с хорошей акустикой. Поэтому естественно, что изучение музыкальной акустики входит в образо- вательные программы практически всех университетов и консерва- торий мира, где ведется подготовка специалистов по указанным специальностям.
Предмет «музыкальная акустика». История развития 17 1.2. ИСТОРИЯ МУЗЫКАЛЬНОЙ АКУСТИКИ История музыкальной акустики насчитывает несколько тысяче- летий. В данном разделе кратко рассмотрены только ее основные исторические этапы, необходимые для понимания процессов ста- новления и накопления знаний об основных свойствах музыкаль- ных звуков, а также труды выдающихся ученых, на базе которых развивается современная наука. Историю музыкальной акустики можно отсчитывать с очень глубокой древности, когда из всех звуков окружающей природы человек выделил некоторые звуки и их сочетания, которые достав- ляли ему эстетическое удовольствие, и начал создавать первые музыкальные инструменты для их воспроизведения. Время создания первых духовых и струнных инструментов датируется несколькими тысячелетиями до н. э. (например, инструменты типа флейты с игровыми отверстиями и типа арфы обнаруже- ны в пятом тысячелетии до н. э.) [1]. Очевидно, что в течение этого периода накапливались знания о природе музыкальных звуков и методах их формирования. В древних музыкальных куль- турах Китая и Индии, где были созданы за несколько веков до нашей эры такие музыкальные строи, как китайская система «люй» (содержащая 12 звуков в октаве) и индийская система «шрути», описанная в книге Бхарата «Натья шастра» (II век до н. э.), содержащая 22 звука в октаве [1, 4-8], уже несомненно использовались сведения о звуковысотных соотношениях, опреде- ляющих музыкальные интервалы, и др. В дальнейшем развитии музыкальной акустики можно выделить несколько основных периодов [2—4]. Античный период: начало развития акустики как научного на- правления связано прежде всего с именем греческого философа Пифагора (ок. 580-500 до н. э.) и его последователей, которые изучали связь между высотой тона и длиной колеблющейся стру- ны. Они установили связь между музыкальными интервалами и отношениями простых целых чисел (2:1 — октава, 3:2 — квинта и т. д.), тем самым заложив основу для построения музыкальной шкалы, основанной на квинтовых переходах и названной именем Пифагора. Аристотель (384-322 до н. э.) и его ученики создали первый энциклопедический труд «Проблемата», обобщающий на- копленные знания во многих областях науки и искусства. В него была включена имеющаяся информация о физике звука, в част- ности, такие корректные предположения, что звуковая волна рас- пространяется в воздухе благодаря движению его частиц, что звук подобно свету отражается от препятствий и др. [2]. Последовате- ли Аристотеля высказывали предположения, что слух «зависит от проникновения звуков в мозг через движение воздуха» (Теофраст). Многие греческие исследователи' внесли свой вклад в учение
18 Глава 1 о звуке. Наиболее значительным трудом последнего периода в зо- лотом веке греческой науки можно считать «О слышимом», авто- ром которого, вероятно, был Стратон (340-262 до н. э.), — в нем уже четко высказывалась мысль, что звуковая волна распрост- раняется в воздухе в виде сжатий и разрежений. Интересная идея была высказана в трудах Аристоксена (ок. 320 до н. э.) — о том, что музыку нельзя свести просто к соотношению простых чисел, ее восприятие требует работы сознания и памяти, поскольку надо не только принимать звуки в настоящий момент, но и держать в памяти предыдущие [4]. Однако эти предположе- ния еще не были поняты современниками. Римский архитектор Витрувий (I век до н. э.) достаточно точно определил механизм распространения звуковой волны в помеще- нии, в том числе эффекты отражения и эхо. Он внес значительный вклад в акустическое проектирование амфитеатров, результаты его исследований были отражены в десятитомном труде «Об архитек- туре», который многие столетия служил базой для развития архи- тектуры и архитектурной акустики. Завершением первого периода научного развития акустики мож- но считать пятитомный труд римского философа Боэция (480-524), в котором были обобщены результаты трудов античных ученых и высказаны идеи, что восприятие высоты звука связано с таким физическим параметром как частота колебаний, что музыкальные тоны состоят из отдельных частей и что созвучия могут быть при- ятные и неприятные (что очень близко к классическим понятиям консонанса и диссонанса). Таким образом, античный период в развитии музыкаль- ной акустики принес понимание таких базовых свойств звука как: связь высоты с частотой колебаний струн; рас- пространение звуковых волн как процесса сжатий и разре- жений в воздухе; законы падения, отражения и поглощения звуковых волн в помещениях и др. Кроме того, были вы- сказаны догадки, что сложные музыкальные звуки состоят из отдельных элементов, сочетания которых могут быть приятными и неприятными на слух, а это послужило базой для создания первых музыкальных шкал (например, шкалы Пифагора). Второй период — XVI-XVII век. Второй период научного раз- вития акустики в Европе можно отсчитывать с начала эпохи Воз- рождения (следует отметить, что в Средние века научные знания о звуке продолжали развиваться в трудах арабских и византийских ученых, подробнее об этом можно прочитать в книге Ф. Ханта [2]). Такой гигант этой эпохи, как Леонардо да Винчи (1452-1519), внес свой вклад в развитие музыкальной акустики: в частности, он изу-
Предмет «музыкальная акустика». История развития 19 чал физические принципы образования певческого голоса, природу регистров, технику пения bel canto и др. Большой вклад в науку в этот период внес Дж. Царлино (1516-1590) — итальянский компо- зитор и теоретик, который занимался созданием темперированной музыкальной шкалы, обсуждал роль мажорной и минорной терции, настройку интервалов тетрахорда, разработал теорию консонансов и диссонансов на основе теории соотношения простых чисел. Он был одним из создателей учения о гармонии [4]. Серьезные научные результаты в области музыкальной акусти- ки были получены в XVII веке, и связаны они прежде всего с име- нем Г. Галилея (1564-1642). Необходимо отметить, что отец Г. Галилея Винченцо Галилей — известный композитор и музы- кальный теоретик, один из основателей нового жанра в музыкаль- ном искусстве — оперы, автор труда «Диалоги о древней и новой музыке» (1581) — также сделал ряд тонких наблюдений: в частно- сти, он установил, что если длину струны держать постоянной, то, изменяя ее массу и натяжение, можно также добиться изменения высоты тона. Он отметил, что малые изменения в настройке стру- ны не замечаются слухом (т. е. впервые обратил внимание на ко- нечную разрешающую способность слуховой системы). В. Галилей предложил в 1581 году свой вариант равномерно темперирован- ной шкалы. Продолжая дело своего отца, Галилео Галилей приблизительно в 1600 году расширил наблюдения Пифагора с помощью тщатель- но поставленных экспериментов, заложив таким образом основу экспериментальной акустики. Именно он первый установил зави- симости собственной частоты натянутой струны от ее длины, мас- сы и натяжения. Он изучал законы музыкальной гармонии, консо- нанса и диссонанса, распространение звука в воздухе, явление резонанса и др. Он впервые четко объяснил, что восприятие вы- соты тона непосредственно связано с частотой звуковой волны, которая достигает уха. На базе фундаментальных трудов Галилея музыкальная акустика начала ускоренно развиваться. Французский математик и физик, а также францисканский мо- нах Марен Мерсенн (1588-1648) в период 1627-1638 гг. опублико- вал ряд трудов, в том числе девятнадцатитомную энциклопедию «Всеобщая гармония» (1636). Результаты исследований, изло- женные в его книгах, определили дальнейшее развитие экспери- ментальной акустики: он поставил серию опытов по измерению времени возвращения эха от различных препятствий и таким об- разом смог приблизительно оценить скорость звука в воздухе (ко- торая у него оказалось равной 450 м/с). Ему удалось вывести формулу «закон Мерсенна», установившую, что «основная частота пропорциональна корню из натяжения и обратно пропорциональ- на длине струны и корню из ее массы». Он обнаружил октавную разницу между частотой открытых и закрытых труб, предложил
20 Глава 1 учение о консонансах и диссонансах, в частности, объяснил явле- ние «биений» при звучании двух тонов, близких по частоте; открыл наличие обертонов в составе сложного звука (он писал, что может идентифицировать путем прослушивания первые пять обертонов в спектре). Мерсенн работал над созданием равномерно темпериро- ванной шкалы (предложил деление октавы на равные полутоны, расположенные в соотношении, равном корню 12-й степени из 2) и т. д. Необходимо отметить, что скорость звука первым измерил Пьер Гассенди еще в 1635 году — он получил значение 478,4 м/с, при- чем установил, что скорость звука не зависит от частоты. Ученые Боррели и Вивиани во Флоренции в 1650 году повторили экспери- менты и получили значение скорости 350 м/с. В 1740 году италь- янский физик Бьянцони показал, что скорость звука увеличивает- ся с повышением температуры. (В настоящее время значение скорости звука принято равным 331,29 м/с при 0°С, по результа- там измерений 1986 года.) В период 1660-1675 гг. английский физик Р. Гук опубликовал свое открытие, установившее, что растяжение твердого тела (ме- талла, дерева и др.) пропорционально величине приложенной к нему силы. Закон Гука является основой современной теории упругих колебаний, а следовательно, и теории звука. В конце XVII — начале XVIII века детальное исследование соотношений между формами колебаний струн, их частотой и вы- сотой тона было выполнено французским физиком Ж. Совёром (1653-1716), который в 1701 году на своих лекциях в Сорбонне и предложил термин «акустика» для науки о звуке. Он изучал яв- ление биений (с помощью органных труб) и предложил метод вы- числения их частот. Кроме того, изучая колебания натянутых струн, он установил, что струны могут колебаться частями: точки, которые остаются неподвижными, Совёр назвал узлами, а сами колеба- ния — гармоническими тонами и установил, что их частоты отно- сятся как целые числа к частоте основного тона, который был назван им фундаментальным. Он также заметил, что струна может колебаться на нескольких своих гармонических тонах одновремен- но. Математическое объяснение этому явлению (принципу супер- позиции) было дано позже в трудах Л. Эйлера. В 1660 году Роберт Бойль показал,что звуковая волна не может распространяться в вакууме (он поставил эксперимент, откачав воздух из сосуда, где был установлен звонок). В этот период продолжались попытки создания равномерно темперированной шкалы: немецкий органист и теоретик А. Верк- майстер (1645-1706) предложил несколько вариантов темперации, в основу которых была положена идея отказа от чистой терции и распределения «пифагоровой коммы» между различными квин- тами [6, 24].
Предмет «музыкальная акустика». История развития 21 Таким образом, XVI и XVII века стали периодом накопле- ния в основном экспериментальных знаний в музыкальной акустике. Исследования были посвящены установлению ко- личественных связей высоты тона с частотой колебаний струн, зависящей от их геометрических и физических па- раметров; изучению процессов распространения звука в воздухе; определению скорости звука; анализу музыкаль- ных интервалов; поиску различных вариантов музыкальных шкал; первичным попыткам объяснения эффектов биений, консонансов и диссонансов; выяснению связей между тем- бром и составом обертонов. Третий период — XVIII век. Этот период характеризуется прежде всего как этап развития теоретической музыкальной акус- тики. Исаак Ньютон (1643-1727) предпринял первую попытку со- здания математической теории волнового движения. Он рассмат- ривал в своем труде «Математические начала натуральной философии» (1687) звук как процесс распространения импульсов давления в среде и вычислил, из одних теоретических соображе- ний, значение скорости звука в воздухе. Ньютон доказал, что ско- рость звука определяется как корень из величины атмосферного давления, деленной на плотность воздуха. Кроме того, он устано- вил связь основной частоты колебаний с длиной открытых труб органа, флейты и др. Труды И. Ньютона и Г. В. Лейбница (1646- 1716) позволили Д'Аламберу в 1740 году вывести общее волновое уравнение, использование которого для анализа колебаний струн, мембран, столбов воздуха и т. д. дало возможность получить мно- гочисленные прикладные применения. Огромную роль в развитии акустики этого периода сыграли тру- ды двух выдающихся физиков и математиков Д. Бернулли (1700- 1782) и Л. Эйлера (1707-1783). Оба они, получив образование в Швейцарии, в Базельском университете, длительное время рабо- тали в Санкт-Петербурге. В круг интересов обоих ученых вошла и музыкальная акустика, по проблемам которой они опубликовали целый ряд очень важных работ. Их исследования касались коле- баний струн, балок, трубок и колокольчиков в музыкальных ин- струментах, а также продольных колебаний столбов воздуха в тру- бах органа и духовых инструментах. Эйлер, кроме того, написал ряд работ по музыкальным шкалам, консонансам и системе гармо- нии. В 1759 году Эйлер вывел волновое уравнение для анализа одно-, двух- и трехмерного волнового поля в воздухе и предложил принцип разделения переменных, что является основой теорети- ческой акустики до настоящего времени. Бернулли, в частности, создал теорию и вывел формулы для расчета резонансов воздуш- ного столба в цилиндрических и конических трубах, это он впервые
22 Глава 1 показал, что закрытые с одного конца трубы имеют только нечет- ные гармоники в спектре. В период с 1772 по 1774 год они создали теорию колебаний упругих балок с разными условиями закрепле- ния краев; в частности, были получены отношения собственных частот для свободных краев в виде 1,00 : 2,76 : 5,40 : 8,90. Кро- ме того, Бернулли впервые показал, что смещения любой точки струны можно представить как сумму простых синусоидальных колебаний (принцип суперпозиции волн). Полученные результаты явились основой для развития теоретической базы музыкальной акустики в XIX-XX веках. Дж. Тартини (1692-1770), выдающийся итальянский скрипач и композитор, впервые обнаружил появление комбинационных тонов при одновременном звучании двух громких звуков; это явление было объяснено только в XX веке на базе нелинейной теории слуха. В 1802 году появилась знаменитая книга немецкого акустика, члена-корреспондента Петербургской Академии наук Е. Хладни (1756-1827) «Акустика». В ней были представлены результаты исследований колебательных процессов в пластинах, мембранах, балках и других вибраторах, используемых в музыкальных ин- струментах. Он впервые предложил метод визуализации форм колебаний различных тел с помощью песчаных фигур на их по- верхности, которые получили название «фигуры Хладни». Следу- ет отметить, что в настоящее время визуализация колебаний дек, пластин, струн и т. д. осуществляется с помощью лазерной техни- ки, однако полученные формы по-прежнему называются «фигуры Хладни». Е. Хладни получил много интересных результатов в изу- чении вибраций струн и пластин, а также внес свой вклад в из- мерение скорости звука в твердых телах с помощью анализа рас- пределения узловых линий в металлических стержнях. Таким образом, в XVIII веке создается теоретическая база развития музыкальной акустики на базе математиче- ской физики, механики и т. д. Это дало возможность при- ступить к количественному анализу механизмов звукообра- зования в музыкальных инструментах и послужило основой для их модернизации и развития. Четвертый период — XIX век. В начале XIX века француз- ский ученый Ж. Фурье (1768-1830) предложил метод представле- ния сложного сигнала в виде суммы простых гармонических коле- баний. С 1822 года, когда появилась теория рядов Фурье, начал развиваться спектральный анализ и синтез звука, который в насто- ящее время широко используется в музыкальных редакторах и компьютерных программах звуковой обработки. Немецкий физик Г. Ом (1787-1854) впервые установил, что слух чувствителен к амплитудам (но не к фазам) гармонических со-
Предмет «музыкальная акустика». История развития 23 ставляющих сложного звукового сигнала (точнее, он считал, что тембр зависит только от распределения энергии между гармони- ками). Это положение известно как «слуховой закон Ома». Примерно в 1830 году французский физик Ф. Савар (1791-1841) и другие ученые предположили, что слышимый диапазон звуковых частот находится в пределах от 16-32 колебаний в секунду до 24000 колебаний в секунду (сейчас единица частоты колебаний в секунду носит название «Герц» — в честь известного немецко- го физика Генриха Герца (1857-1894), чей вклад в изучение элек- тромагнитных волн определил новую эпоху в физике). В настоя- щее время эти пределы считаются равными 20-20000 Гц, хотя в среднем они существенно меньше (из-за возрастных и других из- менений). Труды Ж. Лагранжа (1736-1813) по механике и разработанный им метод исследования колебаний струны как распределенной системы (путем предельного перехода от системы с конечным числом степеней свободы), а также труды С. Д. Пуассона, Т. Юнга, П. Лапласа по механике колебаний различных тел (мембран, пластин и др.) легли в основу дальнейшего теоретического раз- вития акустики. Значительным событием было появление знаме- нитого двухтомного труда «Теория звука» (1877-1878) профессо- ра, а с 1908 года президента Кембриджского университета Джона Стретта, лорда Рэлея (1842-1919), который многократно переизда- вался и до настоящего времени широко используется в науке [9]. В этой книге были обобщены научные результаты, на- копленные в XVIII-XIX веках, а также собственные работы авто- ра по анализу колебаний струн, мембран, пластин, столбов возду- ха и теории распространения колебаний в упругих средах. Все это создало базу для развития различных научных направлений, в том числе современной акустики музыкальных инструментов. Огромный вклад в развитие музыкальной акустики внес Герман Гельмгольц (1821-1894) — профессор физиологии в Кенигсберге, затем профессор физики и директор первого физико-техническо- го института в Берлине. В книге «Учение о слуховых ощущениях как физиологическая основа теории музыки» (1863) он изложил концепцию резонансной теории слуха, предложил свою теорию консонансов и диссонансов и др. Он начал экспериментальное изучение спектрального состава звуков (изобрел для этих целей так называемые резонаторы Гельмгольца); впервые объяснил воз- никновение разностных тонов (эффект Тартини) как следствие не- линейной обработки сигналов в слуховой системе. Он предложил теорию голосообразования, которая в принципе подтверждается и в наши дни. Круг его интересов был необычайно широк. Гельм- гольц внес также огромный вклад в развитие оптики, электромаг- нетизма и механики.
24 Глава 1 Труды Гельмгольца явились базой для формирования в конце XIX века психоакустики: в 1876 году А. Мейер описал явление маскировки одного звука другим, при этом он обратил внимание на различный характер участия в процессах маскировки низко- и высокочастотных звуков. К этому же времени относятся работы по определению дифференциальных порогов слухового восприя- тия частоты. Карл Штумпф (1848-1936) опубликовал двухтомный труд «Психология звука» (1883-1890), явившийся событием в психоакустике, в котором он предложил ввести для многомерного описания тембра такие субъективные шкалы, как полнота, яркость, острота и др. Он впервые отметил, что музыкальные интервалы воспринимаются по высоте в высоких октавах иначе, чем в низких (что подтвердилось при создании современной шкалы оценки пси- хофизической высоты звука в «мелах»). Термин «музыкальная акустика» был введен в науку в 1898 го- ду, когда в Лейпциге вышла работа швейцарского акустика А.Жанкьера «Основы музыкальной акустики». Г. Риман в 1891 году написал труд, который был переведен на русский язык под на- званием «Акустика с точки зрения музыкальной науки». Теория распространения звука в помещениях, в частности ста- тистическая теория расчета звуковых полей, была создана про- фессором Гарвардского университета В. Сэбином (1868-1919). Именно он предложил формулу для расчета времени ревербера- ции в помещении в зависимости от его объема и среднего коэф- фициента поглощения (в честь него единица поглощения была названа «Сэбин)». Бостонский симфонический зал, построенный в 1900 году, был создан на основе его расчетов. Двоюродный брат ученого П. Сэбин, опубликовавший в 1932 году книгу «Акустика и архитектура», продолжил эти исследования. Таким образом, в XIX веке был достигнут значитель- ный прогресс в теории механических колебаний; сделаны выдающиеся открытия в области электричества и магне- тизма (в конце века были изобретены такие приборы как фонограф, телефон и микрофон); создана статистиче- ская теория для анализа распространения звука в поме- щениях; заложены основы формирования психоакустики. В итоге музыкальная акустика как наука сформировалась окончательно во всех своих основных направлениях, вклю- чающих исследование проблем создания, распространения и восприятия музыкальных звуков. Пятый период — XX век. Двадцатый век принес с собой революционные изменения в развитии музыкальной акустики. По- явились принципиально новые средства создания звука и способы
Предмет «музыкальная акустика». История развития 25 его передачи (радио, телевидение, мультимедиа); была создана мощная индустрия по производству технических средств записи, передачи и воспроизведения звука; научные исследования сосре- доточились в крупных институтах и лабораториях и на них стали отпускаться значительные средства как от государства, так и от промышленности; компьютерная революция изменила возможно- сти теоретической и прикладной науки и привела к появлению принципиально новых направлений; произошла дальнейшая диф- ференциация акустики, в том числе и музыкальной. Темп прогрес- са как в теоретической, так и в прикладной науке лавинообразно возрастал с каждым десятилетием. В развитии музыкальной акустики во всех ее основных направ- лениях был достигнут громадный прогресс — как в исследовании проблем создания музыкальных звуков (акустика музыкальных ин- струментов, акустика певческого голоса, электроакустика и компью- терные музыкальные технологии), так и в изучении способов их передачи (акустика концертных залов, студий и др.) и восприятия (психоакустика). Восприятие звука (психоакустика). Труды Г. Гельмгольца создали фундамент для развития психоакустики (а также психо- физиологии, музыкальной психологии и др.) в конце XIX — на- чале XX века как самостоятельного направления в науке, тесно переплетающегося (в той ее части, которая касается вопросов вос- приятия музыкальных звуков) с музыкальной акустикой. К 1910 году были сформулированы основные принципы геш- тальт-психологии, а именно принципы формирования «образа» при восприятии окружающего мира, в основе которых используют- ся такие понятия, как близость, подобие, непрерывность [25]. Эти принципы были первоначально использованы для объяснения восприятия визуальных объектов, однако современная психоакус- тика применяет их для объяснения восприятия музыки и речи [26]. Большой вклад в понимание процессов восприятия музыки вне- сли работы К. Сишора (1866-1949), эксперименты Д. Шаутена в 1938 году и Дж. Ликлайдера в 1954 году и последующие работы Е. Терхардта (основные их результаты изложены в книге «Концеп- ция музыкальной гармонии: связь между музыкой и психоакусти- кой», 1984), позволившие создать теорию восприятия высоты тона, в том числе объяснить эффекты восприятия «виртуальной» вы- соты (см. гл. 3). В начале 1920-х годов в Bell Lab. (США) начали активно разви- ваться исследования по слуховому восприятию музыки и речи, обусловленные потребностями активно развивающейся аудиотех- ники. Занимаясь изучением восприятия музыки и речи, Г. Флетчер и его группа впервые определили пороги чувствительности слуха в зависимости от частоты (кривые равной громкости), определили
26 Глава 1 болевой порог слуха (120 дБ) и установили дифференциальные пороги по частоте и интенсивности. В этот же период была уста- новлена количественная связь изменений физических параметров и вызываемых ими ощущений (закон Вебера — Фехнера). Резуль- таты этих работ были отражены в 1922 году в книге Г. Флетчера «Речь и слух» [27]. Группа под руководством Г. Флетчера успеш- но продемонстрировала в 1934 году стереофонический звук и на- чала активно заниматься бинауральной стереофонией. Работы по слуховому восприятию были продолжены С. Стивенсом, который ввел шкалы для оценки высоты тона (в мелах) и громкости (в со- нах) [28]. Огромный вклад в развитие психоакустики внес венгерский про- фессор Г. Бекеши (1899-1972), который с 1947 года работал в Гар- вардском университете в США. Он описал эффект бегущей волны на базилярной мембране во внутреннем ухе и показал, что распо- ложение нервных рецепторов и степень их активности играют принципиальную роль при определении высоты и громкости звука. За этот комплекс работ он получил в 1961 году Нобелевскую пре- мию. Им были написаны такие книги как «Experiments in Hearing» (1960) и «Sensory lnhibition» (1967) [29]. В настоящее время психоакустика (не только в той части, кото- рая пересекается с музыкальной акустикой) является одним из са- мых быстро развивающихся направлений науки, в частности и по- тому, что от ее успехов в понимании процессов «расшифровки» звукового образа слуховой системой зависит прогресс всей мощ- ной мировой аудиоиндустрии. Добившись значительных успехов в понимании механизмов слухового распознавания высоты тона, громкости, тембра, локализации, маскировки и др., современная психоакустика (совместно с когнитивной психологией) занимается вопросами комплексного восприятия «слухового образа». Из наиболее известных ученых, занимающихся в настоящее время различными аспектами слухового восприятия музыкальных и речевых сигналов, можно выделить следующих: Moore В. — Univ. of Cambridge (UK) [30]; Hartmann W. M. — Michigan State Univ. (USA) [31]; McAdamc S. — IRCAM (France) [32]; Houtsma A. — IPO/TUE (ND) [33]; Deutsch D. — Univ. of California (USA) [34]; Roederer J. — Univ. of Alaska (USA) [35]; Zwicker U. — EPO (Germany) [36]; Terhard E. — Tech. Univ. Munchen (Germany) [37]; Rossing T. — Northern Illinois Univ. (USA) [15]; J. Blauert — Ruhr. Universitat Bochum (Germany) [38]; R. Parncutt [39] и мн. др. По это- му направлению издаются десятки книг и журналов, например Music Perception, Psychology of Music, Psychomusicology, JASA, JAES и т. д. На всех международных конгрессах таких крупных научных обществ, как: ESCOM (European Society for the Cognitive science of Music), SMPC (Society for Musical perception and
Предмет «музыкальная акустика». История развития 27 Cognition), SEMPRE (Society for Education, Music and Psychology), AES (Audio Engineering Society), ASA (Acoustical Society of America) и др., работают специальные секции по психоакустике, вызываю- щие огромный интерес специалистов. Передача звука (архитектурная акустика, системы звукоуси- ления). Работы по созданию теории расчета звуковых полей в по- мещениях в XX веке были продолжены: в частности, С. Эйринг, активно работавший в начале века на Bell Telephone Lab. (США) вместе с Г. Флетчером, усовершенствовал формулу Сэбина для случая больших коэффициентов поглощения в залах. Профессор Калифорнийского университета В. Кнудсен внес большой вклад в изучение резонансов колебаний объема воздуха в помещении, в расчет затухания звука в воздухе и др. (V. О. Knudsen. Architectural Acoustics», 1932). Труды таких ученых, как Ф. Морз [21], Е. Скучик [40] и др., создали теоретическую базу для анали- за процессов колебаний и излучения звука. Опыт, накопленный акустиками при строительстве крупных кон- цертных залов (Royal Festival hall в Лондоне, Salle Pleyel в Пари- же, Beethovenhalle в Бонне и др.), и дальнейшее развитие теории архитектурной акустики были обобщены в трудах Л. Беранека, его книга «Music, acoustics and architecture)) (1962) выдержала уже не- сколько изданий и является вместе с остальными его трудами классической основой современной акустики [41]. Громадный вклад в развитие акустики концертных, оперных залов, кинозалов, студий и других помещений внесли труды таких ученых как Г. Олсон, X. Кутруф, М. Шредер, В. Кнудсен, М. Барон, И. Андо, В. Иордан, В. Рейхард и др. [42-46]. Наряду со строительством крупных концертных и оперных за- лов с естественной акустикой XX век принес новое направление: создание многопрофильных концертных залов, стадионов и пр. с использованием различных систем звукоусиления. Теория расче- та и проектирования таких систем представлена в трудах много- численных ученых, из которых можно выделить работы В. Анер- та [47, 48]. В конце века появилось новое направление в акустике, осно- ванное на современных компьютерных технологиях, получившиее название «аурализация» (термин был предложен М. Клейнером в 1983 году на конгрессе AES). Целью его является создание трехмерных виртуальных моделей любых помещений, позволяю- щее с учетом бинауральных слуховых характеристик воспроиз- вести звучание музыки и речи в любых залах (в т. ч. еще и не построенных). По этому направлению ведутся работы в лабора- ториях многих стран мира, и ему уделяется сейчас большое вни- мание на всех конгрессах AES и в научной литературе.
28 Глава 1 Создание звука (акустика музыкальных инструментов, аку- стика голоса). В начале XX века и в 1930-е годы большой вклад в развитие этого направления музыкальной акустики внесли ра- боты К. Сишора и Д. Миллера. Немецкий ученый В. Лоттермозер получил очень значительные результаты в изучении акустики органа и других инструментов. Следующее поколение ученых представлял Ю. Мейер, его классическая книга «Akustik und musikalische Auffuhrungspraxis» вышла уже третьим изданием в 1995 году [49]. В последующие годы в музыкальной акустике работали и рабо- тают такие известные специалисты как A. Benade, J. Backus, Т. Rossing, N. Н. Fletcher, С. Hutchins, D. Е. HaII и др. [12-18]. Акустикой музыкальных инструментов занимаются десятки институтов и Университетов мира: IRCAM (France), Stanford University — CCRA (USA), McGiII University (Canada), Royal Institute of Technology — KTH (Sweden), Institute for Musical Acoustics — IWK (Austria), International Academy of Music (Italy), Cambridge University Eng. Department (UK), Humboldt Univ. (Germany), Univ. Edinburg (UK) и др., труды которых регулярно представляются на международных конгрессах и конференциях SMAC, ISMA, AES Convention, Meeting of the ASA и др. Международным центром по изучению акустики певческого голоса является Шведская академия музыки, где президентом Комитета по музыкальной акустике на протяжении многих лет с 1970 года является проф. Johan Sundberg: им самим и его кол- легами выполнен большой комплекс исследований по акустике певческого голоса, результаты которых обобщены в его книге «Аку- стика певческого голоса» [50]. Под его руководством проходят ре- гулярные международные семинары по различным направлениям в музыкальной акустике, доклады на которых обобщены в двенад- цатитомных трудах. В этом центре регулярно читаются лекции, проходят семинары и стажировка специалистов из различных стран мира. С начала XX века стали активно создаваться электромузы- кальные инструменты: электроорганы Т. Кахилла и Л.Хаммонда, терменвокс, волны Мартено, тратониум, электропианино, электро- гитары и др. (см. гл. 7). В 1960-е годы появились первые аналоговые синтезаторы (R. Moog), в 1990-е были созданы цифровые устройства: синтеза- торы, сэмплеры, секвенсоры, МИДИ-синтезаторы, компьютерные музыкальные рабочие станции и др., которые открыли новую эпоху в создании и обработке музыкальных и речевых сигналов с помо- щью компьютерных цифровых технологий (см. главу 7) [51-53]. Появление новой компьютерной технической базы с огромными возможностями по управлению параметрами звука создало осно-
Предмет «музыкальная акустика». История развития 29 ву для развития новых направлений электронной (электроакусти- ческой) и компьютерной музыки [54]. Эти же возможности открыли принципиально новые перспекти- вы в развитии музыкальной акустики. Начало XXI века. Музыкальная акустика интенсивно развива- ется на базе современных компьютерных технологий, возможности которых возрастают в геометрический прогрессии по всем трем главным направлениям: — в направлении создания звука разрабатываются компьютер- ные модели имеющихся музыкальных инструментов (методы фи- зического моделирования), создаются новые музыкальные ин- струменты на основе компьютерных музыкальных технологий, разрабатываются алгоритмы компьютерного распознавания музы- кальных инструментов и т. д., что открывает новые возможности для развития музыкального творчества; — в направлении распространения звука создаются новые технологии аурализации, т. е. методы создания компьютерных мо- делей помещений и способы их проектирования; — в области восприятия звука достигнут громадный прогресс в создании компьютерных моделей механизмов слуха, наука стоит на пороге понимания механизмов расшифровки слухово- го образа, что открывает новые пути для развития аудиотехни- ки, акустики и музыки. Музыкальная акустика преподается в большом количестве уни- верситетов, консерваторий и институтов. Для координации систе- мы образования создан Международный комитет во главе с про- фессором Т. Россингом (Northern Illinois Univ. — USA), который издает методические рекомендации. Сотни книг и журналов печатается по этому направлению: JASA, JAES, Acustica, Journal of Voice, J. Cat Gut Society, J. of the American Musical Instrument Society, Galpin Society Journal, Computer Music Journal и т. д., большое количество информации представлено в сети Интернет. Таким образом, в течение XX и в начале XXI века полу- чили ускоренное развитие научные исследования по всем направлениям, связанным с музыкальной акустикой (по акустике музыкальных инструментов, акустике речи и пения, электроакустике, архитектурной акустике, пси- хоакустике и др.). Этот же период привел к появлению нового поколения электромузыкальных и электронных инструментов и прин- ципиально новых способов создания, передачи и воспроиз- ведения музыки и речи на основе систем звукозаписи,
30 Глава 1 звукопередачи (радиовещания, телевидения, мультимедиа) и звуковоспроизведения. Развитие этих систем послужило основой для создания и развития мощной аудиопромыш- ленности, обеспечивающей выпуск громкоговорителей, микрофонов, усилителей, передатчиков, процессоров и других видов оборудования. Последние десятилетия характеризуются появлением новых цифровых технологий, послуживших основой для развития современных видов синтеза и обработки музыки и речи; для разработки компьютерных моделей слуховой системы; для создания и передачи трехмерного виртуаль- ного звукового пространства, для развития электронной и компьютерной музыки. Все это открывает новые пер- спективы в развитии музыкальной акустики как научной основы музыкального творчества. 1.3. МУЗЫКАЛЬНАЯ АКУСТИКА В РОССИИ Музыкальная акустика в России начала развиваться в конце XIX — начале XX века и прошла за столетие интересный и свое- образный путь. Подробная библиография трудов русских ученых по музыкальной акустике за период 1898-1994 гг. собрана в работе А. С. Галембо [55]. В конце XIX — начале XX века появились на русском языке работы А. Лемана, Н. Нестерова, Д. Зеленского по анализу звуко- извлечения в смычковых музыкальных инструментах, в первую оче- редь в скрипках. В 1923-1925 гг. были изданы труды: А. Белявско- го «Теория слуха применительно к музыке. Основы физической и музыкальной акустики» [56] и профессора Л. Немировского «Акустика физическая, физиологическая и музыкальная», создан- ный на основе его лекций в Ленинградской консерватории [57]. Начало организованных исследований в музыкальной акустике можно датировать 1920-30-ми гг. Ленинградская эксперименталь- ная электротехническая лаборатория при научно-техническом от- деле ВСНХ, начавшая свою деятельность с 1919 года, в период 1924-1929 гг. проводила комплекс научных исследований по музы- кальной акустике под руководством В. И. Коваленкова [58]. В течение 1925-1930 гг. в Государственном институте истории искусств (ГИИИ) работала музыкально-акустическая лаборатория под руководством сначала В. И. Коваленкова, затем Л. Г. Немиров- ского и Е. А. Шолпо, в ней проводились работы по изучению аку- стики музыкальных инструментов, микротемперации, электриче- ской записи звука и др. [59]. В 1930 году в Ленинграде была создана Центральная музы- кально-акустическая лаборатория, преобразованная двумя годами
Предмет «музыкальная акустика». История развития 31 позднее по инициативе академика Н. Н. Андреева в Научно-иссле- довательский институт музыкальной промышленности (НИИМП), в котором работали многие выдающиеся ученые-физики: Н. Н. Ан- дреев, А. В. Римский-Корсаков, И. И. Кузнецов, А. А. Харкевич, Г. А. Остроумов, Н. А. Дьяконов, Н. И. Угольников, Я. М. Гуревич, Л. С. Вагин и др. В институте выполнялся большой комплекс работ по изучению материалов для музыкальных инструментов, механизмов взаимодействия струн и дек в фортепиано и щипковых инструментах, исследованию механических свойств клавишных механизмов, системы звукообразования в духовых инструментах, по созданию аппаратуры для записи и анализа свойств звуков музыкальных инструментов и т. д. [55]. Институт тесно сотруд- ничал с отраслевой научно-исследовательской лабораторией, созданной в 1932 году на фабрике «Красный Октябрь» под руко- водством Н. А. Дьяконова, а также с фабрикой им. А. В. Луначар- ского по изучению и разработке новых моделей роялей, гитар, балалаек и других струнных инструментов [60]. Результаты этих работ нашли позднее свое отражение в книге А. В. Римского-Кор- сакова и Н. А. Дьяконова «Музыкальные инструменты. Методы исследования и расчета» [61] и трех томах сборника «Труды НИИМП». Перед Второй мировой войной институт в Ленинграде был закрыт. В Москве под руководством профессора Н. А. Гарбузова в 1921 году был создан Государственный институт музыкальной науки (ГИМН), который просуществовал до 1931 года. После этого Н.А. Гарбузов создал при Московской консерватории Научно-ис- следовательский музыкальный институт (НИМИ), выделив в нем акустическую лабораторию [62]. С середины 1930-х годов в ней ра- ботал А. А. Володин, один из ведущих специалистов в области электромузыкальных инструментов, автор книги «Электромузы- кальные инструменты» [63]. Лаборатория занималась изучением акустики музыкальных инструментов, певческого голоса, пси- хологией восприятия музыкальных звуков и т. д. В ней в разное время работали акустики, психологи, музыковеды, такие как С. Г. Корсунский, С. С. Скребков, Л. С. Термен, Ю. Н. Pare, Е. В. Назайкинский, П. Н. Зимин, И. Д. Симонов и др. Лаборатория музыкальной акустики перестала функционировать в 1991 году. На ее базе в 1992-м была создана Студия электронной музыки и Термен-центр под руководством А. Смирнова. Период 30-70-х годов XX века характеризуется появлением целого ряда серьезных трудов по музыкальной акустике, а также огромным интересом ученых-акустиков и инженеров к разработке нового поколения электромузыкальных инструментов. В 1919 году был создан первый в мире электромузыкальный инструмент «Тер- менвокс» (автор Л. Термен), затем целая серия других электрому- зыкальных инструметов: в 1924 году В. А. Гуров и В. И. Волынкин
32 Глава 1 построили одноголосный грифово-реостатный инструмент «Виоле- на»; в 1925-м С. Н. Ржевкин создал многоголосный клавишный ин- струмент «Катодный гармониум»; к 1935 году А. А. Володин разра- ботал ряд моделей клавишно-грифового инструмента «Экводин». В 1937 году И.Д.Симонов представил клавишный инструмент «Компанола», а в 1944-м А. В. Римский-Корсаков, В. А. Крейцер, А. А. Иванов разработали клавишный электромузыкальный ин- струмент «Эмиритон». В 1955 году С. Г. Корсунский создал гармо- ниум «Кристодин», в 1958-м им же и И. Д.Симоновым было разработано камертонное пианино с электронным возбуждением звука [63]. В это время музыкальной акустикой в России занимались мно- гие выдающиеся ученые, из которых в первую очередь должны быть упомянуты: — Л. С. Термен (1896-1993) — выдающийся физик и музыкант, в 1919 году изобрел первый в мире концертный электронный му- зыкальный инстумент «Терменвокс», который он демонстрировал во многих странах мира. Его концерты, в том числе в Метрополи- тен-опера (США), производили очень большое впечатление на многих композиторов и музыкантов. До настоящего времени звучание инструмента используется для звукового сопровождения фильмов, в концертах и т. д. Находясь длительное время в Аме- рике, Л. С. Термен работал над созданием других инструментов (электронной виолончели, четырехоктавного клавишного инстру- мента и др). После возвращения в 1938 году в СССР он оказал- ся в заключении, где работал в специальной лаборатории по со- зданию систем распознавания речи, идентификации голоса и др. Затем он был сотрудником лаборатории музыкальной акустики при Московской консерватории, с 1966 года начал работать в Москов- ском университете, где активно трудился на протяжении ряда лет в области акустики (в том числе над созданием многоголосного ва- рианта терменвокса). В том же 1966-м опубликовал книгу «Физи- ка и музыкальное искусство» [64]; — А. В. Римский-Корсаков (1910-2002) — ученый-акустик, доктор физико-математических наук. С 1932 года работал в НИИ музыкальной промышленности в Лениграде, являлся одним из со- здателей электронного инструмента «Эмиритон», соавтор книги «Музыкальные инструменты» (1952) [61], которая содержала цен- ные теоретические выкладки и описание результатов по изучению звучания и технологии изготовления струнных инструментов. После войны работал заведующим отделом Акустического института РАН в Москве, занимался фундаментальными проблемами аэро- и гид- роакустики, был членом редколлегии европейского журнала «Акустика»; — А. А. Володин (1914-1981) — выдающийся ученый, чьи тех- нические идеи нашли свое отражение в большом количестве па-
Предмет «музыкальная акустика». История развития 33 тентов на электронные музыкальные инструменты и в его книге «Электромузыкальные инструменты» [62]. Большое внимание он уделял в своих работах проблемам восприятия звука (акустике слуха). Результаты этих исследований были опубликованы в его многочисленных статьях по данному вопросу; — Н. А. Гарбузов (1880-1955) — профессор Московской кон- серватории, один из основателей и директор ГИМН (1921-1931), руководитель акустической лаборатории при Московской консерва- тории. С 1933 по 1948 год занимался проблемами музыкального слухового восприятия, создал зонную теорию слуха [65], издал учебник «Музыкальная акустика» (1954) [10], который широко используется до настоящего времени. В 1970-1990-е годы работы по акустике музыкальных инструмен- тов продолжались в лаборатории музыкальной акустики в Москов- ской консерватории, а также в акустической лаборатории при фаб- рике «Красный октябрь» в Ленинграде. В ней в разное время работали Н. А. Дьяконов, Б. Я. Турина, А. Н. Ривин, А. С. Галембо и др. [60]. В 1967 году на базе фабрики музыкальных инструментов «Заря» был создан под Москвой Научно-исследовательский конструкторско-технологический институт музыкальной промыш- ленности (НИКТИМП), который должен был обеспечивать потреб- ности производства. Некоторые результаты выполненных в нем научно-исследовательских работ по музыкальной акустике нашли отражение в справочнике Л. А. Кузнецова «Акустика музыкальных инструментов» [66]. К сожалению, музыкальная акустика не пользовалась такой поддержкой государства, как другие направления акустики (гидро- акустика, ультразвуковая акустика и пр.), поэтому многие видные ученые-физики, начавшие заниматься музыкальной акустикой, переориентировались на эти области науки (С. Н. Ржевкин, А. В. Римский-Корсаков, А. Н. Ривин и др), по этой же причине не было создано крупных научно-исследовательских институтов по музыкальной акустике, работы продолжались только в отдельных лабораториях при Ленинградской консерватории, при Московской консерватории и при ряде производств. Выдающиеся результаты в области изучения акустики вокаль- ной речи были получены в это время под руководством профес- сора В. П. Морозова. Начав свои исследования по акустике голо- са в Институте физиологии им. Сеченова в Ленинграде, он организовал лабораторию по изучению певческого голоса в Ле- нинградской консерватории. Там в период 1960-1968 гг. был вы- полнен большой комплекс исследований по акустике вокальной речи, которые были затем продолжены им в Москве в Институ- те психологии РАН (Центр «Искусство и наука») и в Московской
34 Глава 1 консерватории. Исследовались проблемы невербальной коммуни- кации, восприятия речи и пения, акустические параметры и их связь с эмоциональным содержанием вокальной речи и др. В. П. Морозовым опубликовано пятнадцать монографий, среди них «Тайны вокальной речи» (1967), «Биофизические основы вокальной речи» (1977), «Искусство и наука общения: невербаль- ная коммуникация» (1998), «Искусство резонансного пения» (2002) и др. (см. гл. 4). Необходимо отметить.что акустике речи было уделено много го- сударственного внимания в связи с изучением проблем ее распоз- навания и синтеза, этими вопросами занимались в 1960-90-е годы крупные научно-исследовательские институты. Из акустических ра- бот этого периода можно отметить труды таких известных ученых как Л. А. Чистович, Л. Я. Мясников, В. И. Галунов, Ю. А. Дубровский, А. В. Венцов, В. Г. Михайлов, М. А. Сапожков, В. Н. Сорокин и др. (см. гл. 4). Проблемам распространения звука в России уделялось всегда очень серьезное внимание, в стране была создана прекрасная школа архитектурной акустики трудами таких ученых, как акаде- мик Н. Н. Андреев, В. В. Фурдуев, А. Н. Качерович, М. А. Сапож- ков, В. С. Маньковский, Л. И. Макриненко, Ю. П. Щевьев и др. (см. гл. 5). Задачами слухового восприятия звука занимались и продолжа- ют заниматься такие институты как АКИН, Институт физиологии им. Павлова, Институт физиологии им. Сеченова; специалисты Н. А. Дубровский, Я. А. Альтман, Г. В. Гершуни, Н. Г. Бибиков, И. А. Вартанян, А. П. Молчанов, Е. А. Радионова и др. (см. гл. 3). В настоящее время проблемами музыкальной акустики в ее связи с теорией музыкального искусства занимаются в Московской консерватории профессор Ю. Н. Pare (докторская диссертация ко- торого, защищенная в 1998 году, была посвящена теме «Акусти- ка в системе музыкальных наук» [8]), профессор Е. В. Назайкин- ский (автор книг «О психологии музыкального восприятия», 1972; «Звуковой мир музыки», 1988) и др. [67]. Вопросы восприятия музыки и речи нашли отражение в трудах Г. В. Иванченко, В. И. Петрушина и др. [68]. Изучением музыкальных инструментов, в том числе и с точ- ки зрения их акустических характеристик, занимаются в Россий- ском институте истории искусств РАН в секторе инструменто- ведения под руководством известного ученого, профессора, доктора искусствоведения И. В. Мациевского. Практические исследования в области музыкальной акустики проводят А. С. Галембо (Санкт-Петербург) и А. Стулов (Таллин, Институт кибернетики).
Предмет «музыкальная акустика». История развития 35 Большой интерес вызывают сейчас новые направления в музы- кальной акустике, связанные с созданием музыки (спектральной, акустической, микротоновой и др.) с помощью компьютерных тех- нологий, а также с развитием физических моделей музыкальных инструментов. Этими направлениями и образовательными про- граммами на их основе занимаются: Студия электронной музыки и Термен-центр при Московской консерватории; компьютерная ла- боратория NTONYX при Новосибирской консерватории; Центр электронной музыки А. Энфи и многие другие.
36 Глава 1 Список литературы 1. Порвенков В. L Акустика и настройка музыкальных инструментов. Методическое пособие по настройке. M.: Музыка, 1990. 2. Hunt E V. Origins in Acoustics. London.: Yale University Press, 1978. 3. Lindsay R. B. The Story of acoustics. JASA. 1966. V. 39, n. 4. 4. The New Grove dictionary of music and musicians I Ed. Sadie S. V. 1- 20. London.: Macmillan Press, 1994. 5. Музыкальный словарь Гроува / Пер. с англ. M.: Практика, 2001. 6. Музыкальная энциклопедия. Т. 1-6. M.: Сов. Энциклопедия, 1981. 7. Encyclopedia of Acoustics I Ed. Crocker M. V. 1-4. N. Y.: Wiley & Sons, 1997. 8. Рагс Ю. H Акустика в системе музыкального искусства. Диссертация в виде научного доклада. M.: МГК, 1998. 9. Корсаков Г. С Физические основы музыкальной акустики. Конспект лекций. Л. : Изд-во Лесотехнической академии, 1972. 10. Музыкальная акустика / Под общ. ред. Гарбузова Н. A. M.: Гос. муз. изд-во, 1954. 11. Аллон С M., Максимов Н. И. Музыкальная акустика. M.: Высшая школа, 1971. 12. Backus J. The Acoustical Foundation of Music. N.Y.: Norton & Company, 1969. 13. Benade A. Fundamentals of Musical Acoustics. London.: Oxford University Press, 1995. 14. Hall D. Musical Acoustics. An Introduction. N.Y: Wadsworth Publ., 1980. 15. Rossing T. D. The Science of Sound. N.Y: Addison-Wesley Publ., 1982. 16. Meyer J. Acoustics and the Performance of Music. Frankfurt.: Verlag Das Musikinstrument, 1978. 17. Musical Acoustics, part 1, 2. I Ed. Hutchins C. N.Y: Wiley & Sons, 1975, 1976. 18. Тэйлор Ч. А. Физика музыкальных звуков. M.: Легкая индустрия, 1976. 19. Физика. Большой энциклопедический словарь. M.: Научное издатель- ство «БРЭ», 1999. 20. Cmpemm (Рэлей) Дж. В. Теория звука. M.: Гос. изд-во техн. лит., 1955. 21. Морз Ф. Колебания и звук. M.: Гостехтеориздат, 1949. 22. Ефимов А. П., Никонов М. А., Сапожков М. А. и др. Акустика. Спра- вочник. M.: Радио и Связь, 1986 . 23. SundbergJ. The Science of Musical Sounds. N.Y: Academic Press, 1991. 24. Шерман H Формирование равномерно-темперированного строя. M.: Музыка, 1964. 25. Шиффман X. Р. Ощущение и восприятие. СПб.: Питер, 2003.
Предмет «музыкальная акустика». История развития 37 26. Bregman A.S. Auditory Scene Analysis: The Perceptual Organization of Sound. Cambridge.: MIT Press, 1990. 27. Fletcher H. Speech and Hearing in Communication. N.Y.: Van Nostrad, 1953. 28. Stevens S. Psychophysics. N.Y.: Wiley & Sons, 1975. 29. Bekesy G. Experiments in Hearing. N.Y.: McGraw-Hill, 1960. 30. Moore B. Introduction to the psychology of hearing. N.Y.: Academic Press, 1989. 31. Hartmann W. Signals, Sound and Sensation. N.Y.: AIP Press, 1997. 32. McAdamc A., de Cheveigne D., Collet S. Auditory Signal Processing: Psychophysics, Physiology and Modeling. N.Y.: Springer, 2004. 33. Houtsma A. Pitch and Timbre: Definition and Use. Journal of New Music Research, 1997. V. 26. 34. The Psychology of Music I Ed. Deutsch D. N.Y.: Academic Press, 1999. 35. Roederer J. The Physics and Psychophysics of Music. New York.: Springer, 1994. 36. Zwicker E., Fast K Psychoacoustics. N.Y.: Springer, 1999. 37. Terchardt E. Akustische Kommunikation: Grundlagen mit Horbeispielen. Berlin.: Springer, 1998. 38. Blauert J. Spatial Hearing: The Psychophysics of Human Sound Localization. Cambridge.: MIT Press, 1997. 39. Parncutt R. Harmony: A Psychoacoustical Approach. • N.Y: Springer, 1990. 40. Скучик E. Основы акустики. Т. 1-2. M.: Мир, 1976. 41. Beranek L. Music, Acoustics and architecture. N.Y: Wiley & Sons, 1996. 42. Olson H. Music, Physics and Engineering. N.Y: Dover Publ, 1967. 43. Кнудсен В. Архитектурная акустика. M.: Стройиздат, 1956. 44. Kutruff Н. Room Acoustics. London.: Elsevier, 2000. 45. Barron M. Auditorium Acoustics and Architectural Design. London.: Chapman & Hall, 1993. 46. Иордан В. Акустическое проектирование концертных залов и теат- ров. M.: Стройиздат, 1986. 47. Анерт В., Рейхардт В. Основы техники звукоусиления. M.: Радио и связь, 1984. 48. Анерт В., Стеффен Ф. Техника звукоусиления. Теория и практика. M.: Эра, 2003. 49. Meyer J. Akustik und musikalische Auffuhrungspraxis. Leitfaden fur Akustiker, Tonmeister, Musiker. Frankfurt.: Boshinsky, 1972. 50. Sundberg J. The Science of the Singing Voice. Illinois.: Dekalb, 1987. 51. Douglas A. The Electronic Musical Instrument Manual: A Guide to Theory and Design . London.: Focal Press, 1976 52. Dodge C. and Jerse J. A Computer Music: Synthesis, Composition & Performance. N. Y: Schimmer Books, 1985. 53. Lehrman P., Tully T. MIDI for the Professional. N.Y: Amsco Publication, 1993.
38 Глава 1 54. Chadabe J. Electric Sound: The Past and Promise of Electronic Music. N. Y.: Prentice Hall, 1997. 55. Galembo A. Russian (Soviet) Contribution to Musical Acoustics. JASA, 1996. V. 98, n. 6. 56. Белявский А. Теория слуха применительно к музыке. Основы физи- ческой и музыкальной акустики. М. — Л.: Гос. изд., 1925. 57. Немировский Л. Г. Акустика физическая, физиологическая и музы- кальная. М. — Пг.: Гос. изд., 1923. 58. Ленинградская экспериментальная электротехническая лаборатория: работы по музыкальной акустике. Л.: Гостехиздат, 1929. 59. Российский Институт Истории искусств и европейское инструмен- товедение. Тезисы Международной конференции. СПб.: Изд-во РИИИ РАН, 2002. 60. Отюгова Т., Галембо А., Гурков И. Рождение музыкальных инстру- ментов. Л. : Музыка, 1986. 61. Римский-Корсаков А. В., Дьяконов К А. Музыкальные инструменты: методы исследования и расчета. M.: Музыка, 1952. 62. Лаборатория музыкальной акустики / Под ред. Назайкинского Е. В. M.: Музыка, 1966. 63. Володин А. А. Электромузыкальные инструменты. M.: Музыка, 1979. 64. Термен Л. С. Физика и музыкальное искусство. M.: Знание, 1966. 65. Гарбузов Н. А. Зонная природа динамического слуха. M.: Музгиз, 1955. 66. Кузнецов Л. А. Акустика музыкальных инструментов. Справочник. M.: Легпромбытиздат, 1989. 67. Назайкинский Е. В. Звуковой мир музыки. M.: Музыка, 1988. 68. Иванченко Г. В. Психология восприятия музыки. M.: Смысл, 2001.
Глава 2. ФИЗИЧЕСКИЕ СВОЙСТВА ЗВУКА Как уже было сказано в главе 1, «звук — это особый вид механических колебаний упругой среды, способный вызывать слуховые ощущения» [1]. Основой процессов создания, распространения и восприятия звука являются механические колебания упругих тел: — создание звука — определяется колебаниями струн, пла- стин, мембран, столбов воздуха и других элементов музыкальных инструментов, а также диафрагм громкоговорителей и прочих уп- ругих тел; — распространение звука — зависит от механических колеба- ний частиц среды (воздуха, воды, дерева, металла и др.); — восприятие звука — начинается с механических колебаний барабанной перепонки в слуховом аппарате, и только после это- го происходит сложный процесс обработки информации в различ- ных отделах слуховой системы. Поэтому, чтобы понять природу звука, надо прежде всего рассмот- реть механические колебания, что будет выполнено в разделе 2.1 данной главы. В разделах 2.2 и 2.3 будут рассмотрены процессы образования звуковых волн, а также различные виды звуковых полей и звуковые явления (распространение звуковых волн, дифракция, интерференция, эффект Доплера и др.). Наконец, в разделе 2.4 бу- дут приведены акустические характеристики музыкальных и речевых сигналов, полученные в результате применения к их исследованию методов статистического, спектрального и корреляционного анализа. 2.1. МЕХАНИЧЕСКИЕ КОЛЕБАНИЯ. ПРОСТЫЕ ГАРМОНИЧЕСКИЕ КОЛЕБАНИЯ. ЗАТУХАЮЩИЕ КОЛЕБАНИЯ. СПЕКТРЫ. РЕЗОНАНС Колебаниями называются повторяющиеся процессы изменения каких-либо параметров системы (например, перепады температур, биение сердца, движение Луны и т. д.). Механические колебания — это повторяющиеся движения различных тел (вращение Земли и планет, колебания маятников, камертонов, струн и др.).
40 Глава 2 Движения могут повторяться через неравномерные промежутки времени (непериодические колебания) и равно- мерные (постоянные) промежутки време- ни (периодические колебания). Периодические колебания лежат в основе создания музыкальных звуков, так как толь- ко по периодическим колебаниям слуховая система идентифицирует высоту тона. Механические колебания — это прежде всего движения тел. Механиче- ским движением тела называется «изме- нение его положения с течением време- ни по отношению к другим телам» [1-5]. Всякие движения описываются с по- мощью таких понятий, как смещение, скорость и ускорение. Смещение — это путь (расстояние), пройденный телом за время его движе- ния от какой-то точки отсчета. Любое движение тела можно описать как изме- нение его положения во времени (t) и в пространстве (х, у, z). Графически это может быть представлено (например, для тел, которые смещаются в одном направлении) в виде линии на плоскости х (t) — в двухмерной системе координат (рис. 2.1.1а). Смещение измеряется в метрах (м). Если за каждый равный промежуток времени тело смещается на равный отрезок пути, то это равномерное движение. Равномер- ное движение — это движение с постоянной скоростью. Скорость — это путь, пройденный телом в единицу времени. Она определяется как «отношение длины пути к промежутку вре- мени, за который этот путь пройден»: V = (x2-x1) / O2-I1) = Ax I At. Скорость измеряется в метрах в секунду (м/с). Если смещение тела за равные промежутки времени неодина- ково, то тело совершает неравномерное движение. При этом ско- рость его все время изменяется (рис. 2.1.16), т. е. это движение с переменной скоростью. В этом случае можно определить путь, пройденный за время Atp и рассчитать скорость V1 = AS1 / At1; затем — путь за время At2 и найти скорость Y2 = AS2/At7 и т. д., а далее определить среднюю скорость как: vcp = (V1+ v2 + v3 +.. .)ln. Если постоянно сокращать промежуток времени и каждый раз вычислять скорость как путь, деленный на время, то получится
Физические свойства звука 41 значение мгновенной скорости в данный момент времени в дан- ной точке пути (траектории), которая определяется как производ- ная от смещения по времени: v = dx / dt. Скорость — величина векторная, т. е. она может изменяться по величине и направлению. Вектор скорости направлен по каса- тельной к кривой пути (траектории), а модуль (величина) скорости равен тангенсу угла наклона касательной. Если движение тела происходит с неравномерной скоростью, то для оценки изменения скорости вводится понятие «ускорение». Ускорение — это отношение изменения скорости к проме- жутку времени, за который это изменение произошло. Для прямо- линейного движения ускорение определяется как: a = (V2-V1) / (t2-t{) = Av / At. Если тело движется с постоянной скоростью, то ускорение равно нулю. Если скорость меняется равномерно (равноускорен- ное движение), то ускорение постоянно: a = const. Если ско- рость меняется неравномерно, то ускорение определяется как первая производная от скорости (или вторая производная от смещения): a = dv I dt = drx I dt2. Ускорение измеряется в метрах на секунду в квадрате (м/с2). Например, при свободном падении тела ускорение равно 9,8 м/с2, значит, каждую секунду скорость увеличивается на 9,8 м/с. Для того чтобы тело находилось в движении (в том числе и в колебательном, т. е. поочередно отклонялось и возвращалось в положение равновесия), на него должны воздействовать опреде- ленные силы: возвращающая сила, которая стремится вернуть тело в положение равновесия, и сила инерции, стремящаяся удер- жать тело в том положении — покоя или выбранного движения, — в котором оно находится. Сила — это действие одного тела на другое, которое вызыва- ет ускорение или деформацию тела [1, 5], т. е. сила есть причина изменения движения. При рассмотрении механического движения основное влияние оказывают три вида сил: сила упругости, сила трения и сила тяготения (первые две играют основную роль в образовании звуков в музыкальных инструментах). Поскольку приложенная к телу сила может вызвать изменение его скорости (ускорить или замедлить), то она должна быть пропорциональна его ускорению. В соответствии со вторым законом Ньютона эта связь может быть представлена в виде: F = та (т. е. «сила, воздействующая на объект, равна силе его инерции»), где F — сила, т — масса, а — ускорение тела. Коэффициент пропорциональности т есть мера того сопро- тивления, которое тело оказывает изменению его положения,
42 Глава 2 т. е. масса тела есть мера его инерционности (она зависит от объема и состава вещества, т. е. количества молекул в нем). Масса измеряется в килограммах (кг), а сила измеряется в ньюто- нах (H). Сила в один ньютон, воздействуя на массу в один килограмм, вызывает ускорение 1 м/с2 : 1 H = / кг 1 м/с2. Давление — закон Ньютона говорит, как сила действует на объект, приводя его в движение, при этом не имеет значения, как она распределена по объекту (по всей поверхности или в одной точке). При описании звуковых процессов оказывается важным знать, как движущая сила распределена на поверхности тела, поэтому вводится понятие «давление», которое определяется как сила на единицу площади: р = F/S. Единица измерения — паскаль (Па). Один паскаль равен силе в один ньютон, распределенной на поверхности в один квадратный метр, т. е. 1 Па = 1 Н/м2. Работа — если сила вызвала перемещение тела, то она со- вершила над ним работу. Работа равна силе, умноженной на рас- стояние, на которое она переместила тело: А = Fxx (t). Единица работы — джоуль (Дж). Один джоуль равен работе, совершаемой силой в один ньютон на пути в один метр: 1 Дж = 1 H х 1 м. Мощность — определение работы ничего не говорит о време- ни, за которое она сделана. Для определения скорости выполне- ния работы введено понятие мощности. Мощность — это работа, выполненная в единицу времени: W = AIt. Мощность измеряется в ваттах (Вт): 1 Вт = 1 Дж/с. Энергия — это мера способности совершать работу, т. е. мера количества работы, которая была произведена над данным объек- том или будет совершена им в будущем. Всякое движущееся (колеблющееся) тело обладает кинетической энергией, т. е. спо- собностью совершать работу (двигаться под действием приложен- ной силы). Энергия движения называется кинетической энергией. Работа силы равна изменению кинетической энергии. Кинетиче- ская энергия тела массой т, движущегося со скоростью v, равна: E = —mV2. кин 2 Энергия покоя называется потенциальной энергией. Например, тело, поднятое над землей, падая, может совершать работу. Потенциальная энергия тела массой т, поднятого над землей на высоту /z, равна: Enom = mgh. Сжатая пружина, разжимаясь, толкает массу, т. е. совершает работу; оттянутая струна обладает потенциальной энергией: если ее отпустить, она будет двигаться, т. е. совершать работу.
Физические свойства звука 43 Энергия может переходить из одной формы в другую, но не мо- жет исчезать — это закон сохранения энергии. Энергия измеряется в джоулях (Дж). Простые гармонические колебания (амплитуда, частота, фаза). Для того чтобы движение было колебательным (т. е. повторя- ющимся), на тело должна действовать возвращающая сила, на- правленная в сторону, противоположную смещению (она должна возвращать тело назад). Если величина этой силы пропорцио- нальна смещению и направлена в противоположную сторону, т. е. F = - кх, то под действием такой силы тело совершает повторяю- щиеся движения, возвращаясь через равные промежутки времени в положение равновесия. Такое движение тела называется простым гармоническим колебанием [1-10]. Этот тип движения лежит в основе создания сложных музыкальных звуков, посколь- ку именно струны, мембраны, деки музыкальных инструментов ко- леблются под действием упругих возвращающих сил. Примером простых гармонических колебаний могут служить ко- лебания массы (груза) на пружине (рис. 2.1.2). Если массу тела от- тянуть из положения равновесия, то на нее начнет действовать возвращающая упругая сила F = - кх (к — коэффициент жестко- сти пружины), под действием которой она вернется в положение равновесия, «проскочит» его по инерции, сместится в другую сто- рону, затем под действием той же силы вернется в положение рав- новесия, после чего цикл движения будет повторяться снова. В этом случае второй закон Ньютона можно записать в виде: - кх = та Учитывая, что ускорение а есть производная от скорости или вторая производная от смещения х, получим уравнение: d2x - кх = т —у (2.1) at Эта формула называется уравнением простого гармоническо- го колебания.
44 Глава 2 Чтобы определить, каким должно быть смещение тела во вре- мени х (t), удовлетворяющее условию (2.1), необходимо рассмот- реть форму движения груза на пружине (рис. 2.1.2) или движение маятника (рис. 2.1.3). Показанная на рис. 2.3 волнистая кривая, ко- торая описывает смещение тела при гармонических колебаниях, называется синусоидой и записывается в виде: x(t) = A sin (cot +(ро) (2.2) Таким образом, простое гармоническое колебание можно определить как колебание тела,смещение которого описывается по формуле (2.2). Колебания тела могут быть периодическими, но несинусоидаль- ными, например смещение струны скрипки (рис. 2.1.4). Здесь дви- жения точки струны повторяются через определенный период, но форма смещения имеет несинусоидальный характер. Однако все сложные периодические колебания могут быть представлены в виде суммы простых гармонических колебаний, подробнее это будет рассмотрено в разделе 2.4. В формуле (2.2) для определения смещения используются сле- дующие величины. А — амплитуда колебаний. Амплитудой колебаний называ- ется максимальное смещение тела от положения равновесия (при установившихся колебаниях она постоянна) (рис. 2.1.2). T — период колебаний. Периодом колебаний называется наименьший промежуток времени, через который колебания по- вторяются (рис. 2.1.2). Например, если маятник проходит полный цикл колебаний (в одну и другую сторону) за 0,01 с, то его период колебаний равен этой величине: T = 0,01 с. Для простого гармони- ческого колебания период не зависит от амплитуды колебаний. / — частота колебаний. Частота колебаний определяется числом колебаний (циклов) в секунду. Единица ее измерения рав- на одному колебанию в секунду и называется герц (Гц). Частота колебаний — это величина, обратная периоду: / = 1/Т. Например, если период колебаний равен T = 0,01 с, то частота колебаний равна /= 1/Т = 1/0,01 с = 100 Гц. Такая связь между периодом и частотой колебаний характеризу- ет только простое гармоническое колебание. Частота колебаний связана с высотой музыкального тона (см. гл. 3): например, нота А4 (ля первой октавы) имеет частоту
Физические свойства звука 45 колебаний 440 Гц. Так же как и период колебаний, частота не зависит от амплитуды колебаний (для малых амплитуд, т. е. линей- ных колебаний). со — угловая (круговая) частота. Угловая частота связана с частотой колебаний по формуле со = 2т$, где число к = 3,14. Она измеряется в радианах в секунду (рад/с). Например, если частота f = 100 Гц, то со = 628 рад/с. (р0 — начальная фаза. Начальная фаза определяет положение тела, с которого началось колебание. Она измеряется в градусах. Например, если маятник начал колебаться из положения равновесия, то его начальная фаза равна нулю. Если маятник сначала отклонить в крайнее правое положение и затем толкнуть, он начнет колебания с начальной фазой 90°. Если два маятника (или две струны, мембраны и др.) начнут свои колебания с задержкой во времени, то между ними образуется сдвиг фаз (рис. 2.1.5); если задержка во времени равна одной четверти периода, то сдвиг фаз — 90°, если половине периода —180°, трем четвертям периода — 270°, одному периоду — 360°. Если какое-то тело (пружину, маятник, струну, камертон и др.) вывести из положения равновесия (т. е. приложить силу и отпус- тить), то оно будет совершать свободные периодические колебания с определенной частотой, которая зависит только от его жесткости и массы. Такая частота называется собственной частотой коле- баний. Если подставить выражение (2.2) в уравнение (2.1), то получит- ся следующее выражение (положим начальную фазу равной нулю Ф0= °У- - k A sin (cot) = - 0)½ Asin(t) Отсюда, если сократить одинаковые члены, получается, что собственная угловая частота равна: со2 = к/т.
46 Глава 2 Значит, частота собственных колебаний тела (например, массы на пружине или струны) может быть представлена как: (2.3) где к — жесткость тела, m — его масса. Примеры значений собственной частоты для простых гармонических колебаний можно привести следующие. Маятник длиной L имеет собственную частоту: Струна длиной L, массой т и натяжением T имеет основную соб- . Эту же формулу можно записать в несколько другом виде, если представить массу как произведение поверхностной плотности материала струны на ее длину: т = pL , то Поскольку, как следует из этих формул, основная собственная частота зависит от силы натяжения, длины и массы струны, то в струнных инструментах (рояль, арфа и др.) низкие ноты извлекают из длинных тя- желых струн, а высокие — из коротких и легких. Как уже было отмечено, частота собственных колебаний тела не зависит от амплитуды колебаний. Это означает, что можно со- хранять высоту музыкального тона (частоту), изменяя его гром- кость (амплитуду) (см. гл. 3). Затухающие свободные колебания В процессе совершения простых гармонических колебаний про- исходит переход энергии движения (кинетической энергии), которая пропорциональна квадрату скорости E = ~ mv2, в энергию покоя 1 (потенциальную энергию), пропорциональную смещению: E= ~^кх2- В течение одного цикла колебаний совершается несколько перехо- дов одной формы энергии в другую: в моменты максимального от- клонения пружины (маятника, струны и др.) от положения равно- весия тело останавливается, в этот момент кинетическая энергия равна нулю, потенциальная энергия максимальна (рис. 2.1.2). 1 IT ственную частоту: J —
Физические свойства звука 47 В момент прохождения поло- жения равновесия тело имеет максимальную скорость, и в эти моменты кинетическая энергия максимальна, а потен- циальная равна нулю. Если бы эта сумма была постоянна всегда, то любое тело, выве- денное из положения равно- весия, колебалось бы вечно, получился бы «вечный двига- тель». Однако в реальной сре- де часть энергии расходуется на преодоление трения в воз- духе, трения в опорах и т. д. (например, маятник в вязкой среде колебался бы очень короткий отрезок времени), поэтому ампли- туда колебаний становится все меньше и постепенно тело (стру- на, маятник, камертон) останавливается — происходит затухание колебаний [1-11]. Затухающее колебание графически можно представить в виде колебаний с постепенно уменьшающейся амплитудой (рис. 2.1.6). Поскольку процесс затухания определяется в основном силами сопротивления из-за трения в среде (например, в воздухе), в опо- рах и т. д., эти силы можно считать пропорциональными скорости: Fтрения=- ^ (2-4) где г — коэффициент внутреннего трения в материале (значения этих коэффициентов для различных материалов обычно даются в справочниках [12]). С учетом трения второй закон Ньютона может быть записан: F + F = та возвращ. трения Уравнение (2.1) для случая механических колебаний с учетом затухания будет иметь следующий вид (если 2.4 добавить в урав- нение 2.1 и выразить скорость через смещение): d2x , dx m~rj + г — + kx dv dt О (2.5) Решение этого уравнения позволяет получить следующую зави- симость смещения от времени (рис. 2.1.6 ): х = Ae^ sin(o)'t + ф0), (2.6) где у — коэффициент затухания; он зависит от массы тела и внутреннего трения материала: y = r/2m. Чем больше коэффициент затухания, тем быстрее затухают колебания (тем быстрее уменьшается их амплитуда). Если мас- са тела уменьшается, то коэффициент затухания возрастает
48 Глава 2 и колебания быстро затухают, поэтому в рояле верхние, тонкие струны не демпфируются, их колебания и так быстро затухают; на нижних, тяжелых струнах используются демпферы, поскольку их масса большая, следовательно, коэффициент затухания достаточ- но мал, и они долго колеблются. Коэффициент затухания, а зна- чит, и скорость затухания колебаний зависят также от коэффици- ента внутреннего трения материала, например в дереве он достаточно большой, поэтому у ксилофона, где используются де- ревянные пластинки, звук затухает быстро. В то же время в метал- лических пластинках металлофона звук затухает гораздо медлен- нее, т. к. коэффициент внутреннего трения в металле меньше, чем в дереве, (звук достаточно долго «звенит»). Коэффициент затухания у можно определить как величину, обратную времени T с, в течение которого амплитуда колебаний уменьшается в е раз (е = 2,71828...) : у = 1/х. Он имеет размер- ность 1/с. Величина T с называется постоянной времени. Для описания процесса затухания механических колебаний иногда используется еще один коэффициент, который называется логарифмический декремент затухания — Д поскольку он до- статочно легко измеряется. Логарифмический декремент затухания определяется как натуральный логарифм отношения амплитуды предыдущей волны к последующей (рис. 2.1.6): А = In AnZAn+1^ Он связан с коэффициентом затухания следующим соотноше- нием: А = уГ, где T— период затухающих колебаний. Чем быстрее затухает колебательный процесс, т. е. быстрее уменьшаются амплитуды, тем больше логарифмический декремент затухания в системе. В электроакустике, радиотехнике и в музыкальной акустике для определения процессов затухания часто используется величина, называемая добротно- стью системы — Q. Добротность Q оп- ределяется как величи- на, обратная коэффи- циенту затухания: Q = к/А = TiIyT, t, с т. е. чем меньше доб- ротность, тем быстрее затухают колебания. Доб- ротность можно предста- вить также в виде Q = к/уТ = пх IT, т. е. она показывает,
Физические свойства звука 49 сколько периодов укладывается в промежутке времени, равном по- стоянной времени т (с). Если Q < 0,5, то затухание будет настолько велико, что систе- ма вообще не будет совершать колебания, она практически сра- зу остановится (рис. 2.1.7). Такое движение называется апериоди- ческим. Величина добротности у музыкальных инструментов достаточно большая: камертон Q = 10000, резонатор духового ин- струмента Q = 10-60 и др. В то же время акустические системы имеют добротность на низких частотах в пределах Q = 0,7-1,2. При наличии затухания в системе процесс колебания уже не будет, строго говоря, периодическим, т. к. частота колебаний будет уменьшаться с увеличением коэффициента затухания. В формуле (2.4) значения частоты будут равны: со'= ^Ja)2 -у2 Однако у музыкальных инструментов коэффициент затухания достаточно мал по сравнению с величиной угловой собственной частоты у«со, поэтому изменение частоты в процессе затухания будет очень незначительным — можно считать, что в процессе за- тухания в музыкальных инструментах высота тона практически не меняется. Необходимо отметить, что процессы затухания звука в музы- кальных инструментах имеют огромное значение для идентифика- ции их тембров. Поэтому такое большое внимание уделяется в процессе их изготовления выбору материалов, технологии обра- ботки и т. д., так как от них зависит величина коэффициента зату- хания и, соответственно, скорость и характер процессов затухания, а значит, и качество звучания данного инструмента. Свободные колебания сложных систем. Спектр Колебательные системы, описанные выше, например маятник или груз на пружине, характеризуются тем, что они имеют одну массу (груз) и одну жесткость (пружины или нити) и совершают движение (колебания) в одном направлении. Такие системы назы- ваются системами с одной степенью свободы. Реальные колеблющиеся тела (струны, пластины, мембраны и др.), создающие звук в музыкальных инструментах, представляют собой значительно более сложные устройства. Рассмотрим колебания систем с двумя степенями свободы, состоящих из двух масс на пружинах (рис. 2.1.8). Количество степеней свободы определяется количеством масс (грузов),
50 Глава 2 Рис. 2.1.9. Поперечные колебания двух масс на пружинах участвующих в процессе колебаний. Такие системы отличаются, во-первых, тем, что они могут совершать колебания с двумя собственными частотами, соответствующими двум формам ко- лебаний (формы колебаний называются модами). Одна форма колебаний соответствует смещению обеих масс в одном направ- лении, другая форма — смещению в противоположных направ- лениях (рис. 2.1.8). При этом первая частота колебаний равна: 1 (F f. - —л\—, а вторая частота, соответствующая второй моде 1 2п\т 1 Щ (форме) колебаний, равна / = — J— 1 2к \ т ний независимы друг от друга (они могут возбуждаться отдельно, могут одновременно как с одинаковыми, так и с разными ампли- тудами) [14]. Второе отличие систем с двумя степенями свободы заключает- ся в том, что колебания могут происходить в двух направлениях — продольном и поперечном. Если движения масс происходят в том же направлении, что и сжатие-растяжение пружин, то такие колебания называются продольными (рис. 2.1.8). В том случае, когда массы смещаются в направлении, перпендикулярном пружинам, происходят по- перечные колебания. Две формы (моды) поперечных колебаний, которые могут возникать в системах с двумя степенями свободы, показаны на рис. 2.1.9. Добавление каждой новой массы в такую систему увеличивает число собственных частот и форм колебаний (как продольных, так и поперечных), т. е. увеличивает число степеней свободы. Если система имеет N масс, то она может колебаться с N про- дольными и N поперечными модами и иметь соответственно столько же собственных частот продольных и поперечных колеба- ний. Примеры возможных поперечных колебаний системы даны на рис. 2.1.10. Все реальные колеблющиеся тела (струны, бруски, мембраны и др.) можно рассматривать как соединение бесконечно большого числа маленьких масс и пружин, т. е. как системы с бесконечно
Физические свойства звука 51 большим числом степеней свобо- ды. Такие системы называются распределенными (в отличие от систем с конечным числом масс и пружин, которые называются сосредоточенными). Например, струна имеет бесконечно много собственных частот и форм (мод) поперечных колебаний, показан- ных на рис. 2.1.11. При реальном возбуждении стру- ны в ней обычно возбуждается не- сколько первых собственных частот, амплитуды колебаний на остальных частотах очень малы и не оказывают существенного влияния на общую форму колебаний. Вид колебаний (продольных или поперечных) зависит от спосо- ба возбуждения. В музыкальных инструментах используются в ос- новном поперечные колебания струн, пластин, мембран, однако в духовых музыкальных инструментах возбуждаются продольные ко- лебания воздушных столбов в трубах. Формы колебаний в откры- тых и закрытых (с одного конца) трубах показаны на рис. 2.1.12.
52 Глава 2 При возбуждении реальных тел они совершают колебания сложной формы, которые могут быть представлены в виде суммы одновременных колебаний с различными собственными частотами и амплитудами (метод представления называется анализом Фурье и будет рассмотрен в разделе 2.4). Набор собственных частот и амплитуд колебаний, которые воз- буждаются в данном теле при воздействии на него внешней силы (ударом, щипком, смычком и др.), называется амплитудным спектром. Если представлен набор фаз колебаний на этих часто- тах, то такой спектр называется фазовым. Пример формы колебаний струны скрипки, возбужденных смычком, и ее спектр показаны на рис. 2.1.13. Основные термины, которые используются для описания спек- тра колеблющегося тела, следующие: первая основная (низшая) собственная частота называется фундаментальной частотой (иногда ее называют основной частотой). Все собственные часто- ты выше первой называются обертонами, например на рис. 2.1.14 фундаментальная частота 100 Гц, первый обертон — 110 Гц, вто- рой обертон — 180 Гц и т. д. Обертоны, частоты которых находят- ся в целочисленных соотношениях с фундаментальной частотой, называются гармониками (при этом фундаментальная частота называется первой гармоникой). Например, на рис. 2.1.14 третий обертон является второй гармоникой, поскольку его частота равна 200 Гц, т. е. относится к фундаментальной частоте как 2:1. (Иногда в литературе используется название всех составляющих спектра — парциалы, включая фундаментальную частоту [15-18]). Следует отметить, что не все тела могут быть использованы в качестве вибраторов в настраиваемых музыкальных инстру- ментах, а только те, которые имеют собственные частоты, находящиеся в гармонических отношениях, т. е. у которых все обертоны являются гармониками [15].
Физические свойства звука 53 Вынужденные колебания. Резонанс Все рассмотренные выше виды свободных колебаний относят- ся к случаю, когда система колеблется свободно, т. е. сила прило- жена только в начальный момент, а затем ее воздействие прекра- щено: короткий удар (рояль), щипок (гитара) и др. В этом случае тела (маятник, масса на пружине, струна, мембрана и др.) начина- ют колебаться на частоте (или частотах) собственных колебаний, которые постепенно затухают. Однако если на колебательную систему начинает действовать периодическая сила с частотой CO1 (например, если груз на пружине установить на опору, которая будет вращаться с определенной частотой с помощью рукоятки, или воздействовать на один конец струны с силой определенной частоты), то колебательные процессы будут развиваться значи- тельно сложнее. В начальный момент груз начнет колебаться со своей собственной частотой со, эти колебания постепенно затухнут, и установятся колебания с частотой вынуждающей силы сог Этот период сложения собственных и вынужденных колебаний называ- ется атакой звука. Через некоторое время в системе, на которую действует вынуждающая сила, установятся периодические вынуж- денные колебания, частота которых совпадает с частотой действу- ющей силы. Колебания эти, несмотря на наличие трения в систе- ме, будут продолжаться до тех пор, пока действует сила, которая постоянно компенсирует энергию, затраченную телом при колеба- ниях. Такие движения тела называются вынужденными стацио- нарными колебаниями. Наконец, когда сила прекращает свое воздействие, колебания в системе начинают затухать с частотой собственных колебаний. Этот период называется периодом зату- хания колебаний. Особым случаем вынужденных колебаний является совпадение периода изменения вынуждающей силы с собственным периодом (частотой) колебательной системы (маятника, струны, груза на пру- жине).
54 Глава 2 Совпадение частоты внешней силы, действующей на систему, с частотой собственных колебаний системы называется резонан- сом. При резонансе амплитуда вынужденных колебаний системы достигает наибольшего значения. Следует подчеркнуть, что явле- ние резонанса может возникать только тогда, когда на тело, со- вершающее колебания, действует внешняя сила. Если ее частота воздействия совпадет с собственной частотой, то можно сказать, что она действует в резонанс. Определение резонанса может быть дано следующим обра- зом [5]: «Явление резонанса состоит в резком возрастании амплитуды установившихся вынужденных колебаний, которое имеет место при приближении частоты внешнего гармонического воздействия к частоте одного из собственных колебаний данной колебательной системы». Уравнение колебания системы с одной степенью свободы при наличии трения (2.5) с учетом воздействия на нее внешней пери- одической силы / = F1 sin (Ojt может быть записано в виде: W-^r + = F1SiH CO11 (2.7) dt2 dt 11 v 7 Если ввести принятые ранее обозначения: со2 = к/т — соб- ственная частота системы; у = г/2т — коэффициент затухания, то уравнение (2.7) можно переписать в виде: dF + 2y~dt + 0)2 х = (Fif т) sin <°i *- (2-7а) Решение этого уравнения можно представить следующим образом: F x(t) = Ае~У* sin(cot + j\) + 1 sin(cOjt + Cp1 ) (2.8) m yj(co2 -co2 ) + 4y2co2 Первый член в формуле (2.8) описывает свободные колебания системы, которые со временем затухают. Второй член представля- ет собой стационарные вынужденные колебания, амплитуда кото- рых, как видно из формулы (2.8), равна: л - , F> ' тJ(co2 -со] ) + 4y2coj (2'9) Отсюда видно, что амплитуда вынужденных колебаний зависит от частоты CO1 и амплитуды вынуждающей силы F1, от массы системы т, от собственной частоты системы со и от коэффициента затухания у. Зависимость амплитуды вынужденных колебаний от частоты при разных значениях коэффициента затухания (доб- ротности) показана на рис. 2.1.15.
Физические свойства звука 55 Как видно из рис. 2.1.15, по мере приближения частоты вынуж- дающей силы к частоте собственных колебаний амплитуда коле- баний резко возрастает и на резонансе, когда со = <о]9 как следует из формулы (2.9), она зависит в основном от величины затухания в системе: A1 = F]/2myco1. Если бы затухание было равно нулю, амплитуда на резонансе стреми- лась бы к бесконечности. При дальнейшем повышении частоты возбуждающей силы, ког- да со < CO1, амплитуда вынужденных колебаний снова уменьшает- ся. Зависимость амплитуды колебаний от частоты внешней силы называется резонансной кривой. Форма резонансной кривой зави- сит от величины затухания в системе. Чем больше затухание в си- стеме, тем меньше амплитуда колебаний на резонансе и тем шире резонансная кривая. Ширина резонансной кривой Aw на уровне 0,7 А связана с добротностью системы следующим соотноше- нием: Q = со/Асо. Величина Асо = со - со называется полосой про- пускания колебательной системы. Во второй член формулы (2.8) входит также фаза вынужденных колебаний ф1? которая определяет величину фазового сдвига между приложенной силой и смещением системы. Величина этого фазо- вого сдвига определяется как: ^ГшГ-г (2.Ю) Из этого выражения видно, что на частоте резонанса фазовый угол равен 90°, т. е. q> = я/2 (когда частоты становятся равными, tgcpj стремится к бесконечности — следовательно, угол Cp1 = 90°); значит, смещение тела отстает от изменения действующей на него силы на четверть периода. Как уже было показано выше, установившиеся колебания воз- никают не сразу. В начальный момент времени в период атаки
56 Глава 2 происходят сложные про- цессы взаимодействия свободных и вынужденных колебаний в системе. Они зависят от: начальных условий, при которых на- чались колебания; величи- ны затухания в системе; соотношения собственных частот и частот вынуждаю- щей силы [2]. На рис. 2.1.16 показан вид колебаний в период атаки для трех случаев: когда частота вы- нуждающей силы много меньше частоты собствен- ных колебаний (O1 < со (рис. 2.1.16а); когда CG1 > со (рис. 2.1.166); когда обе частоты близки друг к дру- гу (рис. 2.1.16в) — в этом случае возникают биения (о биениях подробнее в разделе 2.4). В реальных музыкаль- ных инструментах процесс атаки происходит еще сложнее: поскольку вибра- торы и резонаторы (струны, мембраны, деки и др.) име- ют много собственных час- тот, то при воздействии на них вынуждающей силы они в начальный момент начинают колебаться сразу на всех собственных частотах (как на основной частоте, так и на всех обертонах), затем эти колебания за- тухают, остаются стационарные колебания, после прекращения дей- ствия силы происходит спад колебаний также сразу на всех часто-
Физические свойства звука 57 тах. Поэтому звук, создаваемый реальным музыкальным инстру- ментом, имеет три части: процесс атаки, стационарный процесс, процесс спада (рис. 2.1.17). Каждый инструмент характеризуется своими временными соотношениями этих частей: например, у щипковых инструментов время атаки 30-120 мс, стационарная часть — 0,02-1 с, время спада 0,2-1 с; в то же время ударные имеют очень короткий период атаки (0,4-4 мс) и т. д. Все эти части имеют очень большое значение для распознавания тембра инструмента (см. гл. 3), для идентификации музыкального инстру- мента в ансамбле и т. д. 2.2. ЗВУКОВЫЕ ВОЛНЫ. СКОРОСТЬ ЗВУКА. ЗВУКОВОЕ ДАВЛЕНИЕ Звук создается с помощью механических колебаний различ- ных элементов музыкальных инструментов, голосового аппарата и др. (см. раздел 2.1), а распространяется благодаря передаче энергии механических колебаний частицам среды в виде звуковых волн [7-10, 18-20]. Звуковая волна — это процесс переноса энергии механиче- ских колебаний в упругой среде. Процесс возникновения и распространения звуковых волн можно упрощенно описать следующим образом [19] (рис. 2.2.1): представим упругую среду в виде цепочки из отдельных масс (то- чек) и пружинок между ними, тогда колебательное движение, вы- званное в одной точке, вовлечет в это движение соседние точки; т. к. каждая точка имеет массу, т. е. обладает инерцией, то пе- редача колебаний будет происходить с некоторым опозданием по фазе. Точка 1 смещается вправо от положения равновесия и толкает точку 2, затем она начинает возвращаться обратно,
58 Глава 2 а точка 2 начинает свое движение от положения равновесия с опозданием по фазе на тс/2 (90°) и толкает точку 3 и т. д. В это время точка 1 возвращается в положение равновесия, т. е. прохо- дит уже половина периода Т/2, и продолжает свое движение в другом направлении, а затем возвращается обратно; за время ее полного периода колебаний T в движение оказываются вовлечен- ными уже все точки вплоть до номера 9. Затем цикл повторяется. Этот процесс распространения движения и создает продольную волну. Из рисунка 2.2.1 видно, что в одних участках среды точки сближаются, в других удаляются друг от друга. Таким образом, процесс распространения движения частиц среды приводит к по- явлению чередующихся зон сжатия-разрежения ее плотности. На рис. 2.2.2 показан процесс распространения продольной звуковой волны в воздухе. Звуковая волна называется продольной, если направление движения частиц совпадает с направлением распространения возмущения (т. е. передачи энергии механических колебаний) в уп- ругой среде. Если направление движения частиц перпендикулярно направле- нию распространения возмущения, то такая волна называется поперечной. В газах (в воздухе, например) распространяются только продольные волны, в твердых телах могут быть и про- дольные (рис. 2.2.1) и поперечные (рис. 2.2.3). За тот промежуток времени, когда одна точка совершила пол- ный цикл колебаний, т. е. за период Г с, в движение оказывают- ся вовлеченными уже Лоточек среды (на рис. 2.2.1. это точки с 1 по 9), т. е. возмущение в среде распространилось на определен- ное расстояние. Это расстояние, на которое распространилось возмущение в среде за один период колебаний отдельной точки, называется длиной волны — Я. Поскольку за один период колебаний образу- ется одно сжатие и одно разрежение плотности среды, то рассто- яние между двумя сжатиями (или разрежениями) в звуковой вол- не и равно длине волны (рис. 2.2.2). Следует подчеркнуть, что звуковая волна переносит только ме- ханическую энергию движения (возмущение); сами частицы среды б t3=|-T в t4=fT г I5=T Д ^=2Т 42 3 4 5 6 7 8 9 10 12 14 16 18 20 22 24 26 28 30 3233 * • ,. ••••••• **"•... х ....... х . х х . . , • • .. • •* * * Рис. 2.2.3. Процесс образования поперечной волны
Физические свойства звука 59 не переносятся, они только колеблются около своего положения равновесия. После прохождения волны среда остается неподвиж- ной (т. е. при распространении звуковой волны нет ощущения вет- ра, поскольку массы воздуха при этом не переносятся). Скорость звука: поскольку расстояние, на которое рас- пространилось возмущение в среде (сжатие или разрежение) за время, равное периоду колебаний (Tc) частиц среды (т. е. время, в течение которого частица отклонилась от положения равновесия в одну и в другую сторону и вернулась обратно), называется длиной волны (X м), то скорость звуковой волны может быть оп- ределена как: С = XIT (м/с ). Скорость звуковой волны — это скорость передачи энергии в упругой среде. Она определяется как расстояние, на которое распространилось возмущение за единицу времени. Скорость име- ет размерность м/с. Как было определено в разделе 2.1, частота колебаний / Гц есть число колебаний в единицу времени (она определяет, как часто каждая частица отклоняется от положения равновесия в единицу времени), при этом частота и период колебаний имеют обратную зависимость: / = 7/Г(1/с). Отсюда скорость звуковой волны, частота колебаний и длина волны связаны соотношением: Например, если частота равна /=100 Гц, а скорость звука С = 340 м/с, то длина волны X = (340 м/с : 100 1/с) = 3,4 м. Необходимо заметить, что скорость смещения частиц от свое- го положения равновесия v и скорость распространения звуковой волны С в среде — принципиально разные величины: частицы воздуха имеют скорость v - 5 мм/с (для среднего уровня громко- сти), а звуковая волна имеет скорость в воздухе 343 м/с (при 20°). При этом скорость частиц зависит от частоты и амплитуды звуко- вого сигнала, а скорость звука только от свойств среды (темпера- туры, плотности, упругости). Зависимость скорости звуковой волны от свойств среды, в ко- торой звуковая волна распространяется, а именно от плотности и упругости среды, может быть представлена в следующем виде: где E— коэффициент упругости среды, который определяет силу взаимодействия частиц друг с другом; р = т/К(кг/м3) — плотность среды. В связи с тем, что упругость твердых тел больше, чем жидкости и газа, соотношение скоростей звука в этих средах будет следующим: C = XXf (2.11) (2.12)
60 Глава 2 С > с > с твердого тела жидкости газа? т. е. скорость звука в твердых телах больше, чем в жидкостях и газах. Значения скоростей звуковых волн для разных материалов даны в таблице 2.2.1 [13]. Таблица 2.2.1 Среда Плотность, кг/м3 Скорость звука, м/с воздух 1,2 343 вода 999 1430 железо 7800 5170 дерево (сосна) 500 1450 гранит 2700 3950 Скорость звука в газах может быть представлена в следующем виде, как следует из формулы (2.12): /Рат (2.13) где у = cp/cv — отношение удельной теплоемкости при постоянном давлении к удельной теплоемкости при постоянном объеме (для воздуха при температуре T = 15° у = 1,402); р— плотность газа; ратм — атмосферное давление, которое связано с темпера- турой газообразной среды как ратм = pRT, где T— температура среды, R — газовая постоянная. Таким образом, в газообразной среде скорость звука сильно зависит от температуры (молекулы в горячем газе быстрее двигаются, имеют большую энергию и быстрее передают механическое возбуждение). Зависимость скорости звука от температуры в воздухе (при нор- мальном атмосферном давлении) приближенно может быть пред- ставлена в виде [14]: C = (331 + 0,6 Г°) м/с, (2.14) где Т° — градусы Цельсия. При температуре +20 0C скорость звука в воздухе равна C = (331 + 0,6 х 20°) = 343 м/с, при 0 0C скорость звука равна 331 м/с, а при -200C =319 м/с. Такая сильная зависимость скорости звука от температуры создает проблемы при настройке духовых инструментов, их надо прогревать перед испол- нением. Скорость звука в воздухе при температуре 20 0C составляет 343 м/с, что равно 1235 км/час. Это достаточно много по отно- шению к скорости перемещения человека (6 км/час) или поезда (80-100 км/час), но мало по отношению к скорости света, которая составляет 300 000 км/с, или 108 х 107 км/час. Эта разница стано-
Физические свойства звука 61 вится заметной на больших расстояниях: например, расстояние 500 м свет проходит за 1,67 х 106с, а звук за 1,457 с. В воздухе скорость звука не зависит от частоты: хотя в соответ- ствии с формулой (2.11) скорость звука С должна зависеть от ча- стоты, но при изменении частоты соответственно меняется длина волны и скорость звука остается постоянной. То есть в воздушной среде отсутствует дисперсия — зависимость скорости распростра- нения звука от частоты. Если бы в воздушной среде имела место дисперсия, слушать музыку в концертном зале было бы практиче- ски невозможно: высокие и низкие звуки, сыгранные одновремен- но, приходили бы к слушателю в разное время. Звуковое давление: поскольку звуковая волна распространяется в среде в виде зон сжатия и разрежения плот- ности (рис. 2.2.2), а в газах плотность и давление связаны соотно- шением р = RTp, где T— температура среды, R — газовая посто- янная среды, р — плотность, то в областях сжатия среды давление будет выше статического атмосферного, а в зонах раз- режения — ниже. Если поставить в какой-то точке среды измери- тельный прибор, например микрофон, то он покажет изменение давления при прохождении через эту точку среды звуковой волны (зон сжатия — разрежения) (рис. 2.2.4). Разность между мгновенным значением давления в данной точке среды и атмосферным давлением называется звуковым давлением: P36= Рмгн-Ратм Звуковое давление — величина знакопеременная: в зонах сгущения она положительна, в зонах разрежения отрицательна. Как уже было показано в разделе 2.1, звуковое давление измеря- ется в паскалях (Па): 1 Па = 1 Н/м2. Слуховая система в состоя- нии определить огромный диапазон разностей между мгновенным значением звукового давления и атмосферным, которое равно Рмгн^Рати Рмгн^Рет атмосферное давление р0 движение молекул воздуха распространение звука Рис. 2.2.4. Изменение звукового давления в продольной волне
62 Глава 2 в среднем 100 ООО Па. Звуковое давление может оцениваться в пределах от 2 х 105 Па до 20 Па. Таким образом, слуховая сис- тема ощущает изменения в атмосферном давлении от 2 х 10"8 % до 0,02 %, что подтверждает ее необычайную чувствительность. Звуковое давление, создаваемое различными звуковыми источ- никами, приведено в таблице 2.2.2. Таблица 2.2.2 Источник Расстояние до Звуковое Уровень звукового звука источника, м давление, Па давления, дБ Шум самолета 5 200 120 Большой оркестр (fj) 10 2-Л 100-106 орган {J) 3,6 2 100 Тарелки 0,9 1,67 99 Камерный ансамбль 4 0,8-1 92-94 Труба 0,9 0,80 92 Кларнет 0,9 0,36 85 Флейта 1 0,063 70 Речь 1 0,02-0,05 60-68 Шепот 1 2 х Ю-4 20 Писк комара 0,5 2 х Ю-5 0 Как уже было сказано выше, скорость частиц в среде, где рас- пространяется звуковая волна, зависит от частоты и амплитуды звукового давления (т. е. приложенной силы); если под действием данного звукового давления частицы среды приобретают малую скорость, например в твердых телах, то можно сказать, что данное тело оказывает большое сопротивление приложенному звуковому давлению. Для оценки этого свойства вводится понятие: удельное акустическое сопротивление [13]. Удельное акустическое сопротивление среды (импеданс) есть отношение звукового давления к скорости колебаний частиц среды: Z — ph. Удельное акустическое сопротивление измеряется в единицах: (Па • с)/м или кг/(с • м2). Значения Z зависят от свойств среды и условий распространения звуковых волн в ней. В общем случае удельное акустическое сопротивление (импеданс) является вели- чиной комплексной, т. е. у него есть активная и реактивная часть: Z = R + iX. Активная составляющая R определяет величину полезной аку- стической энергии, излучаемой источником звука в окружающую среду; реактивная составляющая X характеризует потери звуковой энергии. Поскольку удельное акустическое сопротивление для воз- духа достаточно мало (при температуре 20 0 C оно состав- ляет 413 кг/(с-м2), для сравнения: в металле оно равно 47,7 х 106 кг/(с- м2)), то полезная излучаемая энергия в воздушной среде также мала.
Физические свойства звука 63 Следовательно, и коэффициент полезного действия КПД = Ря/Рппп, ^ а под' где Ра — излучаемая акустическая энергия, Рпод — подводимая энергия (механическая или электрическая), у всех излучателей, работающих на воздух, очень мал. Например, музыкальные ин- струменты, голосовой аппарат, громкоговорители и др. имеют КПД в пределах 0,2-1%. Поскольку звуковая волна переносит энергию механиче- ских колебаний, то, следовательно, она может характеризоваться энергетическими параметрами, к числу которых относятся: об- щая акустическая энергия Ра(Дж); мощность W — энергия, пере- носимая в единицу времени (Вт); интенсивность I, т. е. количе- ство энергии, проходящее в единицу времени через единицу площади, перпендикулярной к направлению распространения волны (Вт/м2); плотность 8— количество звуковой энергии в еди- нице объема (Дж/м3). Уровни звукового давления и интенсивности: поскольку че- ловеческий слух различает огромный диапазон изменения звуко- вого давления (разница между самым тихим звуком 2х10*5Па и самым громким 20 Па составляет 106), то использовать при из- мерениях такую большую шкалу чрезвычайно неудобно, поэтому во всех измерительных приборах (шумомерах, измерительных ком- пьютерных станциях и др.) используется логарифмическая шкала, которая позволяет сжать масштаб изменения давления [11-12]. Для этого используется уровень звукового давления, который определяется как: L = 20 1gp/p0, (2.15) где р0 = 2х 10"5Па. Уровень звукового давления измеряется в децибелах (дБ). Например, если звуковое давление равно р = 2 Па, то уровень звукового давления равен: L = 20 Ig р/р0= 20 Ig (2 Па/(2х 10*5)Па) = 20 Ig (1 х 1O+5) = 20 х 5 = 100 дБ. Обратный пример: если задан уровень звукового давления L = 80 дБ, то звуковое давление определяется следующим образом: L = 20 Ig р/р0, отсюда 80 дБ = 20 Ig р/(2 х 10"5), значит, lgp/(2xl0"5) = 4. Следова- тельно 104 = р / (2 х Ю5), отсюда значение звукового давления будет равно р = 0,2 Па. Увеличение звукового давления в два раза соответствует из- менению уровня звукового давления на 6 дБ, например звуковое давление 2 Па соответствует уровню звукового давления 100 дБ, а звуковое давление 1 Па соответствует уровню 94 дБ, звуковое давление 4 Па — уровню 106 дБ, и т. д. Кроме того, следует обратить внимание на то, что уровни зву- кового давления нескольких одновременно работающих различных
64 Глава 2 источников никогда не складываются. Для определения суммарно- го уровня необходимо рассчитать значения звукового давления, соответствующего каждому уровню: р, и р2. Затем определить сум- марное звуковое давление р = ->/р? + Pl • После этого по форму- ле (2.16) определить суммарный уровень звукового давления L. Например, если играют две скрипки с уровнем 80 дБ и 86 дБ, то их суммарный уровень звукового давления определяется следующим образом: уровню 80 дБ соответствует звуковое давление 0,2 Па, уров- ню 86 дБ звуковое давление 0,4 Па. Суммарное давление равно: р = 0,447 Па, отсюда скрипка и рояль вместе создают уровень звуко- вого давления 86,98 дБ. Уровни звукового давления, создаваемые различными источни- ками, также приведены в таблице 2.2.2. В децибелах могут выражаться и другие величины, например уровень интенсивности звука определяется как: L1 = 10 Ig 1/I0, где I0— нулевой уровень, равный 1012 Вт/м2. Электрические характеристики (мощность, напряжение, ток) так- же часто приводятся в децибелах, которые имеют специальные обозначения, например: ^dBm означает уровень мощности отнесенный к 1 мВт: ^dBm=10 18 WBt/1mBt; ^dBv — уровень напряжения, отнесенный к 1 В (Америка): LdBv = 20 Ig UB/1B; LdBu — уровень напряжения, отнесенный к 0,775 В (Европа): LdBu = 20 Ig UB/0,775B. 2.3. ЗВУКОВЫЕ ПОЛЯ. ЗВУКОВЫЕ ЯВЛЕНИЯ Весь окружающий нас мир заполнен волнами: световые волны, радиоволны, звуковые волны и т. д. Практически все средства ком- муникации зависят от волн одного или другого типа. В физике используется следующее общее определение [5]: «Волны — это изменения состояния среды (возмущения), распространяющиеся в этой среде и несущие с собой энергию». Основное свойство всех волн, независимо от их природы, состоит в том, что в волнах осу- ществляется перенос энергии без переноса вещества. Под возму- щениями среды понимается изменение в ней давления, плотно- сти, скорости частиц и температуры [13]. Волны различного типа имеют совершенно разную физическую природу: световые и радиоволны — это процесс распространения электромагнитных колебаний; звуковые волны — процесс распро- странения механических колебаний. Если первые могут распро-
Физические свойства звука 65 страняться в пустоте, то звуковые волны требуют для своего рас- пространения упругой среды. Кроме того, волны распространяют- ся в среде с совершенно разной скоростью: световые — со скоро- стью 3 х 10 8 м/с, звуковые — 343 м/с и т. д. Однако, несмотря на такие значительные различия, они обла- дают целым рядом общих свойств: они могут распространяться, отражаться, затухать, огибать препятствия (явление дифракции), взаимодействовать друг с другом (явление интерференции) и т. д. Для звуковых волн все эти свойства можно объединить под общим названием звуковые явления [6-9, 13-20]. Область пространства, в которой распространяются звуко- вые волны, называется звуковым полем [5]. Виды звуковых полей: звуковые поля, излучаемые различны- ми источниками (рояль, певец, ансамбль и т. д.) могут иметь очень сложную структуру. Для описания структуры звукового поля пользу- ются следующими понятиями: — фронт звуковой волны — поверхность, соединяющая точки среды, находящиеся в одинаковой фазе колебаний (например, круги на воде от расходящейся волны); — звуковой луч — линия, перпендикулярная фронту волны и направленная в сторону распространения звуковых волн. На рис. 2.3.1 показано распределение фронтов звуковой волны в звуковом поле, создаваемом колеблющейся диафрагмой громко- говорителя. Как видно из рис. 2.3.1, форма фронтов излучаемой волны имеет сложную структуру, расчет которой требует значитель- ных вычислительных ресурсов (в настоящее время для анализа таких полей используются численные методы, например метод ко- нечных элементов (МКЭ) или метод граничных элементов (МГЭ)). Для упрощения анализа структуры звуковых полей обычно пользуются следующими приближенными понятиями: звуковое поле сферической волны, плоской волны, цилиндрической волны. Рис. 2.3.1. Звуковое поле, излучаемое Рис. 2.3.2. Звуковое поле диафрагмой громкоговорителя сферической волны
66 Глава 2 Звуковое поле сферической волны — в области низких ча- стот, где длина звуковой волны велика по отношению к размеру ис- точника X » d (например, на частоте 40 Гц, где длина волны равна 8,5 м, практически любой источник звука будет иметь разме- ры меньше длины волны), можно считать источник сигнала точеч- ным, а расходящуюся вокруг него трехмерную звуковую волну — сферической (рис. 2.3.2). Фронт такой волны представляет собой сферу, в центре которой находится источник звука, а звуковые лучи совпадают с радиусами. Полная звуковая энергия (или мощность), излучаемая точечным источником, распространяется по всем направлениям равномерно и не меняется при удалении от источника (если не считать поте- ри на вязкость, теплопроводность и др.). Интенсивность звука (т. е. мощность, приходящаяся на едини- цу площади) уменьшается с расстоянием, т. к. площадь поверхно- сти расходящихся сфер увеличивается как 4 л: г2. При этом умень- шение ее происходит по следующему закону: I = WaI (An г2), таким образом, интенсивность звуковой волны уменьшается обрат- но пропорционально квадрату расстояния. Поскольку интенсив- ность I и амплитуда звукового давления р связаны следующим со- отношением: I = р/2рС (где р — плотность среды, С — скорость звука в ней), то отсюда получается, что в поле сферической вол- ны звуковое давление уменьшается с увеличением расстояния по следующему закону: р~ i/r (2 16) Следовательно, уровень звукового давления уменьшается на 6 дБ каждый раз, когда расстояние до источника удваивается. Это очень важный результат для звукозаписи: поскольку вблизи зву- кового источника (певца, скрипки, трубы, громкоговорителя и т. д.) трех- мерное звуковое поле вокруг источника можно считать сферическим (на низких частотах), то в нем давление меняется с изменением расстояния. При близком расположении направленных микрофонов возникает эффект близости (proximity), т. к. разность давлений, действующая на обе сторо- ны диафрагмы, усиливается еще и за счет разницы в уровнях звукового давления на фронтальной и тыльной части микрофона, поскольку они находятся на разных фронтах сферической волны, поэтому направленные микрофоны «воспринимают» низкие частоты по-разному, в зависимости от их расстояния до источника (см. гл. 6). Следует также отметить, что в сферической волне удельное акустическое сопротивление Z имеет комплексный характер, его модуль зависит от сдвига фазы \|/ между звуковым давлением р и скоростью частиц v и равен: |Z|= рС cos\|/. Сдвиг фаз зависит от длины волны и имеет существенное значение только на низких частотах.
Физические свойства звука 67 Рис. 2.3.3. Звуковое поле плоской волны Звуковое поле плоской волны: если длина волны становится значительно мень- ше размеров источника X « d или если расстояние до источника увеличивается, то можно сферическую волну приближенно за- менить плоской (радиус кривизны фронта становится настолько большим, что можно не учитывать его кривизну и заменить на плоскость). В плоской волне (рис. 2.3.3) фронты звуковой волны — это плоскости, идущие друг за другом, звуковые лучи идут параллельно и при этом интенсивность и звуковое давление не зависят от рассто- яния: р = const. На практике звуковое давление уменьшается с расстоянием за счет потерь из-за вязкости среды, теплопроводности, турбулентности и т. д. На больших расстояниях звуковое поле от любого источника можно считать плоским. В плоском звуковом поле удельное акустическое сопротивление среды чисто активное и равно Z = рС, т. е. никакого сдвига фазы между давлением и скоростью в плоской волне нет. Обычно дан- ные, которые приводятся по удельному акустическому сопротивле- нию в различных средах, относятся именно к звуковому полю плоской волны [13]. Звуковое поле цилиндрической волны: если источник звука сильно вытянут в одном направлении X « L (примером может слу- жить звуковая колонка — см. гл. 5), то вокруг него формируется звуковое поле цилиндрической волны. В нем фронты звуковой вол- ны представляют собой цилиндрические поверхности увеличивающихся размеров (рис. 2.3.4), звуковые лучи направлены по радиусу цилиндра. В таком поле интен- сивность звука убывает обратно пропорци- онально расстоянию 1-1/г, а звуковое давление меняется по закону р~^— ■ Vr Таким образом, можно считать, что на низких частотах и достаточно близких рас- стояниях вокруг каждого источника образу- ется сферическая волна, на высоких часто- тах (или достаточно больших расстояниях) эти же источники создают плоскую звуковую n 0 ~ Л 0 J 3 J Рис. 2.3.4. Звуковое поле волну, при этом закон изменения звукового ЦИЛИНдрической волны
68 Глава 2 давления от расстояния меняется в зависимости от структуры зву- кового поля. Звуковые источники: так же как сложные звуковые поля мо- гут с определенным приближением рассматриваться как некоторые упрощенные формы — сферические, плоские, цилиндрические и т. д., реальные излучатели сложной конструкции могут аппрок- симироваться некоторыми простыми формами, такими как: — монополь (точечный источник) — на низких частотах, где длина волны велика по сравнению с размерами излучателя, любой излучатель можно приближенно рассматривать как точечный источ- ник, равномерно излучающий во все стороны сферическую волну. Такой источник называют еще пульсирующей сферой; — диполь (осциллирующий поршень или сфера) — примером может служить громкоговоритель без экрана; у такого излучателя, когда он движется вперед, образуется сжатие воздуха, позади него — разрежение. У всех осциллирующих излучателей скорость смещения на одной стороне тела противоположна по знаку скоро- сти смещения на другой. Это приводит к коротким замыканиям и сильно снижает эффективность излучения на низких частотах [6-9]. Звуковые явления: анализ общих свойств звуковых волн нач- нем с рассмотрения процессов их распространения и затухания. Распространение и затухание звуковых волн: как было по- казано выше, при больших расстояниях до источника звуковую волну можно считать плоской, а в плоской волне звуковое давле- ние и интенсивность не должны меняться с расстоянием. Однако в реальной среде происходит постепенное уменьшение уровня звукового давления (интенсивности) с расстоянием, т. е. происходит постепенное затухание звука из-за поглощения его энергии за счет вязкости и теплопроводности воздуха. При сжатии частиц воздуха часть энергии расходуется на преодоление внут- реннего трения между молекулами («вязкое» трение). Кроме того, в области сжатия частиц воздуха в звуковой волне повышается давление и, следовательно, температура, а в области разрежения давление и температура понижаются, между слоями воздуха про- исходит теплообмен, и часть энергии необратимо затрачивается на нагревание воздуха. Уменьшение давления в распространяющейся волне происхо- дит по экспоненциальному закону pt = ре'51, где 8 — коэффициент поглощения в среде; коэффициент определяется как 8 = XIlx, где Z1 — расстояние, на котором амплитудное значение звукового давления р уменьшается в е раз (е = 2,71828...). Коэффициент поглощения зависит от частоты d~ Iff, т. е. высокочастотные составляющие звука затухают быстрее, чем низкочастотные
Физические свойства звука 69 (поэтому слушатель в дальнем конце зала слышит другой тембр звука, чем слушатель, находящийся у сцены). При распространении звука на очень большие расстояния на- чинает играть роль турбулентность воздуха (потоки воздуха, ветер и др.). Звуковые волны сильнее затухают при распространении вдоль поглощающей поверхности, при этом высокие частоты по- глощаются быстрее. Например, при распространении звуковой волны вдоль публики в концертном зале на частоте 6400 Гц при десятикратном увеличении расстояния вносится дополнительное затухание ~ 8 дБ [13], что являет- ся одной из причин изменения тембра музыки в пустом и заполненном зале; при этом в нем также изменяются параметры реверберационного процесса (см. гл. 5). Отражение, поглощение и прохождение звуковых волн: когда звуковая волна достигает границы раздела среды, в которой она распространяется (например, падает на стену помещения или переходит из воздуха в воду и др.), происходят следующие процес- сы: часть звуковой энергии отражается, при этом угол падения волны равен углу отражения (рис. 2.3.5); часть звуковой энергии теряется на поглощение; часть проходит через границу раздела в другую среду. Для количественного описания этих процессов вводятся следу- ющие коэффициенты: коэффициент отражения — P=/ отраж/I пад; коэффициент поглощения — a = I погл/I пад; коэффициент прохождения — у = / прош/I пад, где / пад, I отраж, I погл, I прош — интенсивность падающей, отра- женной, поглощенной и прошедшей волны. Общая сумма коэффициентов равна единице: P + а + у = 1. Каждый из них меньше единицы, поскольку отраженная, погло- щенная и прошедшая волна имеют меньшую интенсивность, чем волна падающая. Коэффициенты Р, у — величины безразмерные, однако для ко- эффициента а используется размерность «сэбин». Коэффициент поглощения в 1 сэбин равен поглощению звука открытым окном площадью 1 м2. Рис. 2.3.5. Отражение, поглощение и прохождение звуковой волны на плоской поверхности
70 Глава 2 Рис. 2.3.6. Отражение волн от шероховатых поверхностей Величина коэффициента поглощения дается обычно в справоч- никах для различных материалов [13]: например, на частоте 500 Гц коэффициент поглощения дерева 0,1, мрамора — 0,01, ковра — 0,23 и др. Следует заметить, что величина коэффици- ента поглощения зависит от частоты: с повышением частоты она увеличивает- ся — например для ковра 0,23 на 500 Гц и 0,43 на 4000 Гц. Кроме того, коэффици- ент поглощения зависит от величины угла падения звуковой волны (для угла паде- ния 90° он имеет максимальное значение), поэтому в таблицах приводится обычно значение, усредненное для различных уг- лов падения. Таким образом, при падении звуковой волны на препятствие (стену, например) отраженная волна имеет меньшую ампли- туду и некоторый сдвиг по фазе по отно- шению к падающей волне. Величина этого сдвига зависит от отношения акустических сопротивлений отражающей среды и сре- ды, где волна распространяется. Структура звуковых волн, отраженных от стен и других предметов в помещении, определяет акустику концертных залов, студий, помещений прослушивания и др. Подбирая различные соотношения ко- ^^^^^^^^ эффициентов, можно менять структуру отраженных волн и тем самым влиять на качество звучания музыки и речи в поме- щении (см. гл. 5). Общий закон отражения звуковой вол- ны «угол падения равен углу отражения» приводит к тому, что если отражения про- исходят от негладких (шероховатых) по- верхностей, то отраженные волны распро- страняются в разных направлениях, и в помещении создается диффузное рассеян- ное звуковое поле (рис. 2.3.6), что в ряде случаев улучшает общее качество звуча- ния в зале. Направление отраженных волн зависит от формы отражающей поверхности: если выбрать поверхность в виде вогнутой или выпуклой чаши, то можно концентрировать (усиливать) или рассеивать звук в опреде- Рис. 2.3.7. Фокусировка звуковых волн Рис. 2.3.8. Мнимый источник
Физические свойства звука 71 ленной точке или направлении («шепчущие» галереи, открытые эстрады, архитектурные формы — эркеры, ниши, купола и т. д.) (рис. 2.3.7). Интересно отметить, что при падении сферической волны на отражающую плоскую поверхность появляется отраженная сфери- ческая волна с центром, находящимся как бы за барьером (рис. 2.3.8), этот центр называется «мнимый источник» (метод «мнимых источников» используется при расчетах структуры звукового поля в архитектурной акустике). Рефракция (преломление) — это изменение направления рас- пространения звуковой волны при переходе из одной среды в дру- гую. Как уже было отмечено выше, звуковая волна, падая на гра- ницу раздела двух сред, частично отражается от нее, частично проходит в другую среду. Если эта среда имеет другие физические свойства, значительно отличающиеся от свойств первой (плот- ность, температуру и др.), то скорость звука в ней меняется, и зву- ковая волна вследствие этого меняет направление своего распро- странения (рис. 2.3.9а). Эффект рефракции имеет место и тогда, когда звуковая волна распространяется в одной среде (например, в атмосфере), физические свойства которой постепенно меняют- ся. Примером может служить звуковая волна, распространяющая- ся над поверхностью воды: поскольку воздух над водой имеет бо- лее низкую температуру, чем в более высоких слоях, скорость звуковой волны, в более холодных слоях становится меньше, и на- правление распространения волны изменяется вниз (рис. 2.3.96) (звуковые лучи изгибаются в сторону той среды, где скорость звука меньше). Соотношение изменения углов распространения звуковой волны (CL1 и a2) и ее скоростей (C7 и C2) выражается следующей формулой: sin a /sin a2= C/C2 Явление рефракции может приводить к различным звуковым эффектам (звуковым миражам, т. е. слышимости на больших рас- стояниях над морем, пустыней и др.). Воздух Стекло источника Шум Препятствие а б Рис. 2.3.9. Рефракция звуковых волн Рис. 2.3.10. Дифракция звуковых волн
72 Глава 2 Дифракция звуковых волн: звуковые волны обладают спо- собностью огибать встретившиеся на их пути препятствия и про- никать в область за ними, эта способность к огибанию препят- ствий называется дифракцией [14]. Благодаря этому явлению звуковые волны могут огибать углы, проникать через щели и отвер- стия и распространяться за ними (иначе звук можно было бы услы- шать только в пределах прямой видимости источника) (рис. 2.3.10). Способность к дифракции зависит от соотношения длины вол- ны (т. е. частоты) и размера препятствия: концентрироваться вперед, при этом края ее «размыты»; — если длина волны меньше размеров препятствия Я << d, то звуковая волна отражается от него, и за препятствием образуется «акустическая тень», а через отверстие проходит только узкий звуковой пучок. Поэтому за колонной или балконом тембр звука меняется (низко- и среднечастотные составляющие огибают их, а высокочастотные — нет). Явление дифракции лежит в основе бинауральной локализации звука (см. гл. 3), вся современная пространственная стереофония построена на использовании этого явления. Звуки разной частоты огибают голову и ушные раковины по-разному: в то время как низ- кочастотные звуки проходят без изменения интенсивности, средне- и высокочастотные образуют акустическую тень (за счет дифрак- ции), граница между ними находится примерно в области 2 кГц. В связи с этим интенсивность звука и тембр меняются в зависимости от расположения источника по отношению к голо- ве, что и позволяет локализовать его в пространстве. Дифракция звука на корпусе микрофонов, на углах корпусов акустических систем и др. также имеет существенное значение для качества воспроизведения звука и учитывается при их проектировании. Рассеяние — процесс отражения части звуковой волны от пре- пятствия, в то время как остальная ее часть огибает препятствие. Например, для сферы радиуса а мощность рассеянной волны в области высоких частот приближенно равна .0 — если длина волны много больше разме- ра препятствия Я » d, то звуковая волна оги- бает его и проходит дальше, почти не меняя своей структуры и интенсивности. Так же она проходит и через отверстие (рис. 2.3.11), оно просто становится как бы новым источником сферической волны; Дифракция звуковых волн на отверстиях Рис. 2.3.11. — если длина волны сопоставима с раз- мерами препятствия Я ~ d, то звуковая волна огибает его частично (рис. 2.3.10), за препят- ствием интенсивность становится меньше, появляются области «акустической тени», в случае отверстия звуковая волна начинает
Физические свойства звука 73 Р'а = 21*¾, где /—интенсивность падающей плоской волны, а — ее радиус [8]. В общем случае под рассеянием звука понимается «возникно- вение дополнительных звуковых полей на препятствиях, границах и неоднородностях среды»[5]. Именно эти процессы, т. е. дифракция и рассеяние волны на поверх- ности микрофона приводят к значительному искажению структуры зву- кового поля вокруг него и изменению его чувствительности [21]. Интерференция звуковых волн: в окружающей среде возни- кают и распространяются обычно несколько различных звуковых волн от разных источников, например голос и звуки рояля, речь и шум и др., при этом слуховая система отчетливо различает раз- ные звуковые сигналы, приходящие к ней от разных источников. Происходит это благодаря принципу суперпозиции, который со- стоит в том, что звуковые волны, проходя через данную точку сре- ды, создают результирующее колебание, равное геометрической сумме колебаний, вызванных каждой волной в отдельности [5] (т. е. каждая молекула воздуха участвует одновременно в несколь- ких колебательных процессах: если, например, одна звуковая вол- на вызывает ее максимальное смещение в одну сторону, а в это время другая звуковая волна — смещение в противоположную, то данная молекула среды останется на месте, т. е. не будет сдви- гаться из своего положения равновесия). Этот принцип линейного сложения волн действует только при малых амплитудах (в линей- ной среде) и приводит к тому, что звуковые волны распространя- ются через среду независимо, как бы проходят друг через друга (рис. 2.3.12). В результате суперпозиции создается сложное звуко- вое поле. В общем случае результат сложения зависит от соотно- шения амплитуд, частот и фаз составляющих звуковых волн. Сложение волн от двух или нескольких когерентных источни- ков, при котором образуется устойчивое пространственное распре- деление амплитуды и фазы результирующей волны, называется интерференцией. Под когерентностью понимается согласованное Рис. 2.3.12. Интерференции двух распространяющихся волн в пространстве Рис. 2.3.13. Интерференция двух когерентных звуковых волн
74 Глава 2 по времени протекание колебательных процессов, которое приво- дит к созданию звуковых волн, одинаковых по направлению, по ча- стоте и имеющих постоянный сдвиг фаз во времени [5]. Интерференция является одним из фундаментальных явлений, присущих волнам различной природы (акустическим, электро- магнитным и др.). Она была хорошо известна в науке еще во вре- мена Ньютона. При интерференции двух когерентных гармонических волн в разных точках пространства образуется устойчивая интерфе- ренционная картина, состоящая из чередующихся максимумов и минимумов (рис. 2.3.13). Если волны имеют одинаковые ампли- туды, то в тех точках, где две пришедшие волны имеют амплиту- ды в одинаковой фазе, будет сложение колебаний и точки среды будут колебаться с максимальной суммарной амплитудой (такая интерференция называется «конструктивной»); в тех точках, где встречаются две волны с противоположно направленными смеще- ниями (разность фаз равна тс/2), образуется нуль суммарной ампли- туды (такая интерференция называется «деструктивной») [14]. Если волны некогерентны и разность фаз между ними быстро и беспорядочно меняется, то в этом случае интерференционная картина, т. е. расположение максимумов и минимумов, размывает- ся, среднее значение амплитуды результирующей волны выравни- вается в разных точках пространства, при этом происходит сложе- ние потоков энергии (интенсивностей) составляющих волн (а не их амплитуд) [5]. Стоячие волны: особым случаем интерференции является сложение звуковых волн одинаковой частоты и амплитуды, но рас- пространяющихся в противоположных направлениях. Если вдоль
Физические свойства звука 75 струны или столба воздуха (например, в музыкальном инстру- менте) распространяется синусоидальная волна, то отраженная волна может взаимодействовать с прямой таким образом, что суммарная волна в определенных точках всегда будет иметь мак- симальное смещение, а в других определенных точках нулевое (рис. 2.3.14).Такая волна называется «стоячей», она возникает только тогда, когда есть сложение волн, распространяющихся в противоположных направлениях, т. е. это динамический процесс. В отличие от бегущей волны, в стоячей волне не происходит переноса энергии, а осуществляется лишь пространственная пе- рекачка одного вида энергии в другую [5]. Стоячие волны имеют очень большое значение в практике ра- боты со звуком, они возникают в помещениях на низких частотах, определяя неравномерное распределение звукового давления и вызывая окрашивание звука; они возникают в трубах духовых ин- струментов на их резонансных частотах и т. д. Форма отраженной волны зависит от соотношения удельных со- противлений на границе раздела сред: если удельное акустическое сопротивление отражающей среды боль- ше, чем в первичной среде (например, волна отражается от жесткой стенки на закрытом конце трубы), то сдвиг по фазе прямой и отраженной волны будет равен нулю, и в точке отражения будет макси- мум звукового давления (минимум скоро- сти). Если отражающая среда имеет меньшее удельное акустическое сопро- тивление (например, открытый конец трубы музыкального инструмента), то происходит сдвиг по фазе на 180°, и в этой точке будет минимум звукового дав- ления (максимум скорости) (рис. 2.3.15). Биения — это периодические измене- ния амплитуды колебания, возникающие при сложении двух гармонических коле- баний с близкими частотами [5]. Если разница между ними примерно 15 Гц и меньше, то суммарное колебание вос- принимается слуховой системой как единый сигнал с частотой, равной сред- нему значению двух частот fc = (f1+f2)n и изменением амплитуды с частотой равной разности частот (J1 - f2) (рис. 2.3.16), Т. е. ЭТО особый случай Рис. 2.3.16. Эффект биений z2<z, |z2 Рис. 2.3.15. Стоячая волна при отражении от разных поверхностей: а — без сдвига по фазе, б — со сдвигом на 180°
76 Глава 2 амплитудной модуляции (см. разд. 2.4). Биения имеют большое значение в музыкальной практике для настройки музыкальных ин- струментов, для восприятия консонансов и диссонансов в музыке и т. д. Эффект Доплера: обычно слушатель слышит ту же высоту тона (т. е. частоту), которую излучает источник (без этого невоз- можно было бы слушать музыку). Однако этот принцип нарушает- ся, когда или источник, или слушатель движутся относительно друг друга. Этот эффект был открыт в 1845 году австрийским ученым Доплером. Физическая природа эффекта видна из рис. 2.3.17. Если источник создает колебания с частотой 1000 Гц, то мимо слушателя проходит 1000 волн (сжатий-разрежений) в секунду. Но если слушатель движется навстречу источнику, то в секунду он пе- ресекает больше фронтов звуковых волн (встречает больше зон сжатия-разрежения), т. е. воспринимает более высокую частоту и слышит более высокий тон. Аналогичная картина имеет место, когда навстречу слушателю движется источник (например, гудок приближающегося поезда кажется выше, чем в действительности). В том случае, когда источник (или слушатель) удаляется, число звуковых волн, проходящих в секунду, уменьшается, и высота тона падает. Формула для определения измененной частоты (высоты) тона имеет следующий вид:/' = fs (С + v0)/Cc, когда слушатель двигается навстречу источнику со скоростью v0. Когда слушатель проходит мимо источника, надо изменить в формуле числитель на (С - v0). Если источник движется навстречу слушателю, то форму- ла имеет вид: f'=fsC/(C- vs), где С — скорость звука, vs — ско- рость источника,^ — частота источника,/' — воспринимаемая слу- шателем частота. В этом случае при прохождении источника мимо слушателя нужно также поменять знак при скорости vs на обрат- ный, при этом частота меняется скачком. По изменению частоты, а следовательно, и высоты тона можно определить скорость Рис. 2.3.17. Эффект Доплера
Физические свойства звука 77 источника (например, для контроля скорости движущегося транс- порта). Если слушатель и источник движутся навстречу друг дру- гу, то изменение частоты можно определить как: /,=/,[(l+v0/C)/(l-vs/C)]. Все эти формулы справедливы, когда скорости источника и при- емника (слушателя) относительно малы, т. е. v0 « С и vs« С. Если эти условия не соблюдаются, т. е. vQ - С , то формируются ударные волны (например, при движении сверхзвуковых самолетов). Эффект Доплера обнаруживается, например, при возбуждении колебаний в колоколах (см. гл. 4). Он имеет существенное значе- ние при проектировании акустических систем: низкочастотный громкоговоритель может создавать регулярные смещения высоко- частотного, тем самым меняя высоту тона для слушателя, что со- здает определенные искажения («плавание» звука), с которыми приходится бороться различными конструктивными методами. 2.4. АКУСТИЧЕСКИЕ СИГНАЛЫ. ДИНАМИЧЕСКИЙ ДИАПАЗОН. ЧАСТОТНЫЙ ДИАПАЗОН Реальные источники звука — музыкальные инструменты, голос, громкоговорители, источники шума (например, транспорт и др.) — создают вокруг себя в окружающей среде звуковые поля сложной структуры (рис. 2.3.1), т. е. в пространстве происходит распростра- нение звуковых волн (зон сжатия и разрежения) (рис. 2.2.4); сле- довательно, в каждой точке среды изменяется во времени плот- ность и звуковое давление (интенсивность). Звуковые волны, передающие энергию и информацию от ис- точника сигнала, называются акустическими, или звуковыми сигналами. Если в любой точке звукового поля поставить измерительный прибор (например, микрофон), то можно получить зависимость мгновенного изменения звукового давления от времени для данной точки среды. Эта зависимость называется осциллограммой. Следует отметить, что на выходе микрофона будет уже электрический сигнал, напряжение (мощность) которого изменяется пропорционально изменению звукового давления в акустическом сигнале. Обычно в технических приложениях, в частности при компью- терной обработке звуковых сигналов, используется запись за- висимости усредненного за некоторый отрезок времени уровня звукового давления от времени. Такая зависимость называется уровнеграммой. Для построения уровнеграммы определяется усредненное значение сигнала за некоторый предшествующий промежуток
78 Глава 2 времени T (при этом учитывается только значение модуля сиг- нала), и от него рассчитывается уровень звукового давления (или напряжения) [13]: L(I1)ДБ = 20 Ig {\Ucp(tj)\ / U0}, где U0 — нулевой уровень. Усреднение может быть равномерным, когда выбирается посто- янная времени T и всем предшествующим значениям сигнала при- писывается равный вес (рис. 2.4.1): и a) = - W)I* где т~ время УсРеднения' T {j. W(t)\ — модуль сигнала (напряжения 1 или звукового давления). Усреднение может быть экспоненциальным, когда учитывается дополнительный экспоненциальный множитель, придающий уда- ленным значениям сигнала меньший вес (рис. 2.4.2), что соот- ветствует способу анализа сигнала в слуховой системе: UCp(I1) =±\\U(t)\>~ 1т dt Вид полученной таким образом динамической уровнеграммы за- висит от характера изменения мгновенных значений сигнала, вы- бранного времени усреднения, параметров измерительного прибо- ра (его времени срабатывания) и др. При времени усреднения 15-20 мс строятся объективные уров- неграммы (это среднее время срабатывания приборов), при вре- мени усреднения 150-200 мс — субъективные уровнеграммы (это время, необходимое слуховой системе для полной оценки пара- метров сигнала), при времени усреднения 1-2 мс — мгновенные уровнеграммы. Если проанализировать характер изменения уровня звукового давления (или напряжения) в зависимости от времени в звуковых сигналах, то можно их классифицировать следующим образом (рис. 2.4.3): — детерминированные — значение сигнала в данный момент времени позволяет предсказать его значение в последу- Рис. 2.4.1. Уровнеграмма звукового сигнала (равномерное усреднение) сигнал Рис. 2.4.2. Уровнеграмма звукового сигнала (экспоненциальное усреднение)
Физические свойства звука 79 в Рис. 2.4.3. а — уровнеграмма для детерминированных сигналов (гармоническое колебание), б — уровнеграмма для случайных сигналов (шум), в — уровнеграмма для квазислучайных сигналов ющие моменты времени — например, синусоидальная звуковая волна (рис. 2.4.3а). Такие сигналы обычно создаются искусст- венным путем; — случайные — значение сигнала в данный момент времени не позволяет предсказать его значения в последующие моменты времени, поскольку они изменяются по случайному закону — на- пример, белый шум (рис. 2.4.36); — квазислучайные — значения которых предсказуемы на ко- нечных отрезках времени, но в целом изменение сигнала пред- сказать невозможно, — к таким сигналам относятся музыка и речь (рис. 2.4.3в). В музыкальных сигналах большие участки могут иметь периодиче- ский характер, но для очень больших интервалов времени и их можно в среднем рассматривать как случайные [13]. Кроме того, акустические сигналы можно разделить на стаци- онарные, т. е. такие среднестатистические свойства которых не из- меняются во времени U Ct1) = Ucp(t2) = U (t3)... (при некотором интервале усреднения T > T0 где T0 — интервал стационарности) и нестационарные, средние значения которых различны в раз- ные моменты времени. К числу последних относятся речевые и музыкальные сигналы. При больших интервалах усреднения T > 2-3 мин для речи и T > 20 мин для музыки их можно считать стационарными (хотя имеются такие виды музыкальных произве- дений, где интервал стационарности T0 определить невозможно).
80 Глава 2 Таким образом, поскольку музыкальные и речевые сигналы яв- ляются сигналами квазислучайными, т. е. предсказать их значения можно только с определенной вероятностью, то для анализа их акустических характеристик применяются методы статистического, спектрального и корреляционного анализа. Статистический анализ различных акустических сигналов (музыки, речи, шума и пр.) позволяет установить распределение мгновенных значений и их уровней во времени; распределение длительностей пауз; распределение максимальных уровней сигна- ла и длительностей их непрерывного существования во времени; распределение текущей и средней мощности; динамический диа- пазон и др. [13, 21]. Знание статистических свойств звуковых сигналов имеет очень важное значение при монтаже и редактировании звуковых про- грамм, согласовании их с параметрами аппаратуры и звуковых трактов, при выборе различных способов обработки сигналов, при оптимальной организации систем звукового вещания, звукозаписи и т. д. К числу наиболее важных параметров, получаемых из статис- тического анализа уровнеграмм, которые являются необходимыми при изучении механизмов звукообразования в музыкальных ин- струментах, голосовом аппарате, акустических системах и др., относятся динамический диапазон и пик-фактор. Динамический диапазон любого акустического сигнала опре- деляется как отношение максимального значения звукового давле- ния рмах (Па) к минимальному рмин (Па) за время существования сигнала. Однако способы определения максимального и мини- мального значения звукового давления могут быть различными. С помощью анализа уровнеграмм сигнала можно выполнить экспериментальное определение динамического диапазона следу- ющим образом: если взять какой-нибудь уровень сигнала ЦдБ), Ь,дБ "At 1 At2At3At4 At5 At6At7At8 t,C подсчитать по уровнеграмме (рис. 2.4.4) время, в течение кото- рого текущие уровни сигнала будут выше ЦдБ) т = At1 + At2 + At3.., и определить относительное время пребывания сигнала как: -12 (О = т/Т х 100%, -24 максимального и минимального Рис. 2.4.4. Метод определения уровня сигнала по его уровнеграмме где T — общая длительность сигна- ла, то уровень L выше (не ниже) которого относительное время пре- бывания сигнала составляет 2% времени для музыки и 1% для речи, называется квазимаксимальным. Соответственно уровень сигнала
Физические свойства звука 81 называется квазиминимальным, если относительное время суще- ствования сигналов ниже (не выше) него составляет 98% и 99%. Динамическим диапазоном звукового сигнала называется разница между квазимаксимальным и квазиминимальным уровня- ми сигнала: D = LMax — LMun Значение динамического диапазона является одной из важней- ших характеристик любого источника звука (музыкального инстру- мента, голоса, акустической системы и др.) и имеет принципиально важное значение для практики работы звукорежиссера, поскольку одной из его задач является приведение в соответствие динами- ческого диапазона звукового сигнала с техническими возможнос- тями тракта передачи или звукозаписи. Динамические диапазоны музыкальных инструментов находятся в пределах 20-80 дБ, сим- фонического оркестра до 90 дБ, речи — 25-45 дБ и т. д. Значения динамических диапазонов музыкальных инструментов и голоса приведены в гл. 4. Не менее важным параметром для определения акустических характерик сигналов является пик-фактор. Пик-фактор определяется как разность между квазимакси- мальным и средним уровнями сигнала (усредненного за промежу- ток времени не менее 1 мин для музыки и не менее 15 с для речи): IJ = Lmox - Lcp. Пик-фактор также чрезвычайно важная величина при работе с акустическими сигналами, он показывает, насколько ниже надо взять средний уровень сигнала при обработке и записи звука по сравнению с уровнем ограничения в канале, чтобы не перегружать его при пиковых уровнях. Значения пик-фактора, например для рояля 9,8 дБ, для трубы 12 дБ, для симфонического оркестра до 28 дБ [13]. Спектральный анализ позволяет разложить любой сложный акустический сигнал, создаваемый различными источниками звука, на более простые составляющие (аналогично тому, как белый свет можно разложить на его составляющие — примером может слу- жить радуга). В основе спектрального анализа музыкальных и речевых сигна- лов лежит очень важная теорема, сформулированная французским математиком Жозефом Фурье (1768-1830): «Любое периодическое колебание, какой бы сложности оно ни было, может быть пред- ставлено в виде суммы простых колебаний, чьи частоты являют- ся гармониками основного тона (фундаментальной частоты), а ам- плитуды и фазы рассчитываются по определенному закону» [22]. Процесс разложения сложного периодического сигнала на про- стые гармонические составляющие называется анализом Фурье,
82 Глава 2 или спектральным анализом, обратный процесс — конструиро- вание сложного звука по его гармоническим составляющим — называется синтезом Фурье. Методы спектрального анализа могут быть применены не толь- ко к периодическим сигналам, но также и к сигналам непериоди- ческим и к сигналам, представленным в цифровой форме (см. гл. 6). В зависимости от типа сигнала используются различные виды спектрального анализа: ряд Фурье (для периодических сигналов), интеграл Фурье (для непериодических сигналов), дискретное пре- образование Фурье (ДПФ) и быстрое преобразование Фурье (БПФ) для цифровых сигналов [13, 21-23]. Тональный музыкальный сигнал является периодиче- ским, поскольку только у тако- го сигнала слуховая система может определить высоту тона (см. гл. 3). В качестве примера на рис. 2.4.5 показа- на форма звуковой волны (уровнеграмма) для ноты А4 (Z0 = 440 Гц), сыгранной скрипка труба флейта А А -г р. ц 2 мс Рис. 2.4.5. Уровнеграмма музыкального сигнала: нота А4 (440 Гц), сыгранная на скрипке, трубе, флейте и гобое на скрипке, трубе, флейте и гобое. Периодический сигнал U(t) (например, звуковое давление или напряжение) должен удов- U(t + пТ)9 где T — период колебаний 2,27 мс), п — це- летворять условию: U(t) (в случае, показанном на рис. 2.4.5 он равен T лое число. Основная (фундаментальная) частота определяется как f0 = 1/Т, в данном случае (рис. 2.4.5) она равна 440 Гц. Такой сигнал может быть представлен в виде ряда Фурье, т. е. в виде суммы гармоник: /1=1 п=\ Частоты этих гармонических составляющих равны: о0> 2си0, 3o)0...f где Co0 = 27tf0. Амплитуды этих составляющих определяются следующими формулами: Д 2 a0=l/Ti U(t)A; t +— 2 an = 1/Т J U(t) cos п(О0 dt; bn = 1/T J U(t)sin nco0 dt;
Физические свойства звука 83 Ряд Фурье может быть записан и в другой форме: U(I)=SAe-1^W, Как видно из этой формулы, любой сложный периодический звуковой сигнал может быть представлен в виде суммы простых гаромонических сигналов с ам- плитудами An и фазами срп. Со- вокупность всех амплитуд An на шкале частот называется амп- литудным спектром, совокуп- ность всех фаз срп — фазовым спектром. Следует отметить, что такое определение спектра не противо- речит определению спектра, дан- ному в разделе 2.1, т. к. всякое тело (струна, мембрана, пластина и др.) при возбуждении (ударом, щипком и др.) колеблется на всех своих собственных частотах и со- здает звуковой сигнал сложной формы, разложение которого в ряд Фурье и дает значения ампли- туд и фаз собственных колебаний. Примеры различных перио- дических функций и их спектры изображены на рис. 2.4.6а, б: например, квадратичные волны можно представить в виде сум- мы нечетных гармоник, ампли- туды которых убывают как 1/п\ треугольные волны имеют спектр, состоящий из нечетных гармоник с амплитудами, убы- вающими как 1/п2, и т. д. Расчет спектров (т. е. расчет амплитуд и фаз составляющих гармоник) любых звуковых сиг- налов либо выполняется специ- альными приборами-спектро- анализаторами, либо делается программным путем (практи- чески в любом музыкальном IuI лериод- 1S" 10 ■20 3 5 7 9 Ii I lHtr Гц 100 200 400 8001000 2000 4 \ \ U(t) = ^ [sin G)t + 2 sin 3 cot +j sin 5 cot—] -20 ^-30 u §-40 -50 -60 100 200 400 800 1000 2000 U(t) =p[cos cot +^cos 3 cot +55 cos 5 cot ] б Рис. 2.4.6. Примеры амплитудных спектров периодических сигналов: а — квадратичных, б — треугольных
84 Глава 2 редакторе есть операция спектрального анализа — FFT). Пример рассчитанных на компьютере амплитудных спектров для звуковых сигналов, показанных на рис. 2.4.5, представлен на рис. 2.4.7. Так же выполняется и обратная операция — синтез Фурье, т. е. сложение из простых гармонических составляющих с разны- ми амплитудами и фазами акустического сигнала сложной формы; пример для периодического прямоугольного сигнала показан на рис. 2.4.8. Представление сигнала в виде ряда Фурье возможно только для периодических сигналов; в таком случае сигнал имеет дис- кретный спектр, т. е. он состоит из определенного набора дис- кретных (находящихся на определенном расстоянии на шкале частот) гармонических составляющих. Однако для звуковых сигналов более общего вида, т. е. непе- риодических (например, шума, одиночного импульса и т. д.), также можно использовать идею Фурье. Для того чтобы непериодическую функцию можно было описать с помощью набора периодических гармонических составляющих, надо брать бесконечно большое их количество (близко расположенных по частоте), при этом ряд Фурье преобразуется в интеграл Фурье. В этом случае прямое
Физические свойства звука 85 и обратное пребразование сигнала (анализ и синтез) может быть записано в виде: Спектры непериодических сигналов называются непрерывными, в них спектральные составляющие сигнала расположены так плот- но по шкале частот, что обычно для их описания используется спектральная плотность сигнала, отображающая вклад всех спек- тральных компонент, находящихся внутри интервала частот — do. Спектры могут подразделяться также на низко-, средне- и вы- сокочастотные в зависимости от того, какие частоты имеют составляющие их гармоники: например, если составляющие спек- тра имеют наибольшие амплитуды на низких частотах, то спектр низкочастотный (следует обратить внимание, что вообще число со- ставляющих гармоник должно быть бесконечно большим, но их амплитуды убывают с увеличением номера гармоники и могут ста- новиться очень малыми). Спектры также могут быть стационарными (состав их не меня- ется со временем) и нестационарными (происходит изменение структуры спектра во времени). В реальных музыкальных и рече- вых сигналах происходит постоянное изменение их временной структуры; следовательно, спектры реальных сигналов являются нестационарными и их состав все время меняется во времени. Поэтому для описания спектров реальных музыкальных и речевых сигналов используется понятие «долговременного усредненного спектра», когда выделяется длительный отрезок сигнала и рас- считывается его спектр, характеризующий устойчивые свойства данного сигнала. Кроме того, вводится понятие «мгновенного спектра», который представляет собой спектр короткого отрезка сигнала, непосредственно предшествующего данному моменту времени, выделенного с помощью фильтра (например, «прямо- угольного окна»). Это дает возможность проследить за изменени- ем спектра сигнала в разные моменты времени. Такая техника построения трехмерных спектров — 3D (или кумулятивных спек- тров) — используется практически во всех музыкальных компью- терных программах (Spectro-Lab, Wave-Lab и др.); пример пока- зан на рис. 2.4.9. Структура спектров различных музыкальных и речевых сиг- налов имеет решающее значение для восприятия их тембров, где U(t) — непериодический сигнал, S(co) — спектральная плотность сиг- нала.
86 Глава 2 20 44 115 255 640 1440 3620 8130 20500 Рис. 2.4.9. Трехмерный спектр музыкального сигнала (флейта) причем существенное значение имеют не только амплитудные (ко- торые используются чаще всего), но и фазовые спектры (см. гл. 3). Для характеристики работы различных звуковых источников очень важную информацию дают энергетические спектры, опре- деляющие распределение энергии сигнала в различных частотных областях. Поскольку энергия (интенсивность) сигнала пропорцио- нальна квадрату звукового давления (см. разд. 2.3), то спектраль- ная плотность энергии (интенсивности), или его энергетический спектр, определяется как квадрат модуля спектральной плотности сигнала: I(cq) = \S(cq)\2. Если сигнал периодический и его спектр дискретный, то энергетический спектр определяется с помощью расчетов квадратов амплитуд гармонических составляющих сигна- ла 1(g)) ~ Ап2(со) [13]. На практике для определения спектральной плотности энергии (интенсивности) сигнала с помощью узкополос- ных фильтров измеряется значение интенсивности сигнала в узкой полосе частот (обычно используется ширина полосы, равная 1 Гц). Полученные значения выражаются в дБ (раздел 2.2). Таким образом получаются уровни спектральной плотности интенсив- ности (или просто спектральные уровни). Следует отметить, что при расчетах или измерениях энергетических спектров теряется информация о фазах, т. к. используются только квадраты ампли- туд сигнала. Усредненные энергетические спектры для различных видов музыкальных сигналов и для речи показаны на рис. 2.4.10. Как следует из графиков, уровни спектральной плотности имеют максимальные значения в области до 1,5 кГц, постепенно понижа- ясь к высоким частотам для всех видов программ, т. е. основная акустическая энергия в таких сигналах содержится в низкочастот- ной части спектра. Характер их зависимости от частоты определя- ется жанром выбранной музыки — в частности, применение совре- менной электронной музыки привело к значительному расширению энергетических спектров в сторону высоких частот.
Физические свойства звука 87 0,06 0,1 0,2 0,5 Lcp, дБ 20 1 0,06 0,1 0,2 0,5 1 б Lcp, дБ 20 -40 60 0,06 0,1 0,2 0,5 1 2 5 /,кГц Рис. 2.4.10. Уровни спектральной плотности средней мощности: а — речи, б — вокальной и камерной музыки, в — легкой и эстрадной музыки, г — симфонической музыки Шумовой сигнал, уровень спектральной плотности которого оди- наков во всем частотном диапазоне, называется «белым шумом». Если уровень спектральной плотности снижается в сторону высо- ких частот с крутизной 3 дБ/окт, то такой шумовой сигнал называ- ется «розовым шумом». Анализ распределения уровней спектральной плотности позво- ляет определить такой полезный для практики параметр, как час- тотный диапазон. Частотный диапазон является важнейшим параметром, опре- деляющим качество звучания музыкальных инструментов, пев- ческого голоса и всех видов электроакустической аппаратуры. Поскольку не существует четких критериев для определения час- тотного диапазона, его устанавливают с помощью кривых распре- деления уровней спектральной плотности звуковых сигналов на ос- нове слуховых оценок. Принято считать, что если ограничения по частоте распределения спектральных уровней сигнала становятся заметны на слух для более чем 75% слушателей, то такие грани- цы определяют частотный диапазон данного источника сигналов
88 Глава 2 [13]. Следует понимать, что такое определение является средне- статистическим, всегда имеется группа слушателей, которая может заметить ограничения в значительно более широком диапазоне ча- стот. Частотные диапазоны основных музыкальных инструментов и голоса приведены на рис. 2.4.11. Если частотный диапазон определяет, в какой области частот сосредоточена основная энергия акустического сигнала, создава- емая музыкальным инструментом или голосом, то для описания распределения этой энергии в пространстве используется такой параметр, как характеристика направленности. Характеристика направленности определяет количество аку- стической энергии, сосредоточенной внутри определенного угла излучения; ширина этого угла существенно зависит от частоты: если на низких частотах энергия распределена равномерно вокруг источника, то по мере повышения частоты она начинает сосредо- тачиваться внутри все более узкого угла (см. гл. 4). Вид зависимо- сти этой характеристики от частоты дает важную информацию о работе различных звуковых источников. Особой областью применения спектрального анализа в прак- тике звукозаписи, радиовещания и др. является исследование спектров модулированных колебаний, к числу которых относятся практически все музыкальные и речевые сигналы, создаваемые музыкальными инструментами и голосом. Спектры модулированных сигналов: модулированные коле- бания получаются в том случае, если параметры сигнала (ампли- туда, частота, фаза) начинают изменяться по какому-то заданно- му закону. Процесс управления параметрами звукового сигнала называется его модуляцией. Как было показано в разделе 2.1, простое гармоническое коле- бание полностью описывается тремя параметрами — амплитудой, частотой и фазой [22]: x(t) = A0sin(c^0t+^0). Изменяя по определенному закону каждый из этих параметров, можно получить различные виды модуляции сигналов. Если по оп- ределенному закону меняется амплитуда сигнала, то этот процесс называется амплитудной модуляцией, если частота — частотной модуляцией, фаза — фазовой модуляцией. Амплитудная модуляция (AM): при изменении амплитуды коэффициент A0 будет уже не постоянным, он начнет изменяться во времени: A(t). Это изменение может происходить, например, по гармоническому (синусоидальному) закону: A(t) = A0sin(i2t + ф), где Q — частота изменения амплитуды (частота модуляции), ф — фаза.
Физические свойства звука 89 /,Гц 27,50 30,87 32,70 36,71 41,20 43,63 49,00 55,00 61,74 65,41 73,42 82,41 87,31 98,00 110,00 123,47 130,81 146,83 164,81 174,61 196,00 220,00 246,94 261,63 293,66 329,63 349,23 Ля 397,00 та™* $JJ 523,25 587,33 659,26 698,46 783,90 880,00 987,77 1046,50 1174.66 1318,51 1396,91 1567,98 1760.00 1975,53 2093,00 2349,32 2637,02 2793,83 3135,96 3520,00 3951,07 4186,01 /,Гц 29,14 34,65 38,89 46,25 51,91 58,27 69,30 77,78 92,50 103,83 116,54 138,6 155,6 185,0 207,7 233,1 277,2 311,1 370,0 415,3 466,2 554,4 622,3 740,0 830,6 9325 1108,7 1244,5 1480 1661 1865 2218 2489 2960 3322 3729 Голос Инструменты Струнные Деревянные Медные духовые духовые о Ю О —в— _ W Q-п. Q С I о Sr eg -0" >5 ГО О b VO >s T- ГО (Q -а Рис. 2.4.11. Частотные диапазоны различных музыкальных инструментов и голоса
90 Глава 2 Рис. 2.4.12. Вид амплитудно- модулированного сигнала при разных коэффициентах модуляции (M) Функция A(t) называется модулирующим колебанием, на практике его частота обычно много ниже частоты основного колебания (модулируемого): (Q « со> . В этом случае общее результирующее колебание может быть записано в следующем виде: x(t) = A0[I +M sin(i2t + 0)]sin(coot + tp0)9 где M — коэффициент модуляции, который равен отношению M = A1ZA0 (A1 — амплитуда модулирующего сигнала, A0 — амплитуда исходного модулируемого сигнала). Величина M характеризует глубину амплитудной моду- ляции, т. е. показывает, насколько амплитуда основного колебания меняется со временем, что воспринимается на слух как изменение громкости. Вид амплитудно-модулированного колебания при разных коэффициентах модуляции показан на рис. 2.4.12. В музыкальном искусстве ис- пользуются только сигналы с очень малым ко- эффициентом (M) и низкой частотой модуля- ции, порядка 5-7 Гц. Такой вид изменения сигнала называется тремоло. В спектре моду- лированного таким образом сигнала имеется основной сигнал с частотой со0 и появляются дополнительные сигналы с частотами: (CO0 + Q; CO0 - й) и амплитудами A0M/2. Например, если несущий сигнал 1000 Гц, промодулирован сиг- налом с частотой 10 Гц, то появятся две боко- вые частоты 1010 Гц и 990 Гц. Таким образом, спектр АМ-сигнала расширяется по полосе, и ширина его становится равной 2Q Гц. Обычно в технике радиовещания используется модуляция несущего синусоидального сигнала сложным звуковым сигналом (музыкальным или речевым) со спектром, показанным на рис. 2.4.13, при этом в спектре АМ-сигнала появляется много боковых составляющих, и спектр расши- ряется до удвоенной высшей частоты, присутствующей в спектре мо- дулирующего сигнала (например, если звуковой спектр модулирующего музыкального сигнала составляет 80-15000 Гц, тогда ширина спектра АМ-сигнала будет равна: 2х 15000 Гц = 30000 Гц). Частотная модуляция (ЧМ): если в простом гармоническом колебании изменять по определенному закону частоту или фазу ко-
Физические свойства звука 91 О Qi CO0-Oi 0¾+¾ со а б Рис. 2.4.13. Спектр амплитудно-модулированного сигнала лебаний, то можно получить частотно- и фазомодулированные сиг- налы (ЧМ и ФМ). В случае, если изменение частоты происходит также по синусоидальному закону, суммарное частотно-модулиро- ванное колебание будет иметь вид, показанный на рис. 2.4.14, и может быть записано в виде (если считать Cp0 = 0): x(t) = A0sin(co0t + M1 sin Q t), где M1 = Aco/i2— индекс однотональной частотной модуляции, Ao) — девиация (изменение) частоты исходного сигнала. В спект- ре такого сигнала также появляются боковые составляющие. Структура спектра становится сложнее, с ростом индекса мбдуля- ции M1 увеличивается число спектральных составляющих, при этом происходит перераспределение энергии между ними и растет ширина спектра, которая примерно равна: 2(M1 + I)Q Гц, т. е. ЧМ-сигнал требует полосы частот больше в (M1 + I) раз, чем АМ-сигнал, что имеет принципиальное значение в радиовещании. Частотно-модулированные сигналы широко используются в во- кальном и музыкальном творчестве и называются вибрато (с ча- стотой модуляции 5-10 Гц), они воспринимаются как небольшие изменения высоты тона. Фазомодулированные сигналы имеют похожие спектры, но, однако, ФМ- и ЧМ-сигналы по-разному ведут себя при изменении частоты модуляции и амплитуды модулирующего сигнала: при ча- стотной модуляции девиация (изменение) частоты Асо пропорци- ональна амплитуде низкочастотного (модулирующего) сигнала и не зависит от его частоты Q. При фазовой модуляции она ли- нейно увеличивается с ростом час- тоты модулирующего сигнала Q [22]. Фазовая модуляция применя- ется в современных компьютерных программах для обработки му- зыкальных сигналов в различных спецэффектах. Рис. 2.4.14. Вид частотно-модулированного сигнала
92 Глава 2 Корреляционный анализ цвет возможность определить в про- цессе работы с музыкальными и речевыми сигналами очень полез- ную временную характеристику — функцию корреляции (когда сравниваются два разных сигнала) или функцию автокорреляции (когда сравниваются значения одного и того же сигнала в разные моменты времени). Функции корреляции (или автокорреляции) позволяют оценить степень «подобия» сигналов друг другу (или сигнала самому себе в разные моменты времени), а также выя- вить периодичность сигналов (иногда скрытую шумами). Необходи- мость в такой оценке возникает при анализе прямых сигналов и их отражений, например при оценке реверберационных процессов в помещении, при выделении сигналов на фоне шумов и т. д. В со- ответствии с современными взглядами на работу слухового анали- затора (см. гл. 3 и 5) при субъективной оценке «пространственно- сти» в концертных залах, студиях и др. существенную роль играет значение корреляционной функции между бинауральными сигнала- ми, попадающими на два слуховых канала. Кроме того, выявление периодичности в сложных звуковых сигналах с помощью опреде- ления функции автокорелляции используется слуховым аппаратом при определении высоты тона. Краткое определение функции корреляции может быть дано следующим образом: если суммировать два звуковых сигнала, один из которых является запаздывающим повторением первого (например, прямой сигнал и его отражение в помещении), то сред- няя мощность суммарного сигнала за время усреднения T может быть определена по формуле: W (t) = W ,+W ?+ 2г(т), сру / ср. J ср.2 * где W1 — средняя мощность прямого сигнала, W2 — средняя мощность второго (запаздывающего) сигнала, 2г(т) — средняя вза- имная мощность этих двух сигналов, которая называется функцией автокорреляции. Функция автокорреляции определяется как: T(T) = IJx(Ox(S-T)^1 T t-т т. е. это произведение значения сигнала на его задержанную на время тс копию. При т = 0, т. е. при отсутствии задержки функция корреляции становится равной энергии сигнала и имеет макси- мальное значение. Например, функция корреляции для прямо- угольного сигнала длительностью T1 имеет вид треугольника, пока- занного на рис. 2.4.15, т. е. она максимальна при т = О и равна нулю при т = T1. Если при увеличении интервала усреднения значение мощности каждого из сигналов стремится к некоторой предельной величине, не зависящей от времени, то такие сигналы называются стацио-
Физические свойства звука 93 Рис. 2.4.15. Автокорреляционная функция для прямоугольного сигнала нарными и однородными. При этом функция автокорреляции так- же стремится к некоторому предельному значению. Если при уве- личении интервала времени средние мощности и функция корре- ляции непрерывно изменяются со временем, то такие сигналы называются неоднородными. Для широкополосного сигнала типа «белый шум» функция ав- токорреляции отлична от нуля только при т = 0, т. е. имеет интер- вал корреляции, равный нулю; такой сигнал считается некоррели- рованным во времени, т. е. каждое его последующее значение не связано с предыдущим и непредсказуемо. Реальный музыкальный сигнал имеет конечный интервал кор- реляции, на котором функция корреляции отлична от нуля. Причем если в сигнале есть периодичность (даже скрытая шумами), то функция автокорреляции имеет максимумы при времени задерж- ки, равном периоду сигнала, что позволяет выявить эту периодич- ность. Функция автокорреляции связана через преобразование Фурье с функцией спектральной плотности мощности сигнала (т. е. с его энергетическим спектром). Таким образом, если функция корреляции между двумя сигна- лами говорит о степени их подобия, то огибающая автокорреляци- онной функции может быть прямо интерпретирована как мера того, как будущие значения сигнала могут быть с определенной веро- ятностью предсказаны по информации о его поведении «в про- шлом» внутри интервала корреляции [22]. Рассмотренные в данной главе физические характеристики зву- ка составляют основу для описания различных систем звукообра- зования в музыкальных инструментах, голосе, акустической аппа- ратуре и др., а также процессов распространения и восприятия звука, которые будут рассмотрены в следующих главах. Основными акустическими параметрами, которые будут использоваться для характеристики систем звукообразования, в музыкальных инструментах и голосе (см. гл. 4) являются: частотный диапазон, динамический диапазон, уровни звукового давления, переходные процессы, характеристика направлен- ности и др.
94 Глава 2 Контрольные вопросы 1. Что такое механические колебания? Указать их роль в создании, рас- пространении и восприятии звука. 2. Дать определение простого гармонического колебания, привести формулу и объяснить значение основных параметров: амплитуды, ча- стоты, фазы. 3. Что такое собственная частота, от каких параметров она зависит? Привести примеры для струны и маятника. 4. Нарисовать форму затухающих колебаний. Дать определение таких параметров как: коэффициент внутреннего трения, коэффициент за- тухания, декремент, добротность. 5. Что такое спектр, основная частота, обертоны, гармоники, моды ко- лебаний? 6. В чем заключается явление резонанса? От каких параметров зави- сит амплитуда колебаний на резонансе? Привести форму резонансной кривой при разных значениях добротности. 7. Дать определение звуковой волны, длины волны, скорости звука. Привести зависимость частоты от скорости звука и длины волны. 8. Как определяется звуковое давление? В каких единицах оно изме- ряется? Привести примеры перевода значений звукового давления из Па в дБ. Какому звуковому давлению соответствует уровень 100 дБ, 94 дБ, 112 дБ? 9. Описать такие звуковые явления как: распространение, отражение, поглощение, рефракция, интерференция, стоячая волна, дифракция, эффект Доплера. 10. Привести зависимость изменения звукового давления от расстояния для сферической, плоской и цилиндрической волны. 11. Дать определение процессов биения, тремоло и вибрато и нарисовать для них форму звуковой волны. 12. Что такое уровнеграмма звукового сигнала? Как определяется сред- нее значение звукового сигнала? 13. Как определяется динамический диапазон сигнала? Привести значе- ния динамических диапазонов для музыкальных инструментов и го- лоса. 14. Что такое спектральный анализ звукового сигнала, как выполняется преобразование Фурье? Привести определение частотного диапазона и примеры для музыкальных инструментов и голоса.
Физические свойства звука 95 Список литературы 1. Элементарный учебник физики / Под. ред Г. С. Ландсберга. M.: На- ука, 1968. Т. 1-3. 2. Пановко Я. Г. Введение в теорию механических колебаний. Учебное пособие. M.: Наука, 1971. 3. Ландау Л. Д., Китайгородский А. И. Физика для всех. M.: Наука, 1965. 4. Вайнберг Д. В., Писаренко Г. С. Механические колебания и их роль в технике. M.: Наука, 1965. 5. Физика. Большой энциклопедический словарь. M.: Научное издатель- ство «БРЭ». 1999. 6. Скучик Е. Основы акустики. М. : Мир, 1976. Т. 1-2. 7. Ржевкин С. Н. Курс лекций по теории звука. M.: Изд-во МГУ, 1960. 8. Морз Ф. Колебания и звук. M.: Гостехтеориздат, 1949. 9. Стрэтт (Рэлей) В. Теория звука. M.: Гостехтеориздат, 1955. 2-е изд. 10. Алешкевич В. А., Деденко Л. Г., Караваев В. А. Колебания и волны. Лекции. M.: Изд-во МГУ (физический факультет), 2003. 11. http://www.astronet.ru:8101/db/search.html. 12. Кузнецов Л. А. Акустика музыкальных инструментов. M.: Легпромбы- тиздат, 1989. 13. Вибрации в технике. Справочник. Т. 6. Защита от вибраций и ударов. M.: Машиностроение, 1981. 14. Акустика: Справочник / Под общ. ред. ]vl. А. Сапожкова. M.: Радио и Связь, 1989. 15. Rossing Т. D. The Science of Sound. N. Y.: Add-Wesley. 1982. 16. Тэйлор Ч. Физика музыкальных звуков. M.: Легкая индустрия, 1976. 17. Olson К Musik, Physics and Engineering. N. Y.: Dover Pb., 1967. 18. Bakus J. The acoustical Foundations of Music. N.Y: W. W. Norton & Company. 1969. 19. Hall D. Musical Acoustics. N. Y: Wadsworth Publ., 1980. 20. Павловская В. И., Качерович А. К, Лукьянов А. П. Акустика и элек- троакустические аппараты. M.: Искусство, 1986. 21. http: // hypeфhysics.phy-astr.gsu.edu/hbase/music/hгrame.html 22. Радиовещание и электроакустика. Учебник / Под. ред. Ю. А. Ковал- гина. M.: Радио и связь, 1998. 23. Баскаков С. И. Радиотехнические цепи и сигналы. M.: Высшая шко- ла, 1983. 24. Солонина А. И. и др. Основы цифровой обработки сигналов. Курс лекций. СПб.: БХВ-Петербург, 2003.
Глава 3. ВОСПРИЯТИЕ ЗВУКА. ОСНОВЫ ПСИХОАКУСТИКИ Как уже было отмечено в первой главе, музыкальная акустика, как одно из направлений акустики в целом, рассматривает пробле- мы создания, передачи и восприятия звуков, используемых в му- зыке. Вопросы создания звуков будут рассмотрены в главах 4 и 7, передачи звуков — в главах 5 и 6. В данной главе будут рассмот- рены вопросы восприятия звука. Проблемами восприятия звука занимается направление в аку- стике, которое в конце XIX века получило название психоакусти- ка. Психоакустика — это наука о количественных зависимо- стях между внешними стимулами (физическими параметра- ми звука) и ощущениями (психологическими параметрами), которые они вызывают [1-10]. Психоакустика является составной частью психофизики, кото- рая изучает воздействие всех внешних стимулов (света, звука, дав- ления, химической энергии и др.) на сенсорные органы (зрение, обоняние, слух, осязание ), т. е. она пытается связать изменения в окружающем мире с изменениями в наших внутренних ощуще- ниях и выразить эту связь количественно [3]. Психоакустика зани- мается изучением воздействия всех видов звуков на сенсорные органы слуха (в том числе шумов, сигнальных звуков и др.); изу- чая музыкальные звуки, она входит как составная часть в музы- кальную акустику. Как самостоятельное направление науки она начала свое раз- витие в конце XIX — начале XX века. Основные этапы ее разви- тия связаны с трудами таких известных ученых как G. Ohm, Н. Helmholtz, Н. Fletcher, J. Schouten, R. Plomp, G. Bekesi, S. Stevens, Е. Terhard, Е. Zwicker, J. Blauert, В. Moore, A. Houtsma и др. (см. гл. 1). В конце XX века именно психоакустика вышла в общей сис- теме создания — передачи — восприятия звука на первый план. Научно-техническая компьютерная революция открыла принципи- ально новые возможности работы со звуком (в т. ч. с помощью ком- пьютерных музыкальных технологий); послужила базой для мощного развития аудиоиндустрии; создала новые средства передачи про- странственной звуковой информации (цифровое радиовещание, телевидение, звукозапись) и т. д. Однако поскольку конечным при-
Восприятие звука. Основы психоакустики 97 емником звуковой информации остается слуховая система, пони- мание принципов формирования ею звукового образа окружающе- го мира является принципиально важным как для развития науки (в т. ч. музыкальной акустики), так и для дальнейшего развития аудиотехники. Как уже было отмечено в главе 2, звуковой сигнал (музыка, речь, шум и др.), поступающий на вход слуховой системы, облада- ет определенным набором физических характеристик (объективно измеряемых параметров): интенсивностью, периодичностью (час- тотой), длительностью, спектром, расположением в пространстве и др. Этот же сигнал вызывает определенные ощущения, которые могут характеризоваться такими субъективными параметрами как высота, громкость, тембр, маскировка, локализация и т. д. Установ- ление связей и определение количественных соотношений между ними и есть одна из основных задач психоакустики. Уже в XIX веке было замечено, что связи между физическими стимулами (сигналами) и вызываемыми ощущениями нелинейны и неоднозначны. В 1834 году был сформулирован закон Вебера: ощущение пропорционально относительному изменению объектив- ного параметра сигнала — например, ощущение изменения гром- кости связано с изменением интенсивности звука I как: Д1/1 = к Величина к (константа Вебера) зависит от вида ощущений, для громкости k = 0,048 (это соотношение сохраняется и для других видов ощущений, — например, визуальных, — только коэффици- ент к изменяется: для яркости он равен 0,079) [3]. На основе этого закона в 1860 году Г. Фехнер получил следу- ющее логарифмическое соотношение между величиной ощущения и физическим параметром сигнала: S = кх IgI9 где А: — константа Вебера, S — величина ощуще- ния. Например, это может быть связь между громкостью S и интен- сивностью / для звукового сигнала (это относится и к другим ви- дам ощущений). В 1961 году С. Стивене предложил другую физическую шкалу, которая связывала субъективные ощущения и физические харак- теристики по степенному закону: S = klь, где Ъ — показатель степени, постоянный для данного вида стимула (например, для громкости он равен 0,6, для ярко- сти — 0,33 и др.) [3]. Эти законы послужили базой для многочисленных исследова- ний в области психоакустики, позволивших установить к концу XX века количественные связи с физическими параметрами для таких субъективных ощущений звука как громкость, высота, лока- лизация, маскировка, тембр (частично) и др. Традиционно область применения психоакустики ограничива- лась первичными субъективными параметрами звука, формируе-
98 Глава 3 мыми в периферической слуховой системе. Вопросы, связанные с обработкой звука в высших отделах слуховой системы, такие как формирование слухового образа, распознавание источников звука (речь, пение, музыкальные инструменты), ассоциативное и эмоци- ональное восприятие музыки и т. д., относились скорее к области музыкальной психологии, когнитивной психологии и др. Однако применение современных компьютерных технологий, новых алгоритмов (например, теории нейронных сетей, генетиче- ских алгоритмов и др.) позволило психоакустике за последние годы значительно расширить область своих исследований в сторону высших отделов слуховой системы. Уже построены компьютерные модели формирования пространственного трехмерного слухового образа, разрабатываются системы автоматического распознавания тембров музыкальных инструментов и др. — таким образом, гра- ницы между психоакустикой и музыкальной психологией сдвигают- ся [13, 35]. В данной главе будут рассмотрены основные результаты иссле- дований по установлению связи таких субъективных параметров звука как высота, громкость, тембр, маскировка, локализация и др. с физическими характеристиками звуковых сигналов. С более сложными проблемами психоакустики, в том числе вопросами рас- познавания тембров музыкальных инструментов, расшифровки слуховых образов и др., можно ознакомиться в литературе [2-10, 14, 15, 17, 38]. 3.1. СТРУКТУРА СЛУХОВОЙ СИСТЕМЫ И ЕЕ ОСНОВНЫЕ ФУНКЦИИ Слуховая система человека является очень сложным приемни- ком звуковой информации. Ее можно условно разделить на две подсистемы: периферическую часть и высшие отделы, включаю- щие слуховые зоны коры головного мозга, центральные слуховые пути и др. Общее расположение слуховой системы показано на рис. 3.1.1. Периферическую часть слуховой системы можно рассматри- вать, по аналогии с техническими устройствами, как акустическую антенну, дифракционный фильтр и предусилитель, которые ло- кализуют, фокусируют и усиливают звуковой сигнал; микрофон, преобразующий акустический сигнал в электрические импульсы; спектроанализатор с высокой разрешающей способностью; ана- лого-цифровой преобразователь; нелинейный компрессор и уси- литель; процессор предварительной обработки сигнала и др. Высшие отделы слуховой системы выполняют функции ло- гического процессора, который выделяет (декодирует) полезные звуковые сигналы на фоне шумов, группирует их по определенным
Восприятие звука. Основы психоакустики 99 слуховая зона височной доли мозга признакам, сравнивает с имеющи- мися в памяти образами, определя- ет их информационную ценность, производит смысловую расшиф- ровку, формирует целостный слухо- вой образ, принимает решение об ответных действиях и т. д. Наибольшее количество резуль- татов получено в ходе изучения процессов преобразования звуко- вых сигналов в периферической части слуховой системы [3, 5, 9, 13, 19, 20, 23-27], однако, как уже было отмечено выше, в настоящее время проводятся интенсивные ис- следования механизмов обработ- ки звуковой информации в высших отделах мозга [1, 5-8, 10, 13-15]. Общий вид периферической слуховой системы показан на рис. 3.1.2. Обычно ее делят на три части: внешнее, среднее и внутреннее ухо. Внешнее ухо состоит из ушной раковины и слухового канала, заканчивающегося тонкой мембраной, называемой барабанной перепонкой (рис. 3.1.2). Внешнее ухо — это прежде всего акус- тическая антенна, которая обеспечивает локализацию звуков, их концентрацию и усиление, а также предохраняет барабанную пе- репонку от повреждений и обеспечивает согласование ее импе- данса (сопротивления) с внешним акустическим полем. наружный слуховой проход Рис. 3.1.1. Общее расположение слуховой системы
100 Глава 3 ножка противозавитка треугольная ямка бугорок ушной раковины ладьевидная ямка раковина уха противозавиток задняя бороздка ушной раковины ножка завитка передняя вырезка надкозелковый бугорок козелок наружный слуховой проход межкозелковая вырезка противокозелок мочка Рис. 3.1.3. Форма ушной раковины дБ 0.2 0.3 0,4 0.5 0,7 20 Ушная раковина (лат. pinna) (рис. 3.1.3) представляет собой сложную хрящевидную структуру (длиной примерно 6,7 см), раз- деленную внутри на несколько полостей, наибольшая из которых, примыкающая к слуховому каналу, имеет объем порядка 3,8 см3. Все части ушной раковины имеют очень важное значение для локализации звука: при ко i,4 2 з 4 5 7 ю 12 падении звуковой волны под разными направлени- ями за счет дифракции, отражения от разных час- тей ушной раковины и возбуждения резонан- сов в ее главных полос- тях происходит измене- ние временной структуры сигнала, поступающего в слуховой канал, и из- менение его спектраль- ных характеристик. Изме- нение формы частотной характеристики звукового сигнала на входе в слу- ховой канал по отноше- нию к его характеристике в свободном поле в за- висимости от угла паде- ния на ушную раковину показано на рис. 3.1.4. Как видно из этих дан- 0,2 0,3 0,4 0,5 0,7 1,0 1,4 2 3 4 5 7 1012 /,кГц Рис. 3.1.4. Форма частотной характеристики сигнала в зависимости от угла его падения на ушную раковину
Восприятие звука. Основы психоакустики 101 ных, ушная раковина играет роль дифракционного фильтра, изме- няя характеристику сигнала в области 3-10 кГц и формируя опре- деленную характеристику направленности слуховой системы. Этот механизм, а также оценка временной и интенсивностной разности сигналов между двумя ушами (см. раздел 3.6) позволяют обеспе- чить локализацию сигналов в горизонтальной плоскости с точно- стью 3° и в вертикальной — 10-12°. Как показали эксперименты, прижатие раковины к голове (или заполнение ее полостей погло- щающим материалом) резко ухудшает точность локализации, осо- бенно в вертикальной плоскости, это служит причиной расположе- ния звукового образа в «центре» головы при прослушивании через телефоны [12, 13, 23]. Слуховой канал выполняет следующие основные функции: за- щищает барабанную перепонку от механических повреждений, со- гласовывает акустические сопротивления барабанной перепонки и внешней среды и повышает чувствительность слуха в области средних частот за счет продольных резонансов. Слуховой канал представляет собой трубу с переменным се- чением (S-образной формы) и криволинейной центральной осью. Длина канала 2,6-3 см, средний диаметр 0,7 см, один его конец открыт, второй закрыт барабанной перепонкой (мягкой мембраной, которая находится под углом 30° к каналу). Резонансы трубы, за- крытой с одного конца и открытой с другого, приближенно опреде- ляются по формуле: fn = (2п + I)CUL1 поэтому при длине L = 3 см первый резонанс будет на частоте 2870 Гц, второй на 8610 Гц и т. д. На резонансных частотах слуховой канал усили- вает звуки, попадающие на барабанную перепонку, особенно на первой резонансной частоте, до 10 дБ, именно этим объясняется тот факт, что область максимальной чувствительности слуха нахо- дится в пределах 2-3 кГц. Совместное действие ушной раковины, головы и слухового канала за счет дифракционных и резонансных эффектов позволяет усилить звук, поступающий на барабанную пе- репонку, на 15-20 дБ в области 2-5 кГц в зависимости от угла его падения. Подъем уровня звукового давления у барабанной пере- понки за счет их совместного действия показан на рис. 3.1.5. 20 Рис. 3.1.5. Подъем уровня звукового давления 0,2 0,5 1 2 5 10 15 у барабанной перепонки Частота, кГц
102 Глава 3 Барабанная перепонка — тонкая полупрозрачная мембрана, которая отделяет слуховой канал от среднего уха. Средняя тол- щина ее 0,074 мм, она имеет эллиптическую форму с размерами 0,9 х 1 см. Ее средняя часть представляет собой вогнутый конус, вершина которого сращена с рукояткой молоточка (рис. 3.1.6а). Звуковые волны, попадающие в слуховой проход, вызывают коле- бания барабанной перепонки, которая на своих резонансных час- тотах также усиливает звук. Именно здесь происходит преобразо- вание акустического сигнала в механические колебания мембраны, которые дальше обрабатываются и преобразуются в среднем и внутреннем ухе. Среднее ухо представляет собой воздушную полость, в кото- рой находятся три маленькие косточки: молоточек, наковальня и стремечко (рис. 3.1.6а). Молоточек имеет длину 7-8 мм, массу 27 мг; наковальня — длиной 7 мм, массой 25 мг; стремечко — длиной 4 мм, массой 25 мг. Молоточек прикреплен своим основа- нием к барабанной перепонке, наковальня с одной стороны под- вижно скреплена с молоточком, с другой со стремечком, которое передает звуковую энергию во внутреннее ухо через овальное окно. Среднее ухо выполняет три функции: согласование импеданса воздушной среды с жидкой средой внутреннего уха (улитки); уси- ление звука за счет рычажного механизма работы косточек; защиту внутреннего уха от громких звуков за счет акустического рефлек- са. Разница между импедансом жидкости во внутреннем ухе и воз- духа составляет 4000 : 1, поэтому если бы не было среднего уха, то большая часть акустической звуковой энергии (99%) просто Рис. 3.1.6. Структура среднего уха: а — колебания косточек (молоточка, наковальни и стремечка); б — принцип действия рычага
Восприятие звука. Основы психоакустики 103 отражалась бы от упругой мембраны овального окна. Задачей среднего уха является согласование импедансов за счет переда- чи и усиления механической энергии от барабанной перепонки к овальному окну улитки (рис. 3.1.2). С этой целью используются два механизма увеличения силы, воздействующей на овальное окно. Во-первых, за счет разницы в длине молоточка и наковаль- ни (эффект рычага: F1X R1= F2X R2 (рис. 3.1.66), так как R1 > R21 то F2> Fp получается выигрыш в силе в 1,5 раза. Во-вторых, за счет соотношения площадей барабанной перепонки (S6n = 70 мм2) и овального окна (Sqkh = 3 мм2), которое равно примерно 20 : 1, выигрыш по звуковому давлению составляет почти 30 дБ. Если сюда добавить усиление за счет резонансных колебаний бара- банной перепонки, получается общее увеличение уровня звуково- го давления примерно на 40 дБ. Такое значительное увеличение давления в определенной степени компенсирует разность импе- дансов, возникающую за счет увеличения плотности среды внут- реннего уха [3]. Среднее ухо выполняет еще защитную функцию по отношению к внутреннему: при достаточно больших уровнях звукового давле- ния специальные мускулы оттягивают стремечко от овального окна, при этом увеличивается натяжение барабанной перепонки [2, 3, 9]. Это свойство называется акустический рефлекс, он сраба- тывает при уровне 90-100 дБ, примерно через 20 мс после нача- ла стимула (от более коротких импульсов ухо не защищено). При этом удается получить снижение уровня на 20 дБ для частот от 1000 Гц, т. е. среднее ухо действует как линейный фильтр низких частот [2]. Среднее ухо также защищает барабанную перепонку от перепа- дов атмосферного давления: от него отходит узкая трубка длиной 35-40 мм, соединяющая его с глоткой (евстахиева труба), поэто- му давление воздуха внутри среднего уха равно внешнему атмос- ферному давлению, то есть действующее на обе стороны бара- банной перепонки давление уравновешено (при нарушении этого условия — например, при внезапной потере высоты самолетом — барабанная перепонка может быть повреждена). Обычно звук по- падает во внутреннее ухо через наружное и среднее ухо, однако существует и другой путь передачи звука — через костную прово- димость, с помощью которой передаются в основном низкочастот- ные звуки. Внутреннее ухо представляет собой конусообразную трубку переменного сечения, расположенную в височной кости (рис. 3.1.2). Трубка свернута в спираль в 2¾ оборота, поэтому она получила название улитка (лат. cochlea). В развернутом состоянии она име- ет длину 3,5 см, площадь поперечного сечения у стремечка 4 мм2,
104 Глава 3 Стремечко Вестибулярный канал Улитковый (кохлеарный) канал Барабанный канал Геликотрема Основание Вершина Рис. 3.1.7. Внутренний вид улитки в разрезе на противоположном конце — 1 мм2. Внутри улитка имеет чрез- вычайно сложную структуру (рис. 3.1.7 ): вдоль всей длины она разделена на три полости — вестибулярный канал, улитковый (кохлеарный) канал и барабанный канал [3]. Все полости запол- нены жидкостью (в срединной полости — эндолимфа, в двух крайних — перилимфа). Верхняя и нижняя полости соединены через отверстие у вершины улитки — геликотрему. В верхней полости находится овальное окно, затянутое пленкой, по которо- му стучит стремечко. В нижней полости — круглое окно, также затянутое пленкой. Сверху срединная полость закрыта мембра- ной Рейсснера, снизу — базилярной мембраной (рис. 3.1.8). Базилярная мембрана состоит из нескольких тысяч попереч- ных волокон, ее общая длина 32 мм, у стремечка ее ширина равна 0,05 мм (этот конец мембраны узкий, легкий и жесткий), у гелико- тремы ширина ее становится больше и составляет 0,5 мм (этот ко- нец мембраны более толстый и мягкий). На внутренней стороне базилярной мембраны находится орган Корт и, названный так в честь итальянского ученого А. Корти, который первым описал его в 1851 году. Орган Корти и есть основ- волокна s"'. слухового нерва / Рис. 3.1.8. Структура трех полостей улитки ной механо-электричес- кий преобразователь («слуховой микрофон»), в котором находятся специализированные ре- цепторы слуха — волос- ковые клетки (рис. 3.1.8 и 3.1.9). Орган Корти распределен вдоль поверхности базилярной мембраны и состоит из одного ряда внутренних волосковых клеток (ВВК, числом приблизительно 3500) и трех (четырех
Восприятие звука. Основы психоакустики 105 в верхней части) рядов наружных волосковых клеток (НВК, их количе- ство достигает 20000), разделенных тоннелем. На каждой BBK имеется по 50-70 волосков (стереосциллий), на HBK по 40-150 волосков, они располагаются в виде буквы W и ча- стично внедрены в покровную (тек- ториальную) мембрану, которая по- добно ленте покрывает ВОЛОСКОВЬЮ рис ^Л.9. Орган Корти клетки Сверху. От ВОЛОСКОВЫХ КЛетОК (поперечный разрез улитки). отходят через тоннель более 50000 восходящих (афферентных) слуховых нервных волокон, которые образуют слуховой нерв и передают информацию в мозг. К этим же клеткам подходят нисходящие (эфферентные) нервные волок- на. Распределены эти волокна неравномерно: 90-95% восходящих волокон отходят от внутренних волосковых клеток, только 5-10% от наружных; что касается нисходящих волокон, то для них соот- ношение примерно обратное. Следовательно, внутренние и наруж- ные волосковые клетки выполняют разные функции: BBK в основ- ном передают информацию в мозг о внешних звуковых событиях, a HBK выполняют приказы мозга, именно они отвечают за усиле- ние, компрессию сигнала и отоакустическую эмиссию [9]. Общий механизм преобразования звукового сигнала во внутрен- нем ухе упрощенно заключается в следующем (рис. 3.1.2 и 3.1.8): после того как звуковые волны прошли звуковой канал и вызвали механические колебания барабанной перепонки, они через систе- му косточек трансформируются в движение стремечка, а оно в свою очередь толкает мембрану овального окна и вызывает дви- жение жидкости (импульс давления), которая переливается из верхней половины в нижнюю барабанную лестницу через геликот- рему и оказывает давление на перепонку круглого окна, вызывая при этом его смещение в сторону, противоположную движению стремечка. Движение жидкости вызывает колебания базилярной мембраны, в которой возникает бегущая волна (рис. 3.1.10), пере- мещающаяся от основания к вершине (к геликотреме). Исследова- направление движения Рис. 3.1.10. Бегущая волна на базилярной мембране
106 Глава 3 3000 Гц ния Г. Бекеши показали, что бегущая волна на базилярной мембране обладает уникаль- ной особенностью: место рас- положения ее максимумов за- висит от частоты звука. Для низких звуков максимумы рас- полагаются вблизи вершины мембраны, для высоких — вблизи ее основания (рис. 3.1.11). Именно таким спосо- бом происходит предваритель- 20000 Гц 4000 Гц 6000 Гц Рис. 3.1.11. Расположение частотных максимумов на базилярной мембране ный спектральный анализ звукового сигнала. Дальнейшее преобразование механических колебаний в элек- трические разряды в нервных волокнах происходит в волосковых клетках. Когда базилярная мембрана колеблется, это вызывает смещение находящихся на ней волосковых клеток, которые упира- ются в покровную мембрану, что вызывает изгиб ресничек и сти- мулирует возникновение в них электрического потенциала (меха- низм подробно объяснен в книге «Слух» [2]). Это, в свою очередь, генерирует поток дискретных электрических импульсов в нервных волокнах слухового нерва, передающего таким обра- зом информацию в высшие отделы слуховой системы. (Такой механизм частично похож на способ передачи цифровой инфор- мации в виде потока электрических двоичных импульсов в совре- менных компьютерах, хотя в слуховой системе эти процессы на- много сложнее, быстрее и функционально многообразнее.) Если раньше считалось, что периферическая слуховая система просто производит спектральный анализ звукового сигнала, то ис- следования последних лет [8] показали, что в ней происходит сложный нелинейный процесс обработки и кодирования звуковой информации, который включает в себя не только частотное коди- рование, но и информацию о сложной временной структуре сиг- нала — в частности, такие значимые для распознавания звуков данные, как процесс нарастания и спада звука, его спектрально- временная огибающая и др. Это позволяет утверждать [2, 3, 10, 20], что в периферической слуховой системе происходит не только пространственно-времен- ное кодирование, но и предварительный анализ всего акустиче- ского события в целом. Периферическая слуховая система выде- ляет несколько наиболее значимых признаков звукового сигнала и передает их в высшие отделы слуховой системы. Высшие отделы слуховой системы. Слуховой (кохлеарный) нерв представляет собой перекрученный ствол, сердцевина кото- рого состоит из волокон, отходящих от верхушки улитки (низкие частоты), а наружные слои — из волокон, отходящих от ее осно-
Восприятие звука. Основы психоакустики 107 вания (высокие частоты). Число нервных волокон резко увеличивается на различных участках от улитки до коры мозга (примерно с 30 тыс. до 10 млн.). Каждое нерв- ное волокно отводит ин- формацию от своего уча- стка мембраны, в нем происходят эффекты обострения и бокового подавления, которые уси- ливают избирательную способность к спектраль- ному анализу сигнала [9, 24]. Интересно отме- тить, что информация о пространственном рас- пределении частоты сохраняется вплоть до коры головного мозга (такое распределение называется «тонотопическим»). Войдя в ствол мозга, нейроны первого порядка взаимодейству- ют с клетками мозга различных более высоких уровней, поднимаясь к коре и перекрещиваясь по пути. Общая структура нейронных свя- зей показана на рис. 3.1.12. Нейроны первого порядка заканчивают- ся в улитковых ядрах, находящихся в основании заднего мозга, — там слуховая информация передается нейронам второго порядка, затем она поступает в овальные ядра, расположенные в верхне- оливном комплексе, в котором происходит перекрещивание инфор- мации от разных ушей и основная часть (более 60%) от левого уха идет в правое полушарие и наоборот. Поскольку в овальные ядра приходят нервные волокна от обоих ушей, то здесь происходит об- работка бинауральной информации на основе анализа кросс-кор- реляционных связей, что лежит в основе пространственной лока- лизации, бинауральной демаскировки и других слуховых процессов (см. раздел 3.6). Каждое овальное ядро направляет свои сигналы в нижний бугорок четверохолмия, где нервные волокна снова ча- стично перекрещиваются. Затем нейронные сигналы поступают в медиальное коленчатое тело (часть очень важной структуры моз- га, обрабатывающей всю сенсорную информацию, — таламуса), оттуда они проецируются в слуховую кору обоих полушарий, рас- положенную в височной доле мозга (рис. 3.1.1). Результаты многочисленных исследований показали [4, 6, 7, 8, 14, 15, 44], что в обработке слуховой информации (так же как и зрительной и др.) четко проявляется асимметрия работы лево- го и правого полушария мозга: левое больше специализируется на левого уха правого уха Рис. 3.1.12. Общая структура нейронных связей в высших отделах слуховой системы
108 Глава 3 последовательной обработке информации и ее логическом анали- зе, поэтому именно в нем находятся центры обработки речи (зона Брока и зона Вернике); правое — на параллельной обработке и интегральном анализе, поэтому в нем располагаются зоны обра- ботки музыкальной и пространственной информации (подробнее об асимметрии мозга в разделе 3.10). 3.2. АБСОЛЮТНЫЕ И ДИФФЕРЕНЦИАЛЬНЫЕ СЛУХОВЫЕ ПОРОГИ Слуховая система — чрезвычайно тонкий аппарат, но она имеет ограничения: в восприятии частотного и динамического диапазо- нов; в способности определять различия между двумя разными звуками (т. е. имеет ограниченную разрешающую способность); в способности воспринимать перегрузки по уровню интенсивно- сти и т. д. Установление пределов возникновения слуховых ощущений, называемых слуховыми порогами, является в настоящее время одной из самых актуальных проблем в аудиотехнике, поскольку ее технические возможности значительно выросли за последние де- сятилетия, а возможности слуховой системы практически не изме- нились (чувствительность в настоящее время даже несколько снизилась). Все современные звуковые системы обработки и передачи музыкаль- ных и речевых сигналов вносят определенные искажения в обрабатыва- емый сигнал, главная задача их проектирования состоит в том, чтобы эти искажения были «незаметны» для слуха, т. е. лежали ниже порогов слуховой чувствительности. Поэтому знание слуховых порогов имеет огромное значение для современной звукотехники, а соответственно и для работы звукорежиссера. Абсолютные слуховые пороги определяются минимальным значением объективного параметра звукового сигнала (интенсивно- сти, частоты, длительности и др.), при котором возникают слухо- вые ощущения. Они характеризуют чувствительность слухового ап- парата к данному параметру: чем ниже слуховой порог, тем выше чувствительность. Дифференциальные слуховые пороги определяются способно- стью обнаруживать небольшие различия между сходными по тем же объективным параметрам звуками. Установленная в результате многолетних исследований общая картина слуховой чувствительности показывает огромные возмож- ности слуховой системы — как по восприятию динамического и частотного диапазонов, так и по способности к тонкой диффе- ренциации различий между звуками. Слух улавливает звук, интен- сивность которого равна 10"12 Вт/м2, т. е. 0 дБ (звуковое давление
Восприятие звука. Основы психоакустики 109 P1=Ix 10"5 Па); с другой стороны, он ощущает как «звук» давле- ние с уровнем 120 дБ (звуковое давление р2 = 20 Па). Это соответ- ствует отношению давлений P2Ip1= Ю6 (т. е. самый громкий звук, воспринимаемый слухом, по звуковому давлению в 1 млн. раз боль- ше самого слабого). Таким динамическим диапазоном не облада- ет практически ни один современный канал передачи звуковой информации, как аналоговый, так и цифровой. По частоте слух различает звуковые сигналы от 20 Гц до 20000 Гц (в молодом воз- расте). Таким образом, динамический диапазон слуховой системы 120 дБ, частотный диапазон 20 Гц-20 кГц. 3.2.1. Абсолютные слуховые пороги Абсолютные слуховые пороги определяются прежде всего по следующим объективным параметрам звукового сигнала: интенсив- ности (звуковому давлению), частоте и длительности. Абсолютный порог слышимости определяется как «мини- мальный уровень звукового давления (в дБ), при котором еще воз- никает слуховое ощущение» [1-4, 9, 16, 19, 20, 27]. Он характери- зует чувствительность слуха к интенсивности звуковой энергии. Опыты по определению абсолютного порога слышимости пока- зали, что его величина зависит от условий опыта, особенностей звукового сигнала, параметров звукового источника и др. [5, 9] Обычно используются результаты измерений, полученные или в ус- ловиях свободного поля (т. е. в заглушённой камере), где звуковой сигнал подается через громкоговоритель, помещенный перед слушателем, или с помощью сигналов, подаваемых на телефоны. Испытуемый имеет возможность с помощью переключателя ме- нять направление изменения интенсивности звука, уменьшая его до уровня, когда тон становится неслышимым, и повышая до уров- ня, когда тон становится слышимым. Граница между ними и при- нимается за порог слышимости. Измерения проводятся на различ- ных частотах, при этом на каждой частоте определяется 80г полученный уровень. Описан- ные измерения должны быть проделаны с участием мно- гих испытуемых, обладающих здоровым слухом, как трени- рованных (которые дают меньшие значения порогов), так и нетренированых. Полученная таким спосо- бом кривая порога слыши- мости синусоидальных зву- ков, измеренная в условиях 31 63 125250500 IK 2К 4К 8К 16К /Гц Рис. 3.2.1. Кривая порогов абсолютной слуховой чувствительности, измеренная в условиях свободного поля
по Глава 3 свободного поля, показана на рис. 3.2.1. Как видно из рисунка, порог слышимости изменяется в очень широких пределах в зависи- мости от частоты. Наибольшей чувствительностью слух обладает в области частот 2500-3500 Гц, где порог слышимости имеет наи- меньшую величину. Следует отметить, что при бинауральном слу- шании (т. е. двумя ушами) слуховые пороги на 3 дБ ниже, чем при моноауральном [1-3, 9, 16]. В международном стандарте ISO R-226-85 приняты за стан- дартные следующие значения порогов слышимости (громкогово- ритель размещен в свободном поле на оси, слушатели в возрас- те 18-30 лет): _ _ 0 0 . 1 Таблица 3.2.1 Гц 100 200 400 800 1000 2000 3150 5000 8000 12500 ДБ 25,1 13,8 7,2 4,4 4,2 1,0 -3,6 -1,1 15,3 11,6 Представленные на рис. 3.2.1 и в таблице 3.2.1 значения абсо- лютных порогов слышимости относятся к случаю, когда источник звука (громкоговоритель) размещен на оси 0°. Если перемещать ГГ под разными углами к голове слушателя, то абсолютные пороги су- щественно меняются в зависимости от его азимутального положения, что объясняется фильтрующим влиянием ушной раковины и головы за счет дифракционных эффектов. При подаче сигналов на стереотелефоны звуковое давление из- меряется в слуховом проходе у барабанной перепонки. Получен- ные кривые порогов слуховой чувствительности отличаются от по- лученных в свободном поле (рис. 3.2.2). Пороги при предъявлении сигнала через телефоны получаются выше, т. е. слуховая система более чувствительна к сигналам, поступающим из свободного внешне- го пространства. Это объясняется фильтрующим действием ушной раковины и слухового канала. дБ 40. 30. 20. 10. 0-1 -10. 100 а — слуховые пороги для громкоговорителей б — слуховые пороги для стереотелефонов 1000 юооо Гц Рис. 3.2.2. Кривые порогов слышимости при измерении в свободном поле (а) и через стереотелефоны (б) Абсолютные пороги слы- шимости существенно отли- чаются у индивидуальных слушателей в зависимости от возраста, состояния слу- ховой системы, наличия заболеваний и т. д. Средне- статистические изменения порогов слуховой чувстви- тельности в зависимости от возраста показаны на рис. 3.2.3. Для оценки индивиду- альных слуховых порогов строится график слуховой чувствительности в зависи-
Восприятие звука. Основы психоакустики 111 мости от частоты — «аудиограмма». Причем она может быть построена как относительно абсолютных пороговых значений, так и относительно нулевого уров- ня, за который приняты зна- чения стандартизованных слуховых порогов. Оба вида аудиограмм представлены на рис. 3.2.4а, б [3, 9]. Необходимо отметить, что всем, кто регулярно работает со звуком (в первую очередь звукорежиссерам, музыкаль- ным экспертам и др.), крайне полезно регулярно снимать аудиограмму. Абсолютные пороги слышимости зависят от длительности предъявляемого сигнала: если длительность сигнала мала (мень- ше 250 мс), пороги возрастают (рис. 3.2.5), причем скорость это- го возрастания зависит от частоты; только при длительности, большей 250 мс, значения слуховых порогов стабилизируются к норме. Например, сокращение длительности воздействия звуко- вого сигнала с 200 до 20 мс на частоте 1000 Гц приводит к возра- станию слухового порога на 10 дБ. Это связано с особым свой- ством слуховой системы, называемым временной интеграцией (или суммацией). Слуховой аппарат интегрирует энергию внутри определенного временного окна длительностью примерно 200 мс. а б Рис. 3.2.4. Аудиограммы, снятые относительно стандартных порогов (а) и относительно нулевого уровня (б) Рис. 3.2.3. Изменение порогов слуха в зависимости от возраста (1 — 7-13 лет; 2 — 14-19 лет; 3 — 60-80 лет)
112 Глава 3 Для достижения порога слы- шимости требуется накопить определенное количество энергии внутри этого окна, поэтому чем короче сигнал, тем больше должна быть его интенсивность. Болевой порог и об- ласть слышимости. Су- ществует ограничение обла- сти слухового восприятия и со стороны громких звуков, Рис. 3.2.5. Зависимость порогов хотя и не такое четкое, как слышимости от длительности сигнала ПОрОГ СЛЫШИМОСТИ. НапрИ- на разных частотах мер, синусоидальное 3ByKO- вое давление со значением 10 Па (100 дБ) соответствует одному из порогов, называемому по- рогом неприятного ощущения. При достижении 60-80 Па (132 дБ) возникает ощущение давления на уши. Эта величина называется порогом осязания. Наконец, давление 150-200 Па (140 дБ) причи- няет боль и называется болевым порогом. Частотная зависимость болевого порога и общая область слышимости, ограниченная по ча- стоте и по интенсивности звука, приведена на рис. 3.2.6. Нужно отметить, что слуховая система приспособлена к воспри- ятию в основном тихих звуков и звуков средней интенсивности. Громкие звуки с уровнем выше 100 дБ приводят к изменению по- рогов слуха и к необратимым изменениям свойств слуховой сис- темы вплоть до полной глухоты. Причем степень повреждения слу- ха пропорциональна времени воздействия громких звуков, поэтому международные стандарты регламентируют допустимое время пре- бывания (количество часов в день) в звуковой среде с высокими 20 50 100 200 1000 10000 /Гц Рис. 3.2.6. Область слышимости звуковых сигналов, ограниченная по частоте и интенсивности
Восприятие звука. Основы психоакустики 113 уровнями звукового давления, выше которых могут произойти не- обратимые изменения слуховой чувствительности: Таблица 3.2.2 SPL, ДБ 90 92 95 97 100 102 105 110 115 Т, часов в день 8 6 4 3 2 1,5 1 0,5 0,25 Эта проблема особенно актуальна для звукорежиссеров, музыкантов и др., работающих длительное время с высокими уровнями звукового давления (а также для современной молодежи, испытывающей огромные перегрузки слухового аппарата на концертах и дискотеках или при про- слушивании музыки на плеерах с ушными телефонами). Исследования, выполненные различными международными организациями, показали,что уровни абсолютной слуховой чувстви- тельности значительно снизились за последние десятилетия. После воздействия громких звуков высокой интенсивности у че- ловека резко снижается слуховая чувствительность. Процесс вос- становления обычных порогов может продолжаться до 16 часов. Этот процесс называется временный сдвиг порога слуховой чувствительности, или «постстимульное утомление». Этот сдвиг порога начинает появляться при уровне звукового давления выше 75 дБ и соответственно увеличивается при повышении уров- ня сигнала. Причем наибольшее влияние на сдвиг порога чувстви- тельности оказывают высокочастотные составляющие сигнала. Величина сдвига порогов пропорциональна логарифму времени воз- действия (поэтому и нормируется время прослушивания в день). Если измерять пороги чувствительности в разные сроки после выключения сигнала, то можно установить что пороги начинают плавно снижаться, но примерно через 2 минуты происходит «ска- чок» в ходе восстановления чувствительности, затем пороги про- должают плавно уменьшаться со скоростью, пропорциональной логарифму времени после выключения звука. Однако если время нахождения под воздействием громких зву- ков превышает допустимые нормы, то полного восстановления по- рогов чувствительности не происходит, постепенно чувствитель- ность слуха снижается, что может привести к полной глухоте, особенно опасной, потому что она связана с повреждением волос- ковых клеток и поэтому практически не поддается лечению. Абсолютные слуховые пороги по частоте. Если продол- жить кривые болевых порогов и кривые абсолютной слышимости на рис. 3.2.6, то они как бы пересекутся, т. е. на самых низких и самых высоких частотах, чтобы достичь порогов слышимости, требуются уже настолько высокие уровни звукового давления, что они совпа- дают сразу с болевыми порогами, не создавая ощущения «звука».
114 Глава 3 Таким образом, только звуки, попадающие в диапазон частот 20-20000 Гц, воспринимаются в виде слуховых ощущений. Изме- рения показали, что звуки с частотой 20 кГц можно услышать только в очень молодом возрасте; в среднем чувствительность слуха к вы- соким частотам снижается каждые десять лет примерно на 1000 Гц. К шестидесяти годам слышимый частотный диапазон в среднем не превышает по высоким частотам 10-12 кГц (рис. 3.2.3). Однако, как видно на рис. 3.2.6, музыкальные и речевые сигна- лы занимают только часть слышимой области как по частоте, так и по амплитуде. Основная энергия музыкальных звуков сосредо- точена в частотной области от 40 Гц до 5000 Гц, поэтому нормаль- ное возрастное изменение частотных порогов приводит к некото- рому уменьшению яркости звучания за счет высокочастотных обертонов, но не мешает воспринимать музыку и речь, тем более что часто это дополняется большим музыкальным опытом. 3.2.2. Дифференциальные слуховые пороги Дифференциальные слуховые пороги определяют разрешаю- щую способность слуховой системы по интенсивности (амплитуде), по частоте и по длительности звука (в литературе она обозначает- ся JND — just noticeable difference). Амплитудные дифференциальные слуховые пороги. Во- прос о минимальных изменениях амплитуды давления, которые улавливаются нашим слухом, был исследован рядом авторов [1, 2, 3, 5, 9, 16, 19, 22]. Постановка экспериментов по определению слышимых амплитудных различий сигналов в каждом случае от- личалась, однако в результате были получены очень близкие зна- чения дифференциальных порогов (JND). В первой группе экспериментов использовалось два синусои- дальных сигнала одинаковой частоты, но разного уровня интенсив- ности (громкости). Разница в уровнях, которую замечали 75% слушателей, принималась за амплитудный дифференциаль- ный слуховой порог. Эти изме- рения, повторенные для раз- ных частот и разных уровней звукового сигнала, позволили получить зависимости диффе- ренциальных порогов слыши- мости JND от частоты и общей интенсивности звукового сигна- ла (рис. 3.2.7). Как видно из ри- сунка, эти пороги (т. е. едва за- мечаемая разница в уровнях громкости) существенно зави- _l I I I I I L- 40 60 80 Уровень звукового давления дБ Рис. 3.2.7. Зависимость дифференци- альных амплитудных слуховых порогов на частотах 0,2 кГц, 1 кГц и 8 кГц от уровня сигнала
Восприятие звука. Основы психоакустики 115 4? х 100% 40 Р 36 32 28 24 20 Рис. 3.2.8. Зависимость 16 дифференциальных 12 амплитудных слуховых 8 порогов от частоты 4 при разных уровнях громкости 0 56789хЮ22 3 4 5 6789XlO1 2 3 4 5 6789 /кГц сят от частоты сигнала: наименьшие значения получаются на средних частотах (500-4000 Гц), на низких и высоких частотах они возрастают: например, JND для частоты 1000 Гц составляет 0,8 дБ, а для частоты 200 Гц — 1,3 дБ при общем уровне 60 дБ. Кро- ме того, они сильно зависят от общего уровня сигнала: чем гром- че сигнал, тем меньшую разницу между сигналами можно услы- шать: JND на частоте 1000 Гц при общем уровне 40 дБ составляет 1,25 дБ, при уровне 80 дБ — 0,6 дБ. При другой постановке экспериментов использовался амплитуд- но-модулированный синусоидальный сигнал (см. гл. 2). Предвари- тельно был исследован вопрос о влиянии частоты модулирующе- го тона на заметность изменения амплитуды несущего сигнала. Наибольшая чувствительность слуха отмечена при частотах моду- ляции около 4 Гц, в связи с чем дальнейшие измерения произво- дились при этой частоте. Опыты сводились к определению уров- ня звукового давления, при котором становились заметными колебания громкости, обусловленные амплитудной модуляцией. На основе этих данных были получены зависимости амплитудной разрешающей способности слуха от частоты при разных уровнях громкости. На рис. 3.2.8 приведены такие кривые для уровней громкости 40, 60 и 80 фон (фон — единица громкости, равная уровню звукового давления в дБ на частоте 1000 Гц; см. раздел 3.3). По оси ординат отложено отношение порогового изменения звукового давления к уровню звукового давления основного тона (Др/р) в процентах. Амплитудная разрешающая способность, изме- ренная таким способом, также сильно зависит от уровня громкости звука. Например, на частоте 1000 Гц для громких звуков (с уровнем громкости 80 фон) заметно изменение давления на 3%, в то время как модуляция давления для тихих звуков (40 фон) становится за- метна лишь при изменении на 10%. В результате для чистых тонов с уровнями звукового давления от 40 до 80 дБ амплитудные дифференциальные слуховые поро- ги (JND) в области средних частот, измеренные обоими способа- ми, оказались в интервале от 0,5 до 1 дБ.
116 Глава 3 Следует отметить, что для сложных музыкальных сигналов диф- ференциальные пороги существенно зависят от вида музыкальных программ, от опыта слушателя, свойств помещения и др. Учитывая, что динамический диапазон слуховой системы примерно 120 дБ, при такой тонкой дифференциальной чувствительности слуха можно применять достаточно много градаций по громкости при создании музыкальных композиций. Современные компьютерные технологии позволяют использовать 128 градаций громкости [42]. Частотные дифференциальные слуховые пороги. Частот- ная разрешающая способность слуха может быть определена путем прямых экспериментов, т. е. слушателям предъявляются два сину- соидальных сигнала одинаковой интенсивности, и их просят менять частоту сигнала относительного опорного, пока они не услышат раз- ницу по высоте. Эксперименты, выполненные для разных частот и разных уровней интенсивности, позволили установить зависимость JND (дифференциальных частотных порогов) от частоты, уровня громкости и длительности звуковых сигналов [2, 3, 9, 16, 19, 20, 31]. Частотная разрешающая способность может быть также оцене- на другим методом — по минимальным изменениям частоты, за- мечаемой слухом при частотной модуляции. Анализ результатов показывает, что пороги слышимости изменения высоты тона зави- сят от частоты и интенсивности сигнала. На рис. 3.2.9 приведена зависимость от частоты дифференциальных частотных порогов Д/ для средних уровней громкости. Усредненные результаты по раз- личным работам показывают, что в диапазоне частот до 1 кГц дифференциальный частотный порог Af равен 2-3 Гц (имеются данные, что он может быть равен 1 Гц); от 1 до 10 кГц относитель- ные пороги (дробь Вебера) сохраняются равными А/// = 0,004 [3, 9, 16], например на час- тоте 10 кГц Af = 40 Гц. Уменьшение интенсивности (громкости) звука приводит к увеличению дифференци- альных частотных порогов, т. е. чем тише звук, тем труднее отличить его по ча- стоте от других звуков. Если представить этот порог Af в виде музыкаль- ных интервалов, то он со- ставляет 5 центов до 1 кГц , , , , „ , (по другим данным 8 цен- 0,01 0,05 0,2 0,5 1 2 5 10 кГц тов _ см. раздел 3.8) [16]. Рис. 3.2.9. Зависимость Интересно отметить,что дифференциальных частотных результаты исследований порогов от частоты
Восприятие звука. Основы психоакустики 117 по определению «зонной природы музыкального слуха», выпол- ненных в 50-е годы Н. А. Гарбузовым [33], практически совпадают с современными результатами по установлению частотных диффе- ренциальных порогов слуха (JND). Такая способность слуховой системы различать звуки по часто- те (что в первую очередь определяет их различия по высоте — см. разд. 3.4) при современных возможностях компьютерных техноло- гий открывает новые пути для развития микротоновой и спектраль- ной музыки. Временные дифференциальные пороги. Способность слухо- вой системы различать малые изменения во временной структуре сигнала является в настоящее время предметом многочисленных исследований [1, 2, 3, 5, 9, 17]. Эта способность подтверждается удивительно точным слуховым анализом речи, когда в непрерыв- ном временном потоке различается специфическая формантная структура различных фонем (см. гл. 4). Исследования разрешаю- щей способности слуховой системы во временной области прово- дятся в нескольких направлениях: — анализ минимального времени, в течение которого слух спо- собен различать два сигнала. Измерения, выполненные на тональ- ных посылках, показали, что дифференциальный порог в оценке времени поступления двух следующих друг за другом сигналов со- ставляет 2 мс. Эта величина не сильно зависит от частоты тональ- ного звука, а также от его интенсивности. Однако для определения, какой из сигналов поступает первым, необходимо время в 20 мс. Интересно отметить,что для распознавания звуков речи (фонем) не- обходимо время 35 мс, для определения высоты тона требуется также определенное время: для низких частот ~ 60 мс, для высо- ких ~ 15 мс (см. раздел 3.4); — анализ дифференциальной чувствительности к изменению длительности звукового сигнала. Эксперименты были поставле- ны следующим образом: обследуемым предлагали два сигнала, один имел длительность Г мс, а другой — несколько большую длительность (Г + АГ) мс. Сигналы поступали в случайном поряд- ке, а обследуемый должен был указывать на интервал с большей длительностью сигнала. Наименьшую разницу, правильно определя- емую в 75% случаев, принимали за JND (дифференциальный порог) для длительности (АГ). Основной вывод заключается в том, что АГ начинает умень- шаться по мере уменьшения общей длительности воздействия сигнала, т. е. чем короче сигналы, тем меньшее различие по времени между ними слух может заметить. Как можно видеть на рис. 3.2.10, АГ уменьшается от 50 мс при длительности сигна- ла 960 мс приблизительно до 0,5 мс при длительности сигнала
118 Глава 3 ЛТ, мс 1001— 50 10 - 5 0,5- 1 - Рис. 3.2.10. Зависимость временных А = 250Гц дифференциальных порогов од 0,1 0,5 1 1 5 10 50 100 500 j l V sin = 1000Гц 500 1000 MC от длительности сигнала (для шумовых сигналов с полосой А, Гц). Длительность воздействия меньше 0,5 мс. Дифференциальная временная чувствительность А Т/ T (дробь Вебера) не представляет собой константу, а изменя- ется по мере изменения длительности таким образом, что она равна АТ/Т = 1 при T = 0,5-1 мс, приблизительно 0,3 при T= 10 мс и 0,1 при T = 50-500 мс, при этом результаты существенно не за- висят от ширины полосы и интенсивности звука [9]. — исследование чувствительности слуха к изменению времени установления (атаки) или спада сигнала. Время установления и спада звука является характерной особенностью различных музы- кальных инструментов (известно, что, меняя время атаки или спа- да сигнала, можно существенно изменить его тембр). Исследова- ния дифференциальных порогов слуха для времени установления т мс были выполнены для различных типов сигналов; результаты, полученные для сигналов типа тональных посылок (прямоугольный импульс с синусоидальным заполнением), позволили установить, что дифференциальный порог для времени установления (как и для времени спада) оказывается равным для частот ниже 1000 Гц At = 1 мс, для частот 1-10 кГц Ax = 0,5 мс. Таким образом, из- менения времени атаки и спада звукового сигнала, меньшие этих пределов, для слуха оказываются незаметными. Для реальных му- зыкальных сигналов эти пороги могут несколько отличаться в боль- шую сторону за счет маскировки соседними звуками; — главной задачей современных исследований является уста- новление слуховой чувствительности к тонкой временной структуре сигнала, в связи с чем особое внимание было уделено исследова- ниям дифференциальной слуховой чувствительности к фазовым искажениям. Изменения фазовых соотношений между спектраль- ными составляющими сигнала существенно меняют его временную структуру. Однако на протяжении долгого времени (со времен Гельмгольца) считалось, что слух нечувствителен к фазовым соот- ношениям. Исследования последних лет показали, что это не соот- ветствует действительности, изменение фазовых соотношений вли-
Восприятие звука. Основы психоакустики 119 4 /,кГц Рис. 3.2.11. Пороги слуховой чувствительности для ГВЗ яет на изменение тембра, четкость опре- *>мс деления высоты музыкального сигнала и др. Исследования Блауерта показали [12, 13], что слух наиболее чувствителен к скорости изменения фазы, т. е. ГВЗ (групповому времени задержки): T1^5 = - d(p(co)/dcD. В этих же исследованиях были уста- новлены дифференциальные слуховые пороги для искажений ГВЗ (рис. 3.2.11), которые для частоты 2000 Гц имеют минимальное значение - 1 мс. Эти данные используются в насто- ящее время при проектировании высококачественной акустической аппаратуры (искажения ГВЗ в них должны быть ниже установлен- ных порогов). Разумеется, полученные результаты не исчерпывают сложной проблемы установления порогов слуховой чувствительности к из- менению временной структуры сигнала, исследования в этом на- правлении продолжаются. Как уже было отмечено выше, современные компьютерные тех- нологии открывают очень широкие возможности при обработке зву- ка, однако при всех видах обработки следует учитывать возмож- ности слуховой системы, для чего и необходимы данные как по абсолютным, так и по дифференциальным слуховым порогам. 3.3. ГРОМКОСТЬ. КРИТИЧЕСКИЕ ПОЛОСЫ СЛУХА Как уже было отмечено выше, человеческий слух обладает уди- вительной способностью реагировать на слуховые сигналы как очень малой интенсивности (звуковое давление 2 • 10'5 Па — уро- вень 0 дБ), так и очень большой интенсивности (звуковое давле- ние 20 Па — уровень 120 дБ). Субъективное ощущение, позволяющее слуховой системе располагать звуки по определенной шкале — от звуков низкой интенсивности («тихих») к звукам большой интенсивности («громким»), — называется громкостью [1-3, 5, 9, 10, 16, 20, 22, 27]. Громкость связана прежде всего с таким физическим пара- метром звукового сигнала как его интенсивность. Как было пока- зано в главе 2, интенсивность / и звуковое давление р связаны простым (для плоской волны) соотношением /= р2/рС, где р — плотность воздуха, С — скорость звука. Общеизвестно, что чем больший уровень звукового давления (дБ) создает акустическая аппаратура, тем она громче звучит (что легко проверить). Однако
120 Глава 3 можно создать звуковые сигналы очень большой интенсивности и никакого ощущения громкости не вызвать (хотя слуховая система может быть при этом повреждена) — например, в случае, если эти сигналы будут слишком короткими (менее 35 мс) или слишком низкочастотными (ниже 20 Гц). Происходит это потому, что громкость зависит не только от интенсивности звука, но и от его частоты, спектрального со- става, длительности и др. Громкость звука — это субъективное качество. Она характери- зует ощущение слушателя и поэтому не может быть измерена пря- мыми методами (в ближайшем будущем это можно будет сделать на компьютерных моделях слуховой системы, которые сейчас уси- ленно развиваются). В настоящее время оценки ощущения гром- кости при изменении различных параметров звукового сигнала по- лучаются методом субъективных экспертиз. Последние очень трудоемки, требуют проведения большого количества эксперимен- тов и накопления статистических данных, поэтому исследования все время продолжаются, постоянно появляются публикации об уточнении полученных результатов и т. д. [1, 5, 22]. Громкость тональных звуков. Шкалирование звуков по громкости и установление влияния на нее основных параметров звукового сигнала было выполнено прежде всего для тональных сигналов различной интенсивности, частоты и длительности. По- скольку техника оценки абсолютной громкости достаточно сложна, широкое распространение получили методы относительной оцен- ки уровней громкости. Уровни громкости определяются с помощью следующих экспериментов: выставляется уровень звукового давления эталон- ного звука на частоте 1000 Гц, например 40 дБ, затем испытуемо- му предлагается прослушать сигнал на другой частоте, например 100 Гц, и отрегулировать его уровень таким образом, чтобы он казался равногромким эталонному (сигналы могут предъявляться Болевой порог Уровень L, дБ ощущения громкости, фон р? Па 2 2•1O1 2•1(V2 2•1(V3 Рис. 3.3.1. Кривые 2-10"4 равной громкости 5 для различных 210 значений 20 100 500 1000 500010000 / кГц уровня сигнала
Восприятие звука. Основы психоакустики 121 через телефоны или через громкоговорители). Если проделать это для разных частот и отложить полученные значения уровня звуко- вого давления, которое требуется для сигналов разной частоты, чтобы они были равногромкими эталонному сигналу, то получится одна кривая (рис. 3.3.1). Например, чтобы звук с частотой 100 Гц казался таким же громким, как звук с частотой 1000 Гц с уровнем 40 дБ, его уровень должен быть выше, а именно 50 дБ. Если бу- дет подан звук с частотой 50 Гц, то чтобы сделать его равногром- ким эталонному, нужно поднять его уровень до 65 дБ, и т. д. Если теперь увеличить уровень эталонного звука до 60 дБ и повторить все эксперименты, то получится кривая равной громкости, соответ- ствующая уровню 60 дБ, и т. д. Семейство таких кривых для раз- личных уровней — 0 дБ, 10 дБ, 20 дБ... 110 дБ — показано на рис. 3.3.1. Эти кривые называются кривыми равной громкости. Они впервые были получены в результате усреднения результатов большого числа экспериментов в 1933 году учеными Флетчером и Мансоном. В настоящее время в международных стандартах ISO-R-226 (1987) приняты уточненные данные измерений, пред- ставленные на рис. 3.3.1. При этом измерения выполнялись в условиях свободного поля, т. е. в заглушённой камере, источник звука располагался фронтально и звук подавался через громкого- ворители. Каждая из представленных кривых называется изофоной и характеризует уровень громкости звуков разной частоты. Под уровнем громкости данного звука понимается уровень звукового давления эталонного звука на частоте 1000 Ги,, рав- ногромкого данному Уровень громкости измеряется в специаль- ных единицах — фонах. Цифры, которые стоят над кривыми на рис. 3.3.1, соответствуют числу N фон (которое равно числу N дБ звука с частотой 1000 Гц). Зная частоту данного сигнала и его уровень звукового давления, можно, пользуясь представленными кривыми, определить его уро- вень громкости в фонах: например, если тональный звук с часто- той 100 Гц имеет уровень звукового давления 60 дБ, то, проведя прямые, соответствующие этим значениям на рис. 3.3.1, можно найти на их пересечении изофону, соответствующую уровню 50 фон, и значит, этот звук имеет уровень громкости 50 фон. Если проанализировать эти кривые, то видно, что при малых уровнях звукового давления оценка уровня громкости очень силь- но зависит от частоты; слух менее чувствителен к низким и высо- ким частотам, на них требуется создать гораздо большие уровни звукового давления, чтобы звук стал равногромким эталонному на частоте 1000 Гц. При больших уровнях изофоны выравниваются, подъем на низких частотах становится менее крутым, т. е. при больших уровнях низкие, средние и высокие звуки оцениваются по уровню громкости более равномерно.
122 Глава 3 дБ О -5 -10 -15 -20 -25 -30 -35 -40 -45 -50 20 0C /в А 50 100 200 500 10002000 500010000 /,Гц Рис. 3.3.2. Взвешенные кривые А, В, С для измерения уровней шума Это свойство слуха имеет существенное зна- чение для техники звуко- записи, так как относи- тельная громкость звуков разной частоты изменя- ется при изменении об- щего уровня сигнала — только в том случае, ког- да запись воспроизво- дится на том же уровне, что и оригинальный ис- точник, в ней сохраня- ется естественный ба- ланс по громкости; если запись воспроизводится на более низких уровнях, слуховое ощущение низких и высоких частот снижается. Способность слуховой системы по-разному оценивать уровень громкости сигнала в зависимости от его частоты и уровня звуково- го давления учитывается в современных приборах для измерения уровней шума и других сложных звуков. В них применяются взве- шенные корректирующие кривые, аналогичные «слуховым» кри- вым, которые ослабляют низкие частоты в зависимости от уровня сигнала так, как это делает слуховая система. Обычно использу- ются три вида взвешенных кривых (рис. 3.3.2): кривая А со спадом 30 дБ на уровне 50 Гц по отношению к уровню на 1000 Гц; кривая В со спадом 12 дБ и кривая С со спадом 2 дБ. Если нанести эти кривые (перевернутые сверху вниз) на изофоны, то видно, что кри- вая А примерно соответствует изофоне 30 фон (измеренное зна- чение сигнала обозначается в этом случае дБ-А), кривая В (дБ-В) соответствует изофоне 70 дБ, кривая С изофоне 100 дБ (дБ-С). Разумеется, использование таких приборов позволяет оценить уро- вень громкости только очень приближенно, так как при оценке громкости сигналов слуховая система использует более сложные механизмы. Оценка уровня громкости не эквивалентна оценке изменения аб- солютной громкости: например, если имеются два сигнала с уров- нем громкости 40 фон и 80 фон, тс это не значит, что один гром- че другого в два раза. Связь уровня громкости с абсолютной оценкой громкости носит достаточно сложный характер. Поэтому наряду с созданием методов сравнительной оценки уровня гром- кости постоянно продолжаются попытки построения шкалы для оценки абсолютного ощущения громкости в зависимости от интен- сивности, частоты, длительности и других объективных параметров сигнала. Обычно для решения таких задач [3] используются два метода: первый — испытуемым предъявляются звуки разной
Восприятие звука. Основы психоакустики 123 интенсивности и их просят присвоить какое-то число каждому звуку в зависимости от воспринимаемой громкости; второй — задается эталонный звук и испытуемых просят оценить громкость измеряе- мого звука относительно заданного в определенных единицах: на- пример, громче в два раза, в три раза и т. д. Обработка большо- го количества статистических данных позволила построить зависимости ощущаемой громкости от уровня звукового давления. Для количественной оценки абсолютной громкости была принята специальная единица сон, которая определяется следую- щим образом: громкость в 1 сон — это громкость синусоидаль- ного звука с частотой 1000 Гц и уровнем 40 дБ. Количественно зависимость воспринимаемой громкости звука (в сонах) от его звукового давления (в Па) может быть представ- лена в следующем виде: S=Cp °'\ где С — постоянная, зависящая от частоты сигнала [3, 27]. Из этого соотношения следует, что зависимость эта является нелинейной (что подтверждает общий закон психофизики: связь между изменением объективных параметров сигнала и возникаю- щими при этом ощущениями носит нелинейный характер). Из него получается также, что при увеличении уровня звукового давления на 10 дБ громкость возрастает в два раза: например, если на 1000 Гц сигнал с уровнем 40 дБ создает ощущение громкости в 1 сон, то сигнал с уровнем 50 дБ соответствует громкости в 2 сона, 60 дБ — 4 сона и т. д. В некоторых работах показано, что удвоение громкости вызы- вается увеличением уровня сигнала только на 6 дБ (особенно для низких частот) [16]. Между абсолютным значением громкости в сонах S и значени- ем уровня громкости в фонах L (аналогично соотношению между значением звукового давления в Па и его уровнем в дБ) существу- ет следующая связь: l-40 S = 2 10. Графическая зависимость громкости в сонах от уровня громко- сти в фонах (или дБ для частоты 1000 Гц) показана на рис. 3.3.3. Эта зависимость построена для измерений, выполненных в сво- бодном поле при прослушивании через громкоговорители. Полученные количественные соотношения очень важны для оп- ределения громкости сложных звуков, которые будут рассмотрены дальше. Ощущение громкости зависит от длительности сигнала', если на слуховой канал поступают два сигнала одинаковой интенсив- ности, то более короткий сигнал воспринимается как менее гром- кий (что полезно учитывать при обработке музыкальных и рече- вых сигналов). При увеличении длительности сигнала ощущение
124 Глава 3 0,002 0,001 20 '40 60 Уровень громкости, фон 80 ДБ громкости постепенно возрастает, пока его длительность не до- стигнет величины 200 мс (за счет временной интеграции — см. разд. 3.2), при этом возрастание уровня громкости происходит по- чти линейно с увеличением дли- тельности сигнала [9]. Слуховая система обладает свойством адаптации, т. е. под воздействием длительных гром- ких, постоянных по величине зву- ков ощущаемая громкость звука постепенно уменьшается (слух адаптируется). Результаты изме- нения уровня звукового давления и ощущаемого уровня громкости [1, 31, 34] показаны на рис. 3.3.4а, б. При воздействии звука с уровнем 94 дБ в течение двух минут уровень громкости постепен- но уменьшается на величину 9 фон, к концу периода падение за- медляется; если при этом уровень сигнала резко увеличить, напри- мер с 94 дБ до 100 дБ, то уровень громкости увеличивается (однако меньше, чем это должно было бы соответствовать значе- нию уровня сигнала в 100 дБ) и начинает опять снижаться даже с большей скоростью, т. е. степень адаптации тем больше, чем громче звуковой сигнал. Изменение уровня громкости проявляет- ся и при внезапном уменьшении уровня воздействующего сигнала. Как показано на рис. 3.3.46, при воздействии сигнала с уровнем 94 Рис. 3.3.3. Связь между громкостью (сон) и уровнем громкости (фон) Ю5 М>Ш 100 N, дБ Рис 3.3.4 Адаптация слуха при увеличении (а) и уменьшении (б) уровня сигнала
Восприятие звука. Основы психоакустики 125 дБ происходит постепенная адаптация, как и в предыдущем случае, на 9 дБ, затем при скачкообразном уменьшении уровня сигнала на 6 дБ уровень ощущаемой громкости резко падает на 19 фон, затем постепенно увеличивается, т. е. происходит адапта- ция к тихим звукам и постепенно чувствительность восстанавлива- ется. Таким образом, слуховая система пытается защититься от гром- ких звуков: при их длительном воздействии происходит постепен- ное снижение ощущения громкости, звуки кажутся более тихими. Степень адаптации зависит от громкости воздействующего сигна- ла — чем он громче, тем больше снижение ощущаемого уровня громкости. Однако процесс имеет тенденцию к насыщению. В основе адаптации лежат процессы, происходящие в среднем и во внутреннем ухе: акустический рефлекс (см. разд. 3.1) и нели- нейная компрессия (см. разд. 3.5). Рефлекс начинает срабатывать для звуков с уровнем 90 дБ и выше. Кроме того, он обладает оп- ределенной инерционностью: акустический рефлекс начинает сра- батывать только через 20 мс после начала звука, а полная защита еще не достигается и при 150 мс, поэтому наряду с общей опас- ностью для слуховой системы воздействия длительных громких звуков наиболее опасным является воздействие коротких громких импульсов (см. разд. 3.1). Ощущение громкости не исчезает сразу после прекращения звука, а продолжается определенное время. Период, в течение которого ощущаемый уровень громкости уменьшается на 9- 10 фон, называется временной постоянной слуха и составляет обычно 35 мс. Итак, ощущение громкости тонального сигнала сложным нели- нейным образом зависит от интенсивности воздействующего сиг- нала, его частоты и длительности. Однако еще большую проблему представляет определение за- висимости ощущаемой громкости от спектрального состава слож- ных музыкальных и речевых сигналов. Гоомкость сложных звуков. Механизм ощущения громкости для реальных музыкальных и речевых сигналов продолжает оста- ваться предметом многочисленных исследований психоакустиков [4, 10, 22]. Одна из последних компьютерных моделей слухового анализа громкости сложных сигналов, выполненная известными учеными В. Moore, В. Glasberg и др. [22], включает в себя следующие по- следовательные этапы обработки звукового сигнала в процессе формирования ощущения громкости: фильтрацию сигнала внешним ухом (ушной раковиной и слуховым каналом); фильтрацию сигнала средним ухом; фильтрацию с помощью линейки слуховых полосо- вых фильтров на базилярной мембране; преобразование образцов возбуждения на базилярной мембране в кривые распределения
126 Глава 3 удельной громкости; интегрирование площади под кривыми удель- ной громкости. Как уже было сказано в разделе 3.1, внешнее ухо производит обработку звукового сигнала в зависимости от направления прихо- да звука, увеличивая уровень сигнала в области 3 кГц за счет ди- фракции на ушной раковине и резонансов в наружном слуховом канале (см. разд. 3.1). Среднее ухо работает как низкочастотный фильтр, обеспечивая при этом усиление сигнала в области 2- 3 кГц почти на 40 дБ. Во внутреннем ухе происходит спектральный анализ поступившего слухового сигнала; при этом каждой частоте соответствует свое место максимального смещения базилярной мембраны, что аналогично механизму обработки сигнала линейкой полосовых («слуховых») фильтров, которые получили название критические полосы слуха. Ширина критических полос примерно соответствует ширине по- лосы пропускания слуховых фильтров и меняется в зависимости от частоты в соответствии с кривой рис. 3.3.5 (для сравнения приведено изменение ширины полосы, соответствующей третьок- тавной полосе и целому музыкальному тону). Если совместить критические полосы в один ряд, то их в слышимом диапазоне ока- зывается 24, каждой из них соответствует расстояние на базилярной мембране примерно 1,3 мм. Переход от одной критической полосы к другой соответствует изменению высоты тона в 100 мел, или 1 барк (см. разд. 3.7). Форма передаточной функции этих слуховых фильтров и ее изменение с увеличением амплитуды сигнала по- казаны на рис. 3.3.6 (по горизонтальной оси отложено число критических полос). Как видно из рисунка, возбуждение мембра- ны становится все более несимметричным, и площадь под кривой расширяется. Я" 10Ot г. \—I / \ §2000 ,¾ 1000 § 500 3 5000 20 - 10 • 0 . 60 - 50 ■ 40 - 30 - 90 - 80 - 70 - Центральная частота, кГц 10 15 20 25 30 35 40 Число критических полос Рис. 3.3.5. Зависимость ширины критической полосы от частоты (сплошная кривая) Рис. 3.3.6. Форма передаточной функции слухового фильтра с увеличением амплитуды сигнала
Восприятие звука. Основы психоакустики 127 Из практики известно, что широкополосные сигналы кажутся громче, чем узкополосные сигналы с таким же уровнем звукового давления. Пример зависимости уровня громкости от ширины поло- сы шумового сигнала для уровня звукового давления 60 дБ и центральной частоты 1 кГц показан на рис. 3.3.7. При расшире- нии полосы шума до определенного значения (в данном случае 150 Гц) воспринимаемый уровень громкости практически остается неизменным; когда полоса становится шире 150 Гц, уровень гром- кости резко возрастает. Граница, где происходит изменение ощу- щения уровня громкости, соответствует ширине критической поло- сы слуха. Различие механизмов обработки сигнала внутри и вне критических полос имеет прин- ес о В о S о 8Q 70 I 60 OQ О о* £Г50 ципиальное значение для оп- ределения громкости сложных звуков (так же как их высоты, тембра и др.). При колебаниях базиляр-. &65 ной мембраны в волосковых клетках находящегося на ней органа Корти генерируется электрический потенциал (см. разд. 3.1) и возбуждаются потоки импульсов в нервных волокнах. При увеличении интенсивности сигнала ско- рость импульсов увеличивает- ся в единичном волокне, соот- ветствующем данному месту на мембране, и доходит до на- сыщения (порог 1000 имп/с), затем начинает возникать воз- буждение в соседних нервных волокнах; соответственно уве- личивается площадь под кри- вой возбуждения (рис. 3.3.8). Таким образом, ощущение громкости кодируется увеличе- нием числа разрядов в единич- ном волокне и увеличением ко- личества нервных волокон, в которых возникает возбужде- ние в соответствии с изме- нением площади под кривой возбуждения. На основании проведенных экспериментов Центральная частота = 1 кГц Критическая полоса Уровень звукового давления L = 60 дБ 100 200 500 Полоса частот 1000 2000 /Гц Рис. 3.3.7. Зависимость уровня громкости от ширины полосы шумового сигнала а о PQ I PQ со uQ Я а> PQ О Он 50 100 200 500 IK 2К 5К10К Рис. 3.3.8. Номограммы для расчета индексов громкости
128 Глава 3 была высказана гипотеза, что слуховая система производит ин- тегрирование площади под кривой возбуждения на базилярной мембране с учетом распределения нервной активности [22]. В упомянутой выше компьютерной модели слуховой оценки громкости были предложены количественные соотношения между энергией подводимого сигнала, распределением ее по критическим полосам слуха и возникающим при этом субъективным ощущени- ем удельной громкости в сонах. Под «удельной» понимается оце- ниваемая громкость внутри критической полосы [22]. Таким образом, внутри каждой критической частоты происходит интеграция энергии независимо от вида звукового сигнала. Отре- зок шума или тональные сигналы, если они находятся внутри кри- тической полосы и имеют одинаковый уровень интенсивности (зву- кового давления), создают одинаковый уровень громкости. Поэтому когда звуковой сигнал имеет сложный спектральный состав или одновременно звучат несколько сигналов, определение их суммарной громкости происходит тремя различными способами в зависимости от соотношения их частот: — сигналы близки по частоте (т. е. находятся внутри крити- ческой полосы), для определения создаваемой им суммарной громкости необходимо сложить их интенсивности I = I1+ I2+ I3... и по суммарному значению уровня звукового давления, соответ- ствующего этой суммарной интенсивности, определить из кривых равной громкости уровень громкости (в фонах), а затем пересчи- тать в значение громкости в сонах. Например, если на скрипке исполняется определенный звук с уров- нем звукового давления Lp = 60 дБ с частотой 880 Гц (ля второй октавы), то это соответствует уровню громкости L = 60 фон, как следует из кри- вых равной громкости (рис. 3.3.1). Для определения громкости этого звука можно воспользоваться вышеуказанным соотношением: L-40 S = 210, откуда громкость S = 4 сона. Если теперь будут вместе играть десять скрипок, то создаваемая ими громкость определяется следующим образом: если интенсивность звука одной скрипки I1, то интенсивность звука десяти скрипок 1сум. = 10I1 (так как интенсивности складываются). При этом уровень звукового дав- ления увеличится на 10 дБ: LcyM=10 Ig 101/I0 = 10 Ig I/I0 +10дБ= 20lgp/p0+ 10 дБ, т. е.: Lp = L1+ 10 дБ. Поскольку начальный уровень звукового давления был 60 дБ, суммар- ный уровень звукового давления будет 70 дБ, что соответствует уровню громкости 70 фон (рис. 3.3.1). Отсюда по указанной выше формуле мож- но рассчитать громкость, она равна 8 сон. Следовательно, когда вместо
Восприятие звука. Основы психоакустики 129 одной скрипки (или любого другого источника сигнала) будут играть де- сять скрипок, громкость вырастет только в два раза (от 4 сон до 8 сон), что важно учитывать в технологии звукозаписи. Отсюда можно сформулировать правило: при увеличении обще- го уровня звукового давления сигналов с близкими частотами на 10 дБ воспринимаемая громкость удваивается. Аналогично рассчитывается общая громкость, если имеется два уз- кополосных шума с близкими частотами, например внутри критической полосы около 1000 Гц (ее ширина здесь 150 Гц). Если уровень каждого из них 60 дБ, то при сложении интенсивностей суммарный уровень будет 63 дБ, и громкость вырастет от 4 сон до 4,92 сон; — сигналы имеют разность частот шире критической поло- сы (их взаимным маскированием можно пренебречь), тогда дей- ствует другое правило: суммарная громкость равна сумме гром- костей каждого из составляющих. Отсюда получается, что при звучании сигналов с частотами, разне- сенными шире критической полосы, суммарная громкость будет больше, чем в предыдущем случае. Например, если два узкополосных шума име- ют громкость по 4 сона, но частоты их разнесены (600 Гц и 1200 Гц), то суммарная громкость будет 8 сон (а не 4,92 сона, как в предыдущем примере), что соответствует уровню громкости 70 фон; — частоты различных сигналов разнесены по частоте друг от друга достаточно далеко, тоща определение суммарной громко- сти значительно усложняется: слушатель обычно фокусирует свое внимание на каком-то одном компоненте — или самом громком, или одном из самых высоких, — назначая общую громкость сум- марного сигнала примерно равной этому компоненту. Для определения громкости сложного многокомпонентного звука в Международных рекомендациях ISO-532A рекомендуется исполь- зование следующей методики: с помощью стандартных октавных или третьоктавных анализаторов измеряется уровень звукового давления внутри каждой октавной (или третьоктавной) полосы. Затем с помощью графика (рис. 3.3.8) определяется индекс гром- кости Si (по оси ординат отложено значение центральной частоты, по оси абсцисс — значение уровня звукового давления в каждой полосе). Полученные значения индексов громкости Si для каждой октавной полосы суммируются следующим образом: S = Smax + 0,3ISi, где Smax — индекс самого громкого звука, ZSi — сумма индексов громкости во всех остальных полосах. Таким образом, суммарная громкость в сонах получается из суммирования 100% индекса громкости самого громкого звука и 30% суммы от всех остальных;
130 Глава 3 — значительно более сложный метод для оценки громкости ре- альных звуковых сигналов (шума, музыки и т. д.) был разработан Е. Цвиккером [1, 10]. Он позволяет оценить громкость сложного сигнала с учетом взаимной маскировки его составляющих. Этот метод введен в стандарты ISO-532B и ANSI 3,4-1980. На его ос- нове разработаны компьютерные методики расчета громкости и со- временные цифровые анализаторы громкости типа Zwicker Loudness Analysis Type 7704 со специальным программным обес- печением PULSE, что позволяет выполнять расчет громкости слож- ных стационарных сигналов в соответствии с международными стандартами, анализ громкости многоканальных нестационарных сигналов с учетом временных характеристик слуха, а также анализ спектрального распределения громкости и др. Подробное описание методики измерения и программного обеспечения можно найти по адресу http://w\AAA/.bk.dk/pulse/software///04.htm. Таким образом, ощущаемая громкость сложного звука зависит не только от его уровня интенсивности (уровня звукового давле- ния), но и от его спектрального состава, что очень важно учиты- вать при создании музыкальных композиций: например, звучание инструмента можно сделать более громким при сохранении того же уровня звукового давления за счет изменения его спектра (при этом, правда, произойдет и изменение тембра, так что все нужно делать в разумных пределах). В таблице 3.3.1 приведены данные по уровням громкости (фон) и громкости (сон) для наиболее употребительных шумов и звуков, которые могут оказаться полезными для практической работы. Таблица 3.3.1 Источник Уровень громкости, Громкость, звука или шума фон сон 1. Шум в кабине самолета 128 ... 130 875 ... 1400 2. Средний шум на улице 55 .. . 60 3,08 ... 4,35 3. Шум на улице с интенсивным 75 ... 80 1,4 ... 17,1 движением транспорта 4. Звук оркестра 80 ... 100 117,1 ... 88 5. Шум аплодисментов 60 ... 75 4,35 ... 11,4 6. Разговор на расстоянии 1 м: громкий 65 ... 70 5,87 ... 7,95 обычный 55 ... 60 3, 08 ... 4,35 7. Шум в тихой комнате 25 ... 30 0,2 ... 0,36 8. Шепот на расстоянии 1 м 20 0,1 9. Звук в радиостудии 40 ... 50 0,98 ... 2,2 при исполнении соло 10. Шумное собрание 65 ... 70 5,87 ... 7,95
Восприятие звука. Основы психоакустики 131 В музыкальной практике приняты, как известно, другие гра- дации громкости. Их соответствие приведенным выше коли- чественным оценкам громкости и уровням громкости приблизитель- но следующее: Таблица 3.3.2 Обозначение Наименование Уровень громкости, фон Громкость, сон fff Форте-фортиссимо — самое громкое 100 88 ff Фортиссимо — очень громкое 90 38 f Форте — громкое 80 17,1 P Пиано — тихое 50 2,2 PP Пианиссимо — очень тихое 40 0,98 PPP Пиано-пианиссимо — самое тихое 30 0,36 Таким образом, определение громкости сложных звуков пред- ставляет собой сложный многоступенчатый процесс, зависящий от спектрального состава, длительности и других параметров звуко- вых сигналов. В настоящее время активно разрабатывается пол- ная компьютерная модель субъективных процессов оценки громко- сти музыкальных и речевых сигналов в слуховой системе. 3.4. МАСКИРОВКА ЗВУКА Одним из самых важных свойств слуховой системы, широко ис- пользуемым в современных технологиях цифровой звукозаписи, цифрового радиовещания и др., является эффект слуховой маски- ровки. Эффект маскировки связан с процессом взаимодействия сиг- налов, благодаря которому происходит изменение слуховой чув- ствительности к одному сигналу (маскируемому — maskee) в при- сутствии другого (маскирующего — masker). Это взаимодействие тонов постоянно присутствует в музыке и речи и приводит к тому, что восприятие громкости, тембра и дру- гих признаков одного сигнала в присутствии другого меняется вплоть до полного отсутствия его слышимости (например, речь на фоне проходящего поезда). Процессы слуховой маскировки — достаточно сложное явление и в настоящее время находятся в стадии интенсивных исследо- ваний во многих мировых научных центрах, поскольку от их ре- зультатов в значительной степени зависит прогресс в развитии
132 Глава 3 технологий сжатия и передачи цифровых сигналов (стандарты MPEG) [1-5, 9, 16, 27, 45]. Эффекты слуховой маскировки проявляются по-разному в зави- симости от вида сигнала и способа его воздействия и могут быть разделены на следующие основные группы: — одновременное моноауральное маскирование; — временное (неодновременное) маскирование (вперед и назад); — центральное (бинауральное) маскирование; — бинауральное демаскирование. В практической работе звукорежиссера умение пользоваться этими свойствами слуха имеет очень большое значение при всех видах обработки звукового материала: многоканальной записи, монтаже, реставрации, введении различных эффектов и др. Одновременное (моноауральное) маскирование звуков Как было показано в разделе 3.2, если на каждое ухо слушате- ля подавать основной тон с различной интенсивностью и частотой, то можно установить зависимость его порогов слышимости от ча- стоты (рис. 3.2.1). Если теперь к этому основному тону добавить дополнительный тон определенной частоты и интенсивности, то в результате взаимодействия обоих тонов произойдет изменение по- рогов чувствительности к основному тону (действительно, на фоне шума приходится сильно повышать голос, чтобы можно было его услышать). Если менять частоту основного тона и на каждой час- тоте оценивать, на сколько децибел надо повысить его уровень, чтобы можно было слышать его на фоне дополнительного меша- ющего (маскирующего) тона, то можно количественно оценить сте- пень маскировки. Степень (уровень) маскировки есть разность в децибелах между уровнем порога слышимости данного тона в присут- ствии маскирующего тона и уровнем порога слышимости в тишине. На рис. 3.4.1 показаны кривые порогов слышимости маскируе- мого тона в тишине и повышения его порогов слышимости в при- сутствии маскирующего тона с частотой 2400 Гц и уровнем 60 дБ. Из них можно рассчитать степень маскировки тона на разных ча-
Восприятие звука. Основы психоакустики 133 Рис. 3.4.2. Зависимость уровня маскировки от частоты и уровня маскирующего тона 0,25 0,5 стотах dN= Nm- N0, где N1n — уровень порога в присутствии мас- кера на данной частоте, N0 — уровень порога в тишине: например, на частоте 1800 Гц степень маскировки dN = 15 дБ, на частоте 2000 Гц степень маскировки dN = 25 дБ и т. д. Таким образом, количественно эффект маскировки оценивает- ся по сдвигу (повышению) порога слышимости основного тона. Анализ зависимостей этих сдвигов от частоты и интенсивности маскируемого и маскирующего тона, представленных на рис. 3.4.2, позволяет выявить ряд закономерностей: — наиболее выраженная маскировка наблюдается, если часто- та маскируемого звука близка к частоте маскирующего звука, сте- пень маскировки уменьшается по мере увеличения разницы меж- ду той и другой частотой; — степень маскировки увеличивается по мере нарастания ин- тенсивности маскирующего звука (уровень его интенсивности в дБ указан в виде цифр над кривыми); — маскировка становится существенно несимметричной по мере нарастания интенсивности маскера и более выраженной по отношению к звукам высокой частоты; — высокочастотные маскеры эффективно маскируют лишь зву- ки в относительно узком диапазоне частот, тогда как звуки низкой частоты являются эффективными маскерами для звуков в очень широком частотном диапазоне. Это явление связано со специфи- кой обработки звука в улитке (см. разд. 3.1): максимум возбужде- ния низкочастотных звуков находится у самой вершины базиляр- ной мембраны, и низкочастотная огибающая бегущей волны имеет постепенно нарастающую амплитуду вдоль всей базилярной мем- браны, достигая своего максимума у вершины с последующим кру- тым спадом. Таким образом, проходя вдоль всей базилярной мем- браны, волна оказывает воздействие и на ее нижние отделы, где находятся максимумы высокочастотных звуков; в то же время высокочастотные звуки не проходят к вершине — и, следователь- но, почти не оказывают влияния на низкочастотные звуки.
134 Глава 3 0,020,050,1 0,2 0,5 1 2 5 10 20 /кГц Рис. 3.4.3. Зависимость уровня маскировки от уровня интенсивности белого шума Маскировка шумовыми сиг- налами. Несмотря на то, что большую информацию о маски- ровке получают при исследова- ниях с тональными сигналами, при их использовании возникает ряд трудностей. Как известно, если два тона близки по часто- те (разница меньше 15 Гц), то между ними возникают биения; кроме того, при больших ин- тенсивностях могут отчетливо прослушиваться субъективные комбинационные гармоники (см. разд. 3.5), что затрудняет точные оценки эффектов маскировки, по- этому были проведены исследования по количественному уста- новлению степени маскировки, когда в качестве маскирующего сиг- нала выбирался узкополосный или широкополосный белый шум. Эксперименты по маскированию узкополосным шумом по существу подтверждают эффекты маскировки, наблюдаемые при исследова- ниях на чистых тонах. Результаты исследований эффектов маскировки при использо- вании широкополосного белого шума показаны на рис. 3.4.3. Как видно из графика, степень маскировки зависит от уровня интенсив- ности шума (маскера) почти прямо пропорционально: увеличение интенсивности шума на 10 дБ вызывает увеличение порога слыши- мости (т. е. степени маскировки) также на 10 дБ. Эти соотношения соблюдаются и для узкополосных шумовых и тональных сигналов, однако исследования последних лет пока- зали, что на частотах ниже и выше маскера имеют место отклоне- ния от этого закона (он соблюдается, когда частоты сигналов близ- ки): для сигналов с частотой ниже маскера уровень маскировки растет медленнее, а для сигналов выше маскера быстрее (увели- чение на 3 дБ степени маскировки при увеличения уровня маске- ра на 1 дБ). Кроме того, как следует из рис. 3.4.3, белый шум неодинако- во эффективен для маскировки звуков разных частот. На низких частотах, примерно до 500 Гц, кривые (т. е. степень маскировки) от частоты практически не зависят, при дальнейшем увеличении частоты наблюдается четкая зависимость: при каждом удвоении частоты уровень порога слышимости повышается на 3 дБ. При- чина этого заключается в наличии «критических полос слуха» (см. разд. 3.3). Г. Флетчер (Fletcher) [21] показал, что если поддерживать спек- тральный уровень шума постоянным и расширять его полосу, то уровень маскировки будет увеличиваться, однако как только полоса
Восприятие звука. Основы психоакустики 135 60 40 20 0 40— -Tf\— JV 20— 16— л— и -10 0,02 0,05 0,1 0,2 0,5 1 2 10 20 /кГц Рис. 3.4.4. Зависимость уровня маскировки для равномерно маскирующего шума шума достигает определенной N> ДБ критической ширины, дальней- 80i шее ее расширение не приво- дит к увеличению степени мас- кировки тона. Таким образом, было пока- зано, что только определен- ная «критическая» ширина полосы белого шума участву- ет в маскировке тона, равного центральной частоте этой полосы. Расширение полосы шума за пределы пропускания фильтра не увеличивает сте- пень маскировки, несмотря на то что громкость шума повышается. Если вновь вернуться к рис. 3.4.3, то можно объяснить, почему при удвоении частоты то- нального сигнала степень его маскировки повышается на 3 дБ: это примерно соответствует закону пропорционального расширения ширины критических полос с увеличением средней частоты. По- скольку при этом расширяется полоса белого шума, участвующе- го в маскировке, т. е. возрастает его общая интенсивность, то и степень маскировки соответственно увеличивается. Можно подобрать шум с таким распределением спектральной плотности, чтобы он равномерно маскировал все частоты: для это- го нужно, чтобы до частоты 500 Гц его спектральная плотность была равномерна и совпадала с белым шумом, а затем спадала пропорционально частоте. Кривые порогов слышимости при мас- кировке равномерно маскирующим шумом показаны на рис. 3.4.4. Это свойство широкополосных шумов оказывать максимальное влияние на маскировку сигнала только в пределах критических полос положено в основу современных психоакустических алгорит- мов сжатия сигналов в системах звукозаписи и радиовещания, где вся частотная полоса разбивается на ряд подполос, примерно со- ответствующих критическим полосам слуха, и внутри каждой поло- сы производится расчет степени маскировки составляющих пере- даваемого сигнала [45]. Временное (неодновременное) маскирование Все приведенные выше результаты относятся к ситуации, ког- да маскируемый сигнал и маскирующий сигнал (маскер) действу- ют на слуховую систему одновременно. Однако в практике звукорежиссеров и музыкантов возникают ситуации, когда достаточно громкие звуки маскируют (т. е. делают практически неслышимыми) звуки, следующие за ними (и даже — в некоторых случаях — предшествующие им). Такая маскировка,
136 Глава 3 ♦дБ "40 Рис. 3.4.5. Зависимость уровня временной маскировки (прямой и обратной) в зависимости от временного интервала между сигналом и маскером когда сигналы не перекрываются во времени, называется времен- ной маскировкой. Степень маскировки исследуемого сигнала при подаче последу- ющего (обратная маскировка) или предшествующего (предшеству- ющая маскировка) маскера определяется разными параметрами исследуемого сигнала и маскера. Этими параметрами являются: — временной интервал между поступлением исследуемого сиг- нала и маскера Af; — уровень интенсивности маскера; — длительность воздействия маскера т, мс, и др. На рис. 3.4.5 представлены некоторые результаты для оценки степени временной маскировки. На оси ординат отложены значе- ния степени маскировки, вызываемой шумовым сигналом (маске- ром): длительность воздействия маскера — 50 мс при уровне зву- кового давления 70 дБ; частота исследуемого (маскируемого) чистого тона 1000 Гц, его длительность 10 мс. На оси абсцисс от- ложены временные интервалы At, мс, между поступлением маске- ра и исследуемого сигнала при обратной и предшествующей мас- кировках. Сплошная линия обозначает степень маскировки при поступлении маскера и исследуемого сигнала в одно и тоже ухо (моноаурально), а пунктирная линия обозначает степень маскиров- ки, когда маскер подается в одно ухо, а исследуемый сигнал в дру- гое (дихотическая маскировка). На основании данных, представленных на рис. 3.4.5, можно сделать следующие выводы: — обратная маскировка более эффективна, чем предшествую- щая. Другими словами, при поступлении маскера через короткий временной интервал после сигнала наблюдается более высокий уровень маскировки, чем когда исследуемый сигнал поступает вслед за маскером; — маскировка более выражена, когда сигнал и маскер подают- ся в одно ухо (моноаурально), чем когда исследуемый звук пода- ют в одно ухо, а маскер в другое (дихотически); — сближение во времени подачи сигнала и маскера увеличива- ет степень маскировки. Необходимо отметить, что степень маски-
Восприятие звука. Основы психоакустики 137 ровки резко падает при увеличении интервала от 0 до 15 мс, за- тем спад происходит более плавно; — для временной маскировки не найдено линейного повыше- ния порога маскировки как функции уровня интенсивности маске- ра, характерного для одновременной маскировки, описанной ра- нее; увеличение уровня интенсивности маскера на 10 дБ вызывает дополнительный сдвиг порога маскировки только приблизительно на 3 дБ; — длительность действия маскера влияет на степень предше- ствующей маскировки, но не на обратную маскировку: так, маскер, длительность действия которого составляет 200 мс, вызывает большую маскировку, чем маскер, действующий в течение 25 мс; — временная маскировка зависит от частотного взаимоотноше- ния исследуемого сигнала и маскера точно так же, как и при одно- временной маскировке, т. е. маскировка проявится в большей сте- пени, если исследуемый сигнал и маскер близки по частоте; — степень маскировки при сочетании обратной и предше- ствующей маскировок выше, чем суммарная степень маскировки при их раздельном исследовании. Сочетание маскировок осу- ществляется путем подачи исследуемого сигнала между двумя маскерами. Все это позволяет предположить, что обратная и предшеству- ющая маскировки обусловлены разными слуховыми механизмами [9]. О механизмах временной маскировки известно еще недоста- точно. Можно предположить, что при малых по времени интерва- лах поступления основного и маскирующего сигналов происходит взаимодействие (перекрывание) бегущих волн на базилярной мембране, при увеличении временных интервалов между ними (до 200 мс) может сказываться инерционность нервных процес- сов в слуховой системе — например, маскер, обрабатываемый нервной системой, подавляет процесс обработки исследуемого сигнала. Все приведенные выше результаты по исследованию процессов временной слуховой маскировки могут быть полезны в практике работы звукорежиссеров, в частности, при работе с электронными композициями: поскольку выбор последовательности звуков разной интенсивности с короткими временными интервалами между ними может привести к маскировке более тихих звуков (как предшеству- ющих, так и последующих) более громкими (удар барабана, литавр, тарелок и др.), то необходимо контролировать временной промежу- ток между такими сигналами и соотношение их интенсивностей. Центральная (бинауральная) маскировка Наличие бинауральной слуховой системы не только обеспечи- вает локализацию в пространстве, повышение порогов чувстви- тельности и др., но и позволяет получить интересные эффекты
138 Глава 3 TT маскировки, которые вызы- вают сейчас очень большой научный интерес, так как позволяют судить о работе центрального нервного про- цессора, и могут найти об- ширное практическое при- менение. Обычная маскировка о 500 юоо 2000 Гц происходит тогда, когда и Рис. 3.4.6. Центральная маскировка маскируемый И МЗСКИрую- эффект маскировки возникает даже тогда, когда маскер и исследу- емый сигнал подаются в разные уши, — такой процесс называет- ся центральной (или бинауральной) маскировкой. Такое влияние маскера, вероятнее всего, обусловлено взаимо- действием маскера и исследуемого сигнала на уровне центральной нервной системы, где имеются специальные «бинауральные» ней- роны, которые проводят сравнение сигналов от обоих ушей. Центральная маскировка имеет определенные отличия: — величина сдвига порога, вызванная центральной маскиров- кой, гораздо меньше, чем при моноауральной маскировке, и про- является в большей степени для звуков высокой частоты, чем для низкочастотных; — степень маскировки становится значительной только если время воздействия маскера не менее 200 мс; — наиболее выраженная маскировка выявляется, когда маскер и исследуемый тон близки по частоте. Частотная зависимость от- ражена на рис. 3.4.6, на котором маскер в виде тона 1000 Гц по- дают на уровне интенсивности 60 дБ в одно ухо, сигнал — в дру- гое. Маскировка наиболее выражена в небольшом диапазоне частот, прилежащих к частоте маскера. Этот частотный диапазон совпадает с шириной критических полос слуха; — пик маскировки симметричен (в отличие от моноауральной маскировки) до 60 дБ, при интенсивности выше 70 дБ появляется асимметрия; — на рис. 3.4.6 показано также, что наибольшая маскировка осуществляется при пульсирующих маскере и исследуемом сигна- ле, включаемых и выключаемых одновременно (кривая 1), а не при включенном постоянно маскере и пульсирующем в другом ухе сигнале (кривая 2). Такие результаты получены при исследовании центральной маскировки, в разных экспериментах и у разных об- следуемых; — кроме того, степень центральной маскировки нарастает по мере повышения уровня интенсивности маскера только в случае при пульсирующем маскере и сигнале щий сигнал поступают в одно и то же ухо; однако
Восприятие звука. Основы психоакустики 139 подачи пульсирующего маскера и пульсирующего сигнала, тогда как при использовании постоянного маскера и пульсирующего сиг- нала степень маскировки сохраняется (в пределах 1-2 дБ ) неза- висимо от уровня интенсивности маскера. Поскольку реальная речь и музыка представляет собой посто- янно изменяющийся во времени (пульсирующий) процесс, то мож- но предполагать, что эффекты бинауральной маскировки могут оказывать свое влияние, особенно при прослушивании стереофо- нических пространственных систем звуковоспроизведения, когда сигналы, поступающие на разные каналы слуховой системы, отли- чаются друг от друга. Бинауральная демаскировка Больший интерес в настоящее время вызывает эффект «бина- уральной демаскировки», которому посвящены многочисленные исследования. Под этим понимается снижение порога маскировки при выделении отдельных звуков из их общей окружающей звуко- вой среды [2, 9]. Эффект этот проявляется, например, в том, что на фоне общего разговора (шума) можно «выслушать» интересу- ющий слушателя разговор. Он получил название «эффекта вече- ринки» (Cocktail Party Effect). Для объяснения этого явления было рассмотрено несколько ва- риантов подачи сигнала и шума на два слуховых приемника (рис. 3.4.7): если подобрать комбинацию сигнала С и шума Ш с такими уровнями, что сигнал будет полностью замаскирован шумом, и по- дать ее через стереотелефоны на одно ухо СМШМ (рис. 3.4.7а) или на оба уха СДШД (рис. 3.4.76), а то в обоих случаях сигнал будет (f^^\ ™* C11IH11 0 дБ невозможно услышать на фоне \С/ шума (знак м означает моно- б >^ ауральную подачу, т. е. на одно Д( сдшд 0дБ ухо; знак д — дихотическую пода- чу, т. е. на два уха). Если послать <§>■ в одно ухо идентичный шум, а в ^^с^^/ХХ СмШд 9 ^ в другое сигнал и шум (такой вариант СМШД представлен на г ^f]\m с ш 13дБ рис. 3.4.7в), тогда маскирован- m т д * ный до этого сигнал вновь будет услышан (сигнал как бы освобож- д т (КА т с ш 15 дБ дается от шума, его уровень по- т \^/т * д вышается субъективно на 9 дБ). ^-ч Этот эффект и называется бина- е ™ (fej) ™ СдШ^ 3_10дб уральной демаскировкой. V-A При ЭТОМ Шум И СИГНал ЛОКЗ- рис 3 4 7 БинауральНая маскировка ЛИЗУЮТСЯ В разных местах ГОЛО- при различных вариантах подачи ВЫ: шум — В середине ГОЛОВЫ, сигнала и маскера
140 Глава 3 сигнал — ближе к одному уху. Получается, что шум и сигнал слыш- ны в разных местах и сигнал сразу обнаруживается из-за разной субъективной локализации. По-видимому, что-то в этом роде происходит и на вечеринке: шум по- ступает с разных сторон, а нужный сигнал с одной стороны; поворачи- вая голову, слушатель находит положение, при котором ему в оба уха по- ступает почти одинаковый шум, — тогда шумовой источник он слышит точно в центре, а сигнал локализуется в другом месте (ближе к тому уху, через которое он поступает), поэтому и начинает хорошо прослушивать- ся (механизм срабатывает только при наличии в спектре низкочастотных составляющих). В условиях экспериментальной ситуации слышимость маскиро- ванного сигнала можно еще увеличить путем изменения фазы шума в одном ухе на противоположную по отношению к шуму в другом ухе — СцШя (Рис- 3.4.7г) или изменения фазы сигнала в одном ухе на противоположную СЯШД (рис. 3.4.7д). Изменение фазы обозначается буквой я, поскольку стимулы различаются по фазе на 180°. Изменение фазы на противоположную осуществля- ется путем изменения положительной или отрицательной полярно- сти в одном из телефонов. Результаты были получены как для то- нальных, так и для речевых сигналов. Если определить «разность уровня маскировки» как различие (преимущество) в порогах мас- кировки при подаче разных сигналов или одинаковых сигналов на оба уха, то величина этой разности и определяет количественно уровень бинауральной демаскировки. Уровень бинауральной де- маскировки показан на рис. 3.4.7 справа в виде числа децибел для каждой комбинации сигнала и шума. Величина разности уровня маскировки в зависимости от изменения параметров сигнала и шума колеблется от 0 до 15 дБ. Наибольшая разность уровня мас- кировки обнаружена при противоположных по фазе в обоих ушах сигналах (CnUln) или шумах (СдШя). Если сдвиг по фазе (напри- мер, для шума) меньше тс, то разность уровня маскировки умень- шается до 3-10 дБ (рис. 3.4.7е). Разряды волокон слухового нерва связаны с фазой колебаний базилярной мембраны. При этом на низких частотах звука степень «привязки» по фазе наибольшая, поэтому можно ожидать, что эф- фекты бинауральной демаскировки зависят от частоты сигнала. Обобщенные результаты работ разных исследователей позволили установить [9], что для случая подачи в оба уха одинакового шума, но разного по фазе сигнала величина разности уровня маскиров- ки оказывается наибольшей для низких частот — около 15 дБ при 250 Гц; по мере нарастания частоты она уменьшается до величи- ны в 3 дБ в области 1500-2000 Гц. Для объяснения эффекта бинауральной демаскировки была предложена модель работы слуховой системы, известная как мо-
Восприятие звука. Основы психоакустики 141 Правый фильтр Левый фильтр Уравнивание Сокращение Детекти- рующее устройство Рис. 3.4.8. Модель бинауральной демаскировки дель «уравнивание — сокращение» Дурлаха (рис. 3.4.8). В соот- ветствии с этой моделью раздражение от звука, пройдя фильтры критических полос на базилярной мембране в каждом ухе, моно- ауральным и бинауральным путями следует к «различающему ус- тройству» в слуховые центры мозга, которые решают, присутствует ли полезный сигнал в данном шумовом окружении. Различающее устройство переключается между тремя возможными каналами (двумя моноауральными и одним бинауральным) и как основу для ответной реакции использует канал с наиболее подходящим соот- ношением «сигнал / шум». Моноауральные каналы идут непосред- ственно к различающему устройству, а прохождение раздражения по бинауральному каналу включает две стадии — уравнивание и сокращение [9]. В первой стадии сигналы из обоих ушей «уравни- ваются» по амплитуде (уравнивающая стадия), затем в стадии со- кращения эти сигналы «вычитаются» друг из друга. При одинако- вых комбинациях сигналов в обоих ушах С + Ш = С + Ш входной бинауральный сигнал полностью сокращается, и различающее ус- тройство вынуждено выбирать между моноауральными каналами, поэтому разность в уровнях маскировки не выявляется. Однако при условии, что шум сдвинут по фазе: С + Ш = С + (-Ш) = 2С, он при «вычитании» сокращается и сигнал усиливается (до 15 дБ). Модель работает с погрешностями, т. к. имеется внутриушной шум, точного поворота по фазе не происходит, не полностью уравнива- ются стимулы и т. д. Разумеется, это только одна из возможных гипотез — исследо- вания по этому направлению активно развиваются; однако полу- ченные результаты уже очень интересны и могут принести новые неожиданные эффекты, особенно при многоканальной записи для пространственных систем звуковоспроизведения, построение кото- рых требует учета бинауральных свойств слуха, в том числе и би- науральной демаскировки. 3.5. НЕЛИНЕЙНЫЕ СВОЙСТВА СЛУХА Как уже было отмечено в главе 1, еще в 1714 году знаменитый скрипач Тартини заметил и описал странное явление: когда на
142 Глава 3 скрипке громко проигрываются две ноты, иногда можно отчетливо слышать третий тон, которого не было у исполнителя. Это явление вызвало большой интерес среди музыкантов и ученых, привело к постановке многочисленных экспериментов и позволило уста- новить, что эти дополнительные «фантомные» тоны возникают непосредственно в слуховой системе и являются следствием ее нелинейности. По общему определению система называется нелинейной, если выходной сигнал Y(t) отличается от входного сигнала X(t) нали- чием дополнительных спектральных составляющих. Обычно это имеет место, если связь между воздействующей силой (давлени- ем) и откликом системы (смещением) является нелинейной. Прак- тически вся электроакустическая аппаратура (громкоговорители, микрофоны, акустические системы и др.) является нелинейной (для оценки ее всегда нормируется коэффициент нелинейных ис- кажений — см. гл. 6), однако эта нелинейность проявляется при достаточно больших уровнях входного сигнала. Принципиальным отличием слухового аппарата является то, что он производит нелинейное преобразование входного звукового сиг- нала как при большом его уровне, так и при очень малом, только механизмы этого преобразования различны [9]. Нелинейность слуха проявляется прежде всего в появлении «субъективных», или «слуховых» гармоник. При воздействии на барабанную перепонку достаточно громкого синусоидального зву- ка с частотой /0 в процессе его обработки в слуховом аппарате возникают гармоники этого звука с частотами 2f0, 3f0 и т. д. Напри- мер, если подать первичный тон с частотой 500 Гц, то можно ус- лышать звуки с частотами 1000 Гц, 1500 Гц и т. д. Поскольку при объективных измерениях подводимого сигнала можно точно уста- новить, что в спектре первичного воздействующего тона этих гар- моник нет, они и получили название «субъективных» гармоник [31]. Если к звуку, под действием которого возникают субъективные гармоники с частотой, например, 500 Гц, добавить второй скользя- щий тон, частоту и уровень которого можно плавно изменять, то при неточном совпадении частоты этого звука с частотой субъек- тивной гармоники (например, 990 Гц и 1000 Гц) можно услышать на фоне громкого основного звука биения с разностной частотой (f = 10 Гц), возникшие в результате взаимодействия скользящего звука и субъективной гармоники. Аналогичные измерения могут быть сделаны и для гармоник более высоких порядков. Наиболее резкие биения будут прослушиваться при равенстве их амплитуд. Поэтому, отрегулировав амплитуду давления скользящего звука до получения наиболее четких биений и измерив величину этого давления, можно определить величину субъективной гармоники (эта техника называется «метод наилучших биений»). Полученные результаты позволили установить зависимость величины субъек-
Восприятие звука. Основы психоакустики 143 тивных гармоник от уровня основного тона: например, при уровне тона с частотой 10ОО Гц, равном 80 дБ, уровень звукового давления (SPL) второй субъек- тивной гармоники оказался рав- ным 63 дБ. Уровень этих гармо- ник существенно зависит от уровня основного тона: только когда он становится ниже 40 дБ, эти гармоники становятся малы- ми и возникает ощущение чисто- го тона. При увеличении уровня интен- сивности первичного тона вели- чина субъективных гармоник рез- ко возрастает (рис. 3.5.1). Это обстоятельство имеет су- щественное значение для вос- приятия слухом низкочастотных колебаний в диапазоне от 16 Гц до примерно 100 Гц. Как уже было показано в разделе 3.1, звук с частотой 100 Гц восприни- мается почти самым крайним участком базилярной мембраны у ее верхушки, так что на базилярной мембране фактически нет участ- ков, воспринимающих колебания более низких частот. Однако об- ласть слышимых звуков простирается значительно ниже. Предпо- лагается, что звуки с частотой менее 100 Гц ощущаются не сами по себе, а из-за создаваемых ими серий субъективных гармоник, попадающих в область частот свыше 100 Гц, т. е. в конечном счете из-за нелинейности слуха. Целый ряд фактов косвенно под- тверждает это предположение, однако прямого подтверждения еще не найдено, так что пока это гипотеза. Вторая форма проявления нелинейности слуха — возникнове- ние «комбинационных субъективных тонов». Как известно [41], если к нелинейной системе подвести два сигнала достаточно боль- шого уровня с частотами fx и f2 (например, 800 Гц и 1000 Гц), то не- линейные искажения создадут комбинационные тоны с различными частотами, т. е. появляются вторичные комбинационные тоны Л ~f\ и Л + А (2°0 Гц и 1800 Гц)' кубичные комбинационные тоны 2Z1 - /2 (600 Гц), If2 - f (1200 Гц), Ifx +/2 (2600 Гц), If2 + Z1 (2800 Гц) и др. Для их количественной оценки также могут быть использованы «метод наилучших биений» или «метод пога- 60 70 80 90 100110 120 130140 Рис. 3.5.1. Зависимость уровней субъективных гармоник (в %) от уровня основного тона
144 Глава 3 шений» (подается дополнительный сигнал с частотой ком- бинационного тона и подбираются его амплитуда и фаза таким образом, чтобы комбинационный тон погасился, т. е. он подает- ся в противофазе). Многочисленные эксперименты показали, что существуют особые комбинационные тоны, которые чаще всего прослушиваются при субъективных экспертизах: это разностные тоны с частотами^ - /| и 2/j -f2 (200 Гц и 600 Гц в данном при- мере). Простой разностный тон ведет себя как в случае классической квадратичной нелинейности: он может быть услышан, если уро- вень первичных тонов больше чем 50 дБ. При равенстве уровней двух первичных тонов уровень разностного тона увеличивается на 2 дБ при возрастании уровня каждого первичного тона на 1 дБ. Ве- личина уровня разностного тона не очень сильно зависит от отно- шения частот^/ fv В случае кубичного разностного тона установлено, что он воз- никает в основном при соотношении частот 1 <f2l/j < 1,3- В этом частотном диапазоне он может быть услышан при очень низком уровне первичных тонов (при SPL ниже 40 дБ), уровень f2 может быть даже ниже 10 дБ. Все это заставляет предположить, что в образовании этих тонов участвуют дополнительные механизмы, о которых сказано ниже. Многочисленные исследования, особенно в последние годы, по- зволили получить ряд очень интересных результатов относитель- но механизмов возникновения нелинейности [1-3, 9, 16, 20]. Экспериментально доказано, что преобразование сигнала во внешнем и среднем ухе при средних уровнях сигнала есть линей- ный процесс; только при очень больших уровнях начинает прояв- ляться нелинейность работы среднего уха [20]. Основная причина нелинейности как при больших, так и при малых уровнях сигнала заключается в механизме работы внутреннего уха (улитки). Первый источник нелинейности заключен в гидродинамике улитки: при уда- ре стремечка по мембране овального окна в жидкости возникает звуковой импульс, который распространяется из верхнего отдела в нижний и возбуждает базилярную мембрану. При высоких уров- нях сигнала в жидкости улитки образуются вихревые потоки [9] (рис. 3.5.2). Появление этих завихрений искажает форму звуково- Расстояние го импульса, а поскольку бази- лярная мембрана выполняет его спектральный анализ, то эти искажения и приводят к появлению дополнительных гармоник и комбинационных тонов. Рис. 3.5.2. Вихревые потоки в жидкости улитки Вторая причина нелинейно- сти при малых уровнях сигна-
Восприятие звука. Основы психоакустики 145 BBK Рис. 3.5.3. Механизм работы наружных волосковых клеток ЛЭ СВЯЗана С Процессами ЭЛеКТри- Покровная мембрана ческого преобразования сигнала в волосковых клетках. Как уже было отмечено в разделе 3.1, внутренние волосковые клетки связаны в основном с восходя- щими волокнами, они сообщают информацию в мозг, а наружные волосковые клетки получают ин- формацию от мозга. В последние годы удалось установить [1, 2, 5, 10, 20], что именно HBK и играют основную роль в нелинейной компрессии звука во внутреннем ухе. При больших уровнях сигнала они удлиняются (до 10% от основ- ной длины) (рис. 3.5.3) и тем самым придерживают смещения ба- зилярной мембраны, предохраняя внутренние волосковые клетки от слишком большого изгиба, а при малых — усиливают смещения базилярной мембраны. В ходе современных экспериментов было выявлено [4, 5], что на очень низких уровнях сигнала происходит излучение звука от внутреннего уха (отоакустическая эмиссия). По-видимому, это результат воздействия НВК, которое также вызы- вает на низких уровнях аномальное поведение кубичных комбина- ционных тонов. Нужно отметить, что этот механизм работает только в опреде- ленном диапазоне сигналов: при очень длительном воздействии громких звуков (что сейчас очень распространено) HBK повреж- даются, и зависимость смещения мембраны от уровня сигнала приобретает чисто линейный характер (что приводит к дальней- шему разрушению ВВК). Появление слышимых «слуховых» гар- моник и комбинационных тонов является признаком нормальной работы слухового аппарата и свидетельствует о хорошем состо- янии слуха. 3.6. БИНАУРАЛЬНЫЙ СЛУХ. ПРОСТРАНСТВЕННАЯ ЛОКАЛИЗАЦИЯ Наличие двух приемников слуха обеспечивает человеку возмож- ность воспринимать пространственный звуковой мир и оценивать перемещение звуковых сигналов в пространстве. Информация, которая поступает на оба слуховых канала, обрабатывается в пе- риферической части слуховой системы и затем передается в выс- шие отделы головного мозга, где за счет сравнительного анализа этой информации из двух разных каналов формируется единый пространственный слуховой образ.
146 Глава 3 Наличие двух приемников информации, т. е. бинаурального (двойного) слуха, обеспечивает человеку огромные преимущества, основные из которых следующие: — локализация сигналов как от одиночных, так и от множе- ственных источников, что позволяет формировать пространствен- ную перспективу и оценивать пространственное звуковое поле (например, в помещении); — разделение сигналов, приходящих от звуковых источников из различных точек пространства; — выделение сигналов выбранного звукового источника на фоне других звуковых сигналов, например выделение прямого звука на фоне реверберирующих сигналов в помещении, выделе- ние речи на фоне шумов и т. д. Анализ бинауральных слуховых эффектов представляет особый научный интерес, в частности для изучения функционирования и спецификации полушарий головного мозга, а также громадный практический интерес в связи с развитием и промышленным внедре- нием «бинауральных технологий» для создания систем простран- ственной звукозаписи и звуковоспроизведения (стереофонические системы, бинауральные системы, пространственные системы типа Surround Sound и др.), для синтеза трехмерных виртуальных зву- ковых полей (технология 3D-Sound, техника аурализации, создание адаптивных процессоров и др.); для развития новых методов из- мерения и слуховой оценки звуковой аппаратуры. К числу основных свойств бинаурального слуха можно отнести: пространственную локализацию, эффект предшествования, бина- уральную суммацию громкости, бинауральную демаскировку, бина- уральные биения и слияние звуков, эффекты «правого» и «левого» уха при восприятии речи и музыки и др. [4, 9, 12, 13, 16, 23, 39]. Бинауральная пространственная локализация Прослушивая звучание симфонического оркестра в концертном зале (или пение хора в большом соборе), слушатель отчетливо воспринимает и разделяет расположение инструментов в горизон- тальной плоскости на сцене, их расположение по глубине, а так- же ощущает пространственность окружающего звукового образа. Эта способность и называется пространственной бинауральной локализацией. Механизмы локализации в горизонтальной, верти- кальной плоскости и по глубине имеют существенные отличия. Горизонтальная (азимутальная) локализация: на рис. 3.6.1 представлены различительные признаки направленности на источ- ник звука при его смещениях в горизонтальной плоскости относи- тельно головы слушателя. Звук, исходящий из источника, располо- женного справа от слушателя, должен пройти большее расстояние к левому уху, чем к правому (рис. 3.6.1а), и поэтому возникает не- которая разница по времени прихода звуковой волны. Кроме того, поскольку звуки низких и средних частот имеют длину
Восприятие звука. Основы психоакустики 147 оценка ITD Время прихода звука к левому уху Слушатель Прямо напротив левого уха 90° о° Источник звука Звуковая волна ^ремя прихода звука к правому уху . Азимут восприятия / Прямо напротив 4f- ► правого уха +90° Прямо напротив слушателя оценка ITD Интенсивность До- звуковой волны ^ I \ в левом ухе Источник звука Звуковая волна I Интенсивность звуковой волны в правом ухе Слушатель Прямо напротив / левого уха IQgHP / Азимут восприятия Прямо напротив правого уха волны больше диаметра головы (или сравнимую с ним), они «огибают голову» и поступают в расположенное дальше • ухо (за счет эффекта дифракции). Однако зву- ки высокой частоты име- ют длину волны меньше диаметра головы, по- этому образуется «акус- тическая тень», которая уменьшает интенсивность звука, поступающего в ухо, расположенное даль- ше от источника звука, — за счет этого возникает разность по интенсивно- сти (рис. 3.6.16). Таким образом, про- странственная разнесен- ность двух слуховых приемников и экраниру- ющее влияние головы и торса за счет дифрак- ционных эффектов при- водят к значительным различиям между сигналами, поступающими на правое и левое ухо, что позволяет произвести локализацию звукового источника в про- странстве, обусловленную тремя физическими факторами: — временным (lnteraural Time Difference — ITD) — возника- ющим из-за несовпадения по времени моментов прихода одинако- вых фаз звуковой волны к левому и правому уху; — интенсивностным (lnteraural Intensity Difference — HD) — возникающим из-за неодинаковой величины интенсивностей звуко- вой волны, вследствие дифракции ее вокруг головы и за счет об- разования «акустической тени» со стороны, обратной источнику звука; — спектральным — возникающим из-за разницы в спектраль- ном составе звуков, воспринимаемых левым и правым ухом, вследствие неодинакового экранирующего влияния головы и уш- ных раковин на низкочастотные и высокочастотные составляющие сложного звука. Временная разность — ITD Разность времени прихода (ITD) одинаковых фаз звуковой волны можно легко рассчитать, зная разность хода dx звуковой 90° 0'° +90° Прямо напротив слушателя б Рис. 3.6.1. Механизмы локализации в горизон- тальной плоскости: а — разность хода лучей по времени — ITD; б — разность по интенсивности — HD
148 Глава 3 Угол, градусы Рис. 3.6.2. Расчет разности хода лучей (ITD) от источника Рис. 3.6.3. Междуушные различия до левого и правого уха по времени прихода звуков при разных углах расположения источника волны до левого и правого уха: ITD = dx/C, где С — скорость рас- пространения звуковой волны (рис. 3.6.2). Исследования зависимости между направлением локализа- ции источника звука в горизонтальной плоскости, определяемым углом 0, и временем задержки ITD позволили получить следую- щее соотношение: ITD = а /С (в + sin в) при 90° < 9 < + 90°, где 6 — азимутальный угол, отсчитываемый в горизонтальной плоскости от плоскости симметрии головы (рис. 3.6.2J, а — ради- ус головы. ITD равна нулю при расположении звукового источни- ка посередине и равна а/С(п/2+1) для расположения источника точно напротив одного уха, что составляет примерно 0,7 мс (сред- ний радиус головы 9 см, кратчайшее расстояние вокруг головы от одного уха до другого 26 см). Различия по времени прихода звуковых волн для разных углов расположения источника для частоты 1500 Гц показаны на рис. 3.6.3; как видно из рисунка, при перемещении источника зву- ка вокруг головы максимальная разница во времени возникает при 6 = 90°. Для синусоидальных колебаний на частоте 800 Гц мак- симальное время запаздывания ITD становится равным уже поло- вине периода колебания звуковой волны на этой частоте (Т/2), а при более высоких частотах превышает половину периода (ITD > Т/2). В этом случае возникает неясность в фазовых со- отношениях между волнами, действующими на правое и левое ухо, — с одинаковым основанием можно считать, что одна волна отстает по фазе от другой на время t с или опережает ее на это же время. Следовательно, предельное значение времени запазды- вания, правильно воспринимаемое слухом, не должно превышать половину периода волны [39]. В соответствии с этим наибольшее значение азимутального угла 9 max, определяемое за счет временного бинаурального
Восприятие звука. Основы психоакустики 149 эффекта, с повышением частоты уменьшается. Это иллюстрирует- ся данными табл. 3.6.1, в которой приведены для разных частот расчетные значения 6тах, вычисленные по вышеприведенной формуле путем подстановки ITD = Т/2. Например, при частоте 3200 Гц время запаздывания ITD = Т/2 создает ощущение углово- го перемещения всего лишь на 14°. Однако данное обстоятель- ство не столь существенно, так как в этой области частот вступа- ет в силу интенсивностный фактор [39]. Таблица 3.6.1 Частота, Гц Т/2, мс втах> фаДУСЫ 400 1,250 90 800 0,625 90 1200 0,417 42 1600 0,313 30 2000 0,250 24 2400 0,208 19 3200 0,151 14 4000 0,125 11 Интенсивностная разность — HD Как уже было отмечено выше, по мере повышения частоты интенсивность звуков, достигающих противоположного по отноше- нию к источнику уха, становится меньше. Наибольшая разность уровней интенсивности (звукового давления), действующих на левое и правое ухо, возникает при боковом положении источника (а = 90°). Для этого случая на рис. 3.6.4 приведен получен- ный экспериментально график частотной зави- симости разности уров- ней интенсивностей с/Л/ у левого и правого уха. Из графика видно, что по мере повышения 6000 5000 4000 w зооо «г 2500 о 1800 J 1000 500 200 90° 120° 150°180° Спереди Сзади Направление источника звука Рис. 3.6.4. Междуушные различия по интенсивности при разных углах расположения источника
150 Глава 3 10 1000 Частота, Гц ж 10000 Рис. 3.6.5. Локализационная ошибка как функция частоты Рис. 3.6.6. Конус неопределенности частоты эта разность существенно возрастает, достигая на 5000 Гц величины примерно 20 дБ. Последнее обстоятельство, однако, не означает, что при повы- шении частоты звука обостряется способность к локализации ис- точника. Напротив, чистые тоны очень высоких частот (свыше 8000 Гц) почти не поддаются локализации. Так же слабо выражена способность человека определять направление на источник сину- соидальных звуков низкой частоты (ниже 300 Гц она значительно ухудшается, а ниже 150 Гц отсутствует вообще). Исследования ошибок при локализации положения синусо- идального источника показали (рис. 3.6.5), что наибольшие ошибки совершаются в области 2000-4000 Гц, где, по-видимому, происхо- дит смена механизмов локализации от временного к интенсивно- стному. Максимальная угловая различимость источников достигается на оси в передней плоскости перед испытуемым; минимальная — ког- да источники находятся точно справа или слева от испытуемого. В последнем случае возникает так называемый «конус неопреде- ленности» с каждой стороны уха (рис. 3.6.6). Внутри него измене- ние положения источника звука не вызывает соответствующего ощущения (поскольку при расположении источника сбоку получа- ется большая разница и в интенсивности и во времени, и неболь- шие сдвиги источника дают малое относительное изменение об- щей разности), поэтому для улучшения локализации очень важно движение головы, так как оно изменяет положение конуса и умень- шает его влияние. Спектральные различия Наибольшая острота локализации достигается при восприятии сложных звуков и звуковых импульсов, когда, кроме рассмотрен- ных ранее причин, сказывается еще и спектральный фактор. На- пример, если звук, приходящий под углом 8 = 90° на ближайшее ухо, содержит как низкочастотные, так и высокочастотные состав- ляющие, то в спектре звука, действующего на дальнее ухо, высо- кочастотных составляющих будет меньше, так как на этих часто-
Восприятие звука. Основы психоакустики 151 тах оказывает влияние теневое действие головы. Кроме того, сами ушные раковины производят сложную фильтрацию звука, завися- щую от его частоты (раздел 3.1). Существенное значение для ло- кализации имеет также энергия переходных процессов, причем наибольшее значение имеет наличие в звуке низкочастотных со- ставляющих переходного процесса. Поэтому при прослушивании музыкальных и речевых сигналов изменение спектрального соста- ва сигнала (а следовательно, и его тембра) в зависимости от рас- положения источника помогает в его локализации. В целом анализ способности к локализации в горизонтальной плоскости показывает, что наименьший ощутимый угол отклонения источника при восприятии звуковых импульсов составляет около 3°. Эту величину следует считать угловой, или бинауральной, раз- решающей способностью слуха. Однако слух замечает угловое смещение на 3°, но при определении направления совершает ошибку в среднем на 12°. Поэтому точность локализации имеет величину 12° для источников, находящихся в передней полуплос- кости; для источников, расположенных позади слушателя, эта точ- ность еще меньше. Вертикальная (высотная) локализация. Способность опре- делять направление прихода звука в вертикальной плоскости у че- ловека развита значительно слабее, чем в горизонтальной. Она со- ставляет 10-15° (по сравнению с 3° в горизонтальной). Эту способность связывают обычно с ориентацией и формой ушных ра- ковин [9, 13, 20, 23]. Как было показано в разделе 3.1, ушная рако- вина действует как фильтр, внося максимальные искаже- ния в области 6-16 кГц, при- чем форма этих искажений зависит от того, спереди или сзади находится источник звука и под каким углом по- дьема он расположен в ме- дианной плоскости. Вид АЧХ, записанных на микро- фоны, находящиеся в уш- ных раковинах, при разных положениях источника пока- зан на рис. 3.6.7 (они назы- ваются бинауральными пе- ред аточ ными функциями головы — HRTF). Эта зависимость АЧХ звукового давления, посту- пающего на барабанную 0,5 1 1,5 2 2,5 ^ ц 0,5 1 1,5 2 2,5 Рис. 3.6.7. Передаточные функции головы и ушных раковин (HRTF) для левого и правого слухового каналов (ф — угол подъема в вертикальной плоскости, в градусах)
152 Глава 3 перепонку левого и правого уха, от положения источника исполь- зуется для сравнения спектральных компонентов сигнала в верти- кальной плоскости. Если звуковые сигналы подавать через стерео- телефоны, то ушные раковины оказываются прижатыми к голове и способность производить локализацию в пространстве теряется, источник звука при этом помещается внутрь головы (поскольку та- кая ситуация для мозгового процессора является неестественной). Это свойство называется латерализацией и служит причиной зна- чительной утомляемости людей, долгое время работающих в сте- реотелефонах. В настоящее время созданы цифровые процессо- ры, производящие предварительную фильтрацию сигналов в стереотелефонах, аналогичную той, которую выполняет ушная раковина, что дает возможность «выносить» звуковой образ из го- ловы, облегчая работу звукорежиссеров, операторов и др. Гпубинная локализация (оценка расстояния до источни- ка). Чувствительность слуха к расстоянию до источника имеет жиз- ненно важное значение. Среди основных факторов, определяющих оценку глубины, можно выделить следующие: — уменьшение уровня звукового давления с расстоянием — на низких частотах, где длина волны большая (X > 5-15 м) любой источник можно считать точечным и звуковые волны вокруг него сферическими. В сферической волне давление падает обратно пропоционально расстоянию (р ~ IZr)1 т. е. на 6 дБ при каждом удвоении расстояния (см. гл. 2). Многочисленные эксперименты по смещению источника и оценке кажущегося расстояния до слухо- вого образа (выполненные в заглушённой камере или на открытом пространстве) показали, что при удалении источника (например, громкоговорителя) на расстояние от 1 до 10 м «слуховой образ» у экспертов (при отсутствии визуального контроля) также смещает- ся в этом же направлении, но имеет место отставание «слухово- го образа» от реального источника — чем дальше, тем больше. Ощущение удвоения расстояния до звукового объекта возникает только при уменьшении уровня звукового давления на 20 дБ (а не на 6 дБ, как при объективном измерении). При этом точность ло- кализации оказывается небольшой: ошибка составляет от 3,5 см до 30 см при изменении расстояния от 1 до 8 м для широкопо- лосного сигнала. Если при увеличении расстояния повышать на- пряжение на громкоговорителе так, чтобы уровень звукового дав- ления у слухового канала эксперта не менялся, то способность определять расстояние до источника (т. е. глубинная локализация) исчезает. Таким образом, при отсутствии визуального контроля в условиях свободного поля решающим признаком, по которому оценивается расстояние до источника, является уровень звуково- го давления в месте расположения эксперта;
Восприятие звука. Основы психоакустики 153 — затухание звука, которое начинает сказываться при больших расстояниях, проходимых звуковой волной (больше 15 м). При этом высокочастотные составляющие затухают быстрее и спект- ральный состав сигнала при удалении источника меняется (тембр становится «темнее»). Кроме того, на распространение звука ока- зывают влияние влажность воздуха и направление ветра на от- крытом пространстве. Следует отметить, что возможности слуха при определении глубины расположения источника ограничены, имеется «акустический горизонт»; — на близком расстоянии (менее 3 м) на глубинную локали- зацию начинает оказывать влияние также дифракция на ушной раковине и голове, т. е. сказываются разности уровней интенсив- ностей (выше 1500 Гц) и временные задержки (ниже 1500 Гц), как и в предыдущих случаях. Приближенно локализацию по глубине (при расстояниях мень- ше 3 м) можно оценить по формуле [34]: L= 2С АТ(1СР/Al), где AT — временная разность сигналов , AI — интенсивностная. Таким образом, при изменении расстояния до источника меня- ются одновременно громкость и тембр, что и служит различи- тельными признаками. Общая точность глубинной локализации не очень велика, при смещении широкополосного звукового источни- ка от 50 до 150 см ошибки составляют 15-30%; — существенную роль для глубинной локализации играет лич- ный опыт: если слушателю знаком сигнал или если он имеет воз- можность сделать визуальную оценку, тогда точность глубинной локализации многократно увеличивается; — точность глубинной локализации звукового источника значи- тельно повышается в закрытом помещении (см. гл. 5). При пере- мещении звукового источника по глубине меняется отношение энергии прямого звука к энергии отраженного (реверберационного) звука, что помогает точнее определить расстояние до источника. Важнейшее значение имеет также разность по времени между при- ходом прямого звука и приходом первых отражений и соотношение их по уровням. Приближенно глубинную локализацию в помещении можно оце- нить следующим образом [40]: I Ерев Q.S V Епр 50(1-а) ' где а — коэффициент поглощения, S — площадь поверхности, Ерев/Епр — отношение отраженной и прямой энергии. Таким образом, слуховой аппарат, используя разные механизмы обработки звуковых сигналов, имеет возможность определить
154 Глава 3 1 (локализовать) положение звукового источника в трехмерном пространстве. Именно эта способ- ность используется при создании современных систем компьютерного моделирования трехмер- ных звуковых пространств (систем аурализации — см. гл. 5). Это же свойство слуха используется и в современных системах пространственного звуковоспроизведения (см. гл. 6). Создавая искус- ственные условия, к которым слуховая система не была приспособлена в процессе естественной эволюции, например помещая два одинаковых громкоговорителя на одинаковом расстоянии от левого и правого уха и подавая на них одина- ковые сигналы (рис. 3.6.8), можно заставить слуховой аппарат поместить слышимый (мнимый) источник звука посередине между реальными зву- Г1 1 Рис. 3.6.8. Расположение мнимого источника ковыми источниками. Пространство таких мнимых источников, со- здаваемых различными пространственными системами воспроизве- дения (например, стереофоническими, Dolby Surround и др.), и создает стереоэффект — по существу, слуховую иллюзию (см. гл. 6). Как уже было отмечено выше, кроме эффектов пространствен- ной локализации, наличие бинаурального слуха, т. е. двух слухо- вых приемников, обеспечивает целый ряд других преимуществ в получении и переработке слуховой информации. К их числу можно отнести: бинауральную суммацию громкости (см. разд. 3.3), эффект предшествования Хааса (см. гл. 5, разд. 5.1), бинауральную маскировку и демаскировку (см. разд. 3.4), бинау- ральные «слияния» звукового образа и биения, эффекты «право- го» и «левого» уха при восприятии речи и музыки (см. разд. 3.10) и др. [9, 13]. Каждое из этих свойств слуха имеет огромное значение для восприятия окружающего звукового пространства и все в большей степени используется в современных звуковых технологиях запи- си, передачи и воспроизведения, особенно с помощью быстро раз- вивающихся компьютерных технологий. 3.7. ВЫСОТА ЗВУКА Важнейшим свойством слуховой системы является возможность определения высоты звука. Это свойство имеет огромное значе- ние для выделения и классификации звуков в окружающем звуко- вом пространстве, эта же способность слуховой системы лежит в основе восприятия мелодии и гармонии в музыке.
Восприятие звука. Основы психоакустики 155 В соответствии с международным стандартом ANSI-S3.20 (1973 г.): «Высота (pitch) — это атрибут слухового ощущения, в терминах которого звуки можно расположить по шкале от низкого к высокому». Высота зависит главным образом от часто- ты звукового стимула, но она также зависит от уровня звукового давления и от формы звуковой волны [1, 2, 3, 5, 9, 16, 20]. Таким образом, ощущение высоты представляет собой субъективную ли- нейную классификацию звуковых сигналов. Прежде всего необходимо отметить, что слуховая система спо- собна различать высоту звука только у периодических сигналов. Если это простое гармоническое колебание (например, синусо- идальный сигнал), то период колебаний T с определяет частоту / = ~ , поэтому определяющим параметром для различения высо- ты является частота сигнала. Если это сложный звук, то высоту слуховая система может присвоить по его основному тону, но только если он имеет периодическую структуру, т. е. спектр его состоит из гармоник (т. е. обертонов, частоты которых находятся в целочисленных отношениях); если это условие не выполняет- ся, то высоту тона определить слуховая система не может (на- пример, у звуков таких инструментов как тарелки, барабаны, ка- станьеты и др.). Высота простых тонов Изучение связи частоты звука и его воспринимаемой высоты предпринималось еще Пифагором, а также многими известными физиками — Галилеем, Гельмгольцем, Омом и др. (см. гл. 1). В настоящее время на основе тщательных экспериментов, выпол- ненных Стивенсом и др. [19], в процессе которых слушателю предъявлялись два звука разной частоты и его просили располо- жить их по высоте, установлена зависимость высоты тона от ча- стоты сигнала, показанная на рис. 3.7.1. Значение высоты отложено в 4000г специальных единицах — мелах; при этом ощущаемая высота звука 1000 5 30( мел соответствует частоте 1000 Гц л-20( при уровне 40 дБ. (Иногда для оценки о высоты тона используется единица з 10( 1 барк =100 мел.) Как видно из рисун- ка, эта связь нелинейная: при увеличе- и*'^о о о о о ^ d> нии частоты, например, в три раза (от ^ ^2S Й§§ §§§ 1000 Гц до 3000 Гц) высота увеличи- Частота Гц ^ ^ вается только в два раза (от 1000 мел ДО 2000 мел). Нелинейная СВЯЗЬ ОСО- Рис. 3.7.1. Зависимость бенНО Выражена на НИЗКИХ И ВЫСОКИХ высоты тона (в мелах) от частоты звука
частотах, в известных пределах (в об- ласти средних частот) изменение вы- соты тона в мелах пропорционально ло- гарифму частоты: H (мел) = Ig / (Гц). Построенные таким образом зависимо- сти высоты тона (в мелах) от частоты называются психофизическими шка- лами. Исследования, посвященные уста- новлению абсолютных и дифференци- альных частотных порогов (см. разд. 3.2), позволили установить, что ниже частоты 500 Гц можно различить при- мерно 140 градаций высоты тона, в диапазоне от 500 Гц до 16 кГц — примерно 480 градаций (всего 620 градаций) [1-5, 16, 20]. В западноевропейской музыке, в инструментах с равномерно темперированной шкалой используется до 96 градаций высоты то- нов, в то время как возможности слуховой системы гораздо шире, что является основой для современного развития микротоновой и спектральной музыки на основе компьютерных технологий. Ощущение высоты чистого тона (одной частоты) связано не только с частотой, но и с интенсивностью звука и его длитель- ностью. Как показали различные исследования [2, 3, 5, 9, 16], при повышении интенсивности звука ощущение высоты сдвигается: громкие низкие звуки кажутся еще ниже, а высокие звуки с повы- шением громкости кажутся слегка выше (зависимость показана на рис. 3.7.2), для средних частот 1-2 кГц влияние интенсивности малозаметно. Следует подчеркнуть, что эта зависимость не очень велика и для сложных музыкальных звуков почти незаметна: это принципиально важно для исполнения музыки, т. к. иначе при переходе от рр к ff звуковысотные отношения в ней были бы нарушены. Ощущение высоты тона зависит и от его длительности: корот- кие звуки воспринимаются как сухой щелчок, но при удлинении звука щелчок начинает давать ощущение высоты тона. Время, требуемое для перехода от щелчка к тону, зависит от частоты: для низких частот требуется на распознание высоты тона примерно 60 мс, для частот 1-2 кГц примерно 15 мс (для сложных звуков это время увеличивается ) [2, 16]. При предъявлении двух звуков разной частоты можно сказать, что действует принцип неопределенности: чем меньше разница по частоте Af (Гц), тем больше времени надо слуховой системе At (с), чтобы распознать различие по высоте тона: Af х At = const.
Восприятие звука. Основы психоакустики 157 Тональная высота Рис. 3.7.3. Двухмерное представление высоты звука Высота сложных звуков В музыке простые синусоидальные тоны практически не используются, каждый музы- кальный тон имеет сложную структуру и состоит из основного тона и гармоник. Для сложных периодических сигналов вы- сота присваивается по частоте основного тона, что было доказано еще в XIX веке (см. гл. 1). Например, если сравнить ноту А4 (ос- новной тон — 440 Гц) и чистый синусои- дальный сигнал с частотой 440 Гц, то они воспринимаются как звуки одинаковой высо- ты, но разного тембра. В музыке для оценки высоты звука ис- пользуются музыкальные интервалы: окта- вы, тоны, полутоны и др. (см. разд. 3.8). Следует отметить, что их связь с психофизической шкалой высоты тона (построенной для чистых тонов) неоднозначна. До частоты примерно 5000 Гц увели- чение высоты тона на октаву связано с удвоением частоты (напри- мер, переход от ноты ля первой октавы к ноте ля второй октавы соответствует увеличению частоты от 440 до 880 Гц). Но выше ча- стоты 5000 Гц это соответствие нарушается: чтобы получить ощу- щение увеличения высоты на октаву, надо увеличить соотношение частот почти в 10 раз (это надо иметь в виду при создании компьютерных композиций). Это дало основание некоторым уче- ным [2, 3, 5, 16] предложить две размерности высоты тона: психо- физическую в мелах, получившую название «pitch height» (высота тона), и музыкальную (соответствующую названию нот) «pitch chroma» (тональная высота), которая может быть определена при- мерно до 5 кГц. Различие между ними показано на рис. 3.7.3: по вертикальной оси отложена высота тона в зависимости от часто- ты, по спирали отложены звуки в пределах одной октавы. Один виток спирали соответствует одной октаве, при этом звуки, разде- ленные на октаву, располагаются близко к друг другу (например, А1, А2, A3, А4), т. е. имеют близкую тональную высоту, это называется тональным хроматизмом [3]. Следует отметить, что даже музыканты с абсолютным музы- кальным слухом затрудняются в определении нот для звуков с ча- стотой выше 5 кГц. Это говорит о том, что механизмы определе- ния высоты тона до 5 кГц и выше 5 кГц существенно различаются. Для объяснения восприятия высоты как простых, так и слож- ных звуков используются две теории: «теория места» и «времен- ная теория».
158 Глава 3 Теория места Теория места при восприятии высоты основана на способности базилярной мембраны выполнять частотный анализ сложного зву- ка, т. е. действовать как спектральный анализатор. Как уже было сказано выше (см. разд. 3.1), звуковой сигнал вызывает появление на мембране бегущей волны (рис. 3.1.12), при этом максимумы смещения бегущей волны располагаются в разных местах бази- лярной мембраны в зависимости от частоты. Таким образом, ба- зилярная мембрана организована «тонотопически», т. е. каждый тон имеет свою топографию размещения. В зависимости от спек- трального состава звукового сигнала максимальные смещения до- стигаются на различных участках базилярной мембраны, волоско- вые клетки, находящиеся на этом месте, смещаются, и их электрическая активность сообщает мозгу, какие частоты присут- ствуют в спектре. Необходимо также отметить, что нервные волок- на, отходящие от различных мест мембраны, настроены частотно- избирательно, т. е. имеют минимальный порог чувствительности к тем частотам, на которых в данном месте возникает максимальное смещение. Кроме того, в них имеют место эффект «бокового по- давления» и другие эффекты, которые обостряют их чувствитель- ность и повышают разрешающую способность мембраны к диф- ференциации различных частот [2, 3, 5, 6, 9, 16, 25]. Интересно отметить, что для того чтобы слух различил два тона по высоте, необходимо, чтобы на базилярной мембране максимумы смеще- ния, соответствующие данным частотам, находились на расстоя- нии всего 52 мк (если выразить это в мелах, то одна градация вы- соты равна 3,9 мела) [1]. Таким образом, частота тона представлена в коде, основанном на информации о том, на каких участках мембраны регистрируется активность нейронов. Физиологические исследования показывают, что тонотопическая организация нейронов сохраняется во всех отделах мозга вплоть до отделов слуховой коры. Поэтому была предложена «теория места», согласно которой распознавание частоты и определение высоты тона есть результат тонотопиче- ского кодирования [5, 6, 16, 17]. При восприятии музыкального звука в соответствии с «теорией места» для слуховой системы существует три возможности опре- деления его высоты: — локализовать место фундаментальной частоты и по нему оп- ределить высоту тона; — найти минимальную частотную разницу между соседними гармониками, которая равна фундаментальной частоте: (п + Vf0-(Kf0) = (Uf0) + (If1) - (Hf0)= U где п = 1, 2, 3, ... и принять ее за основу при распознавании высоты;
Восприятие звука. Основы психоакустики 159 — найти общий наибольший сомножитель, который получается при делении всех гармоник на последовательные целые числа, и использовать его как базу для определения высоты. Первой была предложена теория, по которой ощущаемая высо- та соответствует фундаментальной частоте только если в звуковой волне присутствует энергия на этой частоте (второй закон Ома). Отсюда следовало, что физическое присутствие фундаментальной частоты является обязательным для определения высоты звука. В 1940 году Шаутен (J. Schouten) [2, 4, 5, 16] продемонстрировал, что ощущение высоты тона (сложной периодической волны) не из- менится, если вырезать в музыкальном тоне фундаментальную ча- стоту. Этот эксперимент получил название «феномен пропущенной фундаментальной». Дальнейшие исследования позволили предположить, что в этом случае слуховая система, оценивая положение максимумов на ба- зилярной мембране, соответствующих более высоким гармоникам (2, 3, 4, 5....), вычисляет частотную разницу между ними, равную фундаментальной частоте и по ней определяет высоту. Причем наибольшую роль для определения высоты тона играют 3-я, 4-я и 5-я гармоники. Однако был выполнен ряд экспериментов, резуль- таты которых оказалось трудно объяснить только с помощью этой гипотезы (например, наличие виртуальной высоты тона у колоко- лов — см. гл. 4) [17]. Тогда была предложена третья гипотеза, которая позволяет объяснить и пропущенную фундаментальную частоту и наличие виртуальных тонов, т. к. при отсутствии каких-то отдельных гармо- ник общий наибольший сомножитель не меняется [16] . Считается, что механизм места на базилярной мембране «раз- вертывает» данную гармонику, если критическая полоса (см. разд. 3.1 и 3.3) ее слухового фильтра, построенного на ней как на сре- динной частоте, достаточна узкая и соседние гармоники внутрь этого фильтра не попадают; если гармоники находятся настолько близко по частоте друг от друга, так что внутрь одного слухового фильтра попадает несколько гармоник, то они «не развертывают- ся». Какой бы ни была фундаментальная частота, слуховой меха- низм «развертывает» только первые шесть-семь гармоник, имен- но они и являются решающими при определении высоты звука. Теория места создает базис для понимания того, как можно определить высоту из анализа гармонического ряда, но она име- ет и ряд проблем, которые не может объяснить: например, очень высокая точность определения высоты звука для тонов, чьи частотные компоненты не развертываются (т. е. звуки с гармо- никами выше седьмой) и др. Поэтому была предложена альтер- нативная теория восприятия высоты, получившая название «временной».
160 Глава 3 Временная теория восприятия высоты Временная теория базируется на анализе временной структуры звуковой волны (в то время как теория места на ее спектральном анализе). Временная теория использует синхронизацию разрядов нейронов органа Корти с фазой колебания базилярной мембраны («эффект запирания фазы»), т. к. при смещениях данной точки мембраны в сторону расположения волосковых клеток в них возникает электрический потенциал; при смещении в противо- положную сторону потенциал отсутствует. Благодаря фазовому запиранию время между импульсами в любом отдельном волокне будет равно Тс= Vf0 Гц — периоду звуковой волны (например, если частота звука 250 Гц, то импульсы должны возникать 250 раз в секунду, т. е. с интервалом 4 мс). Основу временной теории составляет анализ формы волны в различных частях базилярной мембраны. Если рассматривать механизм частотного анализа на базилярной мембране как рабо- ту линейки фильтров различной ширины («критические полосы» слуха), то форма волны звукового сигнала, выходящего из этого набора фильтров, должна иметь вид, показанный на рис. 3.7.4. Например, если слуховой системой анализируется музыкальный тон с фундаментальной частотой 200 Гц, то выход из фильтра с центральной частотой 200 Гц имеет форму синусоидальной вол- ны, т. к. эта гармоника развертывается анализирующим фильтром. Аналогично все гармоники до пятой (около 1000 Гц) развертыва- ются этими фильтрами и на выходе имеют форму синусоидальной волны. Шестая гармоника имеет уже вариации амплитуды, но ин- дивидуальные циклы еще видны. Волновая форма выходного сиг- нала для фильтра, центральная частота которого выше шестой гармоники, уже не синусоидаль- ная, т. к. гармоники не разверты- ваются индивидуально (поскольку частотный диапазон полосового фильтра шире, чем расстояния между ними). По меньшей мере две гармоники комбинируются на выходе фильтра. Известно, что если две частоты находятся до- статочно близко друг от друга, между ними возникают биения, т. е. одно колебание со средней частотой, амплитуда которого ме- няется по периодическому закону с периодом, равным разности ча- стот. В данном случае, когда вза- имодействуют две гармоники, этот I 4,0 |_, Я" 3,0 I^^^^M^V^^WW^V^/W^^V'A^^ 2 2,0 § F 1,5 1,0 0,2 Время, мс Рис. 3.7.4. Вид звуковых волн для различных гармоник, выходящих из линейки слуховых фильтров (спектр ноты С4)
Восприятие звука. Основы психоакустики 161 Т" iniiiL...!—{. 1111 III M ■ ■ ■ ■■ шш II Им...... III i 111 111 ■ i I Il I I I I I I I ♦ I I основание If, 2fc 3f, Время между ► разрядами нейронов Рис. 3.7.5. Периоды разрядов нейронов от разных мест базилярной мембраны период определяется фундаменталь- ной частотой T = Vf0. Таким образом, ^0""* период огибающей всех волн, выходя- щих после фильтров с центральной частотой выше шестой гармоники, бу- дет одинаковым и равным Vf0. Минимальное время между импульсами от различных мест на ба- зилярной мембране определяется периодом волны, выходящей от со- ответствующего фильтра: для мест, которые соответствуют частотам от основной до шестой-восьмой гар- моники, минимальное время равно периоду данной гармоники; для мест, соответствующих более высоким гар- моникам, промежутки между импуль- сами равны периоду огибающей, т. е. основному тону (рис. 3.7.5), поэтому выше шестой гармоники разряды нейронов синхронизированы с формой огибающей и период разрядов совпадает с периодом фун- даментальной частоты. Таким образом, для всех гармоник перио- ды разрядов или равны частоте основного тона, или отличаются от нее в целое число раз. Основа временной теории восприятия высоты тона заключа- ется в том, что высшие отделы слуховой системы определяют пе- риодичность разрядов и по ним восстанавливают частоту основно- го тона. Временная теория дает базу для понимания, как фундаменталь- ная частота может быть найдена на основе анализа временных интервалов между нервными импульсами от различных мест на базилярной мембране и по ней определена высота тона. Однако временная теория не объясняет восприятия высоты тона на час- тотах выше 5 кГц, т. к. эффект фазового запирания не срабатыва- ет на этих частотах. Пространственно-временная теория восприятия высо- ты тона Современная теория слухового восприятия высоты тона бази- руется как на теории места, так и на временной теории. Согласно современным взглядам, мозг извлекает информацию от перифери- ческой слуховой системы как за счет индикации места (частотный анализ), так и за счет распознавания формы звуковой волны (вре- менной анализ); отдельно каждая теория, по-видимому, не может объяснить восприятие высоты полностью. На рис. 3.7.6 показана современная модель восприятия вы- соты тона, объединяющая оба метода: сначала идет фильтрация
162 Глава 3 Входящая звуковая волна mm Передача через внешнее и среднее ухо Анализ сигнала линейкой фильтров Нейронные импульсы ТП i межразрядных интервалов и места интервалов с межразряд, [стом места Установление высоты тона I Л 2 3 4 Рис.3.7.6. Пространственно-временная модель восприятия высоты тона звукового сигнала по час- тоте с помощью «раз- вертки» по месту, после чего происходит анализ по межимпульсным ин- тервалам, при этом до шестой-седьмой гармони- ки они соответствуют пе- риоду каждой гармоники. Для более высоких гар- моник межимпульсные интервалы соответствуют периоду огибающей, а по- скольку ее период равен периоду фундаменталь- ной частоты, различие высоты тона происходит только по месту возбуж- дения. В результате ана- лиза низких и высоких гармоник определяется общий период, и по нему данному звуку присваивается определен- ная высота. Таким образом, обе теории дополняют друг друга; в области низких частот работает временная теория, в области вы- соких частот — теория места, в области средних частот (до 3000 Гц) они работают вместе. Анализ восприятия высоты музыкального тона с помощью пред- ложенной модели позволил получить ряд интересных результатов: — для музыкальных тонов с фундаментальной частотой от 100 до 400 Гц (с уровнем звукового давления не менее 50 дБ) основ- ную роль в определении высоты тона играют первые пять-шесть гармоник, т. е. те гармоники, которые развертываются слуховыми фильтрами (временная теория); — музыкальные сигналы, содержащие очень низкие частоты (с фундаментальной частотой ниже 50 Гц — звуки органа, напри- мер), вызывают ощущение высоты тона только по гармоникам, т. к. такие низкие частоты не вызывают смещений базилярной мембраны (они на ней «не размещаются»), при этом наиболее су- щественную роль играют пятые-шестые гармоники; — музыкальные звуки, содержащие только неразвернутые гар- моники (свыше шестой), могут дать ощущение высоты тона по оги- бающей, при этом слух дает достаточно тонкую дифференциацию сдвига максимумов огибающей, т. е. достаточно точно чувствует высоту; — звуковые сигналы, содержащие только очень высокие гармо- ники (свыше двадцатой), не вызывают ощущения высоты тона;
Восприятие звука. Основы психоакустики 163 — фазовые соотношения различных гармоник в музыкальном сигнале оказывают влияние на восприятие высоты, т. к. их изме- нение приводит к изменению структуры огибающей для высших не- развернутых гармоник. Для музыкальных сигналов, содержащих много низких и высоких гармоник, изменение фазовых соотноше- ний может приводить к улучшению четкости восприятия высоты (возрастает «сила высоты»), не вызывая ее сдвига, т. к. они не влияют на оценку низших «развернутых» гармоник. Для сигналов, содержащих в основном высокие гармоники, изменение их фазы может вызвать некоторый сдвиг высоты тона и изменение его чет- кости («силы высоты»), т. к. может приводить к сдвигу пиков в оги- бающей, по которым и определяется высота тона [4, 5, 16, 20, 37]. Восприятие высоты тона для сложных музыкальных сигналов начинается с анализа в периферической слуховой системе, где производится их частотный и временной анализ; затем полученная информация передается в высшие отделы мозга — «центральный слуховой процессор», где полученная информация определенным образом группируется и осмысливается. Мозг «группирует» не- сколько гармоник с одинаковым частотным интервалом в одно ощущение «высоты тона», это принципиальное свойство слухово- го процессора (высших отделов коры головного мозга): из сложного внешнего звукового мира он выделяет звуки и группирует их по ка- ким-то признакам («группировка звуковых потоков» — по месту, по времени начала и конца, по периодичности повторений и т. д. — см. разд. 3.10), т. к. кратковременная память оперирует только ше- стью-семью символами и без группировки мозг не может прини- мать быстрых решений. В настоящее время принята гипотеза, согласно которой цен- тральный процессор, получив информацию от периферической слуховой системы о наличии компонентов с кратными периодами в музыкальном звуке, группирует их и сравнивает с некоторым за- писанным в памяти гармоническим шаблоном (template) (см. разд. 3.10), в котором имеются все последовательные гармоники. Для каждого входного сигнала подбирается гармонический шаблон, который ему лучше подходит. В соответствии с этой моделью фундаментальная частота подобранного шаблона и будет воспри- нимаемой высотой тона. В случае, если два шаблона с разными фундаментальными частотами подходят к данному сигналу, можно услышать или неопределенную высоту, или две высоты. В случае отсутствия фундаментальной частоты сравнение произ- водится по отдельным гармоникам: если удается подобрать хотя бы несколько гармоник, которые подходят под эталон, то по по- вторяющемуся интервалу между ними определяется «виртуаль- ная» высота тона. Наиболее важными для синтеза ощущения вы- соты тона являются первые шесть-семь развернутых гармоник. Компоненты сигнала, которые ведут себя аномально (например,
164 Глава 3 одна гармоника включается-выключается или резко отличается от шаблона), выделяются центральным процессором и им присваи- вается отдельная высота тона. Таким образом, в соответствии с этой моделью гармоники собираются вместе, сравниваются центральным процессором с гармоническим эталоном (шаблоном) и по нему синтезирует- ся высота музыкального тона. Слуховая организация определения высоты представляет собой процесс объединения различных звуков (гармоник) в одно ощуще- ние высоты, это первичный идентификатор, позволяющий отделять данный звук от других объектов. Слуховой анализ консонансов и диссонансов Способность слуховой системы к спектральному анализу и оп- ределению частотных интервалов между гармониками, которая является базой для определения высоты, лежит в основе ощуще- ния «консонантности» или «диссонантности» звучания различных музыкальных интервалов и аккордов. Консонанс (от французского слова consonance) означает согла- сие (согласное звучание), соответственно диссонанс — несоглас- ное, нестройное звучание. Эти понятия можно рассматривать как с позиций музыкально-психологических, так и с позиций психоаку- стических, т. е. рассмотреть, как влияют на их восприятие частот- ные соотношения между гармоническими составлющими сложных музыкальных звуков. Ощущение диссонантности или консонантно- сти созвучий также связано с наличием критических полос, т. е. с конечной разрешающей способностью слуховой системы. Как было показано в главе 2, при наличии двух тонов с близки- ми частотами (менее 15 Гц) возникает эффект биений (амплитуд- ной модуляции), который воспринимается как крайне неприятное Эксперименты, проделанные известными учеными Пломпом (Plomp) и Левельтом (Levelt) с большой группой слушателей (среди которых не было про- фессиональных музыкантов, по- скольку их слух натренирован на заученные образцы консо- нантных и диссонантных созву- чий) [32], позволили установить, при какой разнице по частоте два чистых синусоидальных зву- ка воспринимаются как «прият- ные» (консонантные) и «резкие, неприятные» (диссонантные). Результаты экспертиз были ко- ' 0,2 0,4 0,6 0,8 1,0 Ширина ) критической полосы Рис. 3.7.7. Зависимость степени ощущения консонантности (диссо- нантности) интервалов между двумя чистыми тонами от ширины крити- ческой полосы
Восприятие звука. Основы психоакустики 165 личественно обработаны и представлены на графике (рис. 3.7.7). Максимальная приятность звучания соответствует значению консо- нанса, равному 1, диссонанса — соответственно равному 0 и на- оборот. Как видно из графика, если разница частот равна нулю, т. е. два тона звучат в унисон, то это «совершенный» консонанс. Если разница частот больше, чем критическая полоса, то это созвучие также звучит как консонанс. Для частот, разница между которыми составляет от 5% до 50% ширины критической поло- сы, созвучие воспринимается как диссонанс. Максимальный диссонанс прослушивается, когда разница составляет одну чет- верть от ширины критической полосы (ширина эта меняется с частотой — рис. 3.3.5). Поэтому два тона могут звучать как консонатный интервал в одной октаве и как значительно менее консонантный (или даже диссонантный) в другой. Эти результаты полезно иметь в виду при составлении различных электронных му- зыкальных композиций и компьютерной обработке звука. Полученные результаты могут служить базой для определения степени консонансности различных интервалов и музыкальных ак- кордов сложных музыкальных тонов, содержащих в спектре боль- шое количество гармоник [2]. В этом случае биения могут возни- кать как между фундаментальными частотами различных тонов, так и между их гармониками. Используя полученные выше резуль- таты для простых тонов, можно количественно оценить степень консонантности (диссонантности) отдельных музыкальных интерва- лов. Например, в таблице 3.7.1 рассмотрены два тона, отношение фундаментальных частот которых равно 3 : 2 (т. е. квинте), нижняя частота 220 Гц. Таблица 3.7.1 Первые Гармо- Разница Средняя Ширина Половина Степень семь ники между частота критической ширины консонант- гармоник верх- частотами между полосы критич. ности-дис- нижнего него двух соседних гармони- Для fcp: полосы со н а нт- тона тона гармоник ками ности C4 Гц G4 Гц d /«, ГЦ А/, Гц 1/2Д/,Гц С, с, D, d 220 440 330 110 385 65 32,5 С 660 660 0 унисон - С 880 1100 990 110 1045 133 66,5 d 1320 1320 0 унисон - С 1540 1650 110 1595 193,5 96,7 d Методика оценки степени консонантности (диссонантности) ин- тервала основана на сравнении разницы частот двух соседних
166 Глава 3 гармоник с шириной критической полосы, соответствующей сред- ней частоте между ними: — если две гармоники имеют равные частоты (или различие между ними меньше 5% от ширины критической полосы), то они обозначаются как «совершенный консонанс» — С; — если разница между двумя гармониками по частоте больше ширины критической полосы (столбец 3 и 5), то это тоже консо- нанс — с; — если разница между частотами ближайших гармоник меньше ширины критической полосы, то это диссонанс — d; — если эта разница меньше половины ширины критической по- лосы, то это «совершенный диссонанс» — D. Если частотная разница между большинством гармоник двух тонов больше ширины критической полосы (или ее половины), то такое созвучие будет восприниматься как консонанс, поэтому, на- пример, квинта относится к консонантным интервалам. Как следует из практики и подтверждается вышеприведенной методикой, уменьшающиеся интервалы между высокими гармони- ками (7 : 8, 8 : 9 и др.) звучат более диссонантно,чем интервалы между первыми гармониками (1 : 2, 2 : 3, 3 : 4 и др.). Решающую роль в слуховом ощущении степени консонантности (диссонантно- сти) интервала играют развернутые первые 6-7 гармоник, как и при определении высоты тона. Таким образом, способность слуховой системы воспринимать определенные сочетания звуков как благозвучные (консонантные) или раздражающие (диссонантные) связана с конечной разреша- ющей способностью слуховой системы и является ее фундамен- тальным свойством. 3.8. МУЗЫКАЛЬНЫЕ ШКАЛЫ И ИНТЕРВАЛЫ Как уже было рассмотрено в предыдущих разделах, слуховой аппарат воспринимает звук в широком диапазоне частот от 20 до 20000 Гц. Дифференциальные пороги слуха (см. разд. 3.2) состав- ляют AfIf = 0,3% (в работе [4] указаны значения 0,1-0,2%). В пре- делах слышимого диапазона слуховая система различает по высо- те примерно 620 градаций, однако различные культуры используют для создания музыки только ограниченный дискретный набор зву- ков, называемый музыкальными шкалами (лат. scala — лестница) [11]. Причем градации между этими звуками, используемыми, на- пример, в классической музыке, превышают в среднем слуховые пороги более чем в двадцать раз. Музыкальная шкала (звукоряд) — «совокупность звуков ка- кой-либо системы, расположенных в определенном порядке (обыч- но в постепенно восходящем)» [2, 8, 11, 16, 18, 28].
Восприятие звука. Основы психоакустики 167 Почему для создания музыки используются, в основном, звуки, изменение высоты которых должно происходить дискретными скачками (а не непрерывно, в виде скользящих тонов, как, напри- мер, у звуков, издаваемых дельфинами), и почему количество этих тонов очень ограничено и при этом значительно меньше общего количества звуковысотных градаций, которые слух может раз- личить, — это проблема, которой в настоящее время активно занимается психоакустика [7, 8]. Существует несколько гипотез для ответа на эти вопросы: во-первых, процесс обработки звуков в слуховой системе обладает определенной инерционностью (для распознавания высоты требуется примерно 15-60 мс, тембра — 200 мс); во-вторых, мозгу легче обрабатывать, идентифицировать и сохранять в памяти мелодию, состоящую из временной последо- вательности дискретных высот, которые находятся в определенных соотношениях друг с другом. Это увеличивает возможности для сравнения с уже записанными в памяти образцами мелодий. В-третьих, обработка, идентификация и сохранение скользящей последовательности тонов требовали бы больше информационных ресурсов, чем дискретная последовательность. Следующая прин- ципиальная причина использования ограниченного числа тонов состоит в физических возможностях музыкальных инструментов, где в качестве вибраторов используются тела, имеющие дискрет- ный набор резонансных частот, — струны, трубы духовых инстру- ментов и т. д. Отбор звуков для построения музыкальных шкал (т. е. конкрет- ная сетка частот, используемая в каждой музыкальной культуре) уникален, он зависит от традиций, опыта и т. д., но психоакустиче- ская основа ощущения консонанса (согласия) и диссонанса (несо- гласия) примерно одинакова, именно она составляет базовую ос- нову отбора тонов для построения музыкальных шкал. В книге известного психоакустика Редерера (J. Roederer) «Физика и психо- физика музыки» [8] предлагается даже такое определение музы- кальной шкалы, как «дискретная последовательность тонов (вы- сот), организованная таким образом, чтобы получить максимально возможное число консонантных комбинаций, когда две или более нот из этой последовательности звучат одновременно». Прежде чем переходить к принципам построения музыкальных шкал в европейской музыке (принципы построения музыкальных шкал в других музыкальных культурах имеют существенные разли- чия, с ними можно познакомиться в литературе [29, 30]), необхо- димо рассмотреть количественные соотношения частот в музы- кальных интервалах, т. е. их интервальные коэффициенты.
168 Глава 3 3.8.1. Музыкальные интервалы и интервальные коэффициенты Тональная музыка требует для построения мелодии и гармонии звуков с четко идентифицируемой высотой (см. разд. 3.7). Для это- го звук должен иметь выраженную периодическую структуру (см. разд. 3.7), иначе слуховая система не может идентифицировать его высоту. Именно по этой причине в большинстве музыкальных инструментов используются вибраторы (струны, столбы воздуха, бруски и др.), резонансные частоты которых находятся в целочис- ленных соотношениях, т. е. в их спектре все обертоны являются гармониками (см. гл. 2), поскольку именно такие вибраторы при ко- лебаниях создают звуковые сигналы с периодической структурой. Как было показано в главе 2, число собственных частот лю- бого вибратора, как распределенной механической системы, бесконечно велико. Поэтому при передаче энергии вибратору (например, при ударе по клавише рояля, которая приводит в действие клавишный механизм, заставляя молоточек ударять по струне, — см. гл. 4) происходит возбуждение его на всех соб- ственных частотах. Таким образом, каждый музыкальный тон представляет собой одновременно звучащий аккорд, содержащий основную частоту и все высшие гармоники. Число возбуждаемых гармоник бесконечно велико, но, во-первых, амплитуды их быстро убывают; во-вторых, только ограниченное число гармоник попадает в слышимый диапазон частот до 16-20 кГц; в-третьих, особенно- сти обработки звука на базилярной мембране (см. разд. 3.1) пока- зывают, что реальное значение для восприятия тембра имеют только первые пятнадцать-семнадцать гармоник. Физическое устройство многих музыкальных инструментов позволяет воспро- изводить только несколько первых гармоник со значительными амплитудами, остальные быстро затухают — напри- мер, у флейты, тубы и др. На рис. 3.8.1 пред- ставлена зависимость зву- кового давления от частоты для ноты А4 с фунда- ментальной частотой f0 = 440 Гц, спектральный анализ которой позволяет представить этот сигнал в виде суммы гармоник (см. гл. 2) с целочислен- ным отношением частот: 1:2:3:4:5: 6... (рис. 3.8.2). Очевидно, что скрипка гобой ' U мс J Щ t, I I MC -4 Рис. 3.8.1. Уровнеграмма звука (зависимость уровня звукового давления от частоты) для ноты А4, сыгранной на скрипке, трубе, флейте, гобое
Восприятие звука. Основы психоакустики 169 сигнал может быть представлен в виде суммы синусоидальных колебаний со следующими час- тотами: If0= 440 Гц; 2/„= 880 Гц; 3f0 = 1320 Гц; 4 f0 = 1760 Гц и т. д. Если представить расположе- ние гармонического (обертоно- вого) ряда на нотном стане, ко- торое показано как пример для ноты СЗ на рис. 3.8.3, и пред- ставить интервалы между гар- мониками в виде отношения их частот, то можно получить набор классических музыкальных ин- тервалов, которые используются в современной музыке: отноше- ние частоты второй гармоники к первой равно 2:1, этот интер- вал равен октаве, третьей гар- моники ко второй — 3:2 (квин- та); 4:3 — кварта, 5:4 — большая (мажорная) терция, 6:5 — малая (минорная) терция, 7:6 — узкая малая (бемоль- минорная) терция; 8:7 — широкая большая (диез-мажорная) секунда, 9:8 — большой (мажорный) целый тон, 10:9 — малый (минорный) целый тон и т. д. [16].
170 Глава 3 Отношения частот для интервалов между несмежными гармоника- ми в этом ряду также видны на рис. 3.8.3: например, музыкальный интервал между четвертой гармоникой и первой 4:1 — две окта- вы, между девятой и шестой 9:6 — квинта и т. д. Музыкальные интервалы с таким отношением частот называются «чистыми». Отношение частот, соответствующее каждому интервалу, называется его интервальным коэффициентом. С помощью интервальных коэффициентов можно найти любые музыкальные интервалы, представляющие собой комбинации вы- шеуказанных. При этом должно выполняться следующее правило: чтобы сложить два интервала, надо умножить их интервальные коэффициенты, а чтобы вычесть один из другого, надо разде- лить их интервальные коэффициенты. Например, два музыкальных интервала — квинта и кварта — в сумме дают октаву; значит, их интервальные коэффициенты на- ходятся в следующих соотношениях: (4 : 3) • (3 : 2) = 2 : 1. Для того чтобы найти интервальный коэффициент большой сексты, надо учесть, что она получается вычитанием из октавы малой терции, — значит, ее интервальный коэффициент равен: (2 : 1) : (6 : 5) = 5 : 3. А4 /о= 440,0 Гц /0= 32¾ Гц Щ I* +1 + l+l+l Hj I+ I ♦ ! «! 1+ /,= 220.0 Гц [^jI +> +! + 1 + !♦ !+ '? t «i ♦I ! i—■—H 1 I ' 0 500 1000 1500 2000 2500 3000 3500 4000 20000 Линейная частота, Гц ► А4 440,0 Гц Е4 /,= 329,6 Гц A3 /0= 220,0 Гц I I \41 + +!++:+ + + + I+MH + + 1 * +t+ ! ! I Ь + ч ь 0 200 400 600 1000 2000 4000 6000 Логарифмическая частота, Гц ^ Рис. 3.8.4. Расположение первых десяти гармоник на линейной и логарифмической частотных шкалах
Восприятие звука. Основы психоакустики 171 < Полный слуховой диапазон ► Малаятерция| | | HЩ* ++1+ 4+ M4+ Hк+++!++■H+kkHH+++I Больш||секста| | j ft JIfJ * | *| |.| Jf1Jj. f |» | |»| | |f| *| Чистаякварта! | | H Ц К + +1* H M HI+ + +I+ H M Ш * I Чиста^квинта! | | MIHI- *i H HfHH * I* H4IHII* +1 °™ ! I IHl!!'* !*! и Hit! 1 !1 !!t!!! * 1 21 2¾ 40 100 2(1о 4(Jo 1о!э02о'оО 400010000 2(1оОО Логарифмическая частота, Гц ► Рис. 3.8.5. Расположение интервалов на логарифмической частотной шкале Если расположить гармоники на линейной и логарифмической частотной шкале (на рис. 3.8.4 представлены первые десять гар- моник для нот А4, Е4, A3), то видно, что расстояния между гармо- никами на линейной шкале равны между собой, на логарифмиче- ской же шкале они прогрессивно уменьшаются. Использование логарифмического представления частоты дает возможность придать равное расстояние тем интервалам на час- тотной шкале, которые слухом воспринимаются как одинаковые. Например, октавы в нижней части диапазона с отношением частот 100 : 200 Гц и в верхней части диапазона с отношением частот 1000 : 2000 Гц на линейной шкале отличаются по расстоянию в десять раз, а на логарифмической шкале интервал в одну октаву соответствует одинаковому расстоянию в любой части диапазона (рис. 3.8.5). Умножение (деление) расстояния на логарифмической шкале в 2 : 1 раза соответствует увеличению (уменьшению) музы- кального интервала на октаву, умножение на 3 : 2 эквивалентно увеличению интервала на квинту и т. д. Поскольку высота тона воспринимается пропорционально лога- рифму частоты (закон Вебера — Фехнера), то и музыкальные ин- тервалы воспринимаются в соответствии с их расстояниями на ло- гарифмической шкале частот. Таким образом, логарифмическое представление интервалов на шкале частот соответствует слуховому механизму анали- за высоты музыкального тона. Пользуясь этими закономерностями, всегда можно определить, сколько октав (так же как и других интервалов) содержится внут- ри диапазона с любым соотношением частот. Если интервальный коэффициент заданного диапазона S = fe/fH, то чтобы определить, из скольких п октав он состоит, надо умножить интервальные коэффициенты октав (п) раз (2 : 1) ( 2 : 1) (2 : 1)... = S или 2n= S; отсюда, если взять логарифм от обеих частей этого равенства, по- лучится: Ig S = n lg2 или n = 3,322 Ig ///„.
172 Глава 3 Рис. 3.8.6. Музыкальные интервалы между гармониками, сведенные внутрь одной октавы /в 1760Гц отсюда 55Гц n = 3,3221 Ig 1760Гц 55Гц = 5, т. е. в этом интервале (А6-А1) находит- ся пять октав. Для других интервалов это соотношение имеет следующий вид: где к — интервальный коэффициент требуемого интервала; напри- мер, чтобы узнать, из скольких квинт состоит диапазон S, надо взять к = 3/2, для кварт — 4A}, больших терций — 5/4 и т. д. Музыкальные интервалы между гармониками уменьшаются по мере увеличения их номера в следующих пропорциях: 2:1>3:2>4:3>5:4>6:5, ит. д.). Если все возможные расстояния между гармониками привести в одну октаву, то полу- чится ряд музыкальных аккордов, представленных на рис. 3.8.6. По мере развития гармонии в европейской музыке происходило . введение все уменьшающихся интервалов между возрастающими по номеру гармониками [16]. 3.8.2. Принципы построения музыкальных шкал i (шкала Пифагора, чистая шкала, равномерно темперированная шкала) Хотя число музыкальных шкал (как дискретных последователь- > ностей звуков, расположенных в определенном порядке [11, 28, 46]) теоретически может быть построено почти бесконечно боль- i шим, в музыкальных культурах разных стран используется относи- i тельно небольшое их количество. Простейшие шкалы, построенные интуитивно, можно найти в древних и примитивных культурах: например, шкалы состоящие из одного-двух-трех интервалов, использовались в музыке Цейло- на, Восточной Сибири и Америки. Более сложные музыкальные шкалы нашли применение в музыке развитых культур, причем п =
Восприятие звука. Основы психоакустики 173 строились они по определенным правилам, исходя из потребно- стей музыкального искусства. Одной из распространенных шкал оказалась пентатоника, имеющая очень широкое распростране- ние в музыке Японии, Китая и в европейской народной музыке, она также широко использовалась в Греции и ранних грегориан- ских песнопениях. Шкала состоит из пяти тонов, например C-D- E-G-A (хотя имеются и другие ее варианты ). В европейской куль- туре применялась диатоническая шкала, построенная на пяти целых тонах и двух полутонах. Ее варианты (мажорный и минор- ный) используются в европейской музыке более трехсот лет. Ком- позиторы XIX-XX веков начали более активно вводить принципы композиции, основанные на более сложной хроматической шкале, состоящей из двенадцати полутонов в октаве. Наконец, в XX веке, особенно в связи с возможностями компьютерных технологий, используются микротоновые шкалы с интервалами меньше полу- тона (например, четвертитоновые). Таким образом, поиски новых вариантов шкал для музыкальных композиций все время продол- жаются. Способы построения шкал, оказавших наибольшее влияние на развитие европейской музыки, кратко рассмотрены ниже. Пифагорийская шкала В основе построения шкалы лежит принцип использования «чи- стых» интервалов с малым соотношением чисел (интервальных коэффициентов): 2:1 — октава, 3:2 — квинта, 4:3 — кварта. Такой принцип был предложен прежде всего потому, что, во- первых, это были наиболее совершенные консонантные интерва- лы, во-вторых — это соответствовало идее Пифагора о гармонии малых чисел, в-третьих — Пифагор экспериментировал со струна- ми, и тогда уже было понятно, как можно физически обеспечить звуки такой шкалы: чтобы повысить тон на октаву, надо струну уко- ротить в два раза; чтобы понизить, надо удлинить струну в два раза; чтобы повысить тон на квинту, надо взять 2/д струны, а если взять от нее еще то тон повысится еще на квинту и т. д. Задача состояла в том, чтобы создать шкалу с максимально возможным числом чистых октав, квинт и кварт, а остальные ин- тервалы должны были быть получены как производные от них, с тем соотношением частот, которые удастся получить. Способ построения шкалы заключался в следующем (рис. 3.8.7): если взять за основу какую-то ноту, например ноту С (до), и добавить к ней квинту, получится нота G (соль), при этом интер- вальный коэффициент fG: fc = ^/j. Если добавить еще квинту (т. е. умножить ^ на 3^)1 то получится нота D (ре) с интерваль- ным коэффициентом к С (З/2)2. Двигаясь дальше на квинту, мож- но получить ноту А (ля) с интервальным коэффициентом к С (З/2)3, затем ноту E (ми) с интервальным коэффициентом (З/2)4 и ноту В
174 Глава 3 с коэффициентом (3½)5. Чтобы полу- чить седьмую ноту, можно сделать один переход на квинту вниз F (фа) с интервальным коэффициентом по от- ношению к С, равным (2/з) (вычесть квинту — значит, поделить на 1 : 3/2). Таким образом, получается семь нот со следующими интервальными коэф- фициентами относительно ноты С (до): 2/3. 1. 3/2. (3Z2)2. (3Z2)3. (3Z2)4. (3Z2)5. которые после возведения в степень оказываются равными: 2/о, 1, 3/о, 9/ф 27Z8. 81Z16, 243/32. Отсюда видно, что все ноты, кроме первых двух, выходят за пределы октавы; чтобы их ввести внутрь октавы, надо вычесть одну, две или три октавы соответственно, т. е. поделить на 2Ai1, (2I^ х 2Aj) и т. д. Результаты представлены в таблице 3.8.1. Таблица 3.8.1 Рис. 3.8.7. Квинтовый круг, основа построения шкалы Пифагора-^ Ноты С D E F G А В с Интерв. коэфф, к ноте С 1Zl % 81Z64 4Z3 3Z2 27Zl6 243Zl28 2Zl Интерв. коэфф. между нотами 9Z8 00S о ^£ 9Z8 9Z8 00J о ^£ CD Ц ю о CN С CD Ц TOH тон тон TOH ТОН Ю О CN С Получилась диатоническая шкала, в которой целый тон имеет интервальный коэффициент ^Iq, а полутон ^^243 (диатонический). Можно продолжить квинтовые переходы (рис. 3.8.7), каждый тон перенести внутрь октавы и получить более полную хроматическую шкалу. Но здесь возникают проблемы. 1) Никаким количеством квинтовых переходов не попасть точ- но в ноту С (на октаву выше), поскольку любое целое число квинт не равно целому числу октав: (3/2)m * (^/i)n. Ближе всего подходят 12 квинтовых переходов к 7 октавам, но CVC = (3/г)12 = 129,764, а семь целых октав дают (2/<|)7 = 128,0, т. е. при квинтовых переходах «проскакивается» нота С, получает- ся нота С" с отношением частот CVC = 129,764/128,0 = 1,01364. Эта разница составляет примерно V9 целого тона или V4 полуто- на. Она называется Пифагоровой коммой (комма-интервал мень- ше целого тона).
Восприятие звука. Основы психоакустики 175 Шкала Пифагора | I I I «Чистая» I шкала Равномерно- темпери- рованная шкала q С Dtif D еУ E F gM G аУ а В С ! и I) Il J11 FiU7 gSa1, / аУ7 I j Il [ Il (1Ij \ \ I V \ I t \ I 200 400 600 800 1000 1200 Рис. 3.8.8. Расположение полутонов на частотной шкале (в центах) для трех видов шкал: Пифагора, чистой и равномерно темперированной шкалы 2) Если двигаться квинтами вниз от ноты С (т. е. вычитать квин- ты или делить на ^), то получится нота С" ниже С на эту же ве- личину. При этом ходы вверх дают диезы к нижней ноте, а ходы вниз — бемоли к верхней ноте. Оказывается, что частоты нот с диезами и бемолями не совпадают. Внутри каждой пары нот в диатонической гамме появляются две ноты с диезами и бемолями (рис. 3.8.8), расстояние между ко- торыми равно также 1,01364. Таким образом, в этой шкале отсут- ствует энгармонизм [28]. 3) Кроме того, полутоны в хроматической гамме, например меж- ду F и F-диез, равны 1,068 и не равны полутонам в диатонической гамме (256/243 = 1.053). Диатонический полутон получается за 5 квинтовых переходов, его интервальный коэффициент равен 243/256, а хроматический за 7 квинтовых переходов с интервальным коэффициентом — 2048/2^jQy1 отсюда разница 1,01364. Таким образом, получается два разных полутона с разницей также 1,01364 (23,5 цента). Построенная таким образом шкала может считаться однофак- торной, все интервалы получаются в ней за разное число квинто- вых переходов [47]. Достоинство шкалы Пифагора состоит прежде всего в том, что в ней используются чистые квинты и кварты. Это значительно облегчает настройку инструментов. Недостатком является то, что строй получается незамкнутым с отсутствием энгармонизма, поэтому невозможно делать транспо- нирование мелодии. Кроме того, в нем отсутствует чистая терция, т. к. чистая терция дает интервальный коэффициент ^/4 = 1,25, а за четыре квинтовых перехода удается получить ^/54 = 1,265. Такое несоответствие приводит к биениям, которые ощущаются на слух.
176 Глава 3 Натуральная (чистая) шкала (Just Scale) Выдающиеся теоретики XVI века Фольяни и Царлино предложи- ли музыкальную шкалу, в которой большая (мажорная) терция со- хранялась как основной интервал с соотношением 5:4, чего не было в пифагоровой шкале. При построении диатонической шкалы в этой системе был применен следующий способ: для сохранения чистых интервалов октавы, квинты и большой (мажорной) терции использовался принцип построения мажорных трезвучий с соотношением частот 4:5:6 (большая терция и чистая квинта) от 1-й, 4-й и 5-й ноты октавы, т. е. тоники, субдоминанты и доминанты. В результате получается диатоническая шкала с соотношением частот, показанным в таблице 3.8.2. Таблица 3.8.2 С D E F G А В с Интервальный коэфф. к С 1 15Z8 2Zl Интервальный коэфф. между нотами % 1% 16/15 9Z8 1% 16Zl5 Достоинством этой шкалы является введение чистой терции, октавы, квинты и кварты; это дает возможность использовать чи- стые мажорные и минорные трезвучия. При этом попарно можно сформировать на такой шкале 16 консонантных и 10 диссонантных интервалов [8]. Недостатком является то, что в этой шкале получается два целых тона (мажорный ^Iq и минорный Ю/g), а также отсутствует энгармонизм (несовпадение по высоте нот с диезами и бемолями), в связи с чем невозможно транспонирование по высоте [16], — поэтому данная шкала и не получила широкого распространения. Равномерно темперированная шкала Совершенно очевидно, что требовалось создание шкалы, кото- рая была бы построена на некоторой компромиссной основе, но обеспечивала бы возможность транспонирования и обладала бы замкнутостью и энгармонизмом. Попытки построить такую шкалу предпринимались в течение длительного периода времени матема- тиками и музыкантами (И.Кеплером, Л.Эйлером, Ж.Совёром и др.). В конце XVII — начале XVIII века усилиями теоретиков М. Мерсенна (1588-1648), А. Веркмайстера (1685-1737), И. Нейд- гарта (1685-1739), И. Кирнбергера (1721-1783) и музыкантов И. С. Баха, Д. Скарлатти, Ф. Куперена и др. такая шкала была создана и получила название равномерно темперированной шка- лы [2, 8, 11, 16, 20, 29, 30].
Восприятие звука. Основы психоакустики 177 Темперированной она называется потому, что содержит после- довательность тонов с математически строго определенными ча- стотными соотношениями (temperare — упорядочивать, приводить в порядок). Разновидности этой шкалы, отличающиеся последова- тельностью расположения целых тонов и полутонов, называются ладами. Для того чтобы можно было транспонировать мелодию с сохра- нением звуковысотных соотношений (например, на октаву или дру- гой интервал вверх или вниз), требовалось создать шкалу, в кото- рой все интервальные коэффициенты были бы одинаковы, независимо от того, где интервалы располагаются на шкале. Для этого было предложено пифагорову комму разделить на 12 равных частей и на каждую из этих частей уменьшить все две- надцать квинт (рис. 3.8.7), при этом каждая квинта сократится на V-| 08 тона. Такие двенадцать квинт дадут в сумме точно семь октав, при этом совпадут энгармонически равные звуки (диезы и бемоли). Поскольку целый тон получается за счет двух квинтовых переходов, то, уменьшив каждый целый тон на V54, в октаве уда- ется получить точно шесть целых тонов. Полутоны хроматические и диатонические при этом совпадают, и в октаве содержится точ- но двенадцать полутонов. Таким образом, чтобы получить интервал, равный октаве, надо сложить двенадцать интервалов, равных полутону. Как уже было сказано выше, при сложении интервалов их интервальные коэффи- циенты умножаются. Если обозначить интервальный коэффициент (т. е. отношения частот) полутона как S1 то для получения октавы надо умножить их друг на друга двенадцать раз: SxSxS... = S12. Поскольку интервальный коэффициент октавы равен 2:1, то S12=2 и отсюда S= 1^2 = 1,0595. Значит, интервальный коэффициент полутона в темпериро- ванной шкале всегда равен 1,0595. Например, если нота ля (А4) имеет частоту 440 Гц, то нота ля- диез имеет частоту 440 х 1,0595 = 466,18 Гц. Чтобы в равномер- но темперированной шкале получить значение частоты для лю- бой ноты, надо, взяв за основу значение частоты какой-либо ноты, например до (С4) = 261,6 Гц, умножить его на S столько раз, на сколько полутонов отличается данная нота от С4. Значе- ния частот для всех нот равномерно темперированной шкалы даны на рис. 3.8.9. Для более мелкого деления интервалов в темперированной шка- ле используется понятие цент; при этом каждый полутон делится на 100 центов. В этом случае интервальный коэффициент цента С определяется следующим образом: CxCxCx С...= С100 = S5 т- е- с = 10^l7o595 = 1,000578.
178 Глава 3 Значение . Гчастоты *0> р Обозначение 261.6 С4 ' 293.7 D4 329.6 Е4 349.2 F4 392,0 G4 440,0 А4 493,9 В4 523.3 С5 587,3 D5 659,3 Е5 698,5 F5 784,0 G5 880,0 А5 987.7 В5 1047 С6 1175 D6 1319 Е6 1397 F6 1568 G6 1760 А6 1976 В6 2093 С7 2349 D7 2637 Е7 2794 F7 3136 G7 3520 А7 3951 В7 4186 С8 Гц ноты п Cf4 F|4 G§4 А|4 С|5 D#5 F|5 G|5 А»5 Cjj6 D|6 F»6 Gjt6 A|6 C#7 D#7 F|7 G«7 A#7 277,2 311,1 370,0 415,3 466,2 554,4 622,3 740,0 830,6 932,3 1109 1245 1480 1661 1865 2217 2489 2960 3322 3729 Г, Значение частоты р-Обозначение Гц ноты 16,35 СО 18,35 DO 20,60 EO 21,83 FO 24,50 GO 27,50 А0 30,87 ВО 32.70 Cl 36.71 Dl 41,20 El 43,63 Fl 48,00 Gl 55,00 Al 61,74 Bl 65,41 C2 73,43 D2 82,41 Е2 87,31 F2 98,00 G2 110,0 А2 123,5 130,8 146,8 164,8 174,6 196,0 220,0 247,0 В2 СЗ D3 ЕЗ F3 G3 A3 ВЗ ~1 с*о DjO FfO G#0 А|0 FlI G|l All т F»2 G«2 A»2 C»3 D|3 F|3 G|3 A«3 17,32 19,45 23,13 25,96 29,14 34,64 38,89 46,25 51,91 58,27 69,30 77,78 92,50 103,8 116,5 138,6 155,6 185,0 207,7 233,1 Рис. 3.8.9. Значения частот для нот равномерно темперированной шкалы Следовательно, интервальный коэффициент цента в равно- мерно темперированной шкале равен 1,000578. Аналогично тому, как это выше было сделано для определения количества октав в любом интервале частот, можно определить, сколько центов содержится в интервале с заданным интерваль- ным коэффициентом г = fJ(JTu)Zfн(Тц). Для этого надо умножить интервальные коэффициенты всех центов, из которых он состоит, т. е. С • С • С... = Сп, и приравнять их к заданному интервальному коэффициенту г = Сп. Значит, n IgC = Ig г, отсюда число центов в любом интервале равно: л = Ig г/lg С = 3,986 Ig г. Например, у чистой квинты г = 3/2, отсюда число центов равно n = 702; у чистой кварты г = 4/з и число центов равно 498; у ок- тавы г = 2/i и число центов равно 1200 и т. д. В равномерно темперированной шкале октава состоит из 12 по- лутонов и, следовательно, 1200 центов, квинта — из 7 полутонов и 700 центов, кварта из 5 полутонов и 500 центов и т. д. Если пе- ресчитать отсюда интервальные коэффициенты для этих интерва- лов по вышеуказанной формуле, то получится, что интервальный коэффициент квинты равен 1,498, кварты — 1,335 и т. д.
Восприятие звука. Основы психоакустики 179 Интервальные коэффициенты и количество центов для основ- ных музыкальных интервалов во всех трех рассмотренных выше музыкальных шкалах даны в таблице 3.8.3. Таблица 3.8.3 Интер- Равномерно Чистая Шкала вал темперированная шкала Пифагора шкала Отноше- Центы Отноше- Центы Отноше- Центы ния частот ния частот ния частот Октава 2,000 1200 2/1 = 2,000 1200 2,000 1200 Квинта 1,498 700 3/2 = 1,500 702 1,500 702 Кварта 1,335 500 4/3 = 1,333 498 1,333 498 Б. терция 1,260 400 5/4 =1,250 386 1,265 408 М. терция 1,189 300 6/5 = 1,200 316 1,184 294 Б. секста 1,682 900 5/3 = 1,667 884 1,687 906 М. секста 1,587 800 8/5 = 1,600 814 1,580 792 Отсюда видно, что темперированная шкала не обеспечива- ет ни одного (кроме октавы) чистого интервала — ни квинты (3Z2), ни кварты (4Z3), ни терции (5Z^ и др. Сравнение их из таблиц показывает, что в равномерно темпе- рированной шкале отклонение квинты от точной настройки — 2 цента, кварты — 2 цента, мажорной терции — 4 цента и т. д. Следует отметить, что хотя отклонения эти небольшие, все интер- валы становятся чуть более диссонантными. Однако эта шкала представляет собой «строй замкнутый и эн- гармонический, позволяет транспонировать мелодию, состоит из интервалов, вполне приемлемых для слуха как при мелодическом, так и при гармоническом воспроизведении, имеет в каждой окта- ве только двенадцать звуков, и поэтому требует относительно про- стого устройства инструментов» [11]. Равномерно темперированная шкала используется уже более 300 лет как стандартная для музыкальных инструментов с фикси- рованной настройкой. Однако эта шкала все время критикуется за отсутствие чистых интервалов (кроме октавы). Были попытки построить темперированный строй из 24 и 48 тонов в октаве. Математически было доказано, что самое близкое приближение к натуральным интервалам мог бы дать 53-тоновый звуковой тем- перированный строй, однако он практически не был реализован. Поскольку современные компьютерные технологии позволяют ре- ализовать шкалы с меньшими интервалами, попытки построения таких шкал в настоящее время продолжаются.
180 Глава 3 3.8.3. Стандартная высота тона Для настройки инструментов в ансамбле уже давно была оче- видна необходимость иметь универсальный стандарт высоты тона. Еще в 1619 году Преториус (Praetorius) предложил использовать в качестве эталонной высоты тона звук с частотой 422,5 Гц. В те- чение XVIII века использовались как стандартные (для настройки ноты ля первой октавы) различные частоты: например, в Париж- ской опере 404 Гц, для настройки органов в Дрездене 415 Гц и т. д. В 1711 году Джон Шор (John Shore) изобрел камертон, на- строенный на частоту 423,5 Гц. В 1751 году Гендель настроил свой камертон на частоту 422,5 Гц. Эта частота довольно широко ис- пользовалась в качестве эталонной в течение XVIII века, хотя были и другие, например 415 Гц. В 1812 году в Парижской консерватории была предложена как эталонная частота 440 Гц, в течение XIX века эта частота стала довольно широко использоваться при настройке инструментов, хотя были попытки использовать и более высокие частоты: напри- мер, для роялей «Стейнвей» — 454 Гц, в оперном театре Ковент- Гарден — 450 Гц и др. В 1859 году была назначена французским правительством комиссия из ведущих композиторов и музыкантов того времени (Россини, Берлиоз, Мейербер и др.), которая приня- ла в качестве стандарта значение частоты 435 Гц для А4. В последующие периоды наблюдалось стремление повысить стандартную частоту настройки — по-видимому, в связи с расши- рением использования в оркестре медных инструментов, которые ярче звучат при более высокой настройке. В 1939 году междуна- родная конференция в Лондоне приняла стандарт частоты для тона А4 равным 440 Гц. Этот стандарт является международным эталоном до настоящего времени (хотя следует отметить, что по- пытки повысить стандартную частоту все время продолжаются как при настройке роялей до 444 Гц, так и при настройке оркестров, особенно духовых до 454 Гц). При исполнении и при записи следует учитывать, что старинные инструменты (например, скрипки Страдивари) отличаются от со- временных по настройке опорного тона А4 почти на полтона. Для создания тона со стандартной частотой пользуются ка- мертонами, однако в настоящее время стандарт частоты обес- печивается с помощью специальных приборов на кварцевых кристаллах, которые создают звук частотой 440 Гц с большой точностью. Эталоны стандарта частоты хранятся в специальных учреждениях (например, в Институте метрологии им. Менделе- ева в Санкт-Петербурге).
Восприятие звука. Основы психоакустики 181 3.9. ТЕМБР Как уже было показано в предыдущих разделах, из анализа объективных параметров звукового сигнала, т. е. изменения его интенсивности во времени, слуховая система формирует такие субъективные характеристики как громкость, высота, локализация источника, маскировка и др. К числу важнейших субъективных характеристик звукового сигнала, являющихся базой для распозна- вания звукового источника, также относится тембр. Тембр (timbre) означает «качество тона», «окраску тона» («tone quality») [8, 16]. Американский стандарт ANSI-S3.20 дает ему такое определение: «Тембр — атрибут слухового восприятия, кото- рый позволяет слушателю определить, что два звука, имеющие одинаковую высоту и громкость, отличаются друг от друга». В трудах Гельмгольца (1877 г.) было сделано следующее за- ключение: «разница в музыкальном качестве тона (тембре) зави- сит только от присутствия и силы парциальных тонов (обертонов) и не зависит от разности фаз, с которой эти парциальные тоны вступают в композицию». Эта формулировка на многие годы (по- чти на сто лет) определила направление исследований в области восприятия тембра и претерпела существенные изменения и уточ- нения только в последние десятилетия. В трудах Гельмгольца был сделан также целый ряд тонких наблюдений, которые подтвержда- ются современными результатами: в частности, им было установ- лено, что восприятие тембра зависит и от того, с какой скоростью парциальные тоны вступают в начале звука и затухают в его кон- це, а также то, что наличие некоторых шумов и нерегулярностей помогает в распознавании тембров отдельных инструментов. В 1938 году Г. Флетчер исследовал зависимость тембра от изме- нения громкости и высоты тона. В 1960-е годы было установлено, что тембр является многоразмерным объектом восприятия и зави- сит от общей динамической обертоновой структуры звука, которая видоизменяется с изменением громкости и высоты тона. В 1973 году к определению тембра, данному в стандарте ANSI, было сде- лано следующее добавление: «Тембр зависит от спектра сигнала, но он также зависит от формы волны звукового давления, распо- ложения частот в спектре и временных характеристик звука». Только в 1976 году в работах Р. Пломпа [32] было показано, что ухо не страдает «фазовой глухотой» и восприятие тембра зависит как от амплитудного спектра (в первую очередь от формы спект- ральной огибающей), так и от фазового спектра. В 1990-е годы было отмечено, что тембр является субъективным атрибутом того или иного источника (например, голоса, музыкального инстру- мента), который позволяет выделить его из различных звуковых потоков. При этом слуховое ощущение тембра обладает достаточ- ной инвариантностью (стабильностью), что позволяет записать
182 Глава 3 и сохранить его в памяти и использовать для сравнения ранее записанной и вновь поступившей в слуховую систему информа- ции об источнике звука. В настоящее время проводится большой комплекс работ по компьютерному распознаванию тембров раз- личных музыкальных инструментов, что позволяет глубже понять природу этого слухового ощущения [35]. Тембр и стационарный спектр Современные компьютерные технологии позволяют выполнить детальный анализ временной структуры любого музыкального сигнала (это может сделать практически любой музыкальный редактор, например Sound Forge, Wave Lab, SpectroLab и др.). Пример временной структуры (уровнеграммы) звуков органа пока- зан на рис. 3.9.1. Как видно из представленной уровнеграммы (т. е. зависимости уровня звукового давления от времени), можно выделить три фазы: атаку звука (процесс установления), ста- ционарную часть, процесс спада. В различных инструментах, в за- висимости от используемых в них способов звукообразования, временные интервалы этих фаз существенно различаются. Как показали многолетние исследования, тембр зависит преж- де всего от спектра музыкального или речевого сигнала. На рис. 3.9.2 и 3.9.3 показаны временная структура (уровнеграмма) и ам- плитудные спектры кларнета и флейты. Для построения указанных спектров в стационарной части уровнеграммы выделяется некоторый отрезок по времени и проводится расчет усредненного спектра по данному отрезку. Такие стационарные спектры обладают индивиду- альными чертами, характерными для каждого музыкального ин- струмента, и зависят от механизма звукообразования в нем. Например, у флейты используется в качестве резонатора откры- тая с двух концов цилиндрическая труба (см. гл. 4) и поэтому в ее спектре содержатся все четные и нечетные гармоники, при этом амплитуда гармоник быстро уменьшается с частотой. У кларнета используется цилиндрический резонатор, закрытый с одного конца, поэтому в его спектре присутствуют в основном нечетные гармони- ки. У медных инструментов, например у трубы, в спектре много вы- сокочастотных гармоник. Соответственно тембр звучания у всех этих инструментов совершенно разный: у флейты — мягкий, неж- ный; у кларнета — глуховатый; у трубы — яркий, резкий. Анализ общей структуры спектров различных инструментов по- T зволяет сделать некото- рые выводы [36]: Рис. 3.9.1. Осциллограмма звуков органа. ^27£ Орган t, мс — при отсутствии или недостатке обертонов (особенно в нижнем ре- гистре) тембр звука ста- новится скучный, пустой (примером может слу-
Восприятие звука. Основы психоакустики 183 жить синусоидальный сиг- нал от генератора); — присутствие в спект- ре первых пяти-семи гар- моник с достаточно боль- шой амплитудой придает тембру полноту и соч- ность; — ослабление первых гармоник и усиление (по амплитуде) высших гармо- ник (от 6-7 и выше) прида- ет тембру резкость, скрипу- честь. Анализ огибающей ам- плитудного спектра для различных музыкальных инструментов позволил установить [36, 47]: плав- ный подъем огибающей (т. е. увеличение амплитуд определенной группы обертонов) в области 200-700 Гц дает возмож- ность получить оттенки сочности, глубины; подъем в области 2500- 3000 Гц придает тембру полетность, звонкость; подъем в области 3000- N Амплитуда 1 1,00 2 1,08 3 1,82 4 1,07 5 1,29 S 1,35 7 i;o6 8 u° [С 9 1,03 10 1,01 11 1,02 12 1,02 13 1,01 14 1,00 Номер гармоники Рис. 3.9.2. Периодическая структура и спектр звуков кларнета N Амплитуда 1 2 3 4 5 6 7 8 15мс10 11 12 13 14 1,00 1,08 1,82 1,07 1,29 1,35 1,06 1,10 1,03 1,01 1,02 1,02 1,01 1,00 Спектр ^ Номер 16 гармоники N Рис. 3.9.3. Периодическая структура и спектр звуков флейты 4500 Гц придает резкость, пронзительность и др. Существенное влияние оказывает группировка обертонов в формантные группы, особенно в области максимальной чув- ствительности слуха. Поскольку именно расположение формант- ных областей служит главным критерием различимости звуков речи (см. гл. 4), наличие формантных частотных диапазонов (т. е. подчеркнутых обертонов) существенно влияет на восприя- тие тембра музыкальных инструментов и певческого голоса. Тембр звучания музыки и речи изменяется в зависимости от изменения громкости и от транспонирования мелодии по высо- те: при изменении громкости звука восприятие тембра меняется — во-первых, потому, что при увеличении амплитуды колебаний виб- раторов различных музыкальных инструментов (струн, мембран, дек и др.) начинают проявляться нелинейные эффекты и это при- водит к обогащению спектра дополнительными обертонами, во- вторых, потому, что с увеличением уровня громкости изменяется
184 Глава 3 чувствительность слуховой системы к восприятию низких и высо- ких частот (кривые равной громкости приведены в разделе 3.3). Поэтому при повышении громкости (до 90-92 дБ) тембр стано- вится полнее, богаче, чем при тихих звуках (при дальнейшем увеличении громкости начинают сказываться сильные искажения в источниках звука и слуховой системе, что приводит к ухудшению тембра). Транспонирование мелодии по высоте также меняет восприни- маемый тембр: во-первых, потому, что обедняется состав спектра, т. к. часть обертонов попадает в высокочастотный диапазон выше 15-20 кГц; во-вторых, потому, что в области высоких частот пороги слуха значительно повышаются и высокочастотные обертоны ста- новятся неслышимыми. В звуках низкого регистра (например, в органе) обертоны усиливаются из-за повышенной чувствительно- сти слуха к средним частотам, поэтому звуки низкого регистра зву- чат богаче, чем звуки среднего регистра, где такого усиления обер- тонов нет. Для сохранения основных признаков тембра при транспонировании (переносе по частотной шкале) приниципиаль- но важным является сохранение формы огибающей амплитудного спектра (т. е. его формантной структуры) [2]. Таким образом, утверждение классической теории, что воспри- нимаемый тембр звука зависит от его спектрального состава, т. е. от расположения обертонов на частотной шкале, от соотношения их амплитуд, формы спектральной огибающей, спектрального рас- пределения энергии по частоте и др., безусловно справедливо и подтверждается многочисленной практикой работы со звуком. Тембр и нестационарный спектр В 1960-е годы начались первые попытки синтеза музыкальных звуков. Однако попытки воссоздать звучание инструмента по известному составу его усредненного спектра оказались неудачны- ми — тембр не был похож на звук реального инструмента; то же относится и к первым попыткам синтеза голоса. Именно в этот период, опираясь на возможности, которые предоставили компью- терные технологии, началось развитие другого направления — по установлению связи восприятия тембра с временной структу- рой сигнала и его нестационарным спектром. Каждый музыкальный инструмент (включая голос) обладает особой системой звукообразования, которая диктует свою времен- ною структуру сигнала и его динамику изменения. Сравнение вре- менной структуры звука у разных инструментов показывает их принципиальные различия; в частности, как было сказано выше, длительность всех трех частей звучания (атаки, стационарной ча- сти и спада) у всех инструментов различается по продолжительно- сти и по форме (см. гл. 4). Кроме того, у каждого инструмента принципиально отличается форма временной огибающей.
Восприятие звука. Основы психоакустики 185 Эксперименты показали, что если удалить часть временной структуры, соответствующей атаке звука, или поменять местами атаку и спад (проиграть в обратном направлении), или атаку от од- ного инструмента заменить на атаку от другого, то тембр данного инструмента опознать становится практически невозможным. Сле- довательно, для распознавания тембра принципиально важными элементами являются не только стационарная часть (усредненный спектр которой служит основой классической теории тембра), но и период формирования временной структуры звука (атака) и пери- од его затухания (спад). При прослушивании музыки и речи в любом помещении первые отражения поступают на слуховую систему после того, как атака и начальная часть стационарной части уже была услышана; в то же время на стационарную часть и спад звука от инструмента накла- дывается реверберационный процесс данного помещения, что зна- чительно маскирует звук и естественно приводит к модификации восприятия его тембра. Хотя слух обладает определенной инерци- онностью, как уже было сказано в разделе 3.2, тем не менее вре- мя между началом прихода прямого звука и моментами поступления первых отражений оказывается достаточным, чтобы распознать тембр звучания отдельного инструмента. По-видимому, этим обсто- ятельством и определяется инвариантность (стабильность) распо- знания тембра инструментов в личных условиях прослушивания. Современные музыкальные компьютерные программы позволя- ют достаточно детально проанализировать процессы установления звука у разных инструментов и выделить существенные акустиче- ские признаки, наиболее важные для определения тембра. Напри- мер, на трехмерном спектре звуков колокола, показанном на рис. 3.9.4, отчетливо виден процесс «развертывания» спектра, т. е. его нарастания, установления и спада. 20 44 115 255 6^0 1440 3(520 3620 20000 /Гц Рис. 3.9.4. Трехмерный спектр звучания колокола
186 Глава 3 Процесс атаки у большинства музыкальных инструментов и го- лоса продолжается несколько десятков мс; за этот период времени (иногда с переходом на стационарную часть) слух воспринимает постепенное расширение спектра во времени, поскольку вступают все новые обертоны с различной скоростью и амплитудой. По- скольку этот процесс «развертывания» обертонов является харак- терным для каждого инструмента, постольку он, очевидно, и слу- жит одним из главных признаков распознавания тембра. На этот процесс распознавания оказывают влияние также многие другие признаки: начальный скрип смычка, начало ноты на медном инст- рументе, шум дыхания, начальное прохлопывание язычка, ударный глухой звук молоточка на пианино, небольшая негармоничность обертонов и др., — все это создает живые акустические призна- ки идентификации инструмента. Примеры формирования атаки звука как во временной, так и в частотной области для различных инструментов показаны на рис. 3.9.5а, б. Например, сравнение атаки тона С4 у различных де- ревянных инструментов показывает, что процесс установления ко- лебаний у каждого инструмента имеет свой особый характер: — у кларнета доминируют нечетные гармоники 1:3:5, причем третья гармоника появляется в спектре на 30 мс позже первой, за- тем постепенно «выстраиваются» более высокие гармоники; — у гобоя установление колебаний начинается со второй и тре- тьей гармоники, затем появляется четвертая, и только через 8 мс начинает появляться первая (фундаментальная) гармоника; Тенор-саксоф| 2Q мс Гобой Юме 1 .I1L Л|Флеига 1 , liniblil, Труба Валторна t, MC Юме t, MC Рис. 3.9.5. а — атака звука у деревянных духовых инструментов: кларнет, гобой, флейта; б — атака звука у медных духовых инструментов: труба, тромбон, валторна, туба
Восприятие звука. Основы психоакустики 187 — у флейты сначала появляется первая гармоника, затем толь- ко через 80 мс постепенно вступают все остальные. На рис. 3.9.56 показан процесс установления колебаний для группы медных инструментов: трубы, тромбона, валторны и тубы. Отчетливо видны различия: у трубы — компактное появление группы высших гармоник, у тромбона первой появляется вторая гармоника, затем первая и через 10 мс вторая и третья. У тубы и валторны видна концентрация энергии в первых трех гармони- ках, высшие гармоники практически отсутствуют. Анализ полученных результатов показывает, что процесс атаки звука существенно зависит от физической природы звукоизвлече- ния на данном инструменте (использование краевых тонов или ко- лебаний тростей, одинарных или двойных тростей, различных форм труб и т. д.), что определяет количество гармоник, время их «вступления», скорость выстраивания их амплитуды, а соответ- ственно, и форму огибающей временной структуры звука. У неко- торых инструментов, например флейты, огибающая в период атаки имеет плавный экспоненциальный характер, а у некоторых, напри- мер фагота, отчетливо видны биения, что и является одной из причин существенных различий в их тембре. Во время атаки выс- шие гармоники иногда опережают основной тон, поэтому могут происходить флуктуации высоты тона. Все эти признаки помогают слуховой системе «опознать» тембр того или иного инструмента в начальный момент звучания. Таким образом, процесс развертывания спектра в период атаки звука является важнейшим фактором распознавания тем- бра инструмента и его идентификации. Для оценки тембра звучания важен не только момент его рас- познавания (т. е. способность отличить один инструмент от друго- го), но и возможность оценить из- менение тембра в процессе исполнения. Здесь важнейшую роль играет динамика изменения спектральной огибающей во вре- мени на всех этапах звучания: ата- ки, стационарной части, спада. Характер поведения каждого обертона во времени также несет важнейшую информацию о темб- ре. Пример изменения формы ата- ки и спада для первых обертонов фортепиано при исполнении раз- личных НОТ (ОТ С4 ДО С5) показан Рис- 3-9-6- Характер атаки на рис. 3.9.6. Поведение различ- ных обертонов во времени зависит от типа инструмента: в звучании и спада звука для первых обертонов фортепиано для нот от С4 (262 Гц) до С5 (593 Гц)
188 Глава 3 скрипки, органа, гитары и др. процесс изменения амплитуд оберто- нов имеет совершенно другой характер. Опыт показывает, что аддитивный компьютерный синтез звуков, учитывающий специфику развертывания отдельных обертонов во времени, позволяет получить значительно более «жизненное» звучание. Вопрос о том, динамика изменения каких именно обертонов не- сет информацию о тембре, связан с существованием критических полос слуха (см. разд. 3.3). Основную роль при распознавании вы- соты тона, как было показано в предыдущих разделах, играют пер- вые пятнадцать — восемнадцать гармоник, причем основной вклад вносят первые шесть — семь «развернутых» гармоник. Экспери- менты показывают, что поведение именно этих гармоник оказыва- ет также наиболее существенное влияние на изменение тембра. Поэтому в ряде исследований предлагалось размерность тембра считать равной пятнадцати — восемнадцати и оценивать его изменение по этому количеству шкал (это одно из принципиальных отличий тембра от таких характеристик слухового восприятия как высота или громкость, которые могут быть шкалированы по двум- трем параметрам). В соответствии с современными взглядами важнейшее значе- ние для восприятия тембра имеет изменение распределения зву- ковой энергии между критическими полосами, т. е. спектральная мощность звукового сигнала [8]. Для оценки этого параметра вве- дено понятие центроида спектра, которое определяется как сред- няя точка распределения спектральной энергии звука. Смещение центроида в сторону высоких частот ощущается как повышение «яркости» тембра звучания. Существенное влияние распределения спектральной энергии по частотному диапазону и динамики ее изменения во времени на субъективное восприятие тембра связано, вероятно, с опытом распознавания звуков речи по формантным признакам, которые и несут информацию о концентрации энергии в различных облас- тях спектра. Изменение тембра при изменении громкости исполне- ния и транспонировании по высоте также сопровождается сдвигом центроида за счет изменения количества обертонов. Наконец, раз- личие в восприятии тембров реальных звуков и звуков с «виртуаль- ной высотой» (см. гл. 4) можно объяснить с позиций положения центроида спектра: поскольку у этих звуков значение частоты основного тона, т. е. высоты, может быть одинаковым, а положе- ние центроида разное из-за разного состава обертонов, то, соот- ветственно, тембр будет восприниматься по-разному. Оценка тембров различных инструментов всегда носит субъек- тивный (и даже индивидуальный) характер: если при оценке высо- ты и громкости можно на основе субъективных оценок расположить звуки по определенной шкале, то оценка тембра — значительно
Восприятие звука Основы психоакустики 189
190 Глава 3 более трудная задача. Попытки установить эти признаки путем си- стематизации и усреднения результатов экспериментов, найти обобщенные шкалы, по которым можно было бы идентифициро- вать тембры звуков различных инструментов, связать эти шкалы с различными временно-спектральными характеристиками звука, предпринимаются достаточно давно [8, 38]. Примером может слу- жить выполненная в IRCAM классификация тембров музыкальных инструментов в зависимости от определенных спектрально- временных признаков сигнала, результаты которой показаны на рис. 3.9.7. Исследования позволили четко идентифицировать тембры синтезированных звуков различных инструментов (пиани- но, скрипки, тромбона и др.), а также звуков смешанных инстру- ментов (вибрафон плюс тромбон и др.) в трехмерном простран- стве, где в качестве акустических признаков использовались следующие шкалы: темп атаки (dimension 1), смещение спектраль- ного центроида (dimension 2) и флуктуации спектральной огибаю- щей (dimension 3). Поиски методов многомерного шкалирования тембров и уста- новление их связей со спектрально-временными характеристи- ками звуков активно продолжаются. Результаты эти чрезвычай- но важны для развития технологий компьютерного синтеза звуков, для создания различных электронных музыкальных ком- позиций, для коррекции и обработки звука в звукорежиссерской практике и т. д. Тембр и фазовый спектр Все изложенные выше результаты по установлению связи вос- принимаемого тембра с акустическими характеристиками сигнала относились к амплитудному спектру. Однако в реальных музыкаль- ных инструментах создаются достаточно сложные сигналы с боль- шим количеством обертонов, определенной негармоничностью между ними, сложным динамичным развитием во времени их спе- ктральной и временной огибающей и определенной динамикой изменения фазовых соотношений, к которым слуховой аппарат до- статочно чувствителен. Как было показано в разделе 3.7, при оценке высоты тона по высшим («неразвернутым») гармоникам с номерами выше 6-7 определение высоты тона происходит по их огибающей, частота которой равна фундаментальной частоте. Если все обертоны му- зыкального тона находятся в фазе, то периодичность огибающей становится четко выраженной и возрастает точность определения высоты тона («сила высоты тона»). Если фазовые соотношения между гармониками становятся случайными, то волновая структура суммарного звука претерпевает существенные изменения (пример показан на рис. 3.9.8) и высота тона становится менее определен- ной (уменьшается сила высоты звука) [37]. Таким образом, если фазовые соотношения оказывают слышимое влияние на опре-
Восприятие звука. Основы психоакустики 191 2 Рис. 3.9.8. Изменение формы волны при разном соотношении фаз: <-0,5 1 — случайные соотношения фаз обертонов; -11 It, MC О 10 20 30 40 50 60 70 80 90100 2 — все обертоны имеют одинаковые фазы деление высоты тона, то можно ожидать, что они окажут су- щественное влияние и на распознавание тембра. Исследования, выполненные на синтезированных сигналах, в которых по опреде- ленным законам менялись фазовые соотношения между составля- ющими обертонами [37], подтвердили, что при этом достаточно от- четливо слышно изменение тембра звучания. В реверберационном окружении сложный звук с высоким пик- фактором (что соответствует высокой степени регуляризации фазо- вых соотношений — см. гл. 2) говорит о близости источника звука, поскольку по мере удаления от него фазовые отношения приобре- тают все более случайный характер за счет отражений в помеще- нии. Этот эффект может служить причиной разных оценок звучания, например, в позиции пианиста и слушателя, а также разного темб- ра звука, записанного микрофоном, у деки и у слушателя, так как чем ближе точка записи, тем выше регуляризация фаз между обертонами и тем более четкая высота тона, чем дальше — тем более ровный тембр и менее четкая высота. Работы по оценке влияния фазовых соотношений на восприя- тие тембра музыкального звука сейчас активно изучаются в раз- личных центрах, например в IRCAM [38]. В заключение можно сказать, что основными физическими признаками (установленными к настоящему времени), по ко- торым определяется тембр звука и его изменение во времени, являются: — изменение формы спектральной огибающей во времени во все периоды развития звука — в течение атаки, стационарной части и спада; — выстраивание амплитуд обертонов в период атаки; — изменение фазовых соотношений между обертонами от де- терминированных к случайным (в частности, за счет негармо- ничности обертонов реальных инструментов); — наличие нерегулярностей спектральной огибающей и поло- жение спектрального центроида (т. е. максимума спектральной энергии), что связано с восприятием формант и их изменением во времени;
192 Глава 3 — наличие амплитудной (тремоло) и спектральной (вибрато) модуляции; — изменение формы спектральной огибающей с изменением интенсивности (громкости) звучания; — наличие дополнительных признаков идентификации инстру- мента, например характерный шум смычка, прохлопывание трос- тей, скрип винтов на рояле и др. Разумеется, все это не исчерпывает физических признаков сиг- нала, определяющих его тембр, поиски в этом направлении все время продолжаются. Однако при синтезе музыкальных звуков учет всех этих признаков создает более реалистическое звучание. Таким образом, с позиций современной психоакустики тембр — это один из первичных признаков при восприятии звука, основа для его категоризации (распознавания) [7, 8], позволяющий выделить источник звука (инструмент или группу инструментов) и определить его физическую природу. ЗЛО. НЕКОТОРЫЕ ОБЩИЕ ЗАКОНОМЕРНОСТИ ВОСПРИЯТИЯ МУЗЫКАЛЬНЫХ И РЕЧЕВЫХ СИГНАЛОВ Как уже было сказано выше, психоакустика пытается исследо- вать и объяснить, как слуховая система из физических параметров (изменения интенсивности во времени), поступивших на два при- емника слуха звуковых сигналов, извлекает информацию о таких слуховых признаках как высота, громкость, тембр и др., и по ним строит трехмерный звуковой образ, осуществляет локализацию звукового источника, распознает тембр отдельных инструментов и голоса и т. д. [2-4, 6-8, 14, 15]. Человек обладает уникальным свойством восприятия и декоди- рования совершенно особой и очень сложной формы звуковой ин- формации — музыки и речи. Хотя музыка есть некоторая упорядо- ченная во времени и пространстве последовательность тональных звуков, охарактеризовать восприятие музыки как последовательно- сти звуков, обладающих определенными физическими параметра- ми и соответствующими им слуховыми характеристиками, по-види- мому, нельзя. При восприятии музыки и речи мозг воспринимает нечто большее, чем просто последовательность звуков. Скорее они воспринимаются как последовательности психологически взаимосвязанных тонов, организованных в виде особых групп (паттернов), обладающих ритмической и мелодической структурой. Закономерностями создания и восприятия таких мелодических (и речевых) структур занимаются когнитивная психология, музы- кальная психология и психолингвистика [3, 4, 14, 15, 43].
Восприятие звука. Основы психоакустики 193 В основе восприятия целостных мелодических или речевых структур (мелодий, слов, фраз) лежат некоторые общие принципы распознавания слуховых образов. Современная психология ис- пользует различные подходы к их объяснению; наиболее распро- страненными при восприятии музыки и речи являются принципы гештальт-психологии (нем. Gestallt — образ), которая позволяет считать, что для восприятия, разделения и распознавания звуковой информации, приходящей к слуховой системе от разных источни- ков в одно и то же время (игра оркестра, разговор многих собесед- ников и др.), слуховая система (как и зрительная) использует не- которые общие принципы [3, 6, 7, 15]: — сегрегация (группировка) — разделение на звуковые пото- ки, т. е. субъективное выделение определенной группы звуковых источников (например, при музыкальной полифонии слух может от- слеживать развитие мелодии у отдельных инструментов); — подобие (сходство) — звуки, похожие по тембру, группиру- ются вместе и приписываются одному источнику (например, звуки речи с близкой высотой основного тона и похожим тембром опре- деляются как принадлежащие одному собеседнику); — близость — звуки, близко расположенные по времени и в пространстве, объединяются (например, в музыке звуки быстро следующие один за другим воспринимаются как часть одной музы- кальной фразы); — непрерывность (замкнутость) — слуховая система может интерполировать звук из единого потока через маскер (например, если в речевой (или музыкальный) поток вставить короткий отре- зок шума, слуховая система может «не заметить» его, звуковой поток будет продолжать восприниматься как непрерывный); — общая судьба — звуки, которые стартуют и останавливают- ся, а также изменяются по амплитуде или частоте синхронно (в из- вестных пределах), приписываются одному источнику; — сочетание «фигура-фон» — так же, как и при зрительном восприятии, при восприятии звуковой информации проявляется тен- денция группировать наиболее заметные или важные звуки как «фи- гуру», отличную от остального «фона» (например, в музыке, где ме- лодия воспринимается как «фигура», а аккомпанемент как «фон»). Таким образом, высшие отделы слуховой системы производят группировку поступившей звуковой информации — как последова- тельную (определяя распределение по времени звуковых компо- нент в рамках одного звукового потока), так и параллельную (вы- деляя частотные компоненты, присутствующие и изменяющиеся одновременно). Кроме того, мозг все время проводит сравнение поступившей звуковой информации с записанными в процессе обу- чения у него в памяти «звуковыми образами» (гештальт-фактор). Сравнивая поступившие сочетания звуковых потоков с имеющи- мися образами, он или легко идентифицирует их, если они совпа-
194 Глава 3 дают с этими образами, или приписывает им какие-то особые свойства в случае неполного совпадения (например, назначает виртуальную высоту тона в звучании колоколов). Измерения активности мозга, выполненные за последние годы, показали [8], что при восприятии мелодии возникают определен- ные образцы нейронной активности, соответствующие мелодиче- скому контуру данной мелодии и отличающиеся от немелодической последовательности звуков; это еще раз подтверждает, что мозг группирует и воспринимает музыку как определенные мелодиче- ские и ритмические образцы (паттерны) на основе распознавания определенных связей и глобальных отличительных признаков му- зыкального пассажа. Способность понимать и воспроизводить речь является уникаль- ным свойством человеческого поведения. Выделение из звукового потока отдельных образцов (паттернов) — слов — со скоростью примерно 5,3 слога в секунду [40] и способность к распознаванию и расшифровке заключающегося в них смыслового контекста тре- буют специальных механизмов и особых нейронных структур, специализированных на обработке речи (в левом полушарии обна- ружены специфические зоны Брока и зоны Вернике, ответственные за воспроизведение и понимание речи). Существуют разные теории и концепции механизма распознавания речи, в частности моторная теория, согласно которой распознавание речи базируется на зна- нии механизмов создания звуков речи (моторики образования) и др. Исследования этих механизмов в настоящее время активно продолжаются (см. гл 4) [3]. Принципиально важным моментом в восприятии музыки и речи является различие функций правого и левого полушария, или асимметрия мозга [8]. Расположение речевых центров в левом по- лушарии было известно более ста лет назад, опыты показали, что повреждение левого полушария (повреждение центров Брока и Вернике) приводило к потере способности говорить и понимать речь. В то же время повреждение правого полушария приводило к потере способности распознавания визуальных образов, темб- ральной и тональной (мелодической) памяти. Современные опы- ты по измерению активности работающего мозга (с помощью ме- тодов энцефалографии, томографии и ядерного магнитного резонанса) [14,15] показали достаточно четкую дифференциацию (асимметрию) при анализе звуковой информации между полушари- ями и позволили построить карты активности зон мозга при реше- нии различных слуховых задач [8]. Разумеется, работы по выяснению этих функций продолжаются, однако можно считать четко установленным, что высота и то- нальность в музыке определяются в правом полушарии, в то вре- мя как понимание и создание речи, так же как анализ ритма, кон- центрируется в левом полушарии.
Восприятие звука. Основы психоакустики 195 Специализация полушарий имеет в своей основе принципиаль- ное различие — совершенно различны способы обработки ими информации: последовательный анализ информации, как это тре- буется для обработки речи (левое полушарие), и параллельная об- работка информации для целостного анализа входных звуковых сигналов (правое полушарие). Обе формы сосуществуют и коопе- рируются для обработки информации и программирования реакции человека на окружающую звуковую среду. Музыка распознается нашим мозгом как интегральный целост- ный слуховой образ, поэтому правая кора специализируется на об- работке музыкальных входных сигналов, а левая кора в основном на обработке вербальных (речевых) сообщений. Опыты с анали- зом электрической активности мозга показали, что когда неопыт- ный слушатель воспринимает мелодию, активность регистрирует- ся в основном в правом полушарии, а когда опытный музыкант концентрируется на анализе короткой тонкой структуры тональной последовательности в мелодии, аналитический процесс передает- ся левому полушарию. Необходимо подчеркнуть, что хотя имеется четко выраженное распределение функций между полушариями, мозг строит еди- ный звуковой образ окружающего мира, пользуясь информацией от обоих полушарий, которые связаны между собой десятками миллионов нервных волокон. Примером построения такого единого образа может служить до- статочно детально исследованный эффект «бинауральных слия- ний» [9]. Эксперименты показали, что если подавать через стереотеле- фоны два высокочастотных звука с разными частотами, то они воспринимаются как отдельные звуковые сигналы; однако если эти сигналы промодулировать каким-либо низкочастотным звуком с ча- стотой до 1500 Гц, то оба сигнала сливаются в единый слуховой образ. Полученный результат свидетельствует о том, что для би- наурального слияния слуховая система использует низкочастотную огибающую комплексного звука (его макроструктуру), несмотря на то что детали составляющих комплексного звука (его микрострук- тура) различны. Бинауральное слияние речи, например, выявляет- ся, когда в одно ухо поступают только высокочастотные компонен- ты речевого звука, а в другое — только низкочастотные. Несмотря на то что ни одно ухо не получает достаточной информации для распознавания речевого сигнала, получаемый в результате бина- урального слияния слуховой образ позволяет понять речь. Меха- низм бинаурального слияния звуков описан в виде математической модели, которая основывается на поиске центральной слуховой нервной системой перекрестных корреляций между звуковыми сиг- налами в обоих ушах.
196 Глава 3 Вопросами познавательных и эмоциональных аспектов в вос- приятии музыки и речи занимается не психоакустика, а когнитив- ная психология, музыкальная психология, психолингвистика и т. д., поскольку установить связь сознательных и эмоциональных про- цессов в высших отделах коры головного мозга с физическими ха- рактеристиками воспринимаемых слуховой системой звуковых (му- зыкальных и речевых) сигналов на данном этапе развития науки практически невозможно (хотя наука в направлении создания си- стем искусственного интеллекта, компьютерного моделирования процессов высшей нервной деятельности и др. развивается таки- ми быстрыми темпами, что можно ожидать в ближайшие годы принципиально новых результатов).
Восприятие звука. Основы психоакустики 197 Контрольные вопросы 1. Привести определение основных задач психоакустики и ее роли в развитии современной аудиотехники. В чем заключаются законы пси- хоакустического восприятия (Вебера — Фехнера)? 2. Описать общую структуру периферической слуховой системы. 3. Привести основные функции в обработке звуковых сигналов элемен- тами внешнего уха (слуховая раковина, слуховой канал, барабанная перепонка). 4. Дать описание трансформации звуковой энергии элементами среднего уха (косточки, круглое окно, овальное окно). 5. Привести структуру и роль в звуковой обработке основных элемен- тов внутреннего уха (базилярная мембрана, орган Корти, покровная мембрана, слуховой нерв). 6. Дать определение и привести форму кривой для абсолютных порогов слышимости. 7. Что такое аудиограмма? В какой форме она может быть представлена? 8. Что такое дифференциальные пороги и чему равны их значения по частоте, интенсивности и длительности звукового сигнала? 9. Что такое уровень громкости в фонах, как определяются изофоны? 10. Связь между уровнем громкости в фонах с громкостью в сонах. 11. Что такое критические полосы слуха, какова зависимость их шири- ны от частоты и их роль в определении громкости сложных звуков? 12. В чем заключается механизм временной адаптации слуха? 13. Что такое уровень маскировки звука? Вид кривых маскировки для чистого тона и для шума. 14. Привести определение временной маскировки, центральной маски- ровки, бинауральной демаскировки. 15. Что такое субъективные гармоники и комбинационные тоны? Причи- ны их возникновения. Привести уровни субъективных гармоник при разных уровнях звукового стимула. 16. Дать описание механизмов локализации звука в горизонтальной плоскости. 17. Описать механизмы локализации в вертикальной плоскости и по глу- бине. 18. В чем заключается эффект предшествования (эффект Хааса)? 19. Что такое психофизическая шкала для определения высоты звука? Что такое мел? Привести зависимость высоты звука от его интенсив- ности. 20. Описать основные механизмы определения высоты сложного звука (теория места, временная теория). В чем состоит эффект «пропущен- ной фундаментальной частоты» и эффект «виртуальной» высоты звука? 21. Привести описание механизмов обработки звуковых сигналов в слухо- вой системе, обуславливающих ощущение консонансов и диссонансов. 22. Что такое частотные интервальные коэффициенты? 23. Привести принципы построения музыкальной шкалы Пифагора, на- туральной шкалы, равномерно темперированной шкалы. 24. Привести определение понятия «тембр». 25. Описать связь восприятия тембра со спектральной и временной структурой сигнала. 26. Привести общие принципы формирования звукового образа.
198 Глава 3 Список литературы 1. Zwicker Е. and Fast H Psychoacoustics, 2nd ed. New York.: Springer, 1999. 2. Howard D., Angus J. Acoustics and Psychoacoustics. G-B.: Focal-Press, 2001. 3. Шиффман X. R Ощущение и восприятие. СПб.: Питер, 2003. 4. Hearing / Ed. Moore В. London.: Academic Press, 1995. 5. Moore B. Introduction to the psychology of hearing. N. Y.: Academic Press, 1989. 6. Bregman A. S. Auditory Scene Analysis: The Perceptual Organization of Sound. Cambridge: MIT Press, 1990. 7. Parncutt R. Harmony: A Psychoacoustical Approach. N. Y: Springer, 1990. 8. Roederer J. The Physics and Psychophysics of Music. N. Y.: Springer- Verlag, 1994. 9. Гельфанд С. А. Слух. M.: Медицина, 1984. 10. Zwicker E., Zwicker Т. Audio Engineering and Psychoacoustics: Matching Signals to the Final Receiver, the Human Auditory System. Journal of Audio Engineering Society. Vol. 39, No. 3, March 1991. P. 115-1261. 11. The New Grove dictionary of music and musicians / Ed. Sadie S. London: Macmillan Press, 1994. V. 1-20. 12. Блауерт К Пространственный слух. Москва.: Энергия, 1979. 13. Blauert J. Spatial Hearing: The Psychophysics of Human Sound Localization. Cambridge: MIT Press, MA, 1997. 14. The Psychology of Music I Ed. D. Deutsch. N. Y: Academic Press, 1984. 15. Sloboda J. A. The musical mind: The cognitive psychology of music. Oxford.: University press, 1985. 16. Rossing T. D. The Science of Sound. N. Y: Addison-Wesley Publ, 1982. 17. Terchardt E. Akustische Kommunikation: Grundlagen mit Horbeispielen. Berlin. Heidelberg: Springer, 1998. 18. Hall D. Musical Acoustics: An Introduction. Belmont. California: Wadsworth Publishing Company, 1980. 19. Stevens S. Psychophysics. N. Y: Wiley, 1975. 20. Encyclopedia of Acoustics I Ed. M. Crocker. N. Y: J. Wiley & Sons, 1997. V. 1-4. 21. Fletcher H Speech and hearing in Communication. N. Y: Van Nostrad, 1953. 22. Moore B., GlasbergB., BaerT. A Model for the Prediction of Thresholds, Loudness, and Partial Loudness I Journal of Audio Engineering Society. Vol. 45, No. 4, April 1997. P. 224-240. 23. Слуховая система I Отв. ред. Я. А. Альтман. Л.: Наука, 1990. 24. Радионова Е. А. Анализ звуковых сигналов в слуховой системе. Ней- рофизиологические механизмы. JI.: Наука, 1987. 25. Молчанов А. П., Бабкина Л. Н. Электрические модели механизмов улитки органа слуха. Л.: Наука, 1978. 26. Вартанян И А. Звук — слух — мозг. Л.: Наука, 1981. 27. Данилова Н. Н. Психофизиология. Учебник. M.: Аспект Пресс, 2001. 28. Музыкальная энциклопедия. M.: Сов. энциклопедия, 1981. Т. 1-6.
Восприятие звука. Основы психоакустики 199 29. Шерман К Формирование равномерно-темперированного строя. M.: Музыка, 1964. 30. Волконский А. М. Основы темперации. M.: Композитор, 1998. 31. ВахитовЯ. Ш. Слух и речь. Л.: ЛИКИ, 1973. 32. Plomp R. Aspects of Tone Sensation. London.: Academic Press, 1976. 33. Гарбузов К А. Внутризонный интонационный слух и методы его раз- вития. М. — Л.: Музгиз, 1951. 34. Цвиккер Э., Фельдкеллер Р. Ухо как приемник информации. M.: Связь, 1971. 35. Kostec В. Soft Computing in Acoustics. N. Y.: Physica-Verlag, 1999. 36. Кузнецов Л. А. Акустика музыкальных инструментов. Справочник. M.: Легпромбытиздат, 1989. 37. Galembo A., Askenfelt A., Cuddy L. L., Russo E A. Effects of relative phases on pitch and timbre in the piano bass range. J. Acoust. Soc. Am. 110 (3), 2001. P. 1649-1666. 38. McAdamc A., de Cheveigne D., Collet S. Auditory Signal Processing: Psychophysics, Physiology and Modeling. N. Y.: Springer-Verlag, 2004. 39. Ковалгин Ю. А. Стереофония. M.: Радио и связь, 1989. 40. Анерт B.t Стеффен Ф. Техника звукоусиления. M.: Эра, 2003. 41. Баскаков С. И. Радиотехнические цепи и сигналы. M.: Высшая шко- ла, 1983. 42. Lehrman R, TuIIy Т. MIDI for the Professional. N. Y: Amsco Publication, 1993. 43. Иванченко Г. В. Психология восприятия музыки. M.: Смысл, 2001. 44. Морозов В. П., Вартанян И. А., Галунов В. И. и др. Восприятие речи. Вопросы функциональной асимметрии мозга / Под ред. М. Морозо- ва. Л.: Наука, 1988. 45. Bosi М, Goldberg R. Introduction to Digital Audio Coding and Standarts. Boston: Kluwer Ac. Publishers, 2003. 46. Encyclopedia Britannica Online. — www.britannica.com 47. Музыкальная акустика I Под общ. ред. Н. А. Гарбузова. M.: Гос. муз. изд-во, 1954.
Глава 4. АКУСТИКА МУЗЫКАЛЬНЫХ ИНСТРУМЕНТОВ. АКУСТИКА РЕЧИ И ПЕНИЯ Как уже было показано в главе 1, одной из основных задач музыкальной акустики является изучение процессов создания звуков музыки и речи. На протяжении веков источником таких зву- ков служили музыкальные инструменты и голос. В XX веке появи- лись и начали очень активно развиваться новые электронные источники музыкальных и речевых звуков, в том числе электро- музыкальные инструменты, электроакустическая звуковоспроиз- водящая аппаратура, электронные устройства (синтезаторы, сэмплеры, секвенсоры и др.); о них будет рассказано в главах 6 и 7. Данная глава посвящена акустике натуральных источников звука, т. е. музыкальных инструментов и голоса. Акустика музыкальных инструментов имеет очень длинную историю (см. гл. 1), однако в настоящее время она переживает особый этап. Развитие компьютерных технологий позволило перей- ти к новому методу синтеза музыкальных звуков, а именно к тех- нологии создания компьютерных физических моделей музыкаль- ных инструментов. Создание таких моделей заставило применить все современные достижения в теории колебаний, лазерной интер- ферометрии и др. к анализу процессов работы музыкальных ин- струментов и разработке их адекватных математических описаний. К настоящему времени созданы компьютерные модели таких ин- струментов как флейта, литавры, тромбон, труба и др., продолжа- ются разработки алгоритмов для реализации физических моделей фортепиано, органа и др. Разработка алгоритмов компьютерного распознавания тембров музыкальных инструментов, являющаяся предметом многочислен- ных современных исследований, позволила более глубоко изучить процессы звукоизвлечения в них и дала возможность значительно продвинуться в понимании таких физических механизмов как про- цессы колебания и излучения основных элементов в музыкальных инструментах (дек, струн, мембран, резонаторов и др.) и в голосо- вом аппарате [1].
Акустика музыкальных инструментов. Акустика речи и пения 201 Описание таких механизмов требует привлечения современного математического аппарата, однако, поскольку данный учебник ори- ентирован в основном на гуманитарные специальности (как было указано во введении), в данной главе мы ограничимся только общим описанием физических процессов, происходящих в музы- кальных инструментах и голосовом аппарате, и их акустических характеристик. Информацию по созданию математических и физи- ческих моделей музыкальных инструментов и голосового тракта можно найти в специальной литературе (журналы JAES, JASA1 AES Convention Papers и др.) [1-4]. 4.1. СОСТАВ И КЛАССИФИКАЦИЯ МУЗЫКАЛЬНЫХ ИНСТРУМЕНТОВ Классический музыкальный инструмент можно рассматривать как «механо-акустический преобразователь, в котором под дей- ствием внешних сил происходят вибрации упругих тел и излучение звука в окружающее пространство». В музыкальных энциклопедиях обычно дается такое определение: «музыкальный инструмент — это система для производства (создания, извлечения) музыкаль- ных звуков». Иногда используется другое понятие: «Музыкальный инструмент — устройство (прибор) для перевода исполнителем символических знаков (нот) в соответствующие музыкальные зву- ки» [4-11]. Состав музыкального инструмента включает в себя следующие основные элементы (хотя среди огромного многообразия музы- кальных инструментов эти элементы не всегда могут быть четко выделены): — генератор (возбудитель колебаний) — система для переда- чи энергии звучащему телу и возбуждения в нем колебаний. Уст- ройство и форма генераторов видоизменяются в зависимости от природы звучащего тела, иногда используются довольно сложные механизмы (клавишный механизм и молоток рояля, воздуходув- ный механизм в органе, дыхательный аппарат человека и др.); — вибратор (звучащее тело) — основная часть инструмента, в которой возбуждаются колебания. В некоторых инструментах излучение звука происходит непосредственно от вибратора (напри- мер, мембрана барабана, пластинки ксилофона, оболочка колоко- ла и др.), в других с помощью дополнительных устройств-резона- торов (например, у скрипки, рояля, арфы и т. д.); — резонатор (усилитель) — устройство, предназначенное для усиления звука и используемое в тех случаях, когда отдача энер- гии непосредственно от вибратора в воздушную среду слишком мала. В большинстве случаев это происходит, когда вибратор име- ет маленькую поверхность (площадь или объем), поэтому не может
202 Глава 4 вызвать смещение достаточно большого количества частиц возду- ха и, следовательно, обеспечить необходимый уровень звукового давления в среде. В таких случаях колебания звучащего тела долж- ны быть переданы другому телу, имеющему большую поверхность или объем и способному обеспечить излучение достаточно большо- го уровня акустической энергии в окружающее пространство (напри- мер, резонансные деки рояля, гитары, скрипки и др.). В музыкальных инструментах применяются три основные ка- тегории вибраторов: — тела, упругие в силу своих природных свойств (твердости и формы). Они не требуют предварительного натяжения, чтобы совершать колебания и излучать звук (бруски, стержни, трубки, пластины, оболочки и др.). Их используют в свободно подвешен- ном состоянии (гонг, трубчатые колокольчики и др.), с опорой на отдельные точки (ксилофон, маримба и др.) или закрепленны- ми на одном конце (например, колокол); — тела, становящиеся упругими вследствие натяжения. Натя- жение может быть приложено в одном направлении, например для струн, а может быть приложено по периметру, например для круг- лых мембран барабанов. От степени натяжения зависит упругость этих тел, а следовательно, и собственные частоты их колебаний, т. е. состав спектра; — тела, становящиеся упругими вследствие процесса сжатия (например, столбы воздуха, заключенные в трубы различного се- чения). Основные способы возбуждения колебаний вибраторов, т. е. генерации энергии, можно свести к следующим: — удар (толчок) — мгновенное приложение силы и передача энергии звучащему телу с последующим предоставлением ему свободы колебаний. При таком режиме возбуждения вибратор со- вершает свободные затухающие колебания, т. к. происходит потеря энергии за счет излучения и внутреннего трения (например, в стру- нах рояля, колоколах и др.); Особый вид возбуждения происходит с помощью передачи энергии последовательными толчками, например для столбов воз- духа в трубах, что создает автоколебательный процесс, который обеспечивает звучание духовых инструментов; — щипок, или зацепление — это способ, при котором звуча- щее тело зацепляется каким-либо предметом (или пальцем), выводится из положения равновесия и освобождается (напри- мер, струна гитары, арфы, лютни, клавесина и др.), после чего оно переходит в режим свободных затухающих колебаний; — трение — при этом способе возбуждающее тело (например, смычок) остается в тесном соприкосновении с вибратором (струной) за счет трения в течение определенного периода времени, после
Акустика музыкальных инструментов. Акустика речи и пения 203 чего происходит отрыв вибратора, далее этот процесс периодиче- ски повторяется (например, при возбуждении струн скрипки). В качестве усилителей-резонаторов могут использоваться тела, обеспечивающие эффективное излучение звука в окружаю- щее пространство, например за счет большой площади (деки ро- яля), или специальных корпусов с заключенным в них воздушным объемом (у скрипки, гитары и др.), или системы резонансных труб (например, в маримбе) и др. Нужно отметить, что в настраиваемых музыкальных инструмен- тах в качестве вибраторов и резонаторов могут использоваться только те тела, которые способны совершать периодические коле- бания, т. е. тела, собственные частоты которых составляют диск- ретный гармонический спектр (см. гл. 2), поскольку, как показано в главе 3, слуховой аппарат способен определить высоту тона только для звуков с периодической структурой. Это накладывает строгие ограничения на выбор формы вибраторов и резонаторов (струны, бруски сложной формы, трубы и т. д.) и их физико-меха- нические параметры (жесткость, коэффициент внутреннего трения, плотность и др.), что и создает основные проблемы при изготов- лении инструментов, поскольку именно этот выбор определяет их точность настройки и тембр. Широкое распространение имели и имеют в настоящее время и ненастраиваемые музыкальные инст- рументы (барабаны, тарелки и др.), однако выбор форм и матери- алов их вибраторов также ограничен определенными требования- ми, поскольку от этого зависит их тембр звучания. Классификация музыкальных инструментов может быть выполнена по различным критериям (хотя далеко не все инстру- менты могут быть четко классифицированы). Наиболее распрост- раненной является классификация, предложенная В. Майоном в 1888 г. и подробно разработанная австрийским музыковедом Э. Хорнбостелем (1877-1935) и его немецким коллегой К. Заксом (1881-1959) в 1914 году [5]. Согласно этой классификации инструменты объединяются в клас- сы по типам вибраторов: — хордофоны (струнные), в которых в качестве вибраторов используются струны различных размеров, диаметров, плотности и степени натяжения (рояли, арфы, гитары, скрипки и т. д.); — мембранофоны, в которых звук извлекается при возбужде- нии натянутой мембраны (барабаны, литавры и др.); — идиофоны, где звук создается за счет возбуждения колеба- ний в телах, обладающих собственной упругостью: брусках (ксило- фон, маримба и др.), трубках (оркестровые колокольчики), пластин- ках (тарелки), оболочках (колокола) и т. д.; — аэрофоны — духовые инструменты, которые используют для возбуждения и поддержания звука колебания воздушных столбов
204 Глава 4 в трубах разной формы (кларнеты, флейты, органы, саксофоны и др.). Пример современной классификации такого типа, дополненной еще группой механических и электрических музыкальных инстру- ментов, показан на рис. 4.1.1 [5]. Такая классификация не охватывает всех видов музыкальных инструментов и способов игры на них, поэтому она дополняет- ся другими видами: исполнительскими, музыкально-исторически- ми и т. д. Исполнительская классификация выделяет обычно следующие группы инструментов [11]: духовые, струнные и удар- ные. Эти группы в свою очередь подразделяются на подгруппы
Акустика музыкальных инструментов. Акустика речи и пения 205 о м СО со о И Q (D CQ О (D X 38 § о § i Il s 5 й о л 2 Ударные Электронные Язычковые Духовые Струнные Клавесы Треугольники Кастаньеты Тарелки Маракасы Металлофоны Кротали Ксилофоны Колокольчики Маримбы Барабаны Тамтамы Литавры и О* 2 1 Фанфары Тромбоны Саксгорны «I —1 Валторны Трубы J J, о I—[ФлеЙТЫ (продольные; § Д H 0> Тубы ФлеЙТЫ (поперечные) Фаготы Гобои —J Кларнеты Гармони духовые Саксофоны Гармони меховые Гармони губные Баяны 1« — Виолончели ] Аккордеоны Контрабасы —j Скрипки Альты S и A S 2 Домры Балалайки Мандолины g —I Гитары Арфы — Пианино Клавесины Рояли Рис. 4.1.2. Классификация музыкальных инструментов (исполнительская) [11]
206 Глава 4 в зависимости от способа возбуждения: духовые — на лабиаль- ные, тростевые и амбушюрные (кроме того, духовые еще традиционно разделяются на медные и деревянные); струнные — на щипковые, смычковые и клавишные; ударные — на мембран- ные и пластиночные и т. д. Пример подобной классификации дан на рис. 4.1.2. Необходимо отметить, что в разные исторические периоды предлагались разные системы классификации, которые все время развивались и дополнялись в связи с появлением новых видов инструментов. В настоящее время, когда развиваются такие на- правления, как электронные музыкальные инструменты, акустиче- ская аппаратура записи и воспроизведения звука, компьютерные музыкальные технологии и др.; открываются новые виды народных инструментов в разных странах мира; совершенствуются извест- ные инструменты и т. д., — соответственно видоизменяются и ме- тоды их систематизации и классификации. 4.2. АКУСТИКА ДУХОВЫХ МУЗЫКАЛЬНЫХ ИНСТРУМЕНТОВ Духовыми музыкальными инструментами (или аэрофонами) на- зывается «класс инструментов, у которых источником звука служат колебания воздушного столба» [6]. Для того чтобы описать физические принципы звукообразова- ния в любом музыкальном инструменте, необходимо ответить на следующие вопросы: как возбуждаются колебания, т. е. принцип их генерации; как эти колебания поддерживаются и усиливаются дли- тельное время, т. е. принципы работы их вибраторов и резонаторов; как энергия колебаний передается окружающему воздуху, т. е. прин- ципы излучения звука. 1 1 1 Система звукообразования духо- —, вых инструментов отличается рядом 2 ' J особенностей, а именно: поскольку излучение звука происходит за счет колебаний столба воздуха в трубах различного сечения, инерция кото- рого очень мала, затухание единич- ного возбуждения (толчка, импульса) будет происходить почти мгновенно. Для того чтобы из духового инстру- мента можно было извлекать музы- кальные звуки, надо подводить к нему энергию в течение опреде- ленного времени в виде сжатого под некоторым давлением воздуха Рис. 4.2.1. Трубы различного сечения, используемые в музыкальных инструментах: 1 — цилиндрические, 2 — конические, 3 — экспоненциальные, 4 — призматические
Акустика музыкальных инструментов. Акустика речи и пения 207 (в форме ритмических импульсов) — тогда, при определенных условиях, в объеме воздуха, наполняющем духовой инструмент, воз- никает длительный автоколебательный процесс. Форма объема воздуха, заключенного в полости духового ин- струмента, оказывает большое влияние на тембр звука. В резуль- тате многовекового опыта человек отобрал для использования в музыкальных инструментах удлиненные трубы различного сече- ния: цилиндрические, конические, экспоненциальные, призматиче- ские (рис. 4.2.1). Такие удлиненные трубы лучше резонируют, поддерживая автоко- лебательный режим; спектр излучаемого ими звука содержит цело- численные обертоны (т. е. гармоники); в них легче добиться перехо- да на более высокие регистры (например, методом передувания). Таким образом, процесс звукообразования в духовых инструмен- тах характеризуется тем, что колебания возбуждаются и поддержи- ваются в удлиненных столбах воздуха внутри труб различного сече- ния (резонаторах) в результате автоколебательного процесса, при непрерывном импульсном подведении энергии за счет модуляции воздушного потока. Генерация энергии у всех духовых музыкальных инструментов происходит за счет энергии сжатого воздуха в легких музыканта (или в специальном воздуходувном механизме, как в органе). Способ модуляции (прерывания) струи воздуха у всех духовых инструментов различается, по этому признаку они могут быть раз- делены на следующие группы: — лабиальные (airreed): к этому классу инструментов относят- ся флейты (продольные и поперечные), рекордеры, органные тру- бы (некоторых видов), окарины, различного рода свистки и др. В этих инструментах возбуждение звука происходит в результате трения о край твердого тела (лабиума) воздушной струи, движу- щейся с достаточно большой скоростью, и ее колебаний относи- тельно этого края (что частично совпадает с процессами, происхо- дящими при свисте, поэтому иногда эти инструменты называют свистящими); — тростевые (mechanical reed): с одинарной тростью (single mechanical reed) — кларнет, саксофон, язычковые трубы органа; с двойной тростью (double mechanical reed) — гобой, фагот и др. В этих инструментах для модуляции используется вибратор в виде удлиненной пластинки-трости, укрепленной на одном кон- це и свободной на другом. Свободный конец пластинки лежит под краями отверстия, через которое вдувается воздух; при продувании воздуха она начинает колебаться, модулирует поток воздуха, кото- рый возбуждает резонансные колебания в трубе. Если используется двойная трость, то это две пластинки, за- крепленные на одном конце, своими свободными концами прилега-
208 Глава 4 ющие друг к другу. Они образуют щель, проходя через которую, поток воздуха модулируется и возбуждает колебания в трубах. Лабиальные и тростевые инструменты традиционно относят к группе деревянных (woodwind), хотя большинство из них изготав- ливается из других материалов (например, саксофоны и попереч- ные флейты обычно делают металлическими) [11]; — амбушюрные (lipreed): это инструменты с воронкообразными мундштуками — валторна, труба, тромбон, туба, саксгорн, корнет и др. В этих инструментах роль вибратора выполняют особым обра- зом сложенные губы (франц. embouchure), приложенные к мундштуку. При продувании воздух раздвигает щель между губами, приводя их в колебания, в результате происходит периодическое увеличение или уменьшение ее площади и модуляция воздушной струи. Амбушюрные инструменты называют медными (brasswind), т. к. для их изготовления используют в основном латунь (сплав меди и цинка). Кроме перечисленных групп инструментов, входящих в состав симфонического оркестра [5, 11, 12-26], имеется множество народ- ных духовых инструментов различных культур, которые трудно классифицировать. Особую группу составляют духовые язычковые инструменты с камерами переменного объема (аккордеоны, баяны, гармони), по- стоянного объема (фисгармонии) и без камер (губные гармони) [11]. В данной главе будут рассмотрены процессы звукообразования и акустические параметры для некоторых (типичных для каждой группы) классических духовых инструментов, используемых в со- временной оркестровой музыке. 4.2.1. Лабиальные духовые инструменты. Флейта Анализ процессов звукообразования у лабиальных (свистящих) инструментов показывает, что в них участвуют следующие компо- ненты: — генератор — источник энергии, вызывающий движение воз- душной струи; — вибратор — колеблющаяся относительно острого края (ла- биума) воздушная струя, а также приспособление для ее регули- рования и направления; — резонатор — воздушная полость в трубе, усиливающая про- цесс звукообразования. Примером может служить процесс звукообразования в попе- речной флейте, где в качестве источника силы (генератора) ис- пользуется дыхательный аппарат. Сила мышц диафрагмы, грудной клетки, лица и др. создает источник энергии, который регулирует движение воздуха с большей или меньшей скоростью. В качестве вибратора используются колебания воздушной струи, приспособ-
Акустика музыкальных инструментов. Акустика речи и пения 209 Рис. 4.2.2. Различные виды лабиальных духовых инструментов лением для регулирования которой являются губы и язык музыкан- та, а также острый край бокового отверстия в стенке трубы флей- ты. Резонатором служит воздушный столб в цилиндрической труб- ке, снабженной рядом боковых отверстий. Аналогичные элементы есть и в других лабиальных инстру- ментах: органных трубах, рекордерах, окаринах и пр. (рис. 4.2.2). Основным механизмом превращения энергии воздушного потока в колебания столба воздуха в резонаторе служит явление «дина- мической нестабильности», приводящее к появлению так называ- емых «краевых тонов». Возбуждение колебаний методом «краевых» тонов. Всю- ду, где струя воздуха проходит с большой скоростью мимо края ка- кого-то препятствия, могут образовываться «краевые тоны» (свист ветра в парусах, гудение проводов и т. д.). Это явление давно ис- пользовалось в своеобразном музыкальном инструменте — «эоло- вой арфе» [22], состоящей из рамки с натянутыми струнами, кото- рая ставилась на пути дующего ветра. Причиной возникновения краевых тонов является нерегулярность потоков воздуха, приводя- щая к появлению вихрей. Такие нестабильные нерегулярные пото- ки воздуха могут возникать и тогда, когда струя вытекает из узкого отверстия или щели. Здесь можно рассматривать три возможные ситуации: поток воздуха вырывается из узкой щели; поток
210 Глава 4 б Рис. 4.2.3. Струи воздуха, вытекающие из щели: а — ламинарная, б — турбулентная воздуха вырывается из щели и натыка- ется на острую кромку твердого тела; поток воздуха и кромка сопрягаются с резонатором. Все эти три процесса со- единяются в лабиальных духовых ин- струментах. Рассмотрим их последовательно: — если струя воздуха выходит в большую среду из узкой щели при малой скорости и плавно растекается (рис. 4.2.3 а), то такой поток называет- ся ламинарным. Если при возрастании скорости струи вытекающий поток ста- новится нестабильным, в нем возника- ют вихри (локальные сгущения частиц воздуха с повышенным давлением) и направление движение струи становится волнообразным, то такой поток называется турбулентным (рис. 4.2.3 6). Вихри, а следова- тельно, и изгибы движения струи распространяются со скоростью V ~ 0,4V, где V — скорость движения струи. В результате образо- вания вихрей в потоке возникают местные сгущения и разрежения воздуха, а как было сказано в главе 2, распространение «сжатия- разрежения» в воздухе создает звуковую волну, которая при опре- деленных условиях может вызвать ощущение высоты тона (напри- мер, «свистящий» чайник), хотя обычно эти завихрения создают сильные турбулентные шумы (возникающие, например, при движе- нии ракет, самолетов и т. д.); — при наличии препятствия в виде острой кромки на пути вытекающей с большой скоростью из щели струи процесс вихре- образования усиливается и струя разбивается на два потока по обе стороны кромки. В турбулентной струе разбиение происходит не на две равные части, как это было бы в ламинарном потоке, а в силу изгибной формы движения струи основная часть струи на- Рис. 4.2.4. Турбулентная воздушная струя на острой кромке Рис. 4.2.5. Колебания воздушной струи около жесткой кромки в лабиальных органных трубах
Акустика музыкальных инструментов. Акустика речи и пения 211 правляется по одну из сторон края кромки (рис. 4.2.4). Поскольку на этой стороне образуется наибольшее количество вихрей, т. е. зон с избыточным давлением, а на другой стороне кромки давле- ние оказывается меньшим, то вихри начинают перетекать на дру- гую сторону и «выталкивают» при этом струю, меняя направление ее движения, затем процесс повторяется (рис. 4.2.5). В результа- те происходят периодические колебания («прохлопывания») струи около острого края, при этом могут возникать тональные звуки, называемые «краевыми тонами». Таким образом, в лабиальных инструментах роль вибратора выполняет воздушная струя (поэто- му они и называются airreed, т. е. воздушно-тростевые [2]). Теорией краевых тонов занимаются на протяжении многих лет ученые различных научных направлений (особенно связанных с ракетостроением и др.), однако нельзя сказать, что теория турбулентных потоков полностью разработана. Этой проблеме много внимания уделялось и в трудах акустиков, начиная с работ Рэлея (1912), Брауна (1937) и др. [22]. За последние годы в тео- рии краевых тонов в лабиальных инструментах с помощью компь- ютерного моделирования получено много интересных результатов, однако они используют достаточно сложный математический аппа- рат [2, 27], поэтому остановимся здесь только на некоторых физи- ческих оценках [11, 12, 16, 18, 21]. Частота краевого тона приближенно может быть оценена по формуле: f = 0,2Vc/В, где Vc — скорость струи, В — расстоя- ние от места выхода струи (губы музыканта или щель в трубе органа) до твердого края отверстия. Например, если скорость струи Vc = 20м/с, В = 0,01м, то час- тота первого краевого тона равна f = 400 Гц [18]. Возможность образования стабильного краевого тона, как и его частота, зависят от скорости струи, расстояния до края отверстия и формы края. Существует некоторое минимальное рас- стояние между отверстием и острой кромкой (Bmin)9 при котором вообще могут образо- вываться вихри. Если при постоянной ско- рости струи увеличивать рас- стояние между щелью и кром- кой (В), то частота краевого тона снижается, затем при дальнейшем увеличении рас- стояния может произойти скачок частоты, она возвраща- ется почти к первоначальному Гц область 2 область 3 область 1 расстояние от щели до края -►м Рис. 4.2.6. Изменение частоты краевого тона в зависимости от расстояния до кромки
212 Глава 4 значению (рис. 4.2.6). Происходит это потому, что дистанция между вихрями, а значит, и длина волны краевого тона Я (равная, как ска- зано в главе 2, расстоянию между сгущениями) с увеличением рас- стояния до кромки (B) увеличивается — следовательно, его часто- та снижается, т. к. / = С/Л, где С — скорость звука. Затем при некотором расстоянии, называемом критическим, увеличивается число вихрей, и расстояние между ними (следовательно, и длина волны) возвращается к прежнему значению, а значит, возвраща- ется и частота краевого тона. Обычно в музыкальных инструмен- тах используются расстояния между щелью и кромкой в пре- делах, соответствующих области 1 на рис. 4.2.6. Если расстояние В постоянно, а скорость вдувания растет, то частота краевого тона увеличивается (рис. 4.2.7) за счет увеличе- ния количества вихрей; при некотором критическом значении ско- рости Vc частота скачком повышает свое значение. Если соединить этот механизм с резонатором определенного размера (как у флей- ты, рекордера и др.), то можно получить изменение тона на октаву и выше (подробнее об этом будет сказано ниже). Если соединить теперь механизм образования «краевых тонов» с помощью турбулентной струи, выходящей из узкой щели и натал- кивающейся на острую кромку, с резонатором, например с трубой определенного вида, то получится полный механизм звукообразо- вания лабиальных духовых инструментов. Процесс взаимодействия турбулентной струи со столбом возду- ха, заключенным в трубе, можно представить следующим образом: в определенный момент, когда струя направлена внутрь трубы, она передает («вбрасывает») импульс сжатого давления (в виде «вих- ря») (рис. 4.2.5). Этот импульс начинает распространяться вдоль трубы, на открытом дальнем конце часть звуковой волны излу- чается, часть отражается обратно в трубу; при этом (поскольку открытый конец сообщается с атмосферой) мгновенное избыточ- ное давление на открытом конце выравнивается; следовательно, звуковое давление на открытом конце трубы становится равным Рис. 4.2.7. Повышение частоты краевого тона при увеличении скорости вдувания в
Акустика музыкальных инструментов. Акустика речи и пения 213 нулю (звуковое давление есть = разность между мгновенным из- I * быточным давлением и атмос- [ | —► -- ферным — см. гл. 2). Поскольку звуковое давление на открытом * конце трубы резко падает, то в -- силу инерции в обратную сторону >г начинает распространяться им- время пульс разрежения (отрицательно- рис. 4.2.8. Распространение го давления) (рис. 4.2.8). Подходя импульса давления к начальному концу трубы (лабиу- в открытой трубе му), импульс разрежения «помога- ет» втягивать внутрь турбулентную струю, которая за это время от- клонилась наружу; струя поворачивается, снова вбрасывает очередной импульс давления (вихри) и процесс повторяется [20]. Когда период прихода импульсов сжатия-разрежения и период поворота струи становятся строго синхронизированными, хаотич- ная картина бегущих волн стабилизируется и устанавливается ста- бильная картина стоячих волн в трубе (узлы и максимумы давле- ния устанавливаются на определенных местах вдоль трубы). Если подобрать период колебаний струи так, чтобы она регулярно передавала порции энергии в трубу (в виде сжатых вихрей) в оп- ределенные моменты, то в трубе установится стабильный процесс «автоколебаний». Однако если подача энергии прекращается, про- цесс сразу останавливается, т. к. инерция воздуха мала (этот про- цесс можно сравнить с необходимостью регулярно подталкивать качели в определенные моменты времени, когда они максималь- но отклонены от положения равновесия, — тогда они будут коле- баться долго). Для того чтобы в трубе возникли интенсивные резонансные колебания, необходимо подобрать скорость вдувания и расстояние от щели до кромки таким образом, чтобы соответствующая часто- та «краевого тона» f (а соответственно, и период колебаний струи) оказалась близкой к основной собственной частоте столба воздуха в трубе /7: fKp т =fr Как было показано в главе 2, на резонансе, когда частота вынуж- дающей силы совпадает с собственной частотой системы, происхо- дит максимальная передача энергии, амплитуда колебаний резко возрастает (она ограничивается только затуханием в системе) и про- исходит значительное усиление громкости звучания инструмента. Собственные частоты столба воздуха в трубе определяются его жесткостью и массой, которые в свою очередь зависят от формы и длины трубы, а также от условий на ее концах (они зависят так- же от упругости стенок трубы, но обычно в музыкальных инстру- ментах стенки делаются достаточно жесткими, и они не оказыва- ют существенного влияния).
214 Глава 4 изменение давления Рис. 4.2.9. Формы резонансных колебаний воздушного столба в открытой трубе изменение скорости В таких лабиальных инструментах, как флейта и лабиальные трубы орга- на, используются цилиндрические (или слегка конические) трубы, открытые с обоих концов или закрытые с одного конца. Если проанализировать картину стоячих волн в открытых трубах, то, как уже было сказано выше, в них на обо- их концах образуются узлы (нули) звукового давления рзв, а в середине трубы находится максимум давления (минимум скорости). Как следует из ри- сунка 4.2.9, на основной (первой) резонансной частоте вдоль длины трубы укладывается половина длины волны: L = 1/2Л. Значит, основная собственная частота связана с длиной трубы следующим соотношением: f0 = CZX= С /2L. Например, если известна длина трубы флейты L = 605 мм, то основная частота ее колебаний равна /7 = С/А= C/2Z,= = (340 м/с)/1,21 м= 281 Гц. Обычно частота краевого тона подбирается в начальный мо- мент несколько выше частоты основного тона трубы, однако при возникновении резонансных колебаний они «навязывают» свою частоту, несколько снижая при этом частоту краевого тона. Этот процесс отражается на структуре переходных процессов в лаби- альных инструментах и, следовательно, на тембре их звучания. Способы изменения высоты тона. Роль боковых отверстий Рассмотренный выше процесс звукообразования относится только к возбуждению звучания на основной резонансной частоте. Для того чтобы воспроизвести полный частотный диапазон, в ла- биальных инструментах применяются два способа: метод «переду- вания» и метод изменения длины трубы за счет использования боковых отверстий. Метод «передувания»: столб воздуха, заключенный в открытую трубу, имеет (как всякое распределенное упругое тело, например струна) бесконечно большое количество собственных частот, хотя влияют на излучение звука только несколько первых из них. Если на первой резонансной частоте вдоль длины трубы укладывается 1/2А, длины волны, то для того чтобы всегда выполнялось условие равенства нулю звукового давления на открытых концах трубы, необходимо, чтобы структура стоячих волн на более высоких соб- ственных частотах имела вид, показанный на рис. 4.2.9, т. е. на второй собственной частоте должно укладываться две полувол- ны, и частота оказывается равной f2 = С/1, при этом f2 = 2fv
Акустика музыкальных инструментов. Акустика речи и пения 215 На третьей частоте укладывается три полуволны, и частота f3 = 3/7 и т. д. Если, увеличивая скорость вдувания и уменьшая расстояние между кромкой и щелью, поднимать частоту краевого тона (рис. 4.2.7), то при определенных ее значениях она совпадет со второй собственной частотой столба воздуха в трубе, и произойдет пере- ход скачком высоты тона на октаву выше. Этот эффект называет- ся «передуванием». Скачкообразный переход на более высокие частоты, соответствующие высшим собственным частотам столба воздуха в трубе, позволяет получить звучание обертонового ряда с соотношением частот 1 :2:3:4:5. Легкость «передувания» зависит от формы трубы, в первую очередь ее мензуры (отношения диаметра к длине трубы): в узких и длинных трубах легче возбуждаются высокие гармоники, а ос- новной тон становится менее устойчивым, т. к. с увеличением ско- рости вдувания больше мощности передается в высокие гармони- ки. Поэтому в лабиальных инструментах на тихих уровнях можно исполнять только низкие тоны; переход на более высокие тоны не- избежно сопровождается увеличением громкости. Это явление приводит к еще одному важному следствию: спектр звучания (тембр) лабиальных инструментов существенно меняется в зави- симости от уровня громкости. Широкие и короткие трубы тяжело передуваются, они издают, главным образом, основной тон, т. е. спектр звука таких труб (соответственно и тембр) беден обертона- ми, например в лабиальных органных трубах типа tibia clausa (см. раздел 4.2.4). Изменение длины трубы с помощью боковых отверстий: для того чтобы получить хроматический звукоряд, в духовых инстру- ментах используются различные способы изменения длины трубы. Эти изменения могут достигаться использованием дополнительных отверстий на боковой стенке (с клапанами или без них), как у ла- биальных и тростевых инструментов, или примененением венти- лей или выдвижных кулис (цугов), как в медных инструментах. Принцип действия боковых отверстий может быть объяснен следующим образом: на основном тоне в открытой лабиальной трубе возникает стоячая волна с максимумом звукового давления в центре и двумя узлами на концах (рис. 4.2.9). Если просверлить отверстие в стенке трубы точно на месте максимума давления, то устанавливается сообщение трубы с атмосферным воздухом и в этом месте образуется еще один узел звукового давления (со- ответственно максимум скорости); в результате устанавливается картина стоячих волн с двумя полуволнами и происходит переход на следующую собственную частоту. Если отверстие просверлить на 2/з длины трубы, то образуется форма колебаний, соответству- ющая третьей гармонике, и т. д. Такие отверстия используются обычно для облегчения процесса передувания.
216 Глава 4 Просверливая небольшие отвер- стия на разных расстояниях от от- крытого конца трубы, удается полу- чать смещение узла (нуля) звукового давления. Это дает возможность, Рис. 4.2.10. Влияние диаметра открывая во время игры отверстия, боковых отверстий слегка «укорачивать» трубу, умень- на изменение длины трубы шая тем самым длину волны и под- нимая частоту колебаний столба воздуха, что в сочетании с передуванием и позволяет получить хроматический звукоряд в нескольких октавах. В деревянных духовых инструментах используется три вида от- верстий: — отверстия, не имеющие клапанов, называются основными, с их помощью получается основной диатонический звукоряд, они закрыва- ются пальцами рук (обычно армируются специальными кольцами); — отверстия с открывающимися клапанами (в исходном состо- янии они закрыты) используются для получения добавочных тонов, не входящих в диатонический ряд; — отверстия с закрывающимися клапанами (в исходном состо- янии они открыты и закрываются при нажатии на клапан) называ- ются добавочными и обычно используются для получения низких тонов, их количество варьируется от 2 до 7. Для управления кла- панами используется система рычагов. Степень повышения частоты зависит от места расположения боковых отверстий, их диаметра, глубины, наличия или отсутствия клапанов, высоты подъема клапанов и др. Полная теория выбора расположения отверстий и их диаметров достаточно сложна, с ней можно ознакомиться в специальной литературе [15, 27]. Очевидно, что, подбирая диаметр отверстия, можно более или менее эффективно укорачивать трубу. Если диаметр отверстия равен сечению трубы, то труба фактически оканчивается на этом отверстии. Если диаметр отверстия уменьшается, то его влияние на эффективную длину трубы также уменьшается, как это показано на рис. 4.2.10. Когда на трубе расположено несколько отверстий, то из них об- разуется решетка, которая действует как фильтр высоких частот, т. е. она пропускает высокие частоты, а низкие частоты отражает. Критическая частота, выше которой пропускаются высокие ча- стоты и отражаются низкие, называется частотой среза и опреде- ляется по следующей формуле [12]: /е = о,иЦ=4= a <y]s(t + l95b) (значения параметров объяснены на рис. 4.2.11).
Акустика музыкальных инструментов. Акустика речи и пения 217 Это приводит к тому, что ха- рактеристика направленности в духовых инструментах с боковы- ми отверстиями приобретает осо- бый ВИД: НИЗКИе частоты ИЗЛуча- Рис. 4.2.11. Значение параметров ковые отверстия. Эффективная длина трубы за счет открытых отверстий на вы- соких частотах меняется сильнее, чем на низких, поэтому верхние резонансы слегка сдвигаются по отношению к низким, что вносит определенную негармоничность в спектр. Закрытые отверстия так- же влияют на акустические характеристики, т. к. слегка увеличива- ют объем воздуха (т. е. труба акустически кажется длиннее), что немного понижает резонансы. Краевой эффект. Негармоничность спектра Следует отметить, что возникновение чисто гармонического спектра в лабиальных духовых инструментах — это идеализиро- ванный процесс, на практике все происходит значительно сложнее. Теоретически первый резонанс наступает, когда длина воздуш- ного столба точно равна половине длины волны. Когда плоская волна выходит из открытого конца в окружающую атмосферу, она превращается в сферическую волну (конец трубы как бы служит точечным источником), при этом часть энергии поглощается, часть отражается. Практически стоячая волна несколько выходит свои- ми концами за физические пределы трубы, т. е. фактически колеб- лющийся столб внутри трубы всегда немного меньше V2 длины волны для открытых труб и V4 для закрытых [2, 4, 12]. В зависи- мости от поперечника трубы влияние процессов на краю трубы будет различным: чем больше площадь сечения, тем сильнее вза- имодействие с атмосферой и больше «выход» волны за пределы трубы. Этот эффект называется краевым и за счет него происходит по- нижение частоты основного тона пропорционально диаметру трубы. Длина волны становится как бы больше, чем длина трубы, и ре- зонансная частота снижается. Сдвиг частоты за счет краевого эффекта у входа трубы (амбушюрного отверстия у флейты или лабиума у органных труб) приблизительно равен ются в основном от открытого конца трубы, а высокие через бо- боковых отверстий для расчета частоты среза 2,3а2 где S — площадь амбушюрного отверстия флейты или лабиума у органной трубы, a — радиус трубы [2, 4]. Для открытых труб влияние краевого эффекта сказывается на обоих концах трубы, т. е. на ее входе и на выходе у излуча- ющего отверстия. Кроме того, краевой эффект имеет место и на
218 Глава 4 открытых боковых отверстиях. Поэтому расчет фактической длины трубы инструментов, настроенной на заданную частоту fJt достаточно сложен. К длине трубы, вычисленной по формуле L0= 1/2А, где X — длина волны, равная CZf1 (С — скорость звука), надо внести некоторые поправки dL. Опытные мастера экспериментально установили требуемую разницу dL между рассчитанной длиной трубы и фактической, которую необходимо принять для учета влияния краевого эффекта L = L0- dL. Она зависит от радиуса трубы а и приблизительно равна [2, 12]: dL ~ 0,635а. Краевой эффект сказывается только на низких частотах; по мере повышения частоты его влияние уменьшается, при этом строгая гармоничность резонансных частот нарушается. Степень этого нарушения, как было сказано выше, зависит от диаметра трубы: чем больше диаметр, тем сильнее негармоничность спек- тра, — поэтому в органных лабиальных трубах этот эффект выра- жен сильнее чем у флейты. Следует отметить, что спектр излучаемого звука в духовых ин- струментах вообще очень сильно зависит от диаметра трубы: на низких частотах, где длина волны больше диаметра трубы X > 2d, звуковые волны лучше отражаются от открытого конца трубы, формируя выраженную картину стоячих волн. На резонансах в вы- сокочастотной части спектра волна излучается наружу через от- крытые отверстия и мало отражается. Для описания резонансных явлений в трубах используются измерения частотной зависимости импеданса (который равен отношению звукового давления к скоро- сти частиц) в разных точках трубы. Измерения на открытом конце трубы [28] отчетливо показывают (см. рис. 4.2.12), что на высоких частотах значения импеданса на открытом конце трубы приближа- ются к величине волнового сопротивления воздуха Z = рс и звуко- вая волна после выхода из трубы «не чувствует», что она перешла в другую среду и плохо формирует отраженную волну. Это ограни- чивает количество «звучащих» гармоник (с достаточно большими значениями амплитуд) в спектре трубы: их примерно можно оце- труба без отверстий Импедансные кривые для трубы без отверстий и для трубы с отверстиями Рис. 4.2.12.
Акустика музыкальных инструментов Акустика речи и пения 219 нить как N = L/d, где N — число гармоник, L — длина трубы, d — диаметр трубы. Реализация всех изложенных выше принципов звукообразо- вания будет рассмотрена далее на примере такого лабиального духового инструмента, как флейта (процессы звукообразования в лабиальных трубах органа будут рассмотрены в разделе 4.2.4). ФЛЕЙТА Система звукообразования. Акустические характеристики Инструменты флейтовой группы имеют древнюю историю. Ве- роятно, первыми использовались дудочки из тростника или из бамбука. Продольная флейта, хорошо известная в Риме, появи- лась в Европе около Xl века (блокфлейта) и до XVII века была достаточно широко распространена как концертный инструмент, но с начала XVII века она была вытеснена поперечной флейтой, первые упоминания о которой встречаются еще в IX веке до н. э. в Китае. Оркестровая поперечная флейта в современном виде была усовершенствована в период с 1832 по 1847 год Т. Бёмом — изоб- ретателем и музыкантом из Мюнхена. Он ввел новую систему от- верстий с различными клапанами (первоначально открытыми или закрытыми) и систему рычагов для управления ими, увеличил ди- аметры отверстий, изменил их расположение и окончательно ввел параболическую головку (закрытую часть на конце флейты). Все это значительно увеличило громкость инструмента, что позволило широко использовать флейту как в симфоническом оркестре, так и при сольном исполнении [5, 11, 24, 29]. В настоящее время используется несколько разновидностей флейт: большая поперечная флейта, флейта-пиколло, а также аль- товая флейта, продольная блокфлейта, или рекордер, и др. [5, 6, 7]. Конструкция, современная поперечная флейта состоит из трех частей (рис. 4.2.13): головная часть (головка, 1) с амбушюр- ным отверстием (дульцем, 2) и пробкой (3); основная часть (сред- нее колено, 4) с большинством рабочих отверстий и клапанов (5); конечная часть (нижнее колено, 6) с отверстиями и клапанами для правой руки (7). Соединение головной и основной частей сделано амбушюрное отвер- клапаны 7 2 стие 5 для левой руки для правой руки 3 5~Т „л. и., . накладка 6 клапан для большого пальца Рис. 4.2.13. Конструкция поперечной флейты
220 Глава 4 подвижным, чтобы можно было подстраивать инструмент. Общая длина трубки 605-616,5 мм, диаметр открытого конца 19 мм. Труб- ка почти цилиндрическая, внутренний диаметр трубки у закрытого конца примерно 16,6 мм, затем он постепенно расширяется к вы- ходу до 19 мм. Это делается для того, чтобы слегка поднять вторую гармонику, т. к. наличие амбушюрного отверстия ее занижает. Проб- ка с винтом (3) у закрытого конца установлена для подбора длины узкой полости между отверстием и пробкой. Чрезвычайно важными для настройки и качества звучания флейты являются такие элементы конструкции, как форма голов- ной части трубы, форма амбушюрного отверстия, размер полости между этим отверстием и пробкой и др. (рис. 4.2.14) [11]. Их вли- яние было детально изучено различными специалистами [2, 27]. Это позволило получить интересные результаты: в частности, было установлено, что выбор размеров амбушюрного отверстия суще- ственно влияет на качество звука (при малых диаметрах отверстия звук получается более слабым, при больших диаметрах — более громким, но менее контролируемым). В современных флейтах для вдувания воздуха используется эллиптическое отверстие (ближе к прямоугольному) с размерами 10x12 мм. Поскольку в металли- ческих флейтах толщина стенок трубы примерно 0,3 мм, что очень мало для амбушюрного отверстия (оно будет работать неэффектив- но, особенно для низких частот), используется специальная метал- лическая накладка (рис. 4.2.14) с достаточно удобной для поддер- жки губ формой. Стенки отверстия наклонены под углом - 7°. Величина полости между пробкой и амбушюрным отверстием также существенно влияет на величину поправки к длине трубы за счет краевого эффекта, т. е. на степень негармоничности спектра. Экспериментально было установлено, что сделать поправку почти постоянной в диапазоне до 2 кГц можно выбором расстояния меж- ду центром отверстия и пробкой примерно 17 мм. На флейте имеется 14 (иногда 15-16) отверстий со следующими размерами: высота 1,5 мм, диаметр от 6,7 мм до 15,5 мм (разме- miii = iiii = iiii = iiii Vl I 1р|11=1111=111ш1 пробка головная Рис. 4.2.14. Формы головной части трубы у флейты ъ трубы ihi = i ры увеличиваются ближе к открытому концу) [12]. При игре используются все три перечисленные выше вида отверстий: часть открывается или закрывается непосред- ственно пальцами левой и правой рук, часть с помо- щью клапанов (пример ис- пользования отверстий пока- зан на рис. 4.2.15). Как уже было отмечено, боковые отверстия выполняют роль
Акустика музыкальных инструментов. Акустика речи и пения 221 •o#*oQ#Ao0gD Щ расположение отверстий для открытые отверстия Q закрытые отверстия ф отверстия, открываемые г\ с помощью клапанов w левая рука 1234 1 2 3 4 правая рука tx°x левый большой палец Рис. 4.2.15. Пример использования отверстий при игре на флейте высокочастотного фильтра; при указанном выше выборе числа, ди- аметров и расположения отверстий частота среза такого фильтра составляет около 2000 Гц. Механизм звукообразования в поперечной флейте включает в себя все перечисленные выше процессы: образование краевых тонов, возбуждение резонансов в трубе, взаимодействие колеба- ний столба воздуха и воздушной турбулентной струи, установле- ние режима автоколебаний и режима излучения. «Краевые» тоны образуются за счет колебаний воздушной струи у кромки амбушюрного отверстия при вдувании воздуха с опре- деленной скоростью (рис. 4.2.16). При исполнении на флейте музыкант контролирует следующие параметры: скорость вдувания, длину воздушной струи (расстояние от губ до амбушюрного отвер- стия — рис. 4.2.17), угол наклона струи, площадь открывания губ, количество и место открываемых или закрываемых отверстий и др. [16, 17, 18]. Рис. 4.2.16. Способ образования краевых тонов у флейты Рис. 4.2.17. Уменьшение расстояния до амбушюрного отверстия при изменении высоты тона
222 Глава 4 Юг §2 о C1 Q C7 Высота тона Рис. 4.2.18. Зависимость высоты тона флейты от длины воздушной струи Как было установлено в процессе исследований механизма звукообра- зования у флейты [2, 18, 27], для по- вышения тона на октаву (методом передувания) необходимо: — уменьшить длину струи (при- мерно на 20%), т. е. приблизить губы к амбушюрному отверстию. Экспери- ментально было показано [2], что при переходе к более высоким тонам рас- стояние до отверстия уменьшается в соответствии с кривой, показанной на рис. 4.2.18. Необходимо отметить, что при этом меняется состав спектра: при уменьшении расстояния (приближении губ к отверстию) спект- ральный состав звука обогащается, увеличивается число обертонов, соответственно меняется тембр; — уменьшить открытие губ (примерно на 30 %), увеличив при этом давление вдувания струи почти в два раза, что соответ- ствует увеличению скорости струи примерно на 40 %. Зависимость высоты тона от воздушного давления и площади открытия губ показана на рис. 4.2.19а, б [17, 18]. Большое значение имеет также выбор угла вдувания: напри- мер, чтобы получить низкие тоны на относительно громком уров- не, используется тупой угол, примерно на 25-40° ниже горизон- тальной плоскости. Спектральное содержание звука зависит от степени симметрич- ности струи. При направлении вдувания, строго симметричном от- носительно кромки, подчеркиваются нечетные гармоники. При не- а Рис. 4. 2.19. Зависимость высоты тона флейты: — от величины давления воздуха в струе, б — от площади открытия губ
Акустика музыкальных инструментов. Акустика речи и пения 223 PQ И (D ч CQ cd 2 о PQ О Л Я <D PQ О Cl. 4Of 20 1ш Ii 1 I I 11 Ii громкий уровень «тихий уровень 0 12340123401 23 4'кГц Рис. 4.2.20. Изменение спектра звука при увеличении высоты тона на громком и тихом уровне у четырех разных исполнителей на флейте (а, б, в, г) симметричном направлении вдувания в спектре появляются как четные, так и нечетные гармоники. Таким образом, меняя угол вду- вания воздушной струи при игре на флейте, можно изменять соот- ношение между четными и нечетными гармониками и, следова- тельно, тембр звучания. Спектральный анализ тонов, сыгранных на флейте четырьмя разными музыкантами (рис. 4.2.20), показывает, что в спектре при- сутствуют все гармоники — как четные, так и нечетные, однако ам- плитуды этих гармоник быстро убывают, при этом по мере увели- чения громкости исполняемых тонов повышается уровень высоких гармоник. Таким образом, один и тот же тон, исполненный на флейте с разной громкостью, будет иметь разный спектральный состав и, следовательно, разный тембр, что очень важно учиты- вать при звукозаписи. Как и у всех лабиальных инструментов, спектральный состав звуков флейты обладает определенной негармоничностью за счет «краевого эффекта», который имеет место на открытом конце, на амбушюрном отверстии и на боковых отверстиях [17]. При игре на флейте используется частотная модуляция (вибрато) за счет небольшой вариации давления вдувания с частотой 5-6 Гц. Причем, как показывает анализ, глубина модуляции наибольшая на высоких гармониках, что придает особый тембр звучанию. Специфической особенностью звуков флейты является наличие шума за счет вихреобразования в турбулентной струе. Для опре- деления степени турбулентности струи в аэродинамике использу- ется обычно специальная величина — число Рейнольдса
224 Глава 4 R = р Vh/ix, где р — плотность среды, Vc — скорость струи, h — толщина струи (в приведенных ниже данных принято Л - 1,0 мм), ju — вяз- кость среды. При игре на флейте число Рейнольдса может дости- гать значения 3000, что соответствует скорости струи примерно 45 м/с; при этом имеет место выраженный турбулентный широко- полосный шум, возникающий у амбушюрного отверстия, который фильтруется резонансами трубы, приобретая определенную то- нальную окраску [31]. Поскольку при переходе к более высоким тонам скорость струи должна возрастать, то и уровень турбулен- тного шума соответственно возрастает. Все это вносит специфи- ческую окраску в тембр звучания флейты. Необходимо отметить также, что на резонансные частоты флей- ты (как и других духовых инструментов) влияет скорость звука, которая сильно зависит от температуры и содержания углекисло- го газа в окружающей среде. Материал. Современные поперечные флейты делают в ос- новном из различных металлов: латуни (недорогой желтоватый сплав меди и цинка), при этом снаружи их покрывают никелем или серебром; белой латуни (сплав меди, цинка и никеля белого цве- та); серебра — поскольку чистое серебро мягкий металл, обычно для флейт используется сплав 92,5% серебра и 7,5% меди; золо- та — обычно в сплаве с медью, иногда золото используется для изготовления амбушюрных пластин, непосредственно соприкасаю- щихся с губами музыканта. Для изготовления клапанов и пружин используется белое золото (сплав золота с цинком, никелем, хро- мом и кадмием), специальная сталь или фосфорная бронза. Известны флейты, изготовпенные из дерева и даже из фарфора. Несмотря на многочисленные утверждения, что флейты из сереб- ра и золота дают самый чистый звук, эксперименты показали [18], что состав материала не оказывает очень существенного влияния на качество звука; более существенной является точность изготов- ления конструктивных элементов флейты (гладкость внутренних стенок, точность изменений диаметра трубы, расположения и ди- аметров отверстий и т. д.). АКУСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ Частотный диапазон звучания большой концертной флейты составляет: для основных тонов от 246,94 Гц (ВЗ) до 2489,02 Гц (Еь7), однако ноты ниже С4 и выше С7 трудно извлекаются, поэто- му обычно используется диапазон от 261,6 Гц (С4) до 2093,0 Гц (С7) [11, 13, 23]. При исполнении на достаточно громком уровне полный частотный диапазон за счет обертонов имеет верхний предел примерно до 6 кГц. Для флейты-пиколло основной диапа- зон составляет 587,3 Гц (D5)-4186 Гц (С8) [23]. Характерной особенностью флейты является плавный спад амплитуд четных и нечетных гармоник относительно амплитуды
Акустика музыкальных инструментов. Акустика речи и пения 225 t, MC Рис. 4.2.21. Трехмерный спектр флейты 20500 3620 813O _ 1>гц основной частоты. В спектре наиболее выражены амплитуды гармоник от первой до пятой (рис. 4.2.21). При переходе к более высоким тонам количество гармоник уменьшается, энергия сосре- дотачивается в области основного тона, причем нечетные гармо- ники несколько превалируют над четными. Имеется слабо выра- женная формантная область около 800 Гц. В спектре присутствуют шумовые компоненты (за счет турбулентного шума вдувания); при этом в непрерывном спектре шума проявляются тональные компоненты, особенно при «передувании» за счет случайного возбуждения отдельных «неиспользуемых» резонансов — напри- мер, в диапазоне выше Е5 такие компоненты появляют- ся на половине основной ча- стоты и нечетных гармониках от нее [13]. Динамический диапазон составляет 25 дБ на низких и 10 дБ на высоких частотах [11, 13, 16, 19]. Максималь- ный уровень (ff) для низких нот достигает 75 дБ-С, для высоких нот — 85 дБ-С (на расстоянии 9 м от инстру- мента). Тихие уровни (рр) возрастают от 50 дБ-А для низких тонов до 75 дБ-А для высоких. Переходные искажения: время атаки звука у флейты самое длинное среди группы деревянных инструментов. Длительность нарастания зву- ка уменьшается с повышени- ем тона от 100 мс до 30 мс [13, 16, 17]. Форма атаки и спада гладкая, однако 1800 Гц 2400 Гц 3000 Гц 8000 Гц Рис. 4.2.22. Формы характеристик направленности флейты на разных частотах
226 Глава 4 процесс вступления обертонов характеризуется первоначальным появлением высоких компонент (из-за шумов вдувания) и так назы- ваемых «предварительных» тонов, обусловленных тем, что краевые тоны возбуждают в начале процесса атаки более высокие оберто- ны. Продолжительность этих высоких тонов во время атаки дости- гает примерно 50 мс [23]. Коэффициент полезного действия этого инструмента низкий, меньше 1%, игра на флейте требует большого объема воздуха при неэкономичном расходовании его [2]. Характеристика направленности остается достаточно широ- кой до высоких частот, т. к. диаметр выходного отверстия мал по сравнению с длиной волны. Имеется довольно значительное излу- чение от амбушюрного отверстия и от открытых боковых отвер- стий, которые начинают излучать с частоты порядка 2 кГц. Вид характеристики направленности на разных частотах показан на рис. 4.2.22. Тембр звучания флейты чистый, светлый, прозрачный в сред- нем регистре, переходящий в резкие свистящие звуки в высоком регистре [11, 24]. 4.2.2. Тростевые духовые инструменты. Кларнет. Гобой. Фагот. Саксофон С точки зрения системы звукообразования инструменты этого типа имеют много общего с лабиальными духовыми инструмен- тами: в качестве генератора энергии здесь также используется дыхательная система музыканта, в которой за счет работы мышц создается определенная энергия сжатого воздуха; вибратором в этой группе инструментов является колеблющаяся пластинка — трость; в качестве резонатора выступают закрытые цилиндри- ческие или конические трубы, процесс колебания воздушного столба в которых имеет некоторые отличия от такового в откры- тых цилиндрических трубах, используемых в лабиальных музы- кальных инструментах. В целом механизм звукообразования у этой группы инструментов несколько сложнее, чем у лабиальных, за счет дополнительного элемента — мундштука с колеблющимися пластинками (тростями). Все инструменты этой группы могут быть классифицированы (по типу тростей и по форме основной трубы-резонатора) следу- ющим образом: — с цилиндрической трубой с одинарной тростью — кларнет, некоторые язычковые трубы органа; — с конической трубой с двойной тростью — гобой, фагот, английский рожок и др.; — с конической трубой с одинарной тростью — саксофон. Общий вид группы тростевых инструментов показан на рис. 4.2.23.
Акустика музыкальных инструментов. Акустика речи и пения 227 Рис. 4.2.23. Общий вид группы тростевых инструментов Процесс звукоизвлечения в духовых тростевых инструментах имеет ряд существенных особенностей, рассмотренных далее. Механизм возбуждения тростей: трость представляет собой тонкую упругую пластинку, закрепленную в мундштуке. На рис. 4.2.24 показана конструкция трости и ее положение в мундштуке однотростевого инструмента — кларнета. Трость закрепляется од- ним концом в нижней части мундштука, верхняя часть которого сделана из жесткого материала. Исполнитель производит вдувание сжатого воздуха в узкую щель между тростью и верхней частью а б Рис. 4.2.24. — конструкция трости (1 — вид сбоку, 2 — вид сверху, 3 — вид сзади); — положение трости в мундштуке кларнета (1 — канал, 2 — трость)
228 Глава 4 К трубе инструмента мундштука, при этом возникают коле- Трость ности [16] (рис. 4.2.25): бания трости в такой ПОСЛеДОВателЬ- ei/d сбоку — в начальный момент — трость пптп^НЫИ^^^ 0==о° отклонена и находится в положении поток равновесия (фаза колебаний соответ- 9=90° ствует 0°). Струя с большой скоро- 3333=1 стью вдувается в узкую щель, при ^22^^ 9 = 180° этом К0ГДа скорость ее растет, давле- " «а ние в струе падает (за счет эффекта _ 0 Бернулли, о котором будет сказано 2з^Г 0 ~270 ниже). Под действием разности дав- ления трость захлопывается, что со- Рис. 4.2.25. ответствует фазе колебаний 90°; Последовательность — в следующий момент — про- смещения трости ход в мундштуке закрыт, давление изнутри растет и трость начинает отклоняться обратно за счет давления и собственной упругости, при этом воздушная струя устремляется в отверстие. Фаза колеба- ний соответствует 180°; — трость под действием силы инерции проскакивает положение равновесия и отклоняется назад (фаза 270°). Скорость струи ра- стет, давление падает и трость снова отклоняется к положению равновесия (360°). После этого процесс колебания струи повторяется. Аналогич- ные процессы происходят и в двутростевых музыкальных инстру- ментах, только там колеблются одновременно две пластинки (кон- струкция двойной трости для гобоя показана ниже). «Эффект Бернулли» заключается в том, что при возрастании скорости струи воздуха V, продуваемой через канал в его узком сечении, давление р в нем падает, а при снижении скорости — возрастает, это вытекает из закона сохранения механической энер- гии. Общее уравнение Бернулли для несжимаемой среды имеет у2 р где V—скорость, вид = сот*, р — давление, P р — плотность среды [32]. При колебаниях свободного конца пластинки происходит моду- ляция воздушной струи с определенной частотой, т. е. происходит изменение скорости проходящего воздушного потока, что и служит причиной возбуждения колебаний столба воздуха в трубе. Толщина, материал и форма тростей влияют на тембр ин- струмента, его динамический диапазон и высоту тона, поэтому большое внимание уделяется выбору их параметров. Трости бы- вают двух видов: бьющие и свободные. Бьющие трости имеют
Акустика музыкальных инструментов. Акустика речи и пения 229 площадь больше площади отверстия, т. е. они закрывают его пол- ностью. При колебаниях трости могут ударять по твердой поверх- ности мундштука, поэтому звук у инструментов получается резкий, острый (такие трости используются в кларнете, гобое, фаготе и др.). Свободные трости имеют площадь меньше отверстия, по- этому звук получается более мягкий, они используются в некото- рых трубах органа [11]. По применяемым материалам трости также разделяются на пла- стинки: металлические (там, где губы не приходят с ними в сопри- косновение, например для язычковых труб органа) и тростниковые (для инструментов типа кларнета, гобоя и др.), в которых прикосно- вением губ и языка можно изменять площадь и массу колеблю- щейся части трости и, следовательно, ее резонансную частоту [22]. Трости изготавливают из определенных пород тростника (Arundo Donax). Физико-механические параметры тростника (плотность, модуль упругости, декремент затухания, гигроскопичность и др.) оказывают очень большое влияние на игровые качества тростей. Обычно плотность его находится в пределах 0,43-0,66 г/см3, модуль упругости 71-125 кг/см2. С повышением влажности модуль упруго- сти падает, декремент затухания возрастает, поэтому тростниковые трости недолговечны, срок их использования составляет несколь- ко недель [11]. Геометрические размеры и формы тростей отрабатывались для каждого вида инструментов на протяжении длительного времени. Форма и размеры трости для кларнета показаны на рис. 4.2.24. Она представляют собой заостренную пластинку овальной формы со средними размерами: ширина В = 12-12,5 мм; длина L = 67- 68 мм; длина заостренной части А = 32-33 мм; толщина колеблю- щейся части h0 = 0,1-0,16 мм. Разброс геометрических параметров тростей оказывает существенное влияние на настройку инструмен- та. Наибольшее значение имеет разброс толщин: при игре с более тонкой тростью разброс по высоте тона возрастает и может до- стигать 70 центов [11]. Изменения настройки тростей на желаемую частоту колебаний можно добиться в тростевых духовых инструментах следующим образом: исполнитель, сжимая мундштук губами и продвигая их к концу, дальше от зажатой кромки, извлекает более высокий звук, т. к. при этом уменьшаются действующая длина и масса трости. Если музыкант хочет извлечь низкие звуки, он уменьшает нажим (одновременно захватывая трость глубже). Поскольку трость имеет неравномерный профиль, уменьшение ее массы происходит непропорционально действующей длине. Следует отметить, что в собранном инструменте полученный при этом сдвиг высоты тона будет не очень большим, т. к. резонансы трубы контролируют высо- ту тона. Существует и другой способ изменения длины трости, который применяется в органных язычковых трубах (о нем будет
230 Глава 4 рассказано в разделе 4.2.4). Выбор частоты резонанса трости имеет существенное значение для тембра инструмента. Проведен- ные исследования показали, что резонансная частота трости долж- на находиться в определенных соотношениях с основной часто- той возбуждения колебаний в трубе: например, для кларнета эти соотношения составляют/трости~ (6-10Jf1 трубы [2]. Таким образом, меняя в процессе игры силу и место стати- ческого сжатия губами трости, музыкант меняет в известных пределах частоту и добротность резонанса трости, что влияет на тембр звучания, а также позволяет получить в процессе игры эффект вибрато (в кларнете используются обычно вариации частоты модуляции в пределах 4%). Процесс взаимодействия тростей и воздушного столба в трубах определяется следующими параметрами: — форма возбуждающего импульса при модуляции струи суще- ственно зависит от амплитуды колебаний трости, следовательно, и от скорости вдуваемой струи. Для обеспечения модуляции воздушной струи должно быть создано избыточное давление во рту музыканта, которое может до- стигать 3 кПа. По мере увеличения разности давления в ротовой полости и в мундштуке скорость воздушной струи, протекающей в щели между тростью и верхней крышкой мундштука, возрастает почти пропорционально увеличению давления (рис. 4.2.26). Затем, когда разность давлений продолжает возрастать, а скорость струи увеличиваться, трость начинает закрываться (т. к. давление внут- ри струи падает по закону Бернулли) и связь между скоростью потока и разностью давлений становится отрицательной. При до- статочно большой разности давлений трость захлопывается и ско- рость потока становится равной нулю (необходимо подчеркнуть, что при увеличении разности давлений трость закрывается, в этом состоит одно из отличий тростевых инструментов от амбушюрных). В режиме, соответствующем левой части кривой (положительное используемый диапазон разность давлении во рту и в мундштуке разность давлении во рту и в мундштуке разность давлении во рту и в мундштуке несинусоидальные чимпульсы почти синусоидальные импульсы клипирование Рис. 4.2.26. Зависимость объемной скорости от разности давлений во рту и в мундштуке и форма импульсов при разной громкости
Акустика музыкальных инструментов. Акустика речи и пения 231 сопротивление), кларнет не будет звучать, можно услышать толь- ко некоторый турбулентный шум. Рабочий режим находится на правой части кривой (отрицательное сопротивление), он показан выделенной областью на рис. 4.2.26. Из этой кривой видно, что если давление не слишком велико, рабочая область находится почти на линейной части кривой и колебания трости подчиняются синусоидальному закону; при увеличении давления рабочая об- ласть смещается в нелинейную часть кривой, это приводит к не- симметричным нелинейным колебаниям трости и создает много высоких гармоник в спектре. Таким образом, тембр звучания ин- струмента существенно зависит от разности давлений (силы вду- вания), создаваемой музыкантом: она должна быть не ниже неко- торой определенной величины, иначе будет слышен только шум, но и не может быть выше некоторого значения, т. к. может произой- ти значительное искажение (клипирование) формы колебаний трости [2]. Формы воздушных импульсов при разных уровнях громкости также показаны на рис. 4.2.26; отчетливо видно, что они существен- но изменяются. Этот нелинейный процесс изменяет спектральный состав создаваемого звука за счет появления дополнительных про- дуктов искажений и может приводить к появлению комбинационных тонов и биений. Таким образом, в однотростевых инструментах контроль за ам- плитудой вибраций трости, а следовательно, за громкостью и тем- бром звучания осуществляется исполнителем с помощью изменения давления вдувания, а также за счет изменения силы статического сжатия тростей губами. В двутростевых инструментах нелинейные процессы выражены сильнее и характер зависимости скорости по- тока от разности давлений носит более сложный характер [2]; — форма резонаторов в тростевых инструментах имеет опре- деленные особенности. Поскольку присоединение резонатора уси- ливает звук на определенных частотах, соответствующих резонан- сам воздушного столба в трубе, то для музыкального инструмента важно, чтобы соотношения между этими «усиленными» частотами также оставались гармоническими, а этого можно добиться толь- ко выбором определенной формы трубы (рис. 4.2.1). Для тростевых инструментов обычно выбираются вытянутые цилиндрические трубы с раструбом (кларнет) или конические трубы с раструбом (гобой, саксофон). Однако в отличие от лаби- альных инструментов конец трубы со стороны мундштука счита- ется закрытым, поскольку при колебаниях трости либо отверстие закрыто, либо там образуется узкая щель между тростью и по- верхностью, к которой она прижимается (или между двумя тро- стями), поэтому выходное сопротивление очень велико и звуко- вое давление на этом конце трубы всегда имеет максимум (что соответствует требованиям на закрытом конце трубы — см. гл. 2) (рис. 4.2.27).
232 Глава 4 Рис. 4.2.27. Закрытая труба кларнета Сравнение формы стоячих волн и значений собственных частот для открытых (рис. 4.2.9) и закрытых цилиндрических труб (рис. 4.2.28) показывает, что если у открытой цилиндриче- ской трубы на первой собственной частоте вдоль длины трубы устанавливается половина волны L = 1/2Л, то у трубы, закрытой с одного конца, на первой частоте устанавливается только чет- верть длины волны L = 1/4Л, т. к. на одном, закрытом конце дав- ление всегда должно быть максимально, а на другом, открытом, всегда равно нулю (скорость наоборот), т. е. первая собственная частота равна /; = C/4L. Следовательно, если взять две трубы одинаковой длины — одну с двумя открытыми концами, как у флейты, где fj флейты= С/2L9 другую с одним закрытым концом, как у кларнета, где/7 oa/7W = C/4L, — то первая частота закрытой трубы будет в два раза ниже, т. е./; кларн = 1/2 Z1 флейты (например, если длина трубы равна 640 мм, то первая собственная частота флейты fi , . = 265 Гц, а кларнета f, = 132,5 Гц). Для того чтобы J1 флейты r J1 кларнета ' r-i основные частоты были одинаковы, закрытую трубу (например, кларнета) надо брать в два раза короче. ._4 j. f _ЗС л с i_4 т. г 5С г. 5 X= п/, (п= 1,3,5...) Рис. 4.2.28. Формы колебаний (моды) воздуха в закрытых цилиндрических трубах Рис. 4.2.29. Формы колебаний воздуха в конических трубах (твердые линии — изменение давления, пунктирные — изменение скорости частиц воздуха)
Акустика музыкальных инструментов. Акустика речи и пения 233 Вторая особенность закрытых цилиндрических труб состоит в том, что на более высоких собственных частотах вдоль длины трубы устанавливаются формы колебаний (рис. 4.2.28), соответ- ствующие 3(1/4^), 5(1/4X)..., т. е. их частоты находятся в соотноше- ниях 3/р 5fj, If1..., — значит, в спектре присутствуют только не- четные гармоники. На самом деле в спектре кларнета всегда имеются и четные гармоники с меньшими амплитудами. Резонан- сами трубы они не поддерживаются, но поступают от источника, т. е. содержатся в спектре вдуваемого воздушного импульса. В конических трубах форма стоячих волн на собственных резо- нансах близка к форме для цилиндрической трубы с закрытым концом (как у кларнета), только с несколько смещенными узлами (рис. 4.2.29). Поскольку у узкого конца конуса давление всегда мак- симально, на первой частоте также устанавливается четверть дли- ны волны. Но при этом значение собственных частот ближе к частотам открытой цилиндрической трубы: например, если Z1 = 136,4 Гц у закрытой цилиндрической трубы, то у открытой ци- линдрической трубы той же длины частота будет в два раза выше Z1 = 272,8 Гц, а у конуса той же длины частота будет равна /; = 255,6 Гц. При этом в спектре излучаемого звука у конических труб присутствуют все гармоники — четные и нечетные. Как уже было отмечено выше, определение резонансных час- тот в трубах обычно делается по измерениям входного сопротив- ления (импеданса). Для этого в один конец трубы вставляется громкоговоритель, а внутри трубы устанавливается микрофон. Меняя частоту излучения громкоговорителя, на разных частотах с помощью микрофона измеряют отношение звукового давления к объемной скорости Z = P/V. Пики на импедансной кривой соот- о OQ 1 3 5 7 9 11 13 Номер гармоники Рис. 4.2.30. Импедансная кривая для цилиндрической закрытой трубы
234 Глава 4 ветствуют резонансам. Пример распределения резонансных частот на импедансной кривой в цилиндрической закрытой трубе (кларне- та) дан на рис. 4.2.30. Механизм влияния отверстий, раструба и мундштука Раструб в тростевых инструментах играет роль рупора, т. е. позволяет усиливать звучание и формировать характеристику на- правленности. Присоединение раструба несколько повышает зна- чение первых нижних собственных частот трубы, что позволяет компенсировать их сдвиг вниз за счет краевого эффекта. Мундштук играет существенную роль в процессе звукообразо- вания. Это дополнительный воздушный объем, соединенный узким каналом с основной трубой инструмента, присоединение которого несколько понижает верхние частоты в спектре. От выбора его формы и размеров существенно зависит тембр звучания инстру- мента. Чрезвычайно большое значение, в частности, имеет фор- ма профиля верхней части мундштука — накладки (рис. 4.2.24). От выбора ее кривизны зависит легкость игры на инструменте. Отверстия в тростевых инструментах играют ту же роль, что и у лабиальных духовых инструментов, т. е. помогают переходить на более мелкие звуковысотные градации за счет уменьшения эф- фективной длины трубы. Однако, поскольку в лабиальных трубах возбуждаются все гармоники, передуванием можно перейти на вто- рую гармонику, т. е. на октаву. В тростевых цилиндрических ин- струментах (кларнете, например) можно перейти только от /7 к 3/у (т. е. на дуодециму), что сделать только передуванием очень труд- но, поэтому в тростевых инструментах используются специальные регистровые отверстия, которые позволяют существенно облегчить переход на следующую гармонику (в более высокий регистр). Принцип их действия показан на рис. 4.2.31. Кроме того, для обеспечения полутоновых переходов между нечетными гармониками, т. е. в более широком диапазоне, чем у лабиальных инструмен- тов, в тростевых инструментах используется существенно большее число отверстий. Механизм работы с ними, т. е. способ открывания и зак- рывания с помощью системы клапанов, является общим с флейтой (механика Т. Бёма). Негармоничность спектра за счет краевого эффекта также имеет место в тростевых инст- рументах и учитывается в процессе их КОНСТруИрОВа- ^gS=^ регистровое отверстие закрыто 41' lkkkklk1 «АкЧЧ' МЛЧЧ> ША«л№ JKl 1Л «Al1HJ 1 основной toh регистровое отверстие открЬгго _3-я гармоника Рис. 4.2.31. Механизм работы регистрового отверстия.
Акустика музыкальных инструментов. Акустика речи и пения 235 ния. Кроме того, влияние температуры окружающей среды играет существенную роль при настройке тростевых инструментов (как и у других духовых инструментов). Далее будет рассмотрено, как изложенный выше механизм зву- кообразования реализован в конструкциях различных духовых тро- стевых инструментов (кларнета, гобоя, фагота и саксофона). КЛАРНЕТ Система звукообразования. Акустические характеристики Кларнет представляет собой однотростевый духовой инстру- мент с цилиндрической трубой (рис. 4.2.23). Его предшественники были известны еще в Древнем Египте. Он получил широкое рас- пространение в Индии, Южной Америке, арабских странах и др. В Европе он также появился как народный инструмент, но уже в начале XVIII века на предприятии известного мастера И. Денне- ра (J. Denner) в Нюрнберге было организовано его производство в качестве профессионального инструмента [5, 7, 33]. Первое при- менение кларнета в оркестре известно с 1716 года. В 1759 году кларнет был впервые продемонстрирован в Санкт-Петербурге. С 1812 года в нем начала использоваться конструкция системы И. Мюллера, в которой общее количество отверстий было уве- личено до тринадцати с введением дополнительных клапанов, что облегчило игру в разных тональностях и позволило получить более точную интонацию [30]. В 1840 году была введена система отвер- стий и клапанов, аналогичная предложенной Бёмом для флейты, что значительно облегчило игру на инструменте. В настоящее вре- мя различаются две системы кларнетов: немецкая и французская, основанная на механике Бёма [30]. Сейчас кларнет широко используется в современных симфонических оркестрах, народных и эстрадных ансамблях и др. Семейство кларнетов достаточно велико [23], но чаще всего используются следующие разновидности: пикколо (in Es, in D), сопрановый (in В, in А), бас-кларнет (in В) [7, 23]. Кларнет состоит из пяти частей: мундштука с тростью (1), короткой части — «бочонка» для подстройки (2), двух составных частей цилиндрического ствола (3, 4), на которых расположена система отверстий, и раструба (5) (рис. 4.2.32). Кларнет обычно I 2 3 4 5 Рис. 4.2.32. Общий вид кларнета
236 Глава 4 ^ & %а. f?: Altissimo ^ g g ~ f~ ^ «F ^ ° { Clarion Chalumeau ^ w %о о о Рис. 4.2.33. Три регистра кларнета in В (ноты на кларнете in В звучат на тон ниже) изготавливается из черного дерева, самшита (иногда из пластмасс, эбонита и др.). У наиболее распространенного типа сопранового кларнета в строе in В (си-бемоль) основные конструктивные раз- меры следующие: общая длина кларнета 741,5 мм, диаметр вы- ходного отверстия равен 58 мм. Внутренний диаметр за мундшту- ком 15 мм, затем на длине 490 мм он увеличивается до 22 мм. Длина раструба 108 мм, диаметр изменяется от 22 мм до 58 мм, воздушный столб раструба имеет резонансы в области 1400- 2000 Гц, что вносит слабую форманту в излучаемый спектр. Мундштук имеет конструкцию, показанную на рис. 4.2.24. Виб- рирующая часть трости толщиной примерно 0,1 мм обычно нахо- дится на расстоянии 1 мм от верхней половины мундштука. Губа- ми она сдвигается до расстояния 0,5 мм, и колебания ее происходят именно около этого положения равновесия. Механизм возбуждения колебаний описан выше. Резонансная частота трос- ти у кларнета равна примерно 1500-3000 Гц. Число голосовых от- верстий у кларнета обычно 21 (иногда доходит до 23), их располо- жение, диаметры и глубина приведены в работе Л. Кузнецова [11]. У кларнета имеются все три типа отверстий (раздел 4.2.1): от- верстия, которые не имеют клапанов и закрываются с помощью пальцев рук, для получения диатонического звукоряда; отверстия с открывающимися клапанами (для получения альтерированных тонов); отверстия с закрывающимися клапанами. Нижнее регистровое отверстие (на ^I^U Длины канала от мундштука) облегчает переход с первого на второй регистр, т. е. от первой к третьей резонансной частоте. Всего у кларнета in В три регистра: chalumeau, clarion, altissimo, что соответствует пере- ходу на 1 : 3 : 5 гармоники (рис. 4.2.33). Для перехода на третий регистр служит одно из отверстий вблизи открытого конца трубы, обычно закрытое указательным пальцем левой руки. Система отверстий, как и у лабиальных инструментов, работа- ет как линейка высокочастотных фильтров с частотой среза поряд- ка 1500 Гц, что оказывает существенное влияние на характерис- тику направленности инструмента. АКУСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ Диапазон воспроизводимых частот: для сопранового кларне- та in В диапазон основных частот 146,8 Гц (D3)-1864,7 Гц (Вь6)
Акустика музыкальных инструментов. Акустика речи и пения 237 Рис. 4.2.34. Состав обертонов для звуков нижнего, среднего и верхнего регистров (для кларнета in А на полтона ниже); для бас-кларнета in В 58,27 (В1 )-698,46 Гц (F5); для пикколо-кларнета in Es 196 Гц (G3)-2093 Гц (С7) [23]. Спектр достаточно богат обертонами (рис. 4.2.34), поэтому пол- ный частотный диапазон может достигать 7 кГц [16] (при исполне- нии ff даже до 12 кГц). Интересно отметить, что в спектре звуков нижних регистров четко видно практическое отсутствие четных гармоник, разница в уровнях нечетных и четных гармоник достига- ет 25 дБ, в верхних регистрах четные гармоники присутствуют при- мерно с одинаковыми уровнями. В спектре имеются две слабые формантные области: 1500-1700 Гц и 3700-4300 Гц. Динамический диапазон у кларнета самый широкий из деревян- ных инструментов, используемых в оркестре. На низких частотах он составляет порядка 35 дБ, на средних — 50 дБ, на высоких — 25 дБ [13, 19]. Самые громкие звуки — 80 дБ-С (могут достигать уровня 90 дБ-С на высоких частотах), самые тихие порядка 45 дБ-А (на расстоянии 9 м от инструмента). Переходные процессы, атака звука ясная и четкая, происходит плавное нарастание амплитуд всех гармоник, время нарастания — 15-20 мс при острой атаке и доходит до 50 мс при мягкой. Характеристика направленности (рис. 4.2.35): наличие боковых отверстий, выполняющих функцию фильтра высоких частот, приводит к сложной структуре характеристики направленности: на низких час- тотах она имеет круговую форму, выше частоты 1000 Гц излучение
238 Глава 4 происходит В ОСНОВНОМ из отверстий, а на частотах выше 3000 Гц острый лепе- сток сужается и направляет- ся вниз, звук поступает к слушателям за счет отра- жений от пола. Только если раструб кларнета направ- лен на твердую поверх- ность пола, будет обеспе- чен высокий уровень 3000 Гц 5000 Гц отраженных высокочастот- ных звуков для слушателей. Рис. 4.2.35. Характеристика направленности кларнета Z. Тембр: из-за низкого уровня четных гармоник в нижних регистрах спектра тембр кларнета несколько глуховатый, гулкий; в сред- них регистрах — чистый (сопрановый) звук; в высо- ких регистрах — резкий (свистящий). На тембр сильно влияет на- стройка частоты среза фильтра высоких частот за счет отверстий: если при всех открытых отверстия частота среза выше 1500 Гц — тембр более яркий, если ниже — более глухой [11, 24]. ГОБОЙ. ФАГОТ Система звукообразования. Акустические характеристики Семейство духовых инструментов с двойной тростью включает в себя: гобой, английский рожок, фагот, контрафагот и др. (рис. 4.2.23). Гобой был сконструирован на основе своего предшествен- ника шалмея в XVII веке, в конце XIX века был усовершенствован благодаря введению клапанного механизма французским мастером Ф. Трибером (F. Triebert) [30]. В современной музыке достаточно широко используется в составе симфонического оркестра и как солирующий инструмент. Конструкция оркестрового сопранового гобоя показана на рис. 4.2.36, он состоит из следующих основных частей: двойной трости, конической трубы и раструба. Трость Рис. 4.2.36. Конструкция гобоя (Основная трубка, состоящая из двух частей)
Акустика музыкальных инструментов. Акустика речи и пения 239 нижнее колено большое колено Рис. 4.2.37. Конструкция фагота гобоя вставляется в специальное отверстие в верхней части инст- румента. Общий размер инструмента 620-640 мм, диаметр конуса меняется от 5 до 17 мм, угол раскрыва конуса 1,5°, диаметр рас- труба 37 мм [11, 18]. Обычно он делается из черного дерева (иног- да из пластмассы). Фагот появился в XVI веке, был усовершенствован в XIX веке немецкими мастерами за счет введения клапанных механизмов. Лучшей конструкцией оказалась система В. Геккеля (W. Heckel) [5], хотя имеется и другая (французская) форма этого инструмента. Конструкция фагота показана на рис. 4.2.37. Фагот состоит из сле- дующих частей: двойная трость насажена на изогнутую трубку «эс», вставленную в малое колено, которое соединено с U-образ- ным коленом и большим коленом с раструбом. Общая длина тру- бы фагота составляет 2,45 м, в свернутом виде 1,2 м, диаметр раструба 60 мм. Форма труб цилиндрически-коническая. Принцип звукообразования в этих инструментах аналогичен однотростевым инструментам (кларнету), только в них используют- ся двойные трости и коническая форма труб. Конструкция трости гобоя показана на рис. 4.2.38. Она пред- ставляет собой две легкие тростниковые пластинки, сложенные таким образом, чтобы в середине образовалась щель. Пластинки (3) с помощью ниток (4) крепятся к латунной трубке (2); на нее Вид А Рис. 4.2.38. Конструкция трости гобоя: а — вид сверху, б — вид сбоку
240 Глава 4 надевается цилиндр из пробки (1), который в свою очередь встав- ляется во внутренний канал гобоя. Пластинки имеют следующие размеры: средняя длина 35 мм, ширина 7 мм, толщина рабочей части 0,01-0,05 мм: толщина той части, которая крепится к труб- ке, — 0,2-0,3 мм. Большое влияние на строй гобоя оказывает под- бор конструкции и размеров внутренней трубки. Трость фагота имеет такую же конструкцию, но несколько большие размеры: средняя длина — 54 мм, ширина — 15 мм. Механизм возбуждения колебаний тростей и модуляции потока воздуха совершенно аналогичен однотростевым инструментам (принцип Бернулли). Собственные резонансы тростей обычно 2000-3000 Гц, резонансы трубы значительно ниже, поэтому в об- ласти низких частот труба активно «управляет» колебаниями тро- стей. Музыканты по игровым свойствам разделяют трости на лег- кие, средние и тяжелые. Трость оказывает влияние на спектр, динамический диапазон и на зону разброса строя инструментов (при легких тростях разброс строя в верхнем регистре составля- ет 70 центов) [11]. Труба гобоя имеет вид прямого конуса с раструбом, общая дли- на 640 мм, максимальный диаметр у раструба 37 мм, другой конец конуса усеченный для вставления трости. Как уже было сказано выше, коническая закрытая труба имеет основную частоту в два раза выше, чем основная частота цилиндрической закрытой трубы той же длины, и имеет все гармоники в спектре. Реальные инстру- менты устроены значительно сложнее [17]: труба гобоя состоит как бы из нескольких усеченных конусов с разными углами раскрыва, в том числе раструба, который слегка повышает первые резонан- сы и вносит в спектр сильную форманту 1600-2000 Гц. На трубе гобоя имеется 22 отверстия всех трех типов (для игры частично пальцами, частично через рычажно-клапанное устройство). Поскольку у гобоя в трубе возбуждаются все резонансные частоты, то за счет отверстий необходимо получить переход на 12 полутонов (у кларнета на 19), поэтому схема расположения отверстий у гобоя и отличается от кларнета. Методом передувания добиться перехо- да на следующий обертон на трубе гобоя и фагота очень трудно, поэтому на них сделано два регистровых отверстия с клапанами, действие которых аналогично их действию в кларнете (т. е. они помогают переходу на следующую резонансную частоту). АКУСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ Гобой: — основной частотный диапазон гобоя — от 233,1 (В^З) до 1567,98 Гц (G6), с учетом обертонов он достигает 9 кГц (даже 12 кГц при ff) [23]. Пример 3-D спектра показан на рис. 4.2.39. Максимальная энергия в спектре 500-1500 Гц, имеется две вы-
Акустика музыкальных инструментов. Акустика речи и пения 241 Рис. 4.2.39. Спектр гобоя 1000 Гц 2000 Гц раженные формантные облас- ти 1400 Гц и 3000 Гц (слабая форманта имеется в области 4500 Гц); — динамический диапазон для нижних регистров составля- ет 20 дБ, для средних частот — 30 дБ, для высоких — 25 дБ. Максимальный уровень звуко- вого давления (при Jf) достига- ет 75 дБ-С ниже С6 и 80 дБ-С выше, минимальный (рр) — 50 дБ-А (на расстоянии 9 м) [13]; — переходные процессы — гобой имеет короткую ясную атаку, длительность которой 40 мс для нижних нот и 20 мс для высоких (на самых высоких она может составлять даже 10 мс); для мягкой атаки возможно увеличение времени установле- ния до 100 мс в нижнем регистре и до 40 мс в верхнем; — характеристика направленности показана на рис. 4.2.40. В области средних частот также имеется сильное излучение через боковые отверстия, в диапазоне свыше 4 кГц излучение направле- но вниз, и звук попадает к слушателям в основном за счет отра- жений от пола; — тембр в низком регистре грубоватый, носовой; в среднем — чистый, приятный похожий на флейту; в высоком — светлый, рез- кий [24]. Фагот: — основной частотный диапазон от 58,27 (ВИ) до 698,46 Гц (F5), для контрафагота от 29,14 (Вь0) до 246,9 Гц (НЗ) [23]. Вмес- те с обертонами энергия распределена в диапазоне до 3,5 кГц 1 метр Рис. 4.2.40. Форма характеристики направленности гобоя
242 Глава 4 Рис. 4.2.42. Форма атаки и спада для фагота 500 Гц Рис. 4.2.41. Спектр фагота (на громких уровнях даже до 7 кГц). Основная формантная область — 440-500 Гц, бо- лее слабая 1220-1280 Гц и 3000 Гц [11, 23]. Спектр по- казан на рис. 4.2.41; — динамический диапа- зон в среднем составляет 33 дБ. Максимальный уро- вень звукового давления — 83 дБ-С, минимальный — 50 дБ-А (на 9 м); — переходный процесс имеет длительность атаки в среднем 30-40 мс, низкие обертоны имеют время уста- новления 50-80 мс, высо- кие — порядка 20 мс [13]. На осциллограмме сигнала во время атаки и спада от- четливо видны биения (рис. 4.2.42), что влияет на харак- тер тембра инструмента; — характеристика на- правленности имеет слож- ный вид из-за наличия от- верстий и изогнутой формы трубы инструмента, причем в отличие от кларнета и го- боя на высоких частотах (свыше 2 кГц) излучение на- правлено вверх (рис. 4.2.43); — тембр — в низком ре- гистре резкие, трескучие звуки; в среднем — мягкий, певучий звук органного характера; в высоком — напряженный, сдавленный [11, 24]. 5000 Гц 1 метр Рис. 4.2.43. Характеристика направленности фагота
Акустика музыкальных инструментов. Акустика речи и пения 243 САКСОФОН Система звукообразования. Акустические характеристики В отличие от таких духовых ин- струментов как кларнет, гобой, флейта и др., которые имеют дол- гую историю создания и совершен- ствования, саксофон был изобре- тен в 1846 году. Его запатентовал в Париже бельгийский музыкальный мастер Адольф Сакс. Он соединил однотростевый механизм кларнета и коническую трубу гобоя, создав инструмент, который обладает своеобразным тембром и широко используется в настоящее время в различных жанрах музыки. Скон- струированное А. Саксом семей- ство саксофонов включало в себя восемнадцать инструментов, одна- ко в настоящее время в основном используются только несколько из них: сопрано, альт, тенор, баритон. Конструкция саксофона включа- ет следующие части (рис. 4.2.44): однотростевый мундштук, подмундштучную трубку, коническую тру- бу, нижнюю изогнутую трубку (сапожок) и раструб. Общая длина сопрано-саксофона составляет 690 мм, диаметр рупора 90-100 мм, угол раскрыва конуса 4°. Мундштук по конструкции совпадает с мундштуком кларнета, однако размеры тростей больше: напри- мер, для альт-саксофона длина 35-36 мм, ширина 15,5-16 мм, толщина 0,12-0,18 мм [11, 34]. Корпус саксофона делается из металла (томпаковой меди или специального сплава), сверху покрывается позолотой или сереб- ром. Такой корпус вносит некоторый своеобразный оттенок в его тембр (за счет участия тонких стенок в вибрациях). Саксофон име- ет 17-25 боковых отверстий и два регистровых отверстия, соеди- ненных между собой автоматическим рычажным механизмом. Раз- ница в конструкции между гобоем и саксофоном заключается в следующем: оба имеют коническую форму, но угол раскрыва сак- софона шире (у гобоя — 1,5°). В более широких трубах высокие гармоники мало отражаются от широкого открытого конца (плохо образуют стоячие волны), у узких труб высокие частоты лучше ре- зонируют и их больше в спектре, поэтому у гобоя спектр богаче [28]. Поскольку саксофон имеет больший диаметр трубы, т. е. со- противление у входа трубы меньше, то на колебания трости Рис. 4.2.44. Общий вид саксофона
244 Глава 4 резонансы трубы оказывают меньшее влияние. Переходные про- цессы у него короче, спектр более равномерный чем у гобоя, от- четливо выражены четные и нечетные гармоники. АКУСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ: — частотный диапазон: сопрано-саксофона от 207,7 (А^З) до 1319 Гц (Е6), альт-саксофона 138,6 Гц (Db3)-830,6 Гц (А^5), бари- тон на октаву ниже альта, тенор на октаву ниже сопрано [11]. С учетом обертонов спектр имеет диапазон до 10 кГц. Пример 3-D спектра показан на рис. рис. 4.2.45; — динамический диапазон — от 40 дБ на низких до 20 дБ на высоких частотах; — переходные процессы — процесс нарастания короткий (20- 30 мс) и происходит с большим разбросом по времени для разных обертонов, что создает своеобразный тембральный оттенок зву- чания (рис. 4.2.46); — характеристика направленности: ширина диаграммы направленности рав- номерно уменьшается с повышением ча- стоты, при этом направление оси главно- го лепестка смещается на 10-15° к высоким частотам (рис. 4.2.47); — тембр — инструмент имеет четы- ре регистра (нижний, средний, верхний, высший) с разными тембрами: плотный, густой в нижнем; мягкий, светлый в сред- Рис. 4.2.46. Процесс атаки нем' напряженный, пронзительный в верх- в саксофоне нем [11, 24]. 150 Гц 400 Гц 1000 Гц 2000 Гц 4000 Гц Рис. 4.2.47. Характеристика направленности саксофона
Акустика музыкальных инструментов. Акустика речи и пения 245 4.2.3. Амбушюрные духовые инструменты. Труба. Тромбон. Валторна. Туба Амбушюрные (медные) духовые инструменты, используемые в современном симфоническом оркестре, включают в себя сле- дующие основные типы: труба, тромбон, валторна, туба и др. [2,5,7,11,12]. Внешний вид этих инструментов показан на рис. 4.2.48. Это инструменты с воронкообразными мундштуками, изго- товленные из металлических сплавов; в них используются различ- ной длины свернутые трубы, узкие у места вдувания, которые по- степенно расширяются к выходному отверстию и оканчиваются раструбом плавного очертания (рис. 4.2.49). Как и все духовые инструменты, они используют в качестве ге- нераторов энергию сжатого воздуха, созданную за счет мускуль- ных усилий музыканта. Роль вибраторов выполняют особым об- разом колеблющиеся губы; в качестве резонаторов используются столбы воздуха в удлиненных трубах. Рис. 4.2.49. Типичная конфигурация труб медных инструментов
246 Глава 4 мундштук воздушный поток 0 = 0° 0 = 90° 0=180° 0 = 270° Рис. 4.2.50. Процесс колебания губ ^бы. ^¾¾¾¾ ~ В их системе звукообразования име- ются определенные отличия от осталь- ных духовых инструментов, которые заключаются в следующем: особый механизм модуляции потока воздуха с помощью колебания губ; использова- ние достаточно больших мундштуков сложной конструкции; применение изо- гнутых цилиндрических и конических узких труб; использование вентилей и ку- лис вместо боковых отверстий; примене- ние больших раструбов в качестве до- полнительных усилителей звука, а также использование сурдин. Рассмотрим их более подробно. Возбуждение столбов воздуха проис- ходит с помощью вибраций губ, которые выполняют роль, аналогичную роли гиб- ких тростевых пластинок. Именно поэтому данная группа инструментов называется амбушюрными. В них через особым обра- зом сложенные губы периодическими тол- чками выходит воздух, т. е. происходит модуляция воздушной струи, которая возбуждает стоячие волны в трубе (резонаторе), что, в свою очередь, усиливает звук, создает «положительную обратную связь» и придает звуку музыкальную окраску. Механизм процессов возбуждения колебаний губ был достаточ- но подробно исследован за последние годы [2, 11, 16-18]. На рис. 4.2.50 показаны последовательные этапы колебания губ: в начальный момент времени ^=Oc (фаза 0°) воздух под давлением из легких размыкает губы; в следующий момент при t = I/4 T с (90°) струя с определенной скоростью вдувается в мундштук, затем скорость ее возрастет и давление в ней падает (за счет эффекта Бернулли), поэтому в момент времени t = I/2 T с (180°) губы опять смыкают- ся; давление изнутри начинает возрастать, губы открываются при t = 3/j T с (270°); скорость струи снова возрастает, давление па- дает и при t = T с (360°) губы опять смыкаются. Процесс аналогичен колебаниям тростей, однако губы — гораз- до более сложный инструмент, в них с помощью мускульных уси- лий можно менять форму и площадь открытия, менять величину натяжения и т. д., т. е. гораздо более тонко «настраивать» их па- раметры в процессе взаимодействия с резонансами трубы. Губы могут вибрировать сами по себе под действием струи воз- духа, но для этого в полости рта должно быть создано достаточно
Акустика музыкальных инструментов. Акустика речи и пения 247 U T и б (+,+) Рис. 4.2.51. Модель взаимодействия разности давления в полости рта (ро) и давления в мундштуке (р) для тростевых (а) и медных (б, в) инструментов большое давление. Крити- ческое значение его зави- сит от требуемой частоты возбуждения губ, которая контролируется мускуль- ным напряжением испол- нителя. Уровень внутрен- него давления очень важен для игры на медных инст- рументах, т. к. колебания губ не сразу стабилизиру- ются: в первый момент они должны опираться только на внутренний импеданс в полости рта, пока в трубе не образуется стоячая вол- на и не сформируется им- педансный пик на входе трубы. Поскольку трубы имеют большую длину, этот процесс зани- мает достаточно долгое время. Различия в поведении губ и стол- ба воздуха в трубе в начальный период определяет характер пере- ходных процессов (атаки) в медных инструментах — он и служит их идентификационной характеристикой. Принципиальным отличием механизма возбуждения звука в мед- ных инструментах от механизма тростевых является то, что фаза взаимодействия воздушной струи и движения губ реверсируется (меняется на обратный знак), т. к. при увеличении разности давле- ний трости закрываются (рис. 4.2.26), в то время как губы при этом открываются; различие между этими процессами показано на рис. 4.2.51. Как видно из представленных моделей, когда давление во рту (ро) растет, губы открываются; когда растет давление в мунд- штуке (р), то закрываются, такая модель обозначается (+, -) (см. рис. 4.2.516), для тростевых процесс обратный, поэтому модель обозначается (-, +) (см. рис. 4.2.51а). Для медных инструментов возможна другая модель взаимодействия, когда при увеличении давления во рту и в мундштуке губы открываются (+, +) (рис. 4.2.51 в). Первая модель (+, -) реализуется в основном на низких частотах (например, в тромбоне в диапазоне до 200-350 Гц); вто- рая модель (+, +) — на более высоких частотах (аналогичные мо- дели используются и при колебаниях голосовых связок — см. раз- дел 4.6). Следует отметить, что в медных инструментах при любой модели вдувания (рис. 4.2.51) отсутствует область отрицательных сопротивлений, как показано на рис. 4.2.26 для тростевых инстру- ментов. При создании компьютерных физических моделей амбушюрных инструментов используются трехмерные динамические модели
248 Глава 4 движения губ в процессе музы- кального исполнения, которые в настоящее время продолжа- ют разрабатываться [2]. Для регулировки громкости звука исполнитель должен кон- тролировать давление вдува- ния. Чем больше давление вдувания, тем больше гармоник в спектре, но при этом сильнее проявляются нелинейные эф- фекты. Величина давления вду- вания в мундштуке для тихих нот, например, в валторне, составляет 0,3 кРа, для громких — 6 кРа (166 дБ); в таком инструменте, как труба, развивается дав- ление до 15 кРа [2]. Отношение между объемной скоростью потока воздуха и перепадом давления представляет собой нелинейную функцию, что и приводит к возникновению сложного механизма вза- имодействия между гармониками, их «кооперации» и возможности возникновения многотонового возбуждения [2]. В амбушюрных инструментах невозможно играть без опоры на воздушный столб. Формирование стоячих волн в трубах с до- статочно большой амплитудой помогает стабилизации потока воздуха через губы. Эта поддержка будет наибольшей, когда пери- одические движения губ совпадают с резонансами труб; при этом если резонансы возникают на гармонических составляющих, то все моды действуют вместе и обеспечивают максимальный контроль над губами. Стабильность тона получается в том случае, когда тру- бы-резонаторы обеспечивают несколько сильных пиков на резо- нансных частотах, находящихся в гармонических соотношениях (рис. 4.2.52), поэтому в медных инструментах так важно, чтобы выбор формы труб обеспечивал строго гармонический ряд соб- ственных частот [17]. В спектре создаваемого звука содержится тем больше оберто- нов, чем больше амплитуда колебаний губ. На частоте 200 Гц она составляет примерно 1,5--2 мм при среднем усилии вдувания. Для возбуждения более высоких частот в трубах губы должны увели- чивать натяжение и изменять площадь раскрыва, при этом изме- няется общая добротность системы, что оказывает существенное влияние на время переходных процессов. Кроме того, с повыше- нием частоты амплитуда колебаний губ уменьшается; при этом спектральный состав, а, следовательно, и тембр звучания также изменяются. Анализ движения губ показал, что их открытие и закрытие про- исходит почти по периодическому закону. Однако выходящая струя воздуха испытывает сопротивление, не прямо пропорциональное
Акустика музыкальных инструментов. Акустика речи и пения 249 DH Чашка Устье S3 Канал Рис. 4.2.53. Конструкция мундштука площади открытия губ, и кроме того, стоячие волны в трубе созда- ют флюктуации давления в мундш- туке. Все это приводит к тому, что импульсы, поступающие в трубу, уже обогащены дополнительными гармониками [18]. Существенным отличием амбу- шюрных инструментов от тросте- вых является также то, что губы тяжелее тростей (динамическая масса равна примерно 0,001 кг на 232 Гц), поэтому их собственная резонансная частота существенно ниже, чем у тростей. В связи с этим возбуждение колебаний в трубах происходит на частотах или чуть выше резонансной частоты губ для модели колебаний (+, -), или чуть ниже (+, +) (рис. 4.2.51). Исполнитель может контролировать эти резонансные частоты, меняя натяжение губ. Мундштук выполняет две функции: обеспечивает удобную под- держку для губ исполнителя и увеличивает входной импеданс ин- струмента в рабочем (игровом) диапазоне, что очень важно для стабилизации колебаний губ. Он представляет собой деталь, со- стоящую из чашки, устья и канала (рис. 4.2.53). От мундштука за- висят удобство и легкость звукоизвлечения, а также в значитель- ной степени спектральный состав звука. Размеры мундштуков соответствуют размерам инструментов с некоторыми вариациями, с тем чтобы каждый музыкант мог подобрать их под особенности своих губ. Точность подбора снижает утомляемость при игре и влияет на точность интонирования. Присоединение мундштука, который представляет собой допол- нительный воздушный объем, к инструменту увеличивает «эффек- тивную» длину последнего, особенно для высоких частот, снижая тем самым значения высших гармоник, что способствует гармони- зации спектра. Размеры и профиль чашки, на которую музыкант опирается во время игры, влияют на процесс звукообразования следую- щим образом: — более резкий переход от чашки к устью (рис. 4.2.53 ) способ- ствует увеличению высших обертонов в спектре и снижению ам- плитуд низших тонов, что делает спектр более ярким (например, оркестровые трубы); плавный переход от чашки к устью делает спектр более мягким (например, валторны); — увеличение диаметра чашки позволяет легче получить низ- кие частоты (и труднее — высокие). Опытным путем установлена
250 Глава 4 зависимость отношения диаметров чашек и первых резонансных частот в трубах инструментов: например у трубы D41 = 16,5 мм, у тубы D42 = 33 мм и соотношение частот равно/12= 0,25/п; — увеличение диаметра устья мундштука дает возможность получить большую громкость, но при этом труднее играть на инстру- менте из-за большого расхода воздуха. Экспериментально установ- ленная связь [11] диаметра устья dy и наружного диаметра чашки может быть представлена в виде Ъч\ 0,22 D4 < dy< 0,28 D4; — глубина чашки, которая составляет (0,6-1,45) D4 (например, для тубы глубина равна минимум 1,03 D4), оказывает влияние на появление вихревых струй за счет трения об острый край чашки (аналогично процессу, возникающему у флейты), что приводит к появлению турбулентных шумов и может вызвать дополнитель- ные краевые тоны. Чем меньше глубина чашки, тем выше частота этих краевых тонов, т. к. скорость истечения воздуха из чашки мундштука при этом увеличивается. За счет этих процессов в звучании медных инструментов прослушиваются характерные шумы. Ширина краев чашки также оказывает существенное влия- ние на процесс звукоизвлечения; — воздушные каналы мундштуков имеют форму, близкую к ко- нусной, разница в диаметрах выходного и входной части канала составляет 1-1,5 мм. Основные размеры мундштуков для медных инструментов приведены в работе [9]. Мундштуки имеют свои резонансы в области 500-1000 Гц, т. е. они усиливают моды трубы между четвертой и седьмой гармоникой. Это определяет формантные области частот каждого инструмента. Для перехода на высокие частоты методом передувания не- обходимо увеличивать скорость вдувания, а следовательно, и ве- личину избыточного давления в ротовой полости: например, что- бы увеличить диапазон частот на 2,5 октавы, надо изменить давле- ние примерно в 20-25 раз [17]. Процесс звукообразования в мундштуке носит нелинейный ха- рактер, т. к. внутри него возникают очень большие уровни звукового давления — до 170 дБ [2], что может привести даже к формиро- ванию ударной волны в узких ци- линдрических трубах (например, 23456789 Число обертонов Рис. 4.2.54. Зависимость состава спектра от уровня громкости для трубы
Акустика музыкальных инструментов. Акустика речи и пения 251 в тромбоне или трубе). В спектре звуков амбушюрных инструмен- тов, извлекаемых на громких уровнях, много высокочастотных со- ставляющих; кроме того, имеется сильная зависимость спектра от уровня громкости (рис. 4.2.54), что оказывает существенное влия- ние на тембр. Процесс взаимодействия колебаний губ и изменения давления в мундштуке носит также нелинейный характер: при больших уров- нях звукового давления в мундштуке форма колебаний губ уже не имеет синусоидального характера. Кривая изменения давления в мундштуке несимметрична относительно нулевого уровня и не рав- на по длительности в положительной и отрицательной фазе, т. е. она имеет сложную несинусоидальную временную форму. Напри- мер, измерения давления в мундштуке тромбона показали, что в положительной фазе давление может быть равно 1 кПа, в отрица- тельной 3 кПа [2]. Эти процессы также приводят к появлению до- полнительных гармоник в спектре излучаемого звука. Резонатор: типичная форма трубы-резонатора у медных духо- вых инструментов показана на рис. 4.2.49. Он состоит из набора длинных труб цилиндрической или конической формы с раструбом на конце. Можно приближенно разделить все медные инструмен- ты на две группы: преимущественно с цилиндрической формой трубы — труба, тромбон, валторна; и преимущественно с кониче- ской формой трубы — туба, альтгорн, корнет и др. В соответствии с геометрией раскрыва раструба все инструмен- ты можно также разделить на имеющие гиперболический раструб (труба, валторна, тромбона и др.) и экспоненциальный раструб (туба, альтгорн). Как правило, медные инструменты используют изогнутые трубы с целью сокращения их общей длины, которая достигает 2,75 м для валторны и 5,36 м для тубы. Конструктивные параметры труб медных инструментов даны в таблице 4.2.1 [11]. Таблица 4.2.1 Название инструмента Параметры Труба Тромбон Валторна Туба Длина, см 140 275 375 536 Диаметр главной трубы, CM 1,1 1,2 1,1 1,8 Длина цилиндри- ческой части, см 53 170 193 Диаметр раструба, см 11 18 32 35-60
252 Глава 4 Основные акустические характеристики труб существенно не ме- няются при их изгибе, однако музыканты считают, что чем больше изогнут резонатор, тем более матовый (мягкий) звук получается. Резонансные частоты чисто конической закрытой на одном кон- це трубы представляют собой гармонический ряд, резонансы же чисто цилиндрической трубы содержат только нечетные гармони- ки (см. раздел 4.2.2). Однако специфика медных инструментов состоит в том, что в них резонаторы представляют собой сочлене- ние нескольких труб различной формы; кроме того, к ним присо- единены мундштук и раструб (влияние которых на спектр описано ниже), что позволяет получить полный гармонический ряд (за ис- ключением фундаментального основного тона). Для того чтобы можно было сыграть тон заданной высоты, необходимо, чтобы фундаментальная частота источника звука (или, по крайней мере, одна из его низших гармоник) совпадала с первым максимумом импеданса трубы резонатора, т. е. с его основной резонансной частотой. Из-за нелинейности процессов взаимодействия колебаний губ с изменением давления в мунд- штуке точное определение результирующей звучащей частоты в медных инструментах представляет собой достаточно сложную проблему. Излучаемая инструментом акустическая мощность зависит от размеров и формы выходного отверстия. В узких трубах, когда длина волны А, велика по сравнению с радиусом выходного отвер- стия а, т. е. в диапазоне X > 8ра, где р— плотность среды, боль- шая часть энергии отражается обратно, создавая стоячие волны, — обычно это и происходит в музыкальных духовых инструментах на низких частотах [28]. Звук при этом будет богат обертонами, но бу- дет иметь сравнительно небольшой уровень громкости. Если раз- меры устья рупора становятся больше (А, < ра/3), то сопротивле- ние излучения RU3JI приближается к сопротивлению воздуха рс, и волна беспрепятственно выходит наружу. При этом уменьшает- ся доля отраженной энергии и увеличивается доля излученной. Звук будет более громким, но беднее обертонами. При создании музыкальных инструментов подбирается компромисс между этими двумя требованиями, поэтому с целью увеличения размеров выходного отверстия используется раструб, диаметр которого существенно больше, чем диаметр трубы (см. табл. 4.2). Материал резонаторов в медных инструментах играет более существенную роль чем в деревянных, поскольку они сделаны из различных металлических сплавов и их достаточно тонкие стенки колеблются во время игры, внося определенный (но не очень зна- чительный) вклад в общее излучение инструмента. Для их изготов- ления обычно используются такие сплавы, как «желтая» медь (70% меди и 30% цинка) или «золотая» медь (85 % меди и 15 % цинка). Для валторн и кулис тромбона используется сплав 63%
Акустика музыкальных инструментов. Акустика речи и пения 253 меди, 27% цинка и 10% никеля. Для уменьшения трения воздуха о стенки (с целью снижения потерь энергии на трение) должна быть обеспечена высокая гладкость стенок. Раструб: имеет очень большое значение для тембра медных музыкальных инструментов. Он выполняет те же функции, что и рупор у громкоговорителей, а именно: — помогает согласованию сопротивлений излучения между большим сопротивлением внутри трубы и малым во внешней сре- де за счет расширения площади, что увеличивает эффективность излучения и громкость звучания; — формирует диаграмму направленности звука, особенно на высоких частотах (на низких частотах инструмент является не- направленным, т. е. звук излучается во всех направлениях одина- ково). Поскольку в медных инструментах излучение звука происхо- дит только через раструб, который больше по размерам, чем в тростевых, то его влияние особенно существенно. Качество звучания инструмента зависит также от направления раструба по отношению к слушателю и позиции исполнителя в помещении, а кроме того, от акустических свойств помещения; — способствует формированию гармонического спектра в ин- струменте, поскольку присоединение мундштука сдвигает высокие частоты вниз, а присоединение раструба (рупора) сдвигает низкие частоты вверх. Физически присое- динение раструба приводит к тому, что «эффективная» длина трубы для низких частот как бы уменьша- ется. При этом высокие частоты больше «проникают» в раструб. Из спектра закрытой цилиндрической трубы, где превалируют только не- четные гармоники, мундштук и раструб формируют спектр звуча- ния, в котором представлены все составляющие гармонического ряда как четные так и нечетные (рис. 4.2.55). При этом низкий тон выпадает из гармонического ряда и фактически не используется при игре. Полный гармонический ряд строится относительного некото- рого основного тона с частотой, которая находится в соотноше- нии 1 :2:3:4... Этот отчетливо прослушиваемый «виртуальный» тон (см. гл. 3) называется
254 Глава 4 «педальным» и является ха- рактерной особенностью медных инструментов. Кулисы и вентильные меха- низмы: как уже было сказано выше, на инструментах этой груп- пы можно с помощью выбо- ра формы резонаторов — трубы, раструба и мундштука — полу- чить гармонический ряд частот в спектре (кроме основного тона). Обычно в спектре медных инстру- ментов отчетливо видны на импе- дансных кривых семь-восемь гар- моник с достаточно большими амплитудами. Чтобы получить ноты хроматического ряда, надо иметь возможность менять акустическую длину труб-резона- торов. В деревянных духовых инструментах это делается с помощью боковых отверстий, в медных инструментах использу- ются другие конструктивные ре- шения: выдвижные кулисы, как у тромбона, или дополнительные трубы со специальными поворот- ными (роторными), как у валторны, или помповыми (поршневы- ми), как у трубы, вентильными механизмами для их открывания и др. (рис. 4.2.56 а, б). Обычно в медных инструментах исполь- зуются три дополнительные трубы (кроны) с вентилями обоих видов. Подключение одной кроны через вентиль 1 меняет высо- ту звука на тон, через вентиль 2 — на полтона, через вентиль 3 — на полтора тона. Различные комбинации вентилей позволя- ют получить семь комбинаций тонов. Иногда используется доба- вочный квартвентиль (например, у тубы), который понижает вы- соту тона на кварту (иногда он устанавливается на тромбон). В более редких случаях могут применяться еще дополнительные вентили с различными функциями. У тромбонов вместо вентилей 1 Рис. 4.2.56. Вентильный механизм: а — поворотный (вентиль 3 нажат, крона 3 подключена); б — поршневой (1 — вентиль не на- жат, 2 — вентиль нажат, крона подключена) 1 2 3 Jl IL XL 5) Рис. 4.2.57. Изменение длины трубы у тромбона с помощью кулис
Акустика музыкальных инструментов. Акустика речи и пения 255 используют выдвижную кулису. Для получения полной шкалы необходимо иметь возможность устанавливать кулисы в семи различных позициях (рис. 4.2.57). Однако при удлинении трубы любым способом возникают оп- ределенные проблемы: для уменьшения высоты на один тон нуж- но удлинить трубу примерно на 12,2%, для уменьшения еще на полутон — дополнительно на 5,9%; таким образом, вместе они да- дут 18,1%, но уменьшение высоты на три полутона в равномерно- темперированной шкале требует увеличения длины трубы на 18,9%, т. е. получается некоторое несоответствие. Таким образом, если удлинение трубы за счет вентилей дает снижение на тон и полутон, то вместе они не дают точного уменьшения на три полу- тона. При нескольких одновременно включенных вентилях общая сумма понижений строя будет лишь приближенно равняться сум- ме понижений за счет отдельных вентилей. Кроме того, добавле- ние нового отрезка цилиндрической трубы сдвигает настройку ра- струба (так как меняет соотношение цилиндрической и конической частей резонатора), что вносит некоторые изменения в низкие ча- стоты спектра. Для решения этой проблемы используются различ- ные компромиссы (небольшие вариации в длине крон), определен- ные приемы в технике игры (некоторая подстройка частоты за счет изменения натяжения губ) и т. д. Сурдина — одним из способов изменения тембра в медных ин- струментах является применение сурдин в виде вставок (из дерева или легкого металла) в раструб. Аналогичные приспособления ши- роко используются в электроакустике (например, различные вариан- ты акустических линз для высокочастотных громкоговорителей). Сурдины изготавливаются в виде: конических вставок, вставок ку- полообразной или сложной формы (которые называются вау-вау (wah-wah), или сурдины Хармана (Harman)) и др. Основные виды сурдин показаны на рис. 4.2.58. Иногда роль сурдины выполняет вставленная в раструб рука (например, при игре на валторне). Сурдина работает как высокочастотный фильтр, т. е. хорошо пропускает высокие частоты и хуже — низкие. Это способствует лучшему формированию стоячих волн на низких частотах внутри трубы, т. к. увеличивается энергия отраженных волн, что улучшает «опору» для музыканта. В то же время она увеличивает энергию а б в г Рис. 4.2.58. Различные виды виды сурдин: а — прямая (straight), б — чашка (сир), в — Хармана (Harman), г — солотон (solotone)
256 Глава 4 излучения на высоких ча- стотах. Сурдина также расширяет характеристику направленности инстру- мента в высокочастотной области спектра. Влияние сурдин на эффективность излучения трубы показано на рис. 4.2.59. Частота среза такого фильтра за- висит от конструкции сур- дины: например, конусная Рис. 4.2.59. Эффект влияния сурдин сурдина пропускает часто- на форму частотной характеристики уь| выше 18(Ю Гц^ чашеч. излучаемого звука ная работает как полосо. вой фильтр с полосой 800-1200 Гц, сурдина Хармана — выше 1500-2000 Гц. Естествен- но, что вмешательство сурдин способствует изменению соотноше- ния амплитуд высоких и низких частот в излучаемом звуке и, со- ответственно, изменению тембра инструмента. У всех медных инструментов наряду с общими конструктивны- ми особенностями имеются некоторые общие акустические свой- ства, основные из которых следующие [2, 12, 13, 16-19]: огибаю- щая спектра характеризуется определенной частотой среза (для трубы — 2 кГц, для тромбона — 1 кГц, для тубы — 0,5 кГц), выше которой амплитуды гармоник резко падают (до 15- 25 дБ/окт). Длительность атаки составляет примерно 50+/-2O мс, при этом первые гармоники достигают своих максимальных значе- ний за -20 мс, гармоники выше пятой за -40-60 мс. Средний КПД порядка 0,1%, почти все потери энергии происходят при продува- нии воздуха через вибрирующие губы, потери в стенках инструмен- та гораздо меньше. Пневматическая входная мощность от 30 мВт до 10 Вт, акустическая выходная мощность от 0,1 мВТ до 1 Вт. Акустические и конструктивные особенности некоторых типов медных инструментов представлены ниже [2, 11, 13, 23]. ТРУБА Система звукообразования. Акустические характеристики Труба — амбушюрный духовой инструмент (рис. 4.2.48), у которого узкий канал согнут в один оборот и заканчивается не- большим раструбом, общая длина примерно 140 см, диаметр ра- струба — 11 см [11]. Труба снабжена обычно помповым трехвен- тильным механизмом. Трубы как сигнальные инструменты использовались с древних времен во многих странах. В средние века натуральные (без вен-
Акустика музыкальных инструментов. Акустика речи и пения 257 Рис. 4.2.60. Спектр трубы t, MC /Гц 20500 тилей) трубы широко применялись в Европе во время шествий, празднеств, религиозных церемоний. С 1737 г. серебряные трубы начали использоваться в русской армии. В начале XVII века тру- бы появляются в оперных оркестрах, с XVIII века они широко ис- пользуются в симфонических и духовых оркестрах. В 1816 г. появи- лись трубы с хроматическим звукорядом, снабженные помповым (пистонным) или поворотным вентильным механизмом. В совре- менном оркестре чаще используется трехвентильный инструмент в строе in В и In С [7, 23, 30]. Частотный диапазон (трубы in В ) — основные тоны 164,8 Гц (ЕЗ)-1046,5 Гц (С6). (Верхний диапазон трубы существенно зависит от вида музыки, в последние годы используется диапазон до F6.) Полный диапазон вместе с обертонами достигает 8 кГц. Пример спектра показан на рис. 4.2.60. В спектре много высокоча- стотных гармоник, имеются выра- женные формантные области: 650 Гц^ 800 Гц* первая — 1200-1400 Гц, вто- / \ рая — 2500 Гц. Q^J Динамический диапазон — Y^U 35 дБ в низком регистре, 15 дБ _BlL_ ^п^Д, в высоком, уровень звукового дав- Переходные процессы — длительность нарастания 25- 30 мс в низких регистрах и 20 мс в верхних. Характерной особен- ностью процессов атаки у труб является возникновение короткого импульса (длительностью 5 мс) через 10-15 мс после начала ата- ки за счет появления высоких обертонов с частотами в области ления от 83 дБ-С до 93 дБ-С (на 14 м), так что это один из самых громких инструментов ор- кестра. 1500-2500 П 4000-15000 Гц Рис. 4.2.61. Характеристика направленности трубы в вертикальной плоскости
Глава 4 2-3 кГц. При «мягкой» атаке длительность переходных процессов может достигать 180-150 мс в нижнем и среднем регистре [13]. Характеристика направленности — звук излучается только вперед через устье, ширина лепестка плавно обостряется к высо- ким частотам (рис. 4.2.61). Тембр — сильный, блестящий в среднем регистре; резкий, пронзительный в верхнем [24]. ТРОМБОН Система звукообразования. Акустические характеристики Тромбон — духовой амбушюрный инструмент с подвиж- ной кулисой (рис. 4.2.48). Он состоит из изогнутой цилиндрической трубки, раздвижной в средней части, заканчивающейся широким раструбом. В ее верхний конец вставлен полусферический мунд- штук. Общая длина инструмента примерно 275-300см, диаметр раструба — 18 см. Изменение высоты звучания достигается посредством выдвигания кулис, при полностью вдвинутой кулисе (1-я позиция) за счет передувания образуются только звуки нату- рального ряда. За счет смещения кулисы можно получать звуки хроматического звукоряда. Однако кулисный способ управления высотой звука по быстроте и четкости уступает вентильному. Тромбон появился в результате реконструкции басовой трубы в конце XV века. В XVII веке уже были известны шесть разно- видностей тромбонов — от дисканта до контрабаса. С XIX века композиторы включают его в состав симфонического оркестра как инструмент мощного, сурового звучания. В первой половине XIX века был изобретен вентильный тромбон. В настоящее время чаще применяется цугтромбон с раздвижной кулисой в двух разно- видностях: теноровый и тенор-бас с дополнительным квартвенти- лем, понижающим звук на кварту [6, 7]. Частотный диапазон — основные тоны для тромбона 41,2 Гц (Е1 )-587,3 Гц (D3), полный частотный диапазон до 5 кГц, имеется достаточно много обертонов в спектре (рис. 4.2.62 ). Главная фор- манта находится в области 500 Гц.
Акустика музыкальных инструментов. Акустика речи и пения 259 540 Гц 750-1100 Гц Динамический диапа- зон — в среднем состав- ляет 37 дБ, при этом са- мые громкие звуки имеют уровень 95 дБ-С (на рас- стоянии 16 м от исполни- теля). Следует отметить, что уровень звукового давления с переходом к высоким регистрам воз- растает: если на низких нотах на тихих уровнях (рр) можно получить 40 дБ-А, то в высоких ре- гистрах он поднимается до 70 дБ-А [13]. Переходные процес- сы — время нарастания 40 мс в нижних регистрах и 20 мс в верхних. Характеристика на- правленности — имеет сужающийся к верхним частотам главный лепесток, направленный вверх (рис. 4.2.63). Тембр — в нижнем регистре мощный, суровый; в среднем ре- гистре — очень яркий, четкий, блестящий. 2000-6000 Гц 7000-10000 Гц Рис. 4.2.63. Характеристика направленности тромбона (в вертикальной плоскости) ВАЛТОРНА Система звукообразования. Акустические характеристики Валторна (French Horn) — духовой амбушюрный инстру- мент, имеет длинную (375 см) узкоканальную цилиндрическую трубу, свернутую спиралеобразно и заканчивающуюся широким раструбом (диаметром 32 см). Валторна снабжена механизмом с четырьмя или пятью вентилями. Инструмент имеет глубокий, узкий, воронкообразный мундштук (рис. 4.2.23). Происходит валторна от охотничьего рога. Старинные валтор- ны не имели вентильного механизма, на них можно было извле- кать только звуки обертонового ряда. В середине XIX века были введены дополнительные трубки, вставлявшиеся в среднюю часть ствола, а также был предложен дрезденским валторнистом А. Хам- пелем способ получения «закрытых» звуков путем введения пра- вой руки в раструб. С середины XVIII века валторна входит в со- став симфонического оркестра. Во второй четверти XIX века получает распространение хроматическая валторна с дополнитель-
260 Глава 4 t, MC 8130 20500 /Гц Рис. 4.2,64. Спектр валторны ными трубками, удлиняющими основной канал инструмента, кото- рые включаются с помощью вращающихся вентилей (изобретены немецкими мастерами Ф. Блюмелем и Г. Штольцем). Сейчас при- меняются в основном валторны строя in F и «двойные» in F, in В. Частотный диапазон: основные тоны для валторны in F со- ставляют 48 Гц (G1 )-698,46 Гц (F5) [23]. Полный диапазон дости- гает 1,5 кГц в нижнем регистре и 5 кГц — в верхнем. Имеется ряд формант: основная в области 340 Гц, менее выраженные в области 750 Гц, 1220 Гц и 2000 Гц. Пример спектра показан на рис. 4.2.64. Динамический диапазон — составляет 40 дБ на низких часто- тах, 25 дБ — на высоких. В среднем уровни звукового давления достигают 53 дБ-А для тихих уровней (рр) и 86 дБ-С для громких iff) ИЗ]. Переходные процессы — достаточно большое время атаки: до 40-80 мс в нижнем регистре, 20-30мс — в верх- нем. Во время атаки также возможно появление коротких импульсов, которые сильнее проявляются при мягкой ата- ке, что оказывает влияние на тембр инструмента [23]. Характеристика направ- ленности — главный лепес- ток диаграммы направленно- сти уменьшается по ширине к высоким частотам и имеет некоторый поворот относи- тельно оси (рис. 4.2.65). Тембр — ровный, мягкий, певучий, хорошо сливающий- Рис. 4.2.65. Характеристика СЯ СО Струнными И дервВЯН- направленности валторны НЫМИ. (в вертикальной плоскости)
Акустика музыкальных инструментов. Акустика речи и пения 261 t, mc Рис. 4.2.66. Спектр тубы ТУБА Система звукообразования. Акустические характеристики Туба — самый низкий по звучанию медный инструмент, имеет длинную свернутую в несколько раз трубу с большим раструбом (рис. 4.2.23). Общая длина трубы 536 см, диаметр раструба — 35- 60 см. Туба снабжена тремя (иногда четырьмя) поворотными (ро- торными) вентильными механизмами. Предшественником тубы можно считать медный духовой военный инструмент, известный в Древнем Риме. Первые тубы как профессиональные инструмен- ты появились в 1820-1830 годы. В состав симфонического орке- стра туба была введена Р. Ваг- нером. В настоящее время исполь- зуются тубы различных разме- ров и диапазонов: теноровая (in В), басовая (in Es) и контра- басовая (in В) [7]. Частотный диапазон: для контрабасовой тубы in В, рас- пространенной в России, диапазон основных частот составляет 30,87 Гц (BO)- 349,2 Гц (F4). Полный диапазон 1-1,5 кГц для низких нот, 1,5- 2 кГц для высоких [23]. В спек- тре мало высших гармоник (рис. 4.2.66 ), имеется область фор- мант в диапазоне 210-250 Гц. Динамический диапазон — на расстоянии 16 метров от ин- струмента можно получить уро- вень 54 дБ-А (др), 74 дБ-В (mf), 87 дБ-С (ff). Средний исполь- зуемый динамический диапазон 20 дБ [13]. 90-180 Гц 300-500 Гц 200-3500 Гц Рис. 4.2.67. Характеристика направленности тубы (в вертикальной плоскости)
262 Глава 4 — Переходные процессы — время нарастания для низких нот составляет 60 мс (в области С1), для средних — 40 мс (С2), для высоких — 25 мс (СЗ). Таким образом, туба имеет сравнительно с другими медными инструментами короткую атаку, поскольку в спектре у нее имеется мало обертонов и они достаточно быст- ро устанавливаются. Характеристика направленности — главный лепесток направлен вверх от раструба, он плавно обостряется к высоким частотам (рис. 4.2.67). Тембр — суровый, массивный, глубокий. 4.2.4. Орган Орган (лат. organum — орудие, инструмент) — клавишно-духо- вой инструмент необычайно сложного устройства. Он является од- ним из красивейших и богатейших по тембру музыкальных инстру- ментов. Типы органов чрезвычайно многообразны: от портативных, использующих один регистр и небольшое количество труб, до ги- гантов, имеющих свыше 30000 труб и более 200 регистров. Внеш- ний вид органа показан на рис. 4.2.68. Процесс звукообразования в органе отличается особой специ- фикой: — каждая труба основных регистров органа воспроизводит только один тон определенной высоты и тембра, поэтому чтобы воспроизвести огромное многообразие мелодий и тембров, необ- ходимо большое количество труб; — принцип организации труб в органе матричный (прообраз современных синтезаторов), что позволяет одну и ту же мелодию воспроизвести в разных тембрах и разной тональности [2]; — возбуждение звуковых колебаний в трубах происходит с по- мощью специальных механизмов, подводящих энергию сжатого воздуха, музыкант только управляет распределением этой энергии, он не соприкасается непосредственно с вибраторами и резонато- рами инструмента (аналогично тому, как это происходит в форте- пиано); — звуки могут продолжаться сколь угодно долго, поскольку за- висят от мощности воздуходувного механизма, а не от человече- ского дыхания; — громкость звуков может быть усилена или ослаблена в очень широких пределах (за счет подключения различного количества труб), что позволяет воспроизводить большой динамический ди- апазон (до 90 дБ); — исполнитель может создавать огромное многообразие темб- ров, имитирующих звучание различных инструментов, с помощью специальных механизмов управления;
Акустика музыкальных инструментов Акустика речи и пения 263 Рис. 4.2.68. Внешний вид органа — звучание каждого органа уни- кально; поскольку не существует двух одинаковых механизмов, изго- товление и настройка каждого органа зависят от конкретного по- мещения, в котором он будет ис- пользоваться. Акустика помеще- ния, в котором установлен орган, имеет огромное значение (поме- щение служит резонатором, обра- зуя вместе с трубами органа еди- ное звуковое поле), поэтому перенос органа из одного помеще- ния в другое, как правило, наруша- ет звуковой баланс и ухудшает ка- чество звучания. Все это в целом позволяет обеспечить при игре на органе та- кое многообразие динамических и тембральных оттенков музыкаль- ных звучаний, которое не доступно никакому другому музыкально- му инструменту [2, 4-7, 10, 16-18, 37-41]. История: первое упоминание о водяном органе (гидравлосе) относится Kill веку до нашей эры (Египет, г. Александрия, мастер Ктесибий) — в этом инструменте использовался водяной насос, ка- чавший воду в сосуд, из которого воздух выходил в трубы. Греки усовершенствовали гидравлос, римляне уже широко применяли его в театрах, цирках и др. В IV веке н. э. в Византии появился пневматический орган-позитив, который использовался на дворцо- вых приемах и в представлениях. В 660 году папа римский Витали- ан ввел орган в службу католической церкви, это способствовало широкому распространению органного искусства и совершенство- ванию конструкции органов, а также выработке совершенного со- четания параметров органа с акустикой огромных католических со- боров. Уже в 980 году для собора в Винчестере (Англия) был построен орган из 400 труб с двумя мануалами. Группировка труб по регистрам появилась в XII веке. Изобретение педальной клави- атуры принадлежит Л. ван Вальбеке (начало XIV в.). В XIII-XIV ве- ках размер клавиш на мануалах был очень большой (длина до 30- 33 см, ширина — 8-9 см), по ним приходилось бить кулаками или локтями. Современный вид орган приобрел только в XVI веке. В XVII веке начала распространяться равномерно-темперирован- ная настройка. В начале XVIII века приобрели известность органы семьи Зильберманов и их учеников (для этих инструментов писал И. С. Бах). В XIX веке появились инструменты других известных ор- ганостроителей (Ф. Ладегаста, А. Кавайе-Колля и др.) [10, 37-42].
264 Глава 4 В конце XIX века английский инженер R Хоуп-Джонс (R. Hope- Jones) использовал электричество для контроля подачи воздуха в органные трубы [17]. В период расцвета органного искусства XVI-XVIII вв. определились главные европейские исполнительские школы: итальянская под руководством Дж. Фрескобальди и Дж. Габ- риели (в итальянских органах использовались в основном лабиаль- ные трубы, обеспечивающие мягкое, теплое звучание); француз- ская — Ф. Куперена, Л. Клерамбо и др. (во французских органах начали применяться язычковые трубы с более ярким звучанием), а также испанская, немецкая и др. Самые известные композиторы XVIII-XIX веков писали музыку для органа — И. С. Бах, Й. Гайдн, Л. ван Бетховен, В. Моцарт, Ф. Лист, и др.; эта традиция была про- должена и в XX веке [10]. В Россию орган пришел из Византии и появился в Киеве в Xl ве- ке [10, 42]. Он использовался в основном в светской музыке; зву- чал в католических церквах, но никогда не был связан с русской православной церковью. Для него писали музыку многие русские композиторы (М. Глинка, А. Глазунов, С. Танеев и др.). В стране были созданы различные школы подготовки органистов, с середи- ны XIX века открылись специальные классы в Санкт-Петербургской и Московской консерватории. В XX веке сложились московская и петербургская школы под руководством профессоров А. Гедике и И. Браудо, подготовившие десятки замечательных органистов. В настоящее время в России имеются сотни крупных органов (многие сейчас реставрируются), проводятся многочисленные органные концерты и фестивали [39, 40, 41, 42]. Интерес к органному искусству и, соответственно, прогресс в органостроении значительно увеличились за последние годы. Это способствовало, наряду с появлением новых возможностей (компьютерных технологий, новых материалов, современной изме- рительной техники и др.), расширению научных исследований в области акустики органа, нашедших свое отражение в специаль- ной литературе, посвященной этим вопросам [2, 4, 17, 18]. Общая конструкция органа. Как все духовые инструменты, орган имеет три главных звукообразующих элемента. Это: генера- тор — воздуходувная установка, распределительная система, система управления подачей воздуха; вибратор — пластинки язычковых труб и воздушная турбулентная струя лабиальных труб; резонатор — воздушные столбы в многочисленных органных трубах. Пример общей конструкции органа показан на рис. 4.2.69. Орган состоит из следующих основных частей: силовой воздухо- дувной установки (1); воздуховодов (2); аппарата управления — «кафедры» (3); системы передачи — «трактуры» (4), обеспечиваю- щей доступ воздуха непосредственно в трубы; системы труб различ- ной формы, высоты и диаметра (5). Все это размещено в большом
Акустика музыкальных инструментов. Акустика речи и пения 265 Трубы педального торгана (о электро- вентилятор Трубы хор-органа 5 Трубы большого органа жалюзи- швеллер 5 in Трубы швеллер-органа 5 задвижки Ef швеллер-орган оолыпои орган хор-орган педаль-орган per iCTpoBbie р; коятки механизм копуляции пуляторы клавиши мануа юв ер-оргад^ !большой орган^, хор-орган ^ кнопки; дя большог > пальца * швеллер-педаль кнопки для ног педали Рис. 4.2.69. Конструктивный принцип построения органа деревянном корпусе, архитектурная отделка которого соответствует стилю эпохи и помещения, в котором он установлен. Силовая воздуходувная установка (1) — бесшумный центро- бежный вентилятор или система нагнетающих мехов, соединенная с механическим двигателем. Нагнетаемый воздух поступает в за- пасной резервуар (магазинный мех), где сохраняется под необхо- димым давлением. До середины XIX века воздух нагнетался в мехи вручную, в современных органах используются мощные электромоторы и вентиляторы. Через деревянные воздуховоды (2) воздух поступает в виндлады — распределительно-разделитель- ную систему из деревянных ящиков с отверстиями в верхней крышке, в которые вставлены трубы (рис. 4.2.70а, б). В виндладах воздух «ожидает» под определенным давлением (500-1000 Па) распоряжений органиста. Аппарат управления — кафедра (нем. Spieltisch) (3) — со- держит различные клавиатуры, кнопки, рукоятки, рычаги, педали и другие вспомогательные устройства, с помощью которых испол- нитель управляет поступлением воздуха в трубы. Конструкция кафедры и ее основные элементы показаны на рис. 4.2.71. Клави- атуры для игры руками называются мануалами. Они расположены террасами, их число бывает от одного до пяти (иногда исполь- зуются органы с семью мануалами). Число клавиш на них в со- временных концертных органах 60-62, звуковысотный диапазон составляет пять октав (от С2 — 65,41 Гц до С7 — 2093 Гц).
266 Глава 4 1— настроечная проволока 2 — трость (язычок) 3 — шеллот 4 — язычковая труба 5 — отверстие 6 — верхняя губа 7 — ротик - нижняя губа 9 — лабиальная труба 10 — отверстие 11 — отверстие 12 — каналы 13 — задвижка 14 — плашка 15 — виндлад 16 — клавиатура 17 — стопы 18 — клапан 19 — насос 20 — воздушная магистраль Рис. 4.2.70 Виндлады с трубами
Акустика музыкальных инструментов. Акустика речи и пения 267 Рис. 4.2.71. Внешний вид кафедры Педальная клавиатура обычно одна, число клавиш достигает 32, диапазон 2,5 октавы (от С1 — 33 Гц до G3 — 196 Гц). За счет использования различных звуковысотных регистров можно изме- нить диапазон на несколько октав вверх или вниз [2,10]. Нажимая на клавишу, органист открывает доступ воздуха в связанную с ней трубу. Аналогично тому, как это происходит в лабиальных и трос- тевых инструментах, создается модуляция воздушного потока, под воздействием которой возникают колебания столба воздуха в трубе и начинается процесс звукоизлучения. Иногда используются и запоминающие устройства (например, зетцер-комбинации), когда заранее подбираются требуемые комби- нации регистров и в нужный момент нажимается только одна кноп- ка, которая заставляет их звучать. Каждый мануал (или педальная клавиатура) связан с опреде- ленной группой труб, называемой Werk (нем.) или Division (англ.), а каждая такая группа представляет собой по существу самосто- ятельный орган внутри одного общего. Самые мощные трубы под- ключены, как правило, к нижнему мануалу (Hauptwerk). В органе, показанном на рис. 4.2.69, группа басовых труб, связанная с пе- дальной клавиатурой, называется бас-орган (pedal-organ); с первым (нижним) мануалом — хор-орган (choir-organ); со вторым мануа- лом — большой орган (great-organ); с третьим — швеллер-орган (swell-organ) [16], хотя возможны и другие варианты соединений. Органный швеллер был изобретен в 1670 году в Англии: трубы некоторых регистров устанавливаются внутри закрытой деревян-
268 Глава 4 ной камеры; открывая и закрывая дверцы этой камеры с помощью специальной педали, органист во время игры изменяет громкость звучания (создает своего рода амплитудную модуляцию). Лучшее техническое воплощение эта идея получила во французских орга- нах XIX века [10, 37, 38]. Кроме мануалов и педальной клавиатуры на кафедре располо- жены рычаги для включения регистров; специальные кнопки под клавиатурой для запоминания выбранных сочетаний регистров, связанных с мануалами; кнопки выше педальной клавиатуры для запоминания комбинаций регистров, связанных с ней; набор спе- циальных копуляций, которые служат для включения соединитель- ных механизмов, позволяющих при нажатии одной клавиши вклю- чать несколько труб из разных мануалов (механизм копуляции был изобретен во Франции в XIV веке); а также другие педали, напри- мер педаль управления швеллером для открывания и закрывания створок дверей на органе. Система передач от клавиатуры к трубам — трактура (4) — открывает клапаны для поступления воздуха в трубы. В органах используется три типа трактур: механическая, пневматическая (электропневматическая) и электрическая. Механическая — самая ранняя трактура, распространенная до середины XIX века и вновь возрожденная в XX веке. Принцип работы показан на рис. 4.2.72а; нажатие пальцем на клавишу с по- мощью специальных абстрактов (тяжей), блоков и вентилей откры- вает доступ воздуха в трубу. Пневматическая — известна с XIX века: воздух передает по трубочкам (кондуктам) «воздушный» толчок клапану, тем самым открывая его. Сейчас такой способ применяется достаточно редко, т. к. трубы отвечают с большим «опозданием». Иногда применяется электропневматическая система: с помощью электро- мотора открывается только доступ воздуха из мехов, затем воз- душный толчок открывает клапаны. а б Рис. 4.2.72. Механическая (а) и электрическая (б) трактура
Акустика музыкальных инструментов. Акустика речи и пения 269 крышка для настройки Электрическая — с нажатием клавиши включается ток в элек- тромагните, с помощью которого открываются клапаны, и в трубы поступает воздух (рис. 4.2.72 б). Эта система имеет ряд преиму- ществ: кафедру можно отодвинуть от труб, клавиши легко нажима- ются, уменьшается время переходных процессов, исполнитель мо- жет без задержки слышать сыгранный звук и др. Однако в новых органах (после 1960 г.) часто возвращаются к механической трактуре, т. к. органист с ней лучше «чувствует» клавиши (обычно сейчас применяется сочетание механической трактуры для игры на клавиатуре и электрической для включения регистров) [10]. Трубы органа (5) представляют собой основные звукообразую- щие и звукоизлучающие элементы органа, содержащие вибраторы и резонаторы. Каждая труба настроена на одну высоту тона (как стру- на рояля) и один тембр. По способу звуко- образования все многочисленные трубы органа делятся на две группы: лабиальные (примерно 80% от общего количества) и язычковые (примерно 20%) [10, 17]. Конструкция лабиальной трубы по- казана на рис. 4.2.73: воздушная струя, выходя под давлением из нижней щели, разбивается об острую кромку сначала нижней, а затем верхней губы и образует вихревые турбулентные потоки, которые совершают колебания около этой кромки, возбуждая продольные колебания столба воздуха в трубе. Механизм звукообразова- ния в лабиальных трубах аналогичен флейтовому (см. раздел 4.2.1). При опре- деленных соотношениях скорости струи и расстояния от щели до острой кромки губы возникают «краевые тоны». Когда частота краевого тона становится близкой к основной собственной частоте трубы, в ней возникают резонансные колебания, которые и обеспечивают излучение звука. В органе используются разные по кон- струкции лабиальные трубы: широкие и узкие; закрытые и открытые; цилиндриче- ские, конические, квадратные, составные и т. д. Конструкция некоторых из них и их названия (open diapason, clarabella, spitz flute, tibia clausa, copula, rohr flute, viola d'orchestre, salicional и др.) показаны на рис. 4.2.74. верхняя губа передняя— панелька нижняя губа щель ■ ножка —" I отверстие' ножки J Рис. 4.2.73. Конструкция лабиальной трубы
270 Глава 4 V d о со cJ д (D О. о V f S я U T CJ J S 3 Q Л V о о а А и ё I (D 00 СО I CJ Й О CJ со Рис. 4.2.74. Различные виды лабиальных труб Спектральный состав излучаемого звука, а следовательно, и его тембр зависят от формы и соотношения размеров труб, мате- риала и толщины их стенок, конструкции лабиума, величины дав- ления вдуваемого воздуха, от точности настройки и др. Форма труб оказывает существенное влияние на акустические характеристики и тембр органа. В открытых цилиндрических трубах частоты собственных колебаний определяются по формуле: С где л = 1, 2, 3 (номер гармоники), С — скорость звука, L — дли- на трубы. При этом в спектре трубы содержится полный ряд гармоник. В связи с возникновением краевых эффектов (обусловленных яв- лением некоторого выхода резонирующего столба воздуха за пре- делы размеров трубы) реальная длина трубы L0 выбирается не- сколько меньшего размера, чем это требуется для заданной основной частоты по вышеприведенной формуле: L = L0+A6+Ат, где A6 — поправка на краевой эффект у открытого конца трубы, Дт — поправка на краевой эффект у лабиума. При этом на низких частотах A6 - 0,6а, где a — радиус цилин- дрической трубы. Поправка за счет краевого эффекта у лабиума: д ~ 2Л^2 где / — высота, s/lb ъ — ширина отверстия лабиума.
Акустика музыкальных инструментов. Акустика речи и пения 271 В целом A111 » Де, т. е. поправки за счет краевого эффекта у лабиума много больше, чем у верхнего отверстия. Величина этих поправок уменьшается к высоким частотам, причем у широких труб скорость их уменьшения больше [2 ]. Формулы эти носят при- ближенный характер, т. к. не учитывают некоторые тонкости в кон- струкции трубы; обычно реальная длина окончательно подстраи- вается опытным путем. Наличие частотно-зависимых краевых эффектов по-разному сказывается на низких и высоких гармониках излучаемого спектра и приводит к негармоничности спектра, т. е. к некоторому сдвигу по частоте («растягиванию») высших гармо- ник, причем у широких труб этот эффект проявляется больше [4]. Закрытые цилиндрические трубы имеют собственные частоты, С_ равные^ = п ~, где п = 1, 2, 3... Основной тон у них в два раза ниже, чем у открытых труб, они содержат только нечетные гармо- ники, создают более спокойные и мягкие тембры звучания. Кони- ческие трубы имеют полный спектр (т. е. содержат четные и нечет- ные гармоники) и дают такое же значение основного тона, как у закрытой цилиндрической трубы (см. раздел 4.2.2). Соотношение размеров труб (мензура) также оказывает суще- ственное влияние на состав спектра излучаемого звука, а следо- вательно, и на его тембр. В широких трубах большинство волн из- лучается и мало отражается; когда труба узкая, большинство волн отражается и мало излучается, поэтому в узких трубах амплитуды высоких гармоник больше [28]. Кроме того, в узких трубах мень- шее влияние оказывают краевые эффекты. В широких трубах за счет этих эффектов сильнее проявляется негармоничность спект- ра, что также приводит к тому, что высокие гармоники в них хуже возбуждаются, поскольку они «растянуты» и не совпадают с гар- мониками звукового источника [2]. Трубы широкой мензуры — «флейтовые» (диаметр — 1/ю~"1/12 от их длины) — дают звуки, бедные обертонами, имеющие спокойный, ровный, матовый тембр. Трубы средней мензуры — «принципалы», составляющие основ- ную массу труб органа (диаметр — 1/i5~~1/l7 от их длины), — дают более богатый обертонами и яркий тембр. Трубы узкой мензуры — «штрейхеры» (диаметр — 1/2СГ1/24 от их длины) — издают звуки напряженного резкого тембра, в них содержится много высоких обертонов. Устройство устья труб (лабиума) является одним из самых существенных элементов конструкции лабиальных труб, влияющих на общее качество звучания. Общая конструкция лабиума показа- на на рис. 4.2.73. Отверстие трубы имеет прямоугольную форму, иногда верхняя губа немного искривлена. Как показали исследо- вания [2,12], основные элементы лабиума, которые оказывают
272 Глава 4 влияние на качество звучания трубы, следующие: ширина и высота отверстия (ротика), относительная позиция керна и губ, насечки на керне и верхней губе, наличие передних панелек (бородки и ще- чек) и др. Размер отверстия в основании трубы (ножке) увеличи- вает поток воздуха и обогащает гармонический состав звука. Ма- лое расстояние между щелью керна и нижней губой уменьшает отношение амплитуд высоких гармоник к низким, звук таких труб отличается небольшой силой и нежным тембром, однако в них увеличен уровень шума за счет турбулентности струи. Большое расстояние требует большего напора и количества воздуха, при этом количество обертонов уменьшается. Высота и ширина отвер- стия (ротика) существенно влияют на атаку и громкость звука. Насечки на нижней губе или керне увеличивают «мягкость» атаки звука. Иногда на трубе устанавливаются две боковые панельки (щечки) и нижняя панелька (бородка), что позволяет лучше контро- лировать направление движения струи воздуха. У лабиальных открытых труб звук из устья беднее обертонами, чем звук из верхнего отверстия. Например, в трубах регистра «принципал» звук, излучаемый из устья, имеет пять-шесть гармо- ник, из верхнего отверстия — до девяти-десяти, у него богаче тембр, хотя он слабее по громкости. Точность настройки: настройка лабиальных труб происходит при установке органа в помещении. Кроме того, подстройка бывает необходима перед выступлением из-за колебаний температуры воздуха в помещении и, соответственно, из-за изменения скоро- сти звука. Для настройки лабиальных труб используется изменение эффективной длины трубы: для закрытых труб за счет сдвига верхней крышки, для открытых — за счет применения специаль- ных настроечных элементов: дополнительных шайб, прорезей или конусных вставок (если нужно поднять высоту настройки, то конус вставляется основанием в трубу; если настройку нужно понизить, то наоборот). Материал, из которого сделаны стенки, также влияет на тембр звука. Обычно для изготовления лабиальных труб применяется дерево или металл. Из дерева делаются прямоугольные трубы различного размера и площади сечения; для этого используются сосна, дуб, красное дерево и др. Дерево подвергается тщательной и длительной просушке. Оно должно обладать ровной слоистой структурой: от его качества зависит срок службы труб. Для цилин- дрических или конических труб используется металл. Из металлов чаще всего применяется сплав олова и свинца в различных про- порциях, который получил название «органный металл». Красивые блестящие трубы, находящиеся в передней части органа, изготав- ливаются из сплава с высоким содержанием олова (70-90%). Вли- яние материала труб на качество звучания органа исследовалось достаточно долго, и в настоящее время установлено [2, 18], что
Акустика музыкальных инструментов. Акустика речи и пения 273 влияние выбора материала на акустические характеристики не очень значительно, если трубы сделаны достаточно жесткими (с тем, чтобы не возникало значительных вибраций стенок) и гладки- ми. Выбор материала сказывается на конструкции лабиума: на- пример, у деревянных труб толщина стенок больше — и, соответ- ственно, по размерам основных элементов лабиума (верхней и нижней губы, отверстия керна и др.) они отличаются от металли- ческих труб. Это оказывает несомненное влияние на качество зву- чания. Таким образом, лабиальные трубы, используемые в органах, очень разнообразны по конструкции и технологии изготовления и позволяют получить огромное разнообразие высотных и темб- ральных соотношений звуков. Вторая группа органных труб, появившаяся в XIV-XV столети- ях, это язычковые трубы. Трубы этого типа обогащают звучание яркими тембрами и составляют значительную часть в конструкции современных органов. Конструкция язычковой органной трубы по- казана на рис. 4.2.75. Механизм звукообразования в ней аналоги- чен механизму однотростевого духового инструмента, например кларнета. В отличие от лабиальных труб здесь модуляция воздуш- ного потока происходит за счет колебаний язычка — тонкой мед- ной искривленной пластинки, которая закреплена на круглом ци- линдре (колодке), сделанном из желтой меди или другого металла. Все звукообразующие элементы помещены в полый металличе- ский цилиндр, называемый стаканом (ножку трубы). Сторона ци- линдра (колодки), обращенная к язычку, делается плоской с треу- гольным отверстием. При продувании воздуха через это отверстие давление падает по закону Бернулли (см. раздел 4.2.2) и язычок прижимается к отверстию, закрывая проход воздуху. Затем под действием собственной упругости и под давлением воздуха в трубе язычок отходит от отверстия, открывая путь для потока воздуха, и процесс начи- Рис. 4.2.75. Конструкция язычковой трубы: 1 нает периодически по- вторяться. Под действием периодических толчков воздуха в трубе возбужда- ются колебания, которые затем поддерживаются в режиме автоколебаний за счет подводимой энер- гии сжатого воздуха. В от- личие от кларнета, где трость настроена на резо- нансную частоту, значи- тельно более высокую, полозок для настройки, 2 — головка трубы, 3 — клинышек, 4 — язычок, 5 — грузик, 6 — ножка трубы, 7 — труба, 8 — колодка (шеллот)
274 Глава 4 чем резонансная частота трубы (при этом резонанс ее сильно за- демпфирован, и колебания столба воздуха в трубе оказывают сильное влияние на колебания трости), в органных трубах язычок мало задемпфирован, настроен на частоту основного тона трубы, и колебания столба воздуха оказывают меньшее влияние на его вибрации. Как и у тростевых инструментов, конец трубы, где нахо- дится язычок, ведет себя как закрытое отверстие [2, 18]. Конструкция колодки и язычка оказывает большое влияние на спектральный состав, а, следовательно, и на тембр излучаемого звука. Широкое отверстие на колодке, которое может занимать всю плоскую поверхность (открытые колодки), обеспечивает большую громкость звука и усиливает основную частоту трубы; узкое отвер- стие, которое занимает только часть ее, сильно сужаясь кверху, подчеркивает высокие гармоники. Существенное значение имеет и материал вокруг отверстия: если язычок ударяет по металлу, то звук получается более яркий; если часть поверхности колодки вокруг язычка покрыта кожей, то более «темный». Значительное влияние на тембр и акустические характеристи- ки труб оказывают также конструктивные параметры язычка: дли- на, ширина, кривизна, толщина и т. д. Для регулировки длины язычка используется настроечная проволока-полозок (рис. 4.2.75). Когда язычок удлиняется, звук становится громче и в его спектре появляется больше гармоник. Толщина язычка также имеет суще- ственное значение: чем толще язычок, тем большая сила (давле- ние воздуха) должна быть приложена, чтобы заставить его вибри- ровать, но при этом получается более громкий звук с подчеркнутой основной частотой (тембр более «темный»). Кривизна язычка име- ет существенное влияние на атаку звука, она подбирается в зави- симости от требуемого тембра: если кривизна подобрана так, что в какой-то короткий период колебания отверстие закрывается по- чти полностью, получается тембр, богатый обертонами; если кри- визна достаточно велика и отверстие никогда полностью не закры- вается, спектр содержит меньше обертонов. Следует отметить, что у труб одного регистра для поддержания единства тембра кривиз- на язычков должна быть одинакова. Язычковые трубы требуют регулярной настройки. Тембр языч- ковых труб очень чувствителен к таким элементам как неоднород- ность язычка, пыль на колодке и др. Язычковые трубы многообразны по форме и могут быть разде- лены на три группы: цилиндрические; конические; составные слож- ной формы (рис. 4.2.76). Трубы также могут быть сделаны из де- рева или из металла (для передних труб используется красная медь, для других труб обычный сплав — олово плюс свинец). Металлические трубы изготавливаются круглыми, деревянные де- лают обычно прямоугольными. Цилиндрические трубы могут быть как открытые, так и закрытые. Конусные трубы, в основном, откры-
Акустика музыкальных инструментов. Акустика речи и пения 275 Рис. 4.2.76. Различные виды язычковых труб тые; при этом угол раскрыва конуса может варьироваться. Состав- ные трубы — это комбинации цилиндрических и конических (или инвертированных конических) труб, иногда с дополнительными раструбами. Они формируют сложную структуру спектра, позволяя выделить определенные гармоники, создавая тем самым большое разнообразие тембров (рис. 4.2.76, 4.2.78). Чаще всего язычковые трубы располагаются вертикально, но среди них встречаются отдельные виды труб, которые распола- гаются горизонтально (излучающее отверстие направлено на слуша- теля). Такие трубы называются en chamade, обычно они делаются из металла (желтой меди) — например, трубы регистра Trompette en chamade. Иногда для сохранения вертикальной позиции использу- ются изогнутые трубы. Цилиндрические трубы, закрытые с одного конца, имеют чет- вертьволновые резонансы (см. раздел 4.2.2) и усиливают только нечетные гармоники. Конические трубы имеют полуволновые резо- нансы и поддерживают все гармоники в спектре, при этом угол раскрыва конуса и его кривизна влияют на тембр звучания: чем шире раскрыв конуса, тем больше подчеркивается фундаменталь- ная частота. Соотношение размеров (мензура) влияет на спектр так же, как и у лабиальных труб: широкие трубы дают более гром- кие, но с меньшим количеством обертонов звуки, узкие трубы — более тихие, но с большим количеством обертонов (они, соответ- ственно, более разнообразны по тембрам звучания). В отличие от лабиальных труб, где изменение длины трубы однозначно связано с изменением высоты тона, у язычковых труб изменение длины не всегда приводит к изменению высоты тона (при соответствующей настройке резонансов язычка), но всегда приводит к изменению тембра. В результате возможна парадок-
276 Глава 4 сальная ситуация, когда более короткая язычковая труба воспро- изводит тон ниже, чем более длинная. Для настройки цилиндри- ческих резонаторов используются также специальные подвижные колпачки, которые позволяют слегка подстраивать эффективную длину трубы. Язычковые трубы используются в органах для имитации темб- ров деревянных и медных духовых инструментов оркестра — кларнета, гобоя, трубы, тромбона, тубы и др., а также различных других тембров, например человеческого голоса (трубы типа vox humana). РЕГИСТРЫ Как уже было отмечено выше, в органах содержится большое количество труб (до 30000). Для того чтобы можно было управлять ими, их особым образом группируют. Принцип группировки орган- ных труб — матричный (как в современных синтезаторах). Как показано на рис. 4.2.77, каждый столбец такой матрицы соответ- ствует трубе определенной высоты тона, все ее строки соответ- ствуют трубам разных регистров с определенным тембром звуча- ния (например, струнным, флейтовым и др.). Регистром называется группа труб одного тембра, имеющая одинаковую конструкцию, т. е. одинаковую форму и мензуру (на- пример, все трубы в данном регистре только лабиальные цилин- дрические или язычковые конические и т. д.). Число регистров зависит от размера органа: маленькие имеют до 10 регистров, большие — до 200 и более. Включение труб дан- ного регистра осуществляется с помощью регистровых рукояток справа и слева от клавиатуры. Подключение кнопок под клавиату- рой открывает заранее заготовленные комбинации регистров. На- конец, использование специальных копуляций позволяет включать трубы из разных регистров. Рис. 4.2.77. Матричный способ группировки труб
Акустика музыкальных инструментов. Акустика речи и пения 277 Основные звуковысотные регистры обозначаются по высоте самой большой трубы, которая измеряется в футах. Номинальный (унисонный) регистр состоит из труб, высота которых настроена на соответствующую ноту на ручной клавиатуре. В современных орга- нах ручная клавиатура имеет диапазон от С2 (65 Гц) до С7 (2093 Гц). Наибольшая труба в номинальном регистре, настроенная на 65 Гц, имеет длину 2,6 м, т. е. почти 8"; для транспонирования мелодии на октаву выше надо перейти в другой регистр, где наи- большая труба имеет размер 4", и т. д. Основные регистры име- ют трубы длиной 8й, 4", 2", 1". В больших органах используются регистры с трубами 16", 32", позволяющие транспонировать высоту на одну или две октавы ниже (соответственно на 33 Гц и 16 Гц). В Австралии был в конце XIX века построен орган, имеющий регистр 64", т. е. настроенный на частоту 8 Гц. В комбинации с но- минальным регистром используются иногда дополнительные регистры «аликвоты», позволяющие сдвигать высоту тона на квин- ту (10 2/3", 51/3", 2", 1") или мажорную терцию (3м); реже — на сеп- тиму, кварту и др., т. е. добавлять обертоны к основному звуку, обогащая тем самым его звучание. Кроме основных, в органах имеются вспомогательные регистры — «микстуры», с помощью ко- торых можно включать несколько труб разной высоты на одну кла- вишу, что позволяет создавать аккорд [7, 10, 37]. Каждая мелодия, исполненная в разных звуковысотных диапа- зонах, может быть сыграна с разными тембрами, что достигается применением специальных тембровых регистров. Регистры по ряду объединяющих признаков (в частности, тембральных) могут объединяться в тональные семейства, напоминая по своему зву- чанию струнные, деревянные, медные и др. инструменты оркест- ра (а также создавая особые тембры, не имеющие аналогов в оркестровых инструментах). Лабиальные регистры делятся на три основные группы: принципалы; флейты; штрайхеры (от нем. — струнные). Принципалы — открытые трубы, обладающие полным и ярким звучанием, они составляют основу органа. В них используются цилиндрические трубы средней мензуры. В спектре имеется до- статочно много обертонов (до 9-11 — рис. 4.2.78), что позволяет получить яркий, звонкий тембр. Флейты — набор различных лабиальных труб, тембр звучания которых напоминает звучание флейты, они могут быть цилиндри- ческие, прямоугольные и конические (рис. 4.2.74). Звучат они тише и «легче» принципалов; поскольку это трубы с большой мензурой, количество выраженных обертонов в их спектре меньше. В откры- тых трубах типа clarabella, spitz flute в спектре присутствуют все гармоники (рис. 4.2.78), обычно первые три превалируют. Иногда в центре трубы делают отверстие, и она начинает звучать на окта- ву выше. Закрытые прямоугольные трубы с подвижным колпачком
278 Глава 4 diapason open diapason principal open flute spitz flute clarabella stopped flute ! I tibia clausa copula rohr flute gedackt string Ii , viola d'orchestre salicional chorus IhH1I fagotto JJjlLUuuXLUjuuu trompette posthorn trumpet regal krummhorn rohr-schalmei solo 'Abu* English horn orcherstral oboe solo I I 11 vox humana kinura б Рис. 4.2.78. Спектры труб: а — лабиальных, б — язычковых сверху типа tibia clausa и цилиндрические типа gedackt, copula и rohr flute с металлической крышкой и трубой для подчеркивания отдельных гармоник в спектре содержат, в основном, несколько первых нечетных обертонов. Штрайхеры — в них применяются узкие лабиальные трубы (малой мензуры) двух типов — viola d'orchestre и salicional, их зву- чание напоминает по тембру струнные инструменты. Звучат они еще тише, но в их спектре много гармоник (рис. 4.2.74), иногда верхние гармоники выше по уровню основного тона. Есть в этих регистрах трубы, четко имитирующие звучание скрипки, а есть
Акустика музыкальных инструментов. Акустика речи и пения 279 трубы, звучание которых более спокойное и мягкое, чем у струн- ных инструментов, с меньшим количеством гармоник в спектре (salicional). Язычковые регистры делятся на: цилиндрические, кониче- ские и с укороченным рупором. Конические (fagotto, trompette, posthorn, trumpet и др.) — мощ- ные, богаты обертонами, имитируют звучание медных духовых инструментов. Цилиндрические (krummhorn, rohr-schalmei и др.) обладают ха- рактерным «гнусавым»звучанием. С укороченным рупором (vox humana, regal и др.) используют- ся для создания особых звуковых эффектов. Например, составные трубы типа vox humana имеют спектр с четко выраженными фор- мантными областями, что позволяет им имитировать человеческий голос. Спектры этих труб показаны на рис. 4.2.74. Кроме этого, имеются и другие регистры, объединяющие трубы по каким-либо признакам [37]. Таким образом, подбирая разные типы труб, можно в значи- тельных пределах изменять спектры получаемых звуков, а следо- вательно, и различные тембры звучаний. Следует отметить также, что для подбора труб в один регистр необходимо обеспечить их однородность по громкости и тембру, для чего требуется тембро- вая настройка регистра (аналогично интонировке в фортепиано) — voicing. Однородность по тембру предполагает подобие спектров и переходных процессов (времени и формы атаки и спада звука) у всех труб, входящих в данный регистр. Для этого они должны иметь подобную форму и определенные пропорции геометриче- ских размеров. АКУСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ Частотный диапазон основных тонов органа от 33 Гц (С1) до 2093 Гц (С7); имеются органы с диапазоном частот от 8 Гц и от 16 Гц. С учетом обертонов он включает в себя почти десять октав — от 16 Гц до 14000 Гц, — что не имеет аналогов среди других инструментов. Основная часть спектральной плотности мощности сосредоточена в области частот до 2 кГц (рис. 4.2.79); область максимальных значений — 250-500 Гц. Рис. 4.2.79. Частотная характеристика спектральной плотности мощности для труб различных регистров (Trumpet 8', Principal 8', Gedackt 8') Gedackt 8,N\ v ,Principal 8' -10- \ \ ч 4, -20L гсГц 0 2 Частота 3 4
280 Глава 4 0 мс у лабиальных труб Рис. 4.2.80. Процесс установления различных обертонов 20 40 60 Время Динамический диапазон составляет 85-90 дБ, максимальное значение уровней звукового давления достигает 110-115 дБ-С. Переходные процессы: обычно в духовых инструментах время установления и спада звука очень небольшое из-за малой инерци- онности столба воздуха, но в органах большие трубы являются уже достаточно инерционными резонаторами и, кроме того, опреде- ленной инерционностью обладает механизм подачи воздуха к тру- бам (трактура). В лабиальных трубах процесс установления звука имеет свою специфику: поскольку частота краевого тона обычно устанавливается несколько выше фундаментальной частоты, то первым в спектре устанавливается второй или третий обертон, который ближе к краевому тону. Например, структура установления первых пяти гармоник для трубы с основной частотой 110 Гц по- казана на рис. 4.2.80, из него видно, что второй обертон устанав- ливается через 10 мс, а основной тон только через 20 мс. Для больших труб эта разница во времени установления составляет 50 мс и 100 мс. Время атаки язычковых труб обычно существен- но меньше и составляет V2 или V5 от времени атаки лабиальных труб, поскольку в них звучание начинается сразу, как только начи- нает колебаться язычок, в то время как в лабиальных трубах тре- буется определенное время для установления струи. Для самых больших лабиальных труб суммарное время установ- ления может достигать 500 мс, для средних труб примерно 100 мс и т. д. Время спада сигналов 0,5-1 с и больше. Эта специ- фика переходных процессов (достаточно большое время установ- ления и начало вступления верхних обертонов раньше, чем основ- ного тона) создает особый тембр звучания органа, отличающий его от других инструментов. Кроме того, большие переходные искаже- ния самого органа требуют соответствующего помещения с доста- точно большим временем реверберации (в соборах оно составля- ет 5-7 с), иначе полный тембр органа не реализуется. Характеристика направленности: излучение звука в органных трубах происходит через лабиум и через открытый конец (для от- крытых труб). При этом, как уже было отмечено, спектральный состав звука и, следовательно, тембр его отличается: звук через лабиум громче, но беднее обертонами; через открытый конец — тише, но содержит больше обертонов. Характеристики направлен- ности также отличаются. У лабиума на низких частотах излучение
Акустика музыкальных инструментов. Акустика речи и пения 281 Характеристика направленности у верхнего отверстия трубы Рис. 4.2.81. CZ^ практически ненаправленное; на высоких частотах, когда длина волны меньше ширины отверстия, образуется широкая характери- стика направленности в вертикальной плоскости и узкая в горизон- тальной. Форма характеристики направленности для трех разных частот у открытого конца трубы показана на рис. 4.2.81. Тембр определяется в первую очередь спектральным составом излучаемого звукового сигнала и структурой переходных процес- сов. О спектре труб различных регистров и их влиянии на тембр уже было сказано выше. Следует отметить также, что из-за крае- вых эффектов спектр негармоничен, высокие частоты несколько растянуты, что также придает особое своеобразие тембру звучания органа. В заключение можно полностью согласиться с мнением О. Баль- зака, что «орган — поистине самый великий, самый смелый, са- мый великолепный из всех музыкальных инструментов, созданных человеческим гением. Это целый оркестр, от которого искусная рука может добиться всего» [42]. 4.3. АКУСТИКА СТРУННЫХ МУЗЫКАЛЬНЫХ ИНСТРУМЕНТОВ Струнные инструменты играют огромную роль в развитии музы- кальной культуры на протяжении всей ее многовековой истории. Они составляют основу современных симфонических оркестров, широко используются в народной музыке, рок-музыке и других ви- дах музыкального искусства. Во всех струнных инструментах имеются основные элементы для извлечения звука (см. раздел 4.1), такие как: генератор — воз- будитель колебаний, с помощью которого мышечная энергия пе- редается через движение смычка, щипок или удар молоточком; вибратор — натянутые колеблющиеся струны инструмента (скрип- ки, гитары, арфы, рояля и др.); резонатор — усилитель колебаний, например плоская дека инструмента (рояль) или корпус с заключен- ным в нем объемом воздуха (гитара, скрипка, арфа и др.). Классификация струнных инструментов обычно производится по способу возбуждения (генерации) звука и включает в себя сле- дующие основные группы [5-7, 10, 11]:
282 Глава 4 — смычковые — скрипки, альты, виолончели, контрабасы, а также народные инструменты (кеманча, басоля, саранги и др.); — щипковые — гитары, арфы, мандолины, клавесины и много- численные народные инструменты: балалайки, домры, гусли, бан- дуры и др.; — ударные (клавишные) — фортепиано. Несмотря на наличие общего типа вибраторов (натянутых струн), эта группа включает в себя инструменты, значительно отличающи- еся по способам звукоизвлечения и по акустическим характеристи- кам из-за различий в способах генерации и усиления звука. В данном разделе будут рассмотрены акустические свойства всех трех групп струнных инструментов на примерах: скрипки (раз- дел 4.3.1); гитары и арфы (раздел 4.3.2); фортепиано (раздел 4.3.3). 4.3.1. Струнные смычковые инструменты. Скрипка К группе смычковых относятся инструменты, звук в которых возбуждается за счет трения, возникающего при движении смыч- ка по струне. Такой способ извлечения звука называется фрикци- онным (friction — трение). В эту группу входят такие инструменты как скрипка, альт, виолончель, контрабас и др., которые уже более трех столетий служат украшением симфонических и камерных оркестров. Сотни композиторов писали для них свою музыку и це- нили их за красоту тембра, широкий частотный диапазон, возмож- ность извлечения множества оттенков звука и т. д. Смычковые струнные инструменты, которые можно считать пред- шественниками скрипки, имеют многовековую историю: например, такие инструменты как ребек (рабаб), были известны на Востоке задолго до н. э. Уже в VIII веке в Европе был известен пятиструн- ный смычковый инструмент кротта, в этот же период арабами были завезены ребек и кеманча, затем с XIV века получили широкое рас- пространение в европейской музыке фидели и виолы (виола да гам- ба, виола д'амур, виола помпоза и др.) [5, 10, 43]. Современная скрипка была создана в Италии к середине XVI века, затем в течение последующих полутора веков ее кон- струкция непрерывно совершенствовалась семьями великих скрипичных мастеров в Кремоне (Северная Италия), самыми знаменитыми из которых были Николо Амати (1596-1684), Антонио Страдивари (1644-1737), Джузеппе Гварнери, по прозвищу дель Джезу (1698-1744). Искусство передавалось от отца к сыну и от мастера к ученикам. Изготовление скрипок было доведено до уров- ня высочайшего мастерства (большинство музыкантов и слушате- лей верят в существование особого секрета скрипок Страдивари, который был утерян в начале XIX века). До настоящего времени звучание скрипок этих итальянских мастеров считается непревзой-
Акустика музыкальных инструментов. Акустика речи и пения 283 денным эталоном. Необходимо отметить, что многие сохранивши- еся скрипки подвергались реставрации в XIX веке, особенно зна- менит был французский мастер-реставратор Ж. Вильом (1798- 1875), который не только реставрировал, но и делал копии скри- пок, в частности Страдивари, добиваясь сильного и яркого звуча- ния [43]. За прошедший период произошли некоторые измене- ния в конструкции инструмента: с целью повышения мощности и яркости его звучания в больших концертных залах увеличилось натяжение струн, несколько выше стала подставка, тяжелее пру- жина и др. [2, 12, 43-46]. Современные скрипичные мастера так- же сделали и делают в настоящее время много замечательных эк- земпляров скрипок. Ни один инструмент не был так овеян легендами и не вызывал столько внимания историков, музыкантов и ученых, как скрипка. Большинство выдающихся ученых-акустиков в течение последних двух столетий уделили внимание анализу процессов звукообра- зования в ней: в XIX веке — Ф. Савар (F. Savart ), Г. Гельмгольц (Н. Helmholtz), Д. Стретт, лорд Рэлей (D. Strutt, lord Rayleigh); в XX веке — Ч. Раман (Ch. Raman), Ф. Саундерс (F. Saunders), Р. Шумахер (R. Schumacher), К. Хатчинс (С. Hutchins), Ю. Мейер (J. Meyer), В. Лоттермозер (W. Lottermoser), Л. Кремер (L. Cremer — автор знаменитой книги «Physics of violin»), и др. [13, 44-46, 48, 49]. В России этой проблемой занимались А. Леман (в 1903 г. вышла его книга «Акустика скрипки»), А. В. Римский-Корсаков, П. Зимин, И. Русаков, Б. Янковский и др. [47]. По инициативе замечательного знатока и мастера скрипок про- фессора К. Хатчинс в США было основано международное науч- ное общество Catgut Acoustical Society, которое занимается про- блемами акустики скрипок и издает научный журнал под тем же названием. Стремление понять секреты итальянских мастеров, создать скрипки, аналогичные старинным по качеству звучания, по- стоянно заставляют современных ученых изучать процессы звукоизвлечения в этом инструменте [48]. Например, только анто- логия статей по акустике скрипок под редакцией К. Хатчинс за 1975-1993 годы включает несколько со- тен работ [49]. Конструкция скрипки представлена на рис. 4.3.1 [11, 43]. Инструмент состоит из следующих частей: корпус (1), шейка с головкой (2), подставка (3), струнодержа- тель, или подгриф (4), кол- ки (5), гриф (6), Верхний Рис. 4.3.1. Конструкция скрипки S It
284 Глава 4 порожек (7). Корпус, имеющий сложную фигурную форму, состоит из рамки (8) и приклеенных к ней верхней (9) и нижней (10) дек (рис. 4.3.2). На верхней деке находятся фигурные звукоизлучающие отверстия — эфы (11). Кроме того, в корпусе имеется еще два очень важных элемента: — душка (12) — еловая палочка цилиндрической формы, которая устанавливается под правой (высокочастотной) ногой под- ставки. Точное место установки душки подбирается эмпирически и оказывает сильное влияние на звук (например, чем ближе душка стоит к подставке, тем сильнее и резче звук, для его «смягчения» душку немного смещают к подгрифу [43]). Душка касается верх- ней и нижней деки и придает им дополнительные жесткость и напряжение (она их подпирает); кроме того, она служит для передачи вибрации от верхней деки к нижней. Диаметр душки у скрипок обычно составляет 5-7 мм, держится она только на трении; — пружина (13) — ребро жесткости на верхней деке под ле- вой (низкочастотной) ногой подставки. Это брусок из дерева (плотной мелкослойной ели), который укрепляет верхнюю деку и служит для передачи вибраций от подставки. Он приклеивает- ся в несколько напряженной изогнутой форме, концы чуть отсто- ят от верхней деки. Обычно он имеет наибольшую высоту в се- редине с постепенным понижением к краям. Общая длина пружины обычно равна 0,75 L (L — длина корпуса): у старинных итальянских скрипок ее длина 241-254 мм, толщина 5 мм, вы- сота в центре — 6-8 мм. Рис. 4.3.2. Поперечный разрез скрипки (вид пружины и душки)
Акустика музыкальных инструментов. Акустика речи и пения 285 трость головка пучок волос колодка Рис. 4.3.3. Конструкция смычка скрипки Для удобства держания скрипки в нижней части корпуса крепят- ся с помощью охватывающей струбцины сверху подбородник (14), а снизу — мостик. Вибратором на скрипке является набор струн (15), передача энергии к которым происходит с помощью смычка. Его конструкция показана на рис. 4.3.3, основные элементы: трость, пучок волос, колодка. По размерам скрипки делят на полные, или четырехчетвертные, (4/4), а также трехчетвертные (3/4), половинные (^/4), четвертные о/4)' восьмые 0Iq). Размеры полной скрипки (^/4) следующие: общая длина 600 мм, длина корпуса 355 мм, его максимальная ширина и толщина — 207 мм и 62 мм, средняя масса — 0,45 кг, длина рабочей части струн — 330 мм [11]. В настоящее время профессор К. Хатчинс разработала новое семейство скрипичных инструментов с пропорционально изменяю- щимися размерами, показанное на рис. 4.3.4. Рис. 4.3.4. Новая коллекция скрипичных инструментов
286 Глава 4 Все элементы скрипки, которые отрабатывались веками, име- ют сложную геометрическую форму и обладают особым комплек- сом физико-механических параметров, определяемых подбором материалов, клеев, лаков, грунтов и т. д. Конструктивные особенности указанных выше элементов и их роль в процессе звукообразования скрипки будут рассмотрены ниже. Корпус — главный элемент конструкции скрипки, изготовление которого — чрезвычайно сложный и трудоемкий процесс, освоен- ный со времен старинных итальянских мастеров. Верхняя дека представляет собой сложной формы пластину (рис. 4.3.2). В качестве материала для нее обычно используется ель (так называемая «резонансная», или «музыкальная»). Старинные итальянские мастера использовали тирольскую или боснийскую ель. Деревья заготавливались только в определенное время года, обычно зимой. Распил дерева должен был быть ра- диальным, чтобы древесные волокна шли параллельно струнам, т. к. жесткость в этом направлении больше. Дерево должно было подвергаться естественной сушке не менее 8-10 лет, т. к. непро- сушенное дерево в процессе игры трескается и теряет свои ка- чества [43]. Верхняя дека делается из двух половинок, склеенных по сере- дине (по линии фуги). Она выпуклая снаружи (соответственно во- гнутая внутри), ее своды выше в средней части и понижаются к краям, где переходят в небольшую ложбину. Высота свода у ста- рых итальянских скрипок примерно 15,5-17 мм. Толщина деки ва- рьируется в среднем от 2 мм (у края) до 3,5 мм. Как показали из- мерения старинных образцов итальянских скрипок, распределение толщин по площади деки имеет очень сложный характер; их вы- борка производилась вручную с целью обеспечения требуемой на- стройки [43]. С нижней стороны к верхней деке приклеивается пружина. Ус вклеивается в ложбину вдоль наружного края верхней деки, он представляет собой три склеенные между собой тонкие полоски дерева (две из черного дерева, посередине — белая из клена). Они украшают инструмент и предохраняют края деки от изломов. Эфы — фигурные отверстия для излучения звука, а также для увеличения чувствительности средней части деки. Они способству- ют возбуждению колебаний верхней деки на высоких частотах, а также обеспечивают усиление звука на низких частотах. Совместно с внутренним объемом они формируют резонатор Гельмгольца [16], основной воздушный резонанс которого зависит от площади эфов, внутреннего объема корпуса и жесткости стенок. Нижняя дека изготавливается из специального клена (явора), она обычно также делается из двух половинок (иногда целой). Явор дает хорошие акустические характеристики и имеет красивый рисунок. По своим контурным очертаниям она повторяет верхнюю
Акустика музыкальных инструментов. Акустика речи и пения 287 деку, но своды у нее поднимаются более полого от краев, высота свода (по измерениям старинных скрипок ) 15-16 мм, толщина в средней части 4-6 мм, у краев примерно 2,5 мм [2]. С верхней декой ее связывает душка. Отношение веса верхней деки с пружиной к нижней деке (как, например, показали измере- ния на скрипках Гварнери) составляет 3 : 4 [43]. Рамка состоит из шести обечаек, тонких, выгнутых по профилю корпуса кленовых дощечек толщиной 1,5-2,0 мм, склеенных с четырьмя уголками и верхним и нижним клоцами (стойками). Для большей прочности приклейки дек к рамке корпуса по пери- метру обечаек с внутренней стороны прикреплены узкие длинные полоски толщиной 2-3 мм (контр-обечайки), которые, так же как уголки и клоцы, сделаны из ели. Задача рамки — формировать воздушный объем внутри дек и передавать колебания от верхней деки к нижней. Подставка устанавливается на верхней деке. Ее основное назначение состоит в том, чтобы удерживать струны на нужном расстоянии от грифа и передавать колебания струн на резонато- ры (верхнюю и нижнюю деки и воздушный объем). Подставка функционирует как механический трансформатор, который конвер- тирует параллельную силу от струн FcmpyH в поперечную силу Fn, действующую на корпус (рис. 4.3.5). Она имеет сложнейшую форму (отработанную еще А. Страдивари), которая показана на рис. 4.3.5; ее высота около 32-34 мм, толщина верхнего края - 1,5 мм, масса 1,6-1,9 г. Изготавливается она из резо- нансной ели, как и верхняя дека. Подставка оказывает существенное влияние на про- цесс звукообразования в скрипке, поэтому так тщательно подбира- ются ее форма и материал [11, 12, 45, 46, 50]. Шейка с головкой делается ра), головка отклоняется назад резонатор Гельмгольца' Рис. 4.3.5. Вид подставки из целого куска клена (или яво- и заканчивается завитком (рис. 4.3.1). Форма головки выбирается из эстетических представлений (по виду завитка узнается почерк мастера). В корпусе головки вы- далбливается колковый ящик, в боковых стенках которого, назы- ваемых «щечками», просверливают четыре отверстия и вставляют колки. Колки вытачиваются из черного или другого твердого дерева. Они служат для регулировки натяжения струн, которое достигает в современных скрипках величины 250 N. Струна продевается
288 Глава 4 в сквозной канал, просверленный в стволе колка, и закрепляется, а затем колок проворачивают в отверстии колкового ящика, натя- гивая струну в процессе настройки скрипки. Верхний порожек — небольшой брусочек из черного дерева, приклеивается около нижнего края колкового ящика поперек шей- ки, служит для поддержания струн на определенной высоте над грифом и для ограничения их рабочей длины. Гриф примыкает непосредственно к верхнему порожку. Он представляет собой выгнутую пластинку из черного дерева, не- сколько расширяющуюся книзу. При игре струны прижимаются к грифу пальцами, причем музыкант определяет на слух (и исхо- дя из опыта ощутимых усилий), как меняется длина звучащей стру- ны и, соответственно, высота и спектр излучаемого звука. Подбородник — пластинка из черного дерева — прикрепляет- ся с помощью струбцины с левой стороны верхней деки. Так же как и мостик, она служит для удобства исполнителя во время игры. Кроме того, подбородник и мостик освобождают корпус скрипки от зажима плечом и подбородком, что предотвращает демпфирова- ние звука и значительно улучшает звучание инструмента. Струны. В скрипке используется четыре струны, настроенные по квинтам на следующие частоты: Е5 — 659,3 Гц, А4 — 440 Гц, D4 — 293,7 Гц, G3 — 196 Гц. Длина рабочей части струн — 330 мм. Для изготовления струн в современных скрипках применя- ется большое разнообразие материалов. Для основы используются жильные, синтетические (перлон), стальные (из специальной высо- коуглеродистой стали) струны; в качестве навивки — алюминиевые, серебряные и стальные нити (канитель). В качестве примера можно привести комплекты струн: Е5, А4 — сталь, обвитая алю- миниевой канителью; D4 — жила, обвитая алюминиевой каните- лью; G3 — жила, обвитая серебряной нитью (мастерские Боль- шого театра); Е5 — сталь; А4, D4 — синтетика (перлон) с алюминиевой навивкой; G3 — синтетика (перлон) с серебряной навивкой (Dominant фирмы Dr. Thomastik); Е5 — хромированная сталь; А4, D4, G3 — хромированная сталь со стальной навивкой (Chromcor фирмы Pirastro) и др. Все деревянные детали скрипки покрываются специальным лаком. Многие ученые считают, что секрет итальянских скрипок в составе грунта и лака [43], однако многолетние исследования показали, что хотя состав лака и оказывает влияние на качество звучания скрипок, он не является определяющим [2]. Сложная форма дек, наличие ребер и стяжек в скрипке обус- ловлены не только акустическими требованиями к качеству зву- чания, но и решением проблемы механической прочности, т. к. очень тонкая и легкая дека должна без изломов и трещин выдер- живать большое натяжение струн (примерно 250-260 N, или
Акустика музыкальных инструментов. Акустика речи и пения 289 25-27 кГ), что создает статическую поперечную силу, воздейству- ющую на подставку, примерно в 80-90 N (8-9 кГ). Смычок — устройство для возбуждения струн. Он представля- ет собой круглую или граненую деревянную трость из фернамбу- ка или граба, слегка изогнутой формы, постепенно утолщающую- ся от одного конца к другому (рис. 4.3.3). На более тонком конце находится головка, на более толстом — колодка, которую можно двигать взад и вперед по трости с помощью винта и гайки. В колод- ке сделано специальное отверстие, в котором закреплен пучок во- лос в виде плоской ленты. В пучке используется обычно конский волос (из хвоста), обработанный особым образом и при игре нати- раемый канифолью. Общая масса смычка для полной скрипки при- мерно 60-70 г, длина примерно 730 мм. В основном современные мастера копируют элементы старин- ных итальянских скрипок, однако постепенно происходят некото- рые изменения в их конструкции: увеличивается высота подстав- ки, т. к. из-за увеличения натяжения струн растет действующая на них поперечная сила; жильные струны заменяются на металличе- ские; увеличивается толщина пружин и т. д., что позволяет полу- чить большую громкость и яркость звучания. Процесс звукообразования. Процесс извлечения звука в скрип- ке может осуществляться разными способами: за счет движения смычка по струне; за счет щипка струны (игра pizzicato); за счет удара по струнам тростью смычка (игра con legno). Струна, как известно, является слабым излучателем звука в воздушную среду, у нее слишком мала площадь, поэтому для уси- ления звука используются резонаторы — корпус скрипки и воздуш- ный объем внутри него. Общий процесс возбуждения и передачи звука происходит в такой последовательности: колебания струны, возбуждаемые при движении смычка (механизм их возбуждения будет рассмотрен ниже), приводят к появлению переменной поперечной силы, дей- ствующей на подставку, которая вызывает возникновение вынуж- денных колебаний в ней. Поскольку подставка имеет свои соб- ственные резонансные частоты, то она действует как полосовой фильтр, усиливая колебания в области 2-3 кГц. От подставки коле- бания передаются корпусу, при этом с помощью душки и пружины возбуждаются вибрации в верхней и нижней деке. Деки имеют свою систему резонансных частот и, следовательно, подчеркива- ют определенные области в спектре. При колебаниях корпуса воз- буждается воздушный объем внутри него, который также имеет свои собственные резонансные частоты и, соответственно, вносит свой вклад в процесс преобразования колебаний струн. Вся эта сложная колеблющаяся система, как механическая, так и воздуш- ная, излучает звук в окружающую среду. Этот сложный звукооб- разующий процесс определяет тембр, громкость, звуковысотные
290 Глава 4 соотношения и все другие характеристики, которые создают «зву- ковой образ скрипки». Процесс преобразования энергии колебаний при передаче ее от смычка к струнам, от них к подставке, корпусу и воздушному объему является не очень эффективным: коэффициент полезного действия меньше 1%, основная часть энергии преобразуется в тепловую в различных элементах конструкции. Процесс возбуждения струн смычком: струна представляет собой тонкое гибкое тело, натянутое между двумя опорами. Иде- альная струна не имеет собственной жесткости и управляется только натяжением. При этом предполагается, что плотность ее распределена равномерно и диаметр у нее строго постоянный. Тонкие вытянутые тела, управляемые натяжением, обладают заме- чательным свойством: их собственные частоты находятся в цело- численных соотношениях 1 : 2 : 3 : 4... (т. е. все их обертоны яв- ляются гармониками — см. гл. 2). Как показано в главе 2, значения собственных частот струны равны: fn 1 где T— натяжение струны, L — длина стру- ны, т — масса струны, п — номер гармоники. - Фундаментальная 2 V Lm Формы колебаний (моды) струны, зажатой между опорами, на собственных частотах показаны на рис. 4.3.6. Как видно из ри- сунка, на первой частоте по длине струны укладывается полволны, т. е. L = А/2; затем две полволны L = 2 7J2 и т. д. Эти соотношения имеют место только в идеальных струнах. В реальных струнах всегда есть некоторые отклонения, которые порождают негармоничность спектра, т. е. сдвиг в целочисленных соотношениях собственных частот. Основными причинами негар- моничности являются: собственная жесткость струн, колебания их опор, неоднородное распределение плотности, неравномерность диа- метра вдоль длины, изменение дли- ны струн в процессе колебаний и др. Собственная жесткость струн приводит к появлению не только по- перечных колебаний в них, но также продольных и крутильных (это со- здает шумовые искажения в звуке). Практически все музыкальные ин- струменты создают звуки с извест- ной негармоничностью спектра: если сдвиг обертонов находится в пределах от 0,1% до 0,35%, то это создает некоторую живость звуча- /2=2/ ооооо* ООООООб /.=п/; Рис. 4.3.6. Формы колебаний струны на собственных частотах
Акустика музыкальных инструментов. Акустика речи и пения 291 ния; если превышает эти пределы, то могут ощущаться биения. Жесткость струн влияет не только на негармоничность обертонов, но и на соотношение их амплитуд: более жесткие и толстые стру- ны хуже возбуждаются на высоких частотах (из-за большого со- противления изгибу), высокие обертоны в них быстрее затухают, поэтому их спектр беднее и тембр более глухой. Процесс возбуждения струны смычком происходит за счет силы трения. В смычке используется натянутый конский волос (как всякий волос, он имеет трехслойную структуру: внутренний слой — куби- ческие ороговевшие клетки, промежуточный слой — корковое веще- ство, внешний слой — черепичные чешуйки волосков). Пучок волос натирается канифолью, удерживаемой внешними чешуйками. При движении натертых канифолью волосков поперек струны лег- коплавкая канифоль вследствие нажима слегка расплавляется и становится липкой, волоски пристают к струне, при этом смычок как бы прилипает к струне за счет силы трения покоя Ртрепш (поскольку скорость смычка равна скорости струны) и оттягивает ее от положе- ния равновесия вправо или влево. Это оттягивание продолжается до того момента, пока возвращающая сила за счет натяжения стру- ны не становится равной силе трения F = F (или больше ~ ~ трения nam. v ее). Струна отрывается от смычка и начинает с большой скоростью скользить назад навстречу его движению (при этом скольжении сила трения движения оказывается малой, т. к. она обратно про- порциональна скорости ^трения движения ^v)» ^O инерции она проскакива- ет положение равнове- сия и отклоняется в дру- гую сторону, пока ее скорость не становится снова равной скорости смычка; тут смычок ее подхватывает, и цикл повторяется. Графически это представлено на рис. 4.3.7 а. В результате форма колебаний струны имеет вид пилообразного им- пульса, в котором можно выделить два этапа: про- цесс сцепления и про- цесс скольжения. Этот импульс перемещается вдоль струны, отражается от опор и снова приходит X, MM движение смычка средняя позиция в процессе колебаний начальная позиция струны время t, с MM Рис. 4.3.7. Изменение формы импульса при возбуждении струны смычком в зависимости от места возбуждения: а — вблизи подставки, б — в центре, в — ближе к грифу
292 Глава 4 в точку, где смычок возбуждает струну. Под действием этих отражен- ных волн могут происходить отрывы и новые зацепления, что при- водит к появлению ступенек на кривой смещения струны. Реальная форма импульса имеет несколько скругленный угол, т. к. влияют ширина смычка, упругость волоса, конечная жесткость струны, отраженные волны и др. [12]. Если бы импульс был один, он со- вершил бы несколько раз путь вдоль по струне и затух, посколь- ку каждый раз при отражении на обеих опорах он терял бы энер- гию. Но смычок все время подпитывает струну (передает ей энергию), поэтому в ней возникают периодические колебания. Форма импульса существенно зависит от места возбуждения струны (места приложения смычка); чаще всего оно находится на расстоянии I/5...I/8 от Длины рабочей части струны со стороны подставки. Чем ближе к опорам располагается место возбуждения, тем более несимметричной становится форма импульса (рис. 4.3.7 б). Время сцепления струны со смычком определяется собствен- ной частотой струны, а амплитуда колебаний струны зависит от силы давления смычка, скорости смычка и возникающих при этом сил трения покоя и скольжения [11]. Поэтому в процессе звукоиз- влечения должны контролироваться следующие основные пара- метры: V— скорость смычка, F — сила давления смычка на стру- ну, x/L — место приложения смычка, Ртрения — сила трения покоя. Скорость смычка V определяет, какое количество энергии смы- чок передает струне для поддержания колебаний. Во время цикла прилипания, когда скорость струны равна скорости смычка, стру- не передается энергия £, которая приближенно может быть опре- делена как: „ / r, „г/ %, E= (mL2/6)(V/x)\ где L — длина струны, ш — масса струны, V— скорость смычка, х — расстояние от подставки. Чтобы повысить громкость звучания (т. е. увеличить количество передаваемой энергии), надо повысить скорость смычка (обычно она находится в пределах 0,1-1 м/с) или сдвинуть смычок к подставке [2, 18]. Сила трения F 1ия между струной и смычком оказывает суще- ственное влияние на качество извлекаемого звука. Она зависит от таких параметров смычка, как масса, размеры, гибкость, положе- ние центра тяжести, характеристики волоса, качество канифоли и др. Хороший смычок позволяет получать нужные оттенки звука при минимальных мускульных усилиях. Лучшие смычки изготавлива- лись такими знаменитыми французскими мастерами как Франсуа Турт (Frangois Tourte, 1747-1835), Жан-Батист Вильом (Jean- Baptiste Vuillaume, 1798-1875) и др. Сила давления смычка на струну F должна находиться в известных пределах (обычно от 0,5 H до 1,5 Н): если сила мала, струна срывается слишком быстро, если велика, то струна вообще
Акустика музыкальных инструментов. Акустика речи и пения 293 не может оторваться от смычка. При каждом положении смычка имеются определенные допусти- мые границы изменения этой силы, показанные на рис. 4.3.8. Как видно из рисунка, при при- ближении смычка к подставке сила давления должна возрас- тать (такая манера игры называ- ется sul ponticello); при удалении от подставки (игра sul tasto) тре- буемая величина силы уменьша- ется, но допустимые пределы ее изменения возрастают. Необхо- димо отметить, что при изменении положения смычка и силы дав- ления меняется форма импульса, а следовательно, и спектр воз- буждаемого звукового сигнала. Каждый импульс волны, идущий вдоль струны, можно предста- вить в виде суммы простых гармонических колебаний в соответ- ствии с преобразованием Фурье (см. гл. 2): x(t)= ^AnSm(PJ+ <ря)9 w = I где x(t) — зависимость смещения струны от времени, т. е. форма импульса (рис. 4.3.7), An — амплитуды гармоник, соп — собствен- ные частоты гармоник, (рп — фазы гармоник. Изменение количества гармоник, их амплитуд и фаз зависит от формы импульса, а следовательно, от всех вышеперечисленных параметров: места возбуждения, силы прижима, скорости смычка и др. Например, если смычок возбуждает струну в том месте, где находится узел каких либо гармоник, то гармоники с данными но- мерами не возбуждаются (при возбуждении точно в середине стру- ны четные гармоники не возбуждаются — рис. 4.3.6). Поскольку тембр зависит от спектрального состава звука (см. гл. 3), то, сле- довательно, он также зависит от позиции смычка, его скорости и силы прижима: если смычок приближается к подставке, гром- кость увеличивается, сильнее будут звучать высокие обертоны, тембр становится блестящим с металлическим оттенком; при при- ближении к грифу амплитуды высоких гармоник уменьшаются, тембр начинает напоминать звук флейты. При наклонном ведении смычка увеличивается доля продольных и крутильных колебаний струн и тембр ухудшается. При игре на скрипке существует особый способ извлечения звука из струн: если во время ведения смычка слегка коснуться Сила прижима смычка, H расстояние от подставки Рис. 4.3.8. Зависимость величины силы давления смычка от его позиции (при постоянной скорости)
294 Глава 4 пальцем одной из точек струны, она может разделиться на несколь- ко частей (рис. 4.3.6), что позволяет получить выделение определен- ных обертонов, получивших название флажолетов [22, 23]. Таким образом, при движении смычка по струне возникает сила смещения струны в плоскости, параллельной деке. Эта сила пере- дается на подставку, с помощью которой она трансформируется в силу, нормальную к плоскости деки и непосредственно возбуж- дающую колебания корпуса и воздушного объема. Роль подставки в звукообразовании. Подставка (рис. 4.3.6) выполняет очень важные функции в процессе игры на скрипке: во- первых, она удерживает струны на заданном расстоянии от грифа, во-вторых, выдерживает большую силу статического давления со стороны струн (порядка 80-100 Н). Наконец, как уже было сказа- но выше, она трансформирует переменную динамическую силу, возникающую при движении смычка в плоскости, параллельной деке, в поперечную динамическую силу, величина которой 2-5 Н. Под действием смычка струна совершает поперечные колебания в его плоскости. Поскольку подставка имеет особую криволиней- ную форму, под действием этих смещений струны она начинает совершать вращательные движения, т. е. качаться на левую или правую «ногу» (рис. 4.3.9), передавая давление вниз на деку. По- скольку подставка под одной ногой имеет пружину (под струной G), а под другой душку (под струной Е), то через пружину она переда- ет усилия верхней деке (низкочастотной «ногой»), через душку нижней деке (высокочастотной «ногой»). Формы колебаний под- ставки подробно исследованы в работах К. Хатчинс и др. [45, 46, 49, 50, 51]. Жесткость и масса подставки были подобраны таким образом, чтобы ее первый собственный резонанс находится в области 2-3 кГц (что совпадает с частотой высокой певческой форманты голоса — см. раздел 4.6). В этой области она увеличи- вает передачу силы со стороны струн на деку, т. е. действует как полосовой фильтр. Эксперименты показали, что даже небольшой сдвиг собственных резонансов подставки приводит к значительному изменению тембра скрипки: при сдвиге их вниз звук становится пружина U U передача энергии L душка на верхнюю деку передача энергии на нижнюю деку U глухим, при сдвиге вверх более пронзительным. Поэтому в современных скрипках конфигурация подставки сохраняется практически такой же, ка- кой ее отработали италь- янские мастера. Рис. 4.3.9. Колебания поставки под действием смещения струн На подставку иногда надевается сурдина. Она имеет форму гребешка с тремя раздвоенными
Акустика музыкальных инструментов Акустика речи и пения 295 Рис. 4.3.10. Формы колебаний верхней и нижней деки зубцами, которые вставля- ются между струнами. Сур- дина ограничивает амплиту- ду колебаний струн, что приводит к уменьшению громкости и изменению тем- бра звучания [5]. Колебания корпуса и воздушного объема и их роль в звукообразовании. Динамическая сила, дей- ствующая на подставку, передается с помощью душки и пружины на верхнюю и нижнюю деку и возбуждает колебания корпуса в целом, включая обе деки, гриф и рукоятку, а также столба воз- духа, заключенного в нем. Анализ колебаний всей этой сложной системы и ее отдельных элементов неоднократно выполнялся экспериментальными методами (с помощью голографической интерферометрии или с помощью акселерометров), а также рекон- струировался на компьютерах с помощью численных методов рас- чета [2, 45, 46, 49, 51]. Формы колебаний верхней и нижней деки на различных частотах показаны на рис. 4.3.10. Основные формы колебаний всего корпуса в целом показаны на рис. 4.3.11. Здесь приведены первые три формы колебаний (моды) деревянного корпуса В-1, ВО, В1, которые соответствуют двум и трем поперечным узловым линиям на поверхности. Соот- ветствующие частоты (в данном примере) равны 130 Гц, 293 Гц, 523 Гц. Следует отметить, что активное участие в колебаниях кор- пуса принимают все его элементы, в т. ч. гриф, рукоятка и др. ■nT f S 1 B-I Рис. 4.3.11. Основные формы колебаний корпуса В-1, ВО, Bl и воздушного объема АО, Al
296 Глава 4 Воздушный объем, заключенный между верхней и нижней де- кой, обладает определенной массой и упругостью и, соответствен- но, имеет свою систему собственных частот. Поэтому при колеба- ниях верхней и нижней деки возбуждаются определенные резонансные колебания воздушного объема. Исследования этих колебаний методами голографической интерферометрии, выпол- ненные в работе К. Хатчинс [51], позволили выявить картину рас- пределения звукового давления на резонансных частотах внутри корпуса. Первая резонансная частота соответствует движению объема воздуха как единого целого («дыхательная» мода — АО), на второй резонансной частоте (мода А1) появляется один попе- речный узловой диаметр, затем появляются моды с двумя попе- речными узловыми диаметрами и набором продольных узловых диаметров. Значения этих частот зависят от объема воздуха, гиб- кости стенок, площади эфов и др. Расположение двух первых форм (мод) колебаний воздушного объема на частотной шкале показаны на рис. 4.3.11: мода АО имеет частоту примерно 261 Гц, мода А1 — частоту примерно 493,8 Гц (у разных скрипок эти час- тоты могут изменяться в пределах 250-280 Гц, 460-480 Гц) [2, 11, 49, 51]. Настройка резонансов дек, корпуса в целом и воздушного объ- ема является определяющим процессом в обеспечении качества звука скрипки. На протяжении многих десятилетий скрипичные мастера подбирали настройку дек экспериментально. Наибольшее распространение в классический период изготовления скрипок получила система настройки, выработанная Страдивари, при ко- торой верхняя дека настраивалась в В^З, а нижняя в С4 (т. е. с разницей в тон) [43]. В настоящее время все эти процессы тщательно изучаются и моделируются компьютерными методами и с помощью лазерной интерферометрии. Результаты многочисленных исследований на сотнях экземпляров скрипок, выполненные под руководством К. Хатчинс [51], позволили выявить следующие закономерности взаимодействия различных резонансных частот и соответствующих форм (мод) колебаний воздушного объема и корпуса (рис. 4.3.11): — необходимым условием хорошего звука и легкости игры явля- ется достаточно близкое расположение частот основной (дыхатель- ной) формы колебаний воздушного объема АО и формы колебаний корпуса ВО. В работе Л. Кузнецова [11] показано, что у многих ита- льянских скрипок резонанс корпуса (дерева), соответствующий моде ВО, находится в области 315 Гц, при этом первый воздушный ре- зонанс (мода АО) находится ниже его примерно на терцию. Основ- ной вклад в общее излучение инструмента в этой области частот вносит именно воздушный резонанс (АО), поскольку его амплиту- да существенно выше, поэтому излучение звука происходит в ос- новном через эфы (рис. 4.3.12);
Акустика музыкальных инструментов. Акустика речи и пения 297 Рис. 4.3.12. Форма амплитудно-частотной характеристики скрипки ДБ ПО 100 90 80 B-I АО ВО Bl ►/Гц — существенное влияние на звучание скрипки оказывают резонансные частоты корпуса и воздушного объема (мода В1 и мода А1), которые находятся в области 400-600 Гц (рис. 4.3.11). Исследования многочисленных экземпляров скрипок показали [51], что у инструментов с ярким звучанием и большим динамическим диапазоном, используемых солистами, разница между частотами составляет: fBl-fM = 60-80 Гц (в частности, у одной из скрипок Гварнери 1741 г. — 68 Гц), у оркестровых скрипок 40-60 Гц. Скрип- ки с разницей меньше 40 Гц используются в камерном исполне- нии, они дают мягкое, но более слабое звучание. Сдвиг частоты резонанса, соответствующего моде колебаний В1, может быть до- стигнут подбором толщин верхней деки, пружины и душки. В час- тности, применение более тяжелой пружины позволяет изменить резонансную частоту колебаний корпуса примерно на 10-16 Гц. При этом в общую амплитудно-частотную характеристику излуча- емого скрипкой звука наибольший вклад в этой области частот вносят резонансные колебания корпуса (дерева) — рис. 4.3.12; входной сигнал АЧХ подставка АЧХ корпуса llhm... ,!.и 1,' г .III кГц кГц кГц выходной сигнал 0 1 2 3 4 5 Рис. 4.3.13. Процесс поэтапного преобразования спектра сигнала в скрипке
298 Глава 4 — наконец, низшая резонансная частота корпуса, соответству- ющая форме колебаний В-1, находится в области 130-150 Гц, что в хороших скрипках обычно соответствует половине основной ре- зонансной частоты воздушного объема (мода АО). При слишком близком расположении резонансов корпуса и струны могут возникнуть биения и отчетливо слышимый диссо- нирующий звук, который называется «волчий» тон [11]. Таким образом, если рассмотреть процесс возбуждения звука в скрипке в целом, то гармонический спектр, создаваемый при коле- баниях струны, подвергается фильтрации за счет колебаний подставки, затем за счет колебаний корпуса и воздушного объема; в силу этого определенные обертоны усиливаются (появляются фор- мантные области), что и формирует конечный спектр излучаемого звука, определяющий тембр звучания инструмента (рис. 4.3.13). АКУСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ Диапазон воспроизводимых частот для основных частот равен 196 Гц (G3)-3520 Гц (А7), в сольных партиях до 3951 Гц (В7), т. е. больше четырех октав [16]. С учетом обертонов он достигает 6 кГц для нижних регистров и 10 кГц и выше для верхних. Спектр звуков скрипки содержит большое количество гармоник со значи- тельными вариациями по амплитуде; примеры огибающих спектра (АЧХ) для старинных и современных скрипок показаны на рис. 4.3.14 (скрипки возбуждались с помощью электромеханического возбудителя, установленного на подставке). В нижних регистрах (струна G3) фундаментальная частота имеет амплитуду на 20- 25 дБ меньше, чем более высокие гармоники в спектре; в верхних регистрах амплитуда фундаментальной частоты становится наи- большей. Типичные формантные области спектра: для низких нот — 400 Гц; вторая очень важная формантная область — 800-И 200 Гц (интересно отметить, что для скрипок Гварнери эта дБ 30 а 30 б Рис. 4.3.14. Огибающая спектра (АЧХ) для старинных и современных скрипок: а — десять старинных итальянских скрипок; 0 б — десять хороших совре- менных скрипок 300 500 1000 2000 4000 Гц
Акустика музыкальных инструментов Акустика речи и пения 299 000-1250 Гц область находится в пределах 1000-1250 Гц, а у скрипок Страдивари от 800 до 1000 Гц [13]). Высокие формантные обла- сти 2000-2600 Гц и 3000-4000 Гц оказывают существенное влияние на яркость и полетность звука. Состав спектра зависит от ме- ста приложения смычка: чем ближе к подставке, тем больше обертонов в спектре. Характерной особенностью спектров является наличие шумовых компонентов, возникающих при движении смыч- ка. Этот смычковый шум «окра- шен» за счет резонансов деки и воздушного объема. Динамический диапазон у скрипки составляет 30-35 дБ. Нижний уровень при исполнении рр составляет 42 дБ-А для низких и средних и 45 дБ-А для верхних частот (на расстоянии 6,5 м). Верхний уровень при ff: 75 дБ-С и 80 дБ-С в области Сб. Необходимо отметить, что у скрипок нет такой сильной зависимости состава спектра от уровня громкости как у духовых инструментов [13 ]. Переходные процессы, при игре на скрипке у исполнителя име- ется значительно больше возможностей контролировать процесс ус- тановления звука, чем на духовых инструментах. Общее время ата- ки составляет 60 мс для низких тонов, 40-50 мс для средних и 30 мс для высоких. При мягкой атаке время установления увели- чивается до 200-300 мс. Обычно высшие гармоники устанавливают- ся быстрее, чем нижние, что влияет на восприятие тембра скрипки. (W3 200-5000 Гц Рис. 4.3.15. Характеристики направленности скрипки на различных частотах
300 Глава 4 Характеристика направленности. Угол излучения звука у скри- пок имеет сильно выраженную частотную зависимость, показанную на рис. 4.3.15 (для горизонтальной плоскости). На низких частотах в диапазоне до 700 Гц излучение происходит как от верхней, так и от нижней деки, а также от воздушного объема через эфы. На более высоких частотах излучение идет в основном от верхней деки, т. к. в этой области частот передача вибраций на нижнюю деку существенно уменьшается [16]. Форма АЧХ при разных пози- циях микрофона показана на рис. 4.3.16. Тембр. Скрипка обладает уникальными возможностями созда- ния огромного многообразия тембральных оттенков звука: светлых, серебристых — в верхних регистрах; мягких, нежных — в средних; певучих, густых — в нижних [23, 24]. 4.3.2. Струнные щипковые инструменты. Гитара. Арфа Отличительной особенностью всех инструментов этого типа является возбуждение струн с помощью щипка. Щипок может осу- ществляться пальцами (например, в гитаре, арфе), плектром — медиатором (например, в мандолине, домре) или с помощью спе- циального щипкового механизма (в клавесине). Щипковые струнные инструменты подразделяются на: — грифовые — гитара, мандолина, бандура, домра, балалайка и др; — безгрифовые — арфа, клавесин, гусли и др. В этом разделе основное внимание будет уделено процессам звукообразования и акустическим характеристикам гитары и арфы. ГИТАРА Гитара (от греч. kithara — лира) относится к семейству лют- невых инструментов и имеет солидную историю: похожие на нее по внешнему виду инструменты встречались еще в древней Месо- потамии и Египте. В период завоевания Испании арабами (VIII- XV вв.) она получила там широкое распространение, к XIII веку было известно два вида гитар: «мавританская» и «латинская» с особой формой корпуса. В конце XVI века появилась пятиструн- ная гитара с квартовым строем, создание которой приписывают знаменитому испанскому поэту и гитаристу В. Эспинелю (V. Espinel). В конце XVII столетия начала использоваться шестиструнная клас- сическая гитара, но окончательно она вытеснила пятиструнную ги- тару только в XIX веке, после широкого распространения в других странах Европы и прежде всего в Италии и Франции [5-7, 24, 30, 52, 53]. Хотя гитары изготавливались во многих странах, например в Италии (даже знаменитый скрипичный мастер А. Страдивари сделал несколько гитар), наибольшего расцвета искусство их изго- товления достигло в Испании в XIX-XX веках трудами знаменитых
Акустика музыкальных инструментов. Акустика речи и пения 301 Рис. 4.3.17. Различные типы гитар: а — классическая, б — фолк-гитара (flattop), в — джазовая гитара (archtop) мастеров и исполнителей, таких как Антонио де Торрес Хурадо (Antonio de Torres Jurado, 1817-1892), Франческо Таррега-и-Эшеа (Francisko Tarrega-y-Eixea, 1852-1909), Андрее Сеговия (Andres Segovia, 1893-1987) и др. Шестиструнная гитара появилась в России во второй половине XVIII века (до этого времени были известны изображения четырех- струнной «латинской» гитары), с конца XVIII века начала распро- страняться семиструнная гитара (огромную роль в ее популяриза- ции сыграл знаменитый русский гитарист А. О. Сихра). Гитара превратилась в русский народный инструмент, используемый в различных видах музыкального исполнения. В настоящее время широкое распространение в России имеет как «русская» семи- струнная гитара, так и «испанская» шестиструнная [30]. В XX веке гитара стала одним из самых массовых инструмен- тов на всех континентах, при этом наряду с акустическими гитара- ми широкое распространение получили различные разновидности электрогитар (см. гл. 7) [2, 11, 12, 53]. Сейчас широкое распространение имеют следующие типы аку- стических гитар: классические; фолк-гитары (flattop) с плоской верхней декой, стальными струнами и увеличенным корпусом (на их основе были созданы большие эстрадные гитары типа «дред- ноут» и типа «джамбо» [12, 53]); наконец, джазовые гитары с ароч- ной верхней декой (archtop), имеющие стальные струны, выгнутый корпус и отверстия, похожие на эфы скрипки. Образцы различных гитар показаны на рис. 4.3.17. Остановимся более подробно на конструкции классической гитары. Классические гитары можно разделить: по числу струн — на шестиструнные, семиструнные, двенадцатиструнные; по строю — на примы, терциевые, квартовые, квинтовые; по приме- нению — на концертные, домашние и др. [11]. Конструкция современной классической шестиструнной гита- ры показана на рис. 4.3.18 а, б. Основные ее элементы: корпус, состоящий из верхней (1) и нижней (2) дек и обечаек (3); резона-
302 Глава 4 торное отверстие (5) с розеткой (4) и подставка (6) для закрепле- ния струн, расположенные на верхней деке; гриф (10), который со- стоит из шейки (11) с пяткой (12) и накладки с ладовыми пластина- ми (10а); верхний порожек (9); головка (8), в которой находится колковый механизм (7); набор струн. Размеры гитары (максимальная длина, ширина и высота корпу- са) существенно варьируются, например 1005 х 366 х 100 мм; 940 х 343 х 85 мм и др. [11]. Верхняя дека делается из резонансной ели толщиной примерно 2-2,5 мм. Нижняя дека и обечайки изготавливаются также из резонан- сной ели или из таких твердых пород, как палисандр, красное дере- во и др. Для грифа используется красное дерево, кедр, клен, граб; для грифовой накладки обычно применяется черное дерево. Шейка грифа обычно склеивается из трех или пяти кусков ценных пород де- рева, причем слои подбираются так, чтобы они лежали в разных на- правлениях. В некоторых конструкциях она изготавливается монолит- ной. Иногда для большей жесткости внутрь грифа вставляется металлический стержень (особенно для гитар типа flattop). Под нижней частью верхней деки, а также на внутренней части нижней деки устанавливаются пружины (ребра жесткости,),
Акустика музыкальных инструментов. Акустика речи и пения 303 а — традиционное веерное расположение для классиче- ской гитары, б — для гитары Bouche (Франция), в — для гитары Ramirez (Испания), г — перекрестное расположение для фолк-гитары а б в Рис. 4.3.19. Расположение ребер жесткости на нижней деке для разных типов гитар: которые представляют собой бруски из резонансной ели. Приме- ры расположения пружин на верхней деке для разных типов гитар показаны на рис. 4.3.19. Струны (струнная одежда) гитары (количеством 6, 7 или 12), могут быть синтетическими или металлическими: классические гитары имеют обычно струны синтетические (нейлон), басовые струны иногда делают с навивкой медной мишурой. Гитары flattop, archtop имеют стальные струны, при этом басовые струны делают с навивкой бронзовой или латунной мишурой (часто на них игра- ют плектром). Настройка струн зависит от выбранного строя и числа струн гитары. Например, в современной классической концертной шести- струнной гитаре с длиной рабочей части струны 650 мм настройка следующая: Е4 — 329,6 Гц, ВЗ — 246,92 Гц, G3 — 195,96 Гц, D3 — 146,8 Гц, А2 — 110 Гц, Е2 — 82,4 Гц. Натяжение для металлических струн 100-170 Н, у синтетических — 50-80 H [11]. Как уже было показано в главе 1, частота колебаний основно- го тона струны связана с длиной струны и натяжением следующей формулой: Следовательно, для изменения частоты настройки струны в про- цессе игры можно использовать только изменение длины струны L, поскольку производить изменение натяжения T или массы стру- ны т в гитаре невозможно. При игре на гитаре струна прижимается к грифу пальцем, тем самым меняется длина струны и соответ- ственно высота тона. Для облегчения игры вводятся лады, т. е. на грифе размечается точками место прижатия струны для получения требуемой высоты тона. При прижатии струны к m-ладу частота колебания струны оп- ределяется из условия т fm/ =L/ = 2Т\ где JO Ьт
304 Глава 4 L- л. JQ О CL порожек ^-х-> < d подставка ► х Рис. 4.3.20. Расположение ладов: х = d/18, где — положение лада, d — расстояние до подставки т — число ладов (ближний к верхнему порожку лад имеет т = 1), L1n — длина струны от подставки до т-лада, L — рабочая длина свободной струны, f0— частота основного тона свободной струны, fm — требуемая частота колебаний струны, прижатой к w-ладу. Разбивка ладов на грифе выполняется по полутонам темпери- рованной шкалы, поэтому (см. гл. 3) отношение частот должно быть 1,05946 (что примерно соответствует отношению 18/<|7), в связи с этим разбивку делают по правилу «V^». т. е. каждый лад должен быть расположен на 1A|g части длины, оставшейся до подставки (рис. 4.3.20); но так как при этом появляется арифмети- ческая ошибка, то делают некоторое смещение положения лада — вместо 1/-|8 используют V^y 817- Кроме того, за счет дополнитель- ного натяжения струны при прижатии ее к ладу происходит смеще- ние частоты настройки (что особенно заметно в стальных струнах). Для компенсации этого подставка сдвигается вниз на 1-2 мм от- носительно расстояния d, которое использовалось для расчета ладов. Количество используемых ладов зависит от типа гитары: испанская шестиструнная и русская семиструнная гитара имеют девятнадцать ладов, иногда для двух верхних струн их количество увеличивается до 21 и более [11]. Процесс звукообразования. Гитара, как и скрипка, представ- ляет собой сложную колебательную систему. Энергия механиче- ских колебаний щипком передается струнам, вызывая в них коле- бания, которые через подставку передаются на верхнюю деку, а через воздушный объем и пружины передаются на нижнюю деку Звуковое излучение верхних частот происходит в основном от верхней деки, а нижних частот — от нижней деки и воздушного объема через звуковое отверстие. Колебания струн. Механизм возбуждения колебаний струны в гитаре очень похож на процесс возбуждения колебаний в стру- нах скрипки, однако имеются и ряд существенных отличий, связан- ных прежде всего со способом возбуждения — щипком. При таком способе возбуждения струна отводится в сторону и отпускается, т. е. в этот момент времени она имеет максимальное смещение от положения равновесия и нулевую скорость. Под действием силы натяжения струна начинает двигаться вниз, проходит по инерции положение равновесия, останавливается, затем опять возвращает-
Акустика музыкальных инструментов. Акустика речи и пения 305 К \ Рис. 4.3.21. Форма смещения струны при возбуждении щипком 0/ ^Гц Рис. 4.3.22. Спектр струны при возбуждении на V5 длины ся в положение равновесия — и процесс повторяется, т. е. стру- на периодически колеблется аналогично маятнику (см. гл. 2). Для того чтобы поддерживать колебания струны, необходимо регулярно под- водить энергию. Форма смещения струны x(t) струны при возбужде- нии ее щипком имеет вид, показанный на рис. 4.3.21 [11, 12, 54 ] Для того чтобы определить спектральный состав таких колеба- ний, необходимо разложить их в ряд Фурье (см. гл. 2). Амплитуды гармоник зависят от величины и места приложения силы воздей- ствия: если щипок приложен в центре струны р = 1Z2, то коэффи- циенты при всех четных гармониках п = 2, 4, 6..., равны нулю. Если струну оттянуть в точке р = V5 от ее длины (р = z/L, где z — место приложения силы), то спектр будет иметь вид, показанный на рис. 4.3.22, при этом амплитуды гармоник п = 5, 10, 15 равны нулю, а остальные будут находиться в соотношениях A2ZA1 = 0,4, A3ZA1 = 0,18, A4ZA1 = 0,061, A5ZA1 = 0 и т. д. [2]. Таким образом, спектр колебаний гитарной струны (а следова- тельно, тембр ее звучания) существенно зависит от места возбуж- дения (щипка). Как уже было сказано в разделе 4.3.1, если место возбуждения совпадает с местом расположения узла п гармоники, т. е. пр равно целому числу, то эти гармоники отсутствуют в спект- ре, их амплитуды равны нулю. Чтобы подчеркнуть определенные гармоники в спектре, надо возбуждать струну в тех точках, где эти гармоники имеют пучность, т. е. максимум смещения. Кроме того, спектр зависит и от способа возбуждения: если щи- пок производится пальцем, т. е. место контакта со струной имеет конечные размеры, то те гармоники, которые имеют узлы внутри зоны контакта в спектре, не возбуждаются, поэтому чем больше зона контакта при возбуждении, тем меньше высоких гармоник в создаваемом звуке. Поэтому при возбуждении ногтем (или плект- ром, у которого зона контакта меньше) звук более яркий и звонкий. Негармоничность спектра для гитарных струн, как и для струн других инструментов (например, скрипки — см. раздел 4.3.1), является достаточно характерным явлением. Строго гармониче-
306 Глава 4 ский спектр, в котором частота любой и-гармоники связана с основ- ным тоном соотношением^ = nfQ9 существует только для идеаль- ной струны, абсолютно жестко зажатой на концах, упругие свойства которой зависят от натяжения. Причины негармонично-сти такие же, как и у скрипичных струн: собственная жесткость, неравномерность распределения массы вдоль струны, овальность сечения и некото- рое изменение длины струны в процессе колебаний за счет закруг- ления опоры. Другой причиной негармоничности спектра является подвижность опор, на которые опирается струна. Поскольку под действием передаваемой энергии подставка гитары начинает коле- баться, то это также приводит к сдвигу гармоник в спектре струны. При этом основной сдвиг будет у низкочастотных обертонов — тем больше, чем меньше сопротивление опоры и больше жест- кость струны [11]. Особый вид негармоничности может возникать в процессе за- тухания колебаний струн. Время затухания свободных колебаний в струнах (т. е. время переходных процессов) зависит от рассея- ния энергии, которое определяется тремя основными факторами: вязкостью воздуха, внутренним трением в материале струны, пе- редачей энергии другим системам (подставке, деке, воздушному объему и др.). Для тонких металлических струн время затухания зависит прежде всего от воздушной вязкости и меняется для верх- них обертонов пропорционально Il Jf (для жильных или нейло- новых струн внутреннее трение в материале струны становится определяющим и время затухания изменяется как 1 If т. е. высшие гармоники затухают быстрее и звук становится менее блестящим). Если подставка легкая, и потери на передачу энергии через нее доминируют, то время затухания высших обертонов изменяется еще быстрее — пропорционально XIf2 [2]. Влияние этих процессов на колебания струн и приводит к особому виду негармоничности спектра: если в начальный момент частоты всех гармоник удовле- творяли соотношению^ = nf0, то в процессе затухания колебаний частоты гармоник меняются в зависимости от величины добротно- сти Q (см. гл. 2). Величина этих изменений может быть оценена по формуле f = Hf0^l-II(IQ)2 . Поскольку добротность (или коэф- фициент затухания) зависит от частоты, то гармоники сдвигаются по частоте неравномерно (высшие гармоники больше) в течение переходного процесса, что может оказывать определенное влияние на тембр звучания инструмента. Все вышеуказанные факторы создают общую негармоничность спектра гитары. Как уже было сказано в предыдущем разделе, если эта негармоничность S = (fn - VIf0)Mf0 (для соседних обертонов) лежит в пределах от 0,1% до 0,35%, то она вносит некоторую живость в звук. Если ее значение выше, то начинают ощущаться биения между отдель-
Акустика музыкальных инструментов. Акустика речи и пения 307 ными компонентами спектра и звук становится более шероховатым и не- приятным. Нелинейность колебания струн. При больших смещениях, т. е. на вы- соких уровнях громкости, в струнах могут возникать и нелинейные колеба- ния из-за упругих свойств материала струн (особенно в жильных или ней- лоновых струнах), особенностей ИХ Рис. 4.3.23. Эллипс вращения закрепления и др. Нелинейные эф- плоскости колебаний гитарной фекты проявляются в появлении до- струны полнительных обертонов в спектре излучаемого звука, а также в появлении зависимости собственных частот струн от амплитуды приложенной силы и «поляризации» плоскости их колебаний. По- скольку щипком руки трудно выдержать постоянную плоскость воз- буждения струны, то из-за реакции опор и трения в них возника- ют дополнительные крутящие моменты, которые приводят к тому, что плоскость колебаний струны начинает вращаться по эллипсу. Частота вращения («поляризации») эллипса Q зависит от началь- ных амплитуд вибраций струны a, b в перпендикулярных плоско- стях, от частоты колебаний струны со, а также модуля упругости Е, силы натяжения Т, длины L и площади сечения струны S: Q = A(ESZT) (ab/L2) со, где А — численный коэффициент, близкий к единице. Обычно эта частота составляет 1-5 Гц [2]. Вид струны, плоскость колебаний ко- торой вращается по эллипсу, показан на рис. 4.3.23; при этом вели- чина силы, передаваемой на подставку, также меняется с частотой Q (рис. 4.3.24а), что приводит к изменению переходных характе- подставка fQQQQQ, верхняя дека д£ . -►с -► с -► с Рис. 4.3.24. а — направление силы на подставку при движении струны в разных плоскостях и время переходных процессов; б — вид затухающих колебаний с биениями
308 Глава 4 >:с 0,51 1,01 1,5 А 0,5 1,5 А 1 2 34567 10 1520 1 2 34567 10 1520' б 1 2 34567 10 1520 Рис. 4.3.25. Форма силы воздействия на подставку при возбуждении: а — в центре струны; б — на V5 длины от подставки; в — на V20 длины от подставки ристик и временной структуры излучаемого звука, которые воспри- нимаются на слух как биения (рис. 4.3.246). Скорость вращения эллипса уменьшается, когда амплитуды колебаний затухают. Передача энергии на подставку происходит в процессе возбуж- дения колебаний в струнах. Роль подставки в гитаре аналогична ее функциям в скрипке — это основное звено передачи колебатель- ной энергии от струн к деке. Подставка на гитаре, в отличие от скрипичной, имеет плоскую форму. Структура импульсов силы, действующей на подставку, и их спектральный состав зависят от места возбуждения струны: как видно из рис. 4.3.25, чем бли- же к подставке отщипывается струна, тем больше сила воздей- 150 40 30 60 30 0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 частота Рис. 4.3.26. Форма АЧХ в зависимости от направления приложения силы к подставке
Акустика музыкальных инструментов. Акустика речи и пения 309 ствия, при этом в спектре появляется больше высоких гармоник и, соответственно, ярче становится тембр звучания. Колебания корпуса гитары. Энергия колебаний струн через подставку передается сначала верхней деке, затем нижней деке и воздушному объему, что приводит в свою очередь к возбуждению в них резонансных колебаний. Каждый из этих элементов имеет собственный спектр, состоящий из большого количества оберто- нов. При их взаимодействии образуется сложная система связан- ных колебательных систем, степень связи между которыми зависит от частоты; при этом суммарный излучаемый звук имеет многорезо- нансную форму амплитудно-частотной характеристики. Форма АЧХ на расстоянии 1 м при возбуждении подставки синусоидально изменяющейся силой, приложенной в трех разных направлениях, показана на рис. 4.3.26. Полученные результаты показывают силь- ную зависимость формы АЧХ от направления приложения силы к подставке. Верхняя и нижняя дека представляют собой пластины изогну- той формы с переменной толщиной, форма колебаний которых имеет достаточно сложный характер. На рис. 4.3.27а показаны формы (моды) колебаний верхней деки гитары с закрепленными краями, рассчитанные методом конечных элементов (МКЭ); эта картина подтверждается результатами измерений с помощью ла- зерной интерферометрии (рис. 4.3.276). а б Рис. 4.3.27. Моды колебаний верней деки гитары: а — рассчитанные, б — измеренные
310 Глава 4 102 Гц 193 Гц 204 Гц Рис. 4.3.28. Колебания корпуса гитары Естественно, что спектр и формы (моды) колебаний связанной системы существенно отличаются от резонансных частот и форм колебаний отдельных элементов. В частности, присоединение ниж- ней деки приводит к увеличению гибкости воздушного объема и сдвигу его резонансов в сторону нижних частот. Характер коле- баний на первых трех резонансах корпуса гитары в сборе показан на рис. 4.3.28. На первом резонансе верхняя и нижняя дека дви- жутся в противоположные стороны — это «дыхательный» резонанс (в данном примере он равен 102 Гц); на втором они обе движут- ся в одну сторону, и движение воздуха (показано стрелкой) также направлено в ту же сторону, что и верхняя дека, что приводит к значительному увеличению уровня излучаемого звука (193 Гц); на третьем резонансе (204 Гц) направление движения воздуха также совпадает с верхней декой, и здесь тоже происходит интенсивное излучение звука. На более высоких частотах на АЧХ начинают про- являться резонансы дек и воздушного объема более высоких поряд- ков (рис. 4.3.29). Чем выше настроена нижняя дека (чем больше ее жесткость), тем меньше ее влияние на сдвиг резонансных ча- стот воздушного объема, поэтому нижнюю деку настраивают как можно выше, усиливая ее жесткость добавлением ребер жестко- сти (пружин). Рис. 4.3.29. Спектр гитары (при возбуждении отдельной струны)
Акустика музыкальных инструментов Акустика речи и пения 311 При обмене энергией колеблющейся струны и корпуса могут возникать явления «расщепления» частот, характерные для свя- занных контуров [4, 11]. Следует отметить, что резонансы деки, «поддержанные» резонансом струны, затухают медленнее, чем ос- тальные резонансы. При этом коэффициент связи резонанса стру- ны fn и соответствующего резонанса корпуса fK определяется при- ближенным соотношением Если коэффициент связи достаточно большой (он зависит от натяжения струны и жесткости корпуса; для гитар обычно К > 3), то может произойти расщепление на две частоты fl2 = ±f1Kj/4Qe, при этом возникают «биения» излучаемых обертонов — так назы- ваемый «волчий тон». Для борьбы с этим можно регулировать на- тяжение струн, добротность (т. е. затухание) и частоту резонансов корпуса, например за счет изменения его жесткости путем выбо- ра количества и способов размещения пружин. В настоящее время проводится большой комплекс работ по созданию компьютерных физических моделей процессов звукооб- разования в гитарах, что позволит в недалеком будущем получить более детальную информацию о них [4]. АКУСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ Частотный диапазон составляет 82,4 Гц (Е2)-1046,5 Гц (С6), с учетом обертонов до 9 кГц, форманты в области 100-140 Гц, 200-280 Гц. Основная энергия спектра сосредоточена в диапазо- не 100-1000 Гц [12]. Общий вид трехмерного спектра гитары по- казан на рис. 4.3.30. Динамический диапазон составляет порядка 20 дБ [57] . Переходные процессы: короткое время атаки (10-50 мс) и дли- тельное время спада (до 0,2-1 с). Время переходных процессов зависит от направления приложения силы от струны на подставку (рис. 4.3.24). K = 2Q8(ImIM3) ПК т — масса струны, M3 — приведен- , где ная масса корпуса, QB — доброт- ность корпуса на частоте fk [4]. Рис. 4.3.30. Трехмер- ный спектр гитары t, MC /Гц 20500
312 Глава 4 ,204 Ti Рис. 4.3.31. Характеристика направленности гитары на разных частотах Характеристика направленности гитары показана на рис. 4.3.31. На частотах 100-200 Гц излучение ненаправленное, на частоте 367 Гц (мода колебаний верхней деки 1,0) характеристи- ка имеет дипольный характер, на частоте 436 Гц — квадруполь- ный, на более высоких частотах энергия излучается в передней полуплоскости, по аналогии со скрипкой [2]. Арфа также является щипковым струнным инструментом. В отличие от гитары она не имеет грифа, высота тона определя- ется фиксированной длиной струн. История арфы насчитывает несколько тысяч лет. Первые изображения инструментов такого типа встречаются в Шумере, где использовались лукообразные арфы (корпус в виде сегмента круга). В Египте впервые начали использоваться угловые арфы (корпус в виде треугольника). В восьмом веке вместе с завоева- ниями арабов арфы проникли в Европу, и в таких странах, как Ирландия и Шотландия, стали национальными инструментами. АРФА 1 — колонна 2 — резонатор с декой 3 — боковая планка 4 — плечо 5 — шейка (дуга) 6 — верхушка (капитель) 7 — металлические пластины, ограждающие механику 8 — диски педального механизма 9 — цоколь (постамент) 10 — педальная коробка 11 — педали 12 — ножки Рис. 4.3.32. Общий вид арфы
Акустика музыкальных инструментов. Акустика речи и пения 313 В средние века в Европе появились арфы с современной фор- мой корпуса. Постепенно арфы увеличивались в размерах (ран- ние образцы имели размер не более 1 м) и усложнялись в кон- струкции. В 1819 году С. Эраром (S. Erard) были изобретены двойные педали, и конструкция арфы окончательно приобрела современный вид. В настоящее время арфа распространена по- чти во всех странах Европы, Африки и Америки, она широко ис- пользуется как оркестровый, ансамблевый и сольный инструмент [2, 5, 23, 24, 36, 55, 56]. Конструкция арфы представляет собой жесткую и прочную раму, на двух сторонах которой параллельно третьей натянуты струны разной длины и толщины (рис. 4.3.32). Рама состоит из резонансного корпуса с плоской декой (1); колонны, внутри которой размещены передаточные соединители педального меха- низма (2), размещенного в ее основании; верхней дуги с колка- ми и дисками (3) [55]. Механизм звукообразования включает передачу механиче ской энергии струнам щипком (генератор), возбуждение колеба- ний струн (вибратор) и усиление колебаний за счет передачи энергии от струн к деке и резонансному корпусу (резонатор). В современной арфе с двойными педалями обычно 44-47 струн (у маленьких арф — 30). Струны жильные (сейчас часто нейлоно- вые); на нижних одиннадцати басовых металлических струнах ис- пользуют навивку для большей жесткости [23]. Струны закрепле- ны внизу на деке, в верхней части рамы они вставлены в колки (специальные двойные винты). Струны арфы настроены на диатонический звукоряд в строе Ces-dur. Нижняя струна имеет длину 1503 мм, диаметр керна 1,6 мм, диаметр навивки 0,5 мм. Она натянута с силой 410 Н, ее ча- стота настройки 30,87 Гц (СИ). Верхняя струна длиной 69 мм, диа- метр 0,5 мм, усилие натяжения 37 H и частота настройки 2960 Гц (G^) [23]. Для изменения строя арф на пол- тона и тон используется специальный двойной педальный механизм. Этот механизм при нажатии педалей, по- мещенных в основании рамы арфы, с помощью специальных металличе- ских соединителей, проходящих внут- ри трубчатой вертикальной колонны (третьей стороны рамы арфы), при- водит в действие систему спаренных дисков с укрепленными на них парами стержней («пальцами») (РИС. 4.3.33). При повороте ДИСКОВ Рис. 4.3.33. Система дисков струна укорачивается либо на V18, для укорачивания струн
314 Глава 4 Рис. 4.3.34. Вид педалей либо на 2/-|з, при этом высо- та издаваемых ею звуков по- вышается на полтона или тон. Этот механизм (рис. 4.3.34) устроен так, что при нажатии какой-либо одной из семи пе- далей на одну зарубку в от- верстии поворачиваются дис- ки для всех одноименных струн (например, для всех струн «до», или струн «ре» и т. д.); со- ответственно все эти струны укорачиваются, и звук повышается на полтона во всех октавах. Более глубокое нажатие той же педали, с опусканием ее на две зарубки, приводит в действие вторые, ле- жащие ниже диски, пальцы которых укоротят все соответствующие струны; при этом звук этих струн повысится еще на полтона, а в сумме — на целый тон. Таким образом, при однократном нажатии всех семи педалей все семь ступеней звукоряда во всех октавах повысятся на полто- на; арфа тогда будет звучать в строе C-dur. Нажатие всех семи педалей на вторую зарубку дает строй Cis-dur (т. е. поднимает его еще на полтона). Комбинируя разные глубины нажатия различных педалей, можно получить мажорные и минорные звукоряды, используемые в современной музыке. Нижняя сторона рамы является резонансным корпусом, служа- щим для усиления звука струн; он имеет форму конусообразной бания деке. Для увеличения Рис. 4.3.35. Резонаторный корпус прочности деки на ее нижней по- звукоизлучающие ^^отверстия педали коробки со срезанным сверху сегментом (рис. 4.3.35). Поверх- ность корпуса закрыта декой из резонансной ели с поперечным расположением волокон в виде удлиненного равнобедренного треугольника, ширина и толщина которого увеличиваются по на- правлению к басовым струнам соответственно от 100 до 300- 400 мм и от 2 до 8-10 мм. По средней линии деки с верхней стороны приклеены две продольные деревянные планки, к которым прикреплены нижние концы струн, передающие коле- с излучающими отверстиями ловине внутри корпуса приклее-
Акустика музыкальных инструментов. Акустика речи и пения 315 170 Гц 288 Гц 583 Гц Рис. 4.3.36. Формы колебаний деки на резонансных частотах ны два продольных ребра-пружины симметрично относительно средней линии. Снизу корпус снабжен пятью большими овальными отверстиями (рис. 4.3.35), через которые и про- исходит основное звукоизлучение. Формы резонансных колебаний деки арфы показаны на рис. 4.3.36. Для небольшой шотландской арфы (с декой длиной 930 мм, шири- ной — от 100 до 300 мм), первые резонансы оказались равными 170 Гц, 288 Гц, 583 Гц [2]. Резонансы внутреннего объема ящика согласуются с резонансами деки (например, для той же арфы первый резонанс объема воздуха составляет 190 Гц), что позволя- ет усиливать звук в области совпадений. Верхняя изогнутая сторона рамы современной арфы несет на себе, во-первых, порожки и колки, служащие для натягивания струн при их настройке, а во-вторых, заключенный в особую короб- ку сложный дисковый механизм для изменения высоты звуков. При возбуждении колебаний с помощью щипка струна оттягива- ется в сторону, затем освобождается, после чего начинает совер- шать свободно затухающие колебания. Форма импульса возбужде- ния имеет вид, аналогичный импульсу в гитаре (рис. 4.3.21). Состав обертонов в спектре, а следовательно, и тембр звучания также зависит от способа отщипывания и от места возбуждения. При отщипывании с помощью мягкой части пальца получается бо- лее мягкий, бедный обертонами звук; при помощи ногтя происхо- дит сильная деформация струны, что дает более резкий звук с большим количеством обертонов. Как и у всех струнных инстру- ментов, место приложения силы влияет на состав обертонов в спектре: при возбуждении точно в центре струны превалируют в основном нечетные гармоники. Сдвигая место возбуждения ближе к подставке, можно увеличить количество высших гармоник и сделать звучание более ярким (рис. 4.3.37). Поскольку на арфе С4(256 Гц) Отщипывание точно посередине Il С4(256 Гц) Отщипывание у конца струны Гц 0 1000 2000 3000 4000 5000 Рис. 4.3.37. Спектр звучания струн арфы при разных точках возбуждения
316 Глава 4 нет специальных демпферов, как, например, у рояля, то после ис- полнения каждого аккорда и пассажа исполнитель приглушает струну прикосновением ладони [55]. Из особых акустических эффектов на арфе применяется игра флажолетами. Для этого к струне слегка прикасаются пальцем точно в середине, одновременно отщипывая ее в какой-то точке ближе к одному из концов. Получающийся при этом звук лишает- ся своего основного тона, звучит на октаву выше и приобретает несколько смягченный тембр вследствие ослабления в нем неко- торых гармоник. В целом звук арфы имеет относительно небольшое количество обертонов, что обусловлено применением жильных струн, имеющих большое внутреннее трение. Кроме того, сам способ возбуждения с помощью мякоти пальца также приводит к снижению уровня вы- соких частот. Для звучания струн арфы также характерна некоторая негармоничность, обусловленная указанными ранее причинами. АКУСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ Частотный диапазон составляет 30,86 Гц (СИ )-2960 Гц (G^), т. е. шесть с половиной октав [23], с учетом обертонов до 15 кГц. Трехмерный спектр звуков арфы показан на рис. 4.3.38. Как вид- но из рисунка, количество обертонов в спектре не очень велико. Основная энергия колебаний сосредоточена в диапазоне 100- 1250 Гц. Форманта находится в области 250 Гц [13] . Динамический диапазон звучания арфы не превышает 20 дБ. Звук арфы относительно слабый, т. к. она имеет сравнительно не- большие по сравнению с другими инструментами площадь деки и объем корпуса резонатора; кроме того, применение жильных струн не позволяет использовать сильное натяжение. Переходные процессы аналогичны другим щипковым инстру- ментам. Арфа имеет короткое время атаки (10-30 мс) и сравни- тельно длинное время спада (до 200 мс). Тембр: арфа имеет нежный, но относительно тихий тембр. У нее нет четко выраженных регистров, можно только приблизи- t, мс /Гц 20500 Трехмерный спектр арфы Рис. 4.3.38.
Акустика музыкальных инструментов. Акустика речи и пения 317 тельно разделить по тембру: нижний регистр — немного глухова- тый; средний — полнозвучный и мягкий; высокий — звонкий и светлый; высший — резкий, слабый [36]. В звучании арфы имеет- ся небольшое количество шумовых призвуков, характерных для щипковых инструментов. 4.3.3. Струнные ударные (клавишные) инструменты. Фортепиано Фортепиано — это струнный ударный инструмент с приме- нением сложного клавишно-молоточкового механизма для воз- буждения струн. Таким образом, фортепиано, с одной стороны, принадлежит к группе струнных инструментов (по типу вибратора), с другой стороны, к группе ударных инструментов (по способу ге- нерации колебаний); кроме того, его относят к группе клавишных инструментов наряду с органом. Историю фортепиано можно отсчитывать со времени изобре- тения первых струнных инструментов, которые были известны в Китае за несколько тысяч лет до нашей эры. Во времена Пифа- гора (VI век до н. э.) широко использовался инструмент монохорд, на котором изменение высоты тона струны достигалось с помо- щью подвижной опоры. Позднее появился геликон, снабженный деревянной коробкой и большим количеством струн [30]. Идея объединения струнных инструментов с клавиатурой, по- явившейся впервые на органах во Il веке до нашей эры, была реализована в конце XIV века при создании клавикорда. В нем по струне ударяли металлические рычажки (тангенты), закрепленные в конце клавиши. На каждую струну было несколько клавиш, уда- ряющих ее в разных местах, в зависимости от требуемой высоты тона. У клавикордов уже использовалась независимая дека-доска на дне корпуса, а также металлические струны и демпфирующий механизм. В 1725 году был создан «свободный клавикорд» (орган- ный мастер Д. Фабер), в котором на каждую клавишу приходилось по отдельной струне, что улучшило исполнительские возможности инструмента. Несмотря на широкое распространение инструмента к концу XVII — началу XVIII века, звучание его оставалось тихим и динамический диапазон был небольшой [5-7]. Следующим предшественником фортепиано можно считать кла- весин, первые удачные образцы которого были изготовлены в Ита- лии в начале XVI века после многолетних экспериментов [5]. Стру- ны клавесина имели разную длину и были натянуты над декой, заключенный в деревянный ящик. Возбуждение струн производи- лось щипком при помощи плектров из вороньих перьев, приводи- мых в действие прыгунками, укрепленными на конце клавиши. В нем уже использовалась педаль, что позволяло расширить возможности получения различных тембровых оттенков. Клавесин
318 Глава 4 до сих пор используется в концертной практике и имеет много мо- дификаций и названий (клавичембало, арпсихорд, кильфлюгель и др.). Хотя клавесин звучал громче клавикорда, но звук был мо- нотонным и плохо управляемым по громкости. Идея создания нового клавишного инструмента, в котором по струнам ударяли бы специальные молоточки, принадлежала мас- теру клавесинов Бартоломео Кристофори. Он в 1709 году постро- ил в Италии первый струнный ударный клавишный инструмент, который назвал «piano-forte» (gravicembalo col piano e forte), что подчеркивало возможности получения большого динамического ди- апазона инструмента. В нем использовался деревянный молото- чек, который с помощью специального механизма разгонялся до удара по струне, а затем возвращался обратно. С каждой клавишей был связан демпфер, заглушающий струну после отвода молоточ- ка. До 1720 года Б. Кристофори занимался усовершенствованием этого механизма, а в 1726 году продемонстрировал сдвигание кла- виатуры в сторону с помощью специальных рукояток (прототип левой педали). Изобретение Б. Кристофори начали использовать такие мастера, как Г. Зильберман (G. Silberman), И. Цумпе (J. Zumpe) и А. Штейн (A. Stein), которые внесли ряд усовершенствований в конструкцию и организовали производство таких инструментов в Германии, Ан- глии и других странах. Полтора столетия спустя был сделан ряд изменений в конструкции фортепиано: на молоточках стал вместо кожи использоваться войлок; клавиатура увеличилась от четырех до семи с половиной октав; молоточковый механизм был дополнен двойным репетиционным устройством, которое было предложено французским мастером С. Эраром (S. Erard), и т. д. [2, 30,58]. Стремление повысить громкость привело в XIX веке к применению более тяжелых и сильно натянутых стальных струн, поэтому по- явилась чугунная рама. При этом струны начали натягивать в двух плоскостях: дискантные (высокие) струны под басовыми по пере- крестным направлениям — это ввел в 1830 году американский мастер А. Бабкок (A. Babcock) [30]. В 1855 г. американец Генри Стейнвей (H. Steinway) создал большой концертный рояль, в кото- ром использовалась тяжелая металлическая литая рама и натяже- ние струн достигло 14 т (в современных роялях оно увеличилось до 20 т). Этот рояль служил прототипом для всех последующих моделей, и хотя небольшие изменения продолжают вводиться до сих пор, фундаментальных изменений в конструкции рояля с 1855 года не происходило. За XIX столетие были разработаны различные модификации инструмента: рояли концертные, кабинет- ные и др. и их уменьшенные модификации с вертикальной конструк- цией рамы пианино (они впервые были созданы в середине XIX в. Д. Хокинсом (J. Hawkins, США) и Р. Ворнумом (R. Wornum, Англия)). В настоящее время к наиболее известным фирмам, производящим
Акустика музыкальных инструментов Акустика речи и пения 319 рояли и пианино, относятся Steinway & Sons (США), Bechstein (ФРГ), Baldwin (США), Yamaha (Япония) и др. Ежегодно в мире производит- ся около 1 млн. роялей и пианино. Несмотря на развитие электрон- ных инструментов, имитирующих звуки рояля, интерес к его нату- ральному звучанию не уменьшается. Конструкция фортепиано показана на рис. 4.3.39 на примере концертного рояля. Она включает в себя: клавишный механизм (1) с клавишами (в данной модели их 88); корпус (2) сложной изогну- той формы; резонансную деку (3), лежащую под струнами и рамой и вклеенную краями в корпус инструмента; на ней находятся мас- сивные бруски изогнутой формы — штеги (За), через которые передается энергия колебаний струн; массивную литую чугунную раму (4), укрепленную на футоре в корпусе инструмента и скреп- ленную в передней части с массивной многослойной доской из прочного вязкого дерева (бука или клена), называемой вирбель- банком (5). В передней части металлической рамы находятся порожки или особые винты с просверленными головками (аграфы), служащие для ограничения длины звучащих струн. В задней час- ти рамы вбиты стальные колышки («задние штифты»), за которые закрепляются струны ушками или петлями.
320 Глава 4 Основным источником виб- раций служат струны (6), на- тянутые на массивную раму (рис. 4.3.40). В большом кон- цертном рояле используется 240-250 струн (в малых роя- лях и пианино 220-230) дли- ной от примерно 1,5-2 м в ба- совом регистре до 50 мм в верхнем (дискантном) регис- тре. Каждой клавише соответ- ствует разное количество струн (группа струн, соответствующая одной клавише, называется хор): первые 8-10 клавиш используют по одной обвитой Рис. 4.3.40. Система струн струне, следующие 5-7 клавиш — по две обвитых струны, следую- щие 7-10 клавиш — по три обвитых струны, и еще 60-65 кла- виш — по три необвитых струны (эти соотношения могут отличать- ся у разных типов инструментов). Для получения требуемой громкости струны находятся под очень большим натяжением — до 120 кГ; общая сила натяжения всех струн в концертном рояле свы- ше 20 тонн. Кроме того, в фортепиано используются две или три педали (7), назначение которых будет показано ниже. Процесс звукоизвлечения заключается в следующем: механи- ческая энергия при ударе пальцами исполнителя по клавише (ме- ханизм генерации) преобразуется с помощью сложной системы рычагов (клавишного механизма) в движение молоточка, который ударяет по струнам (вибраторам), передавая им эту энергию, что приводит к возбуждению в них колебаний; при этом сам он отле- тает назад. Когда пианист освобождает клавишу, клавишный меха- низм опускает на струну демпфер; при этом колебания струны до- статочно быстро затухают. Звук непосредственно от струн слаб и перестает восприниматься слухом на расстоянии 3-5 м от инстру- мента, поэтому в фортепиано используется дека (резонатор). Колебания струн через подставки (штеги) передаются деке, в которой также возбуждаются колебания. Поскольку дека имеет относительно большую площадь, излучаемый ею звук обеспечива- ет достаточно высокий уровень акустической энергии (пропорцио- нальный площади излучения). Таким образом, дека усиливает звук и модифицирует его спектр за счет своих множественных резонан- сов. Простейшая схема передачи энергии в фортепиано показана на рис. 4.3.41. Реальный механизм звукоизвлечения чрезвычайно сложен и служит предметом многочисленных исследований [1, 2, 58-68].
Акустика музыкальных инструментов. Акустика речи и пения 321 демпфер струна штег штифты молоточек вирбельбанк^"^^ t, ычагк 1— дека рипки клавиша Рис. 4.3.41. Упрощенная схема механизма звукоизвлечения Специфическая особенность системы извлечения звука в фор- тепиано состоит в следующем: перед тем как ударить по струне, молоточек отрывается от разгоняющего механизма и «свободно летит» по инерции последнюю часть пути. Соударение молоточка со струной происходит без непосредственного участия исполните- ля: он запускает механизм, но не управляет им после нажатия кла- виши (он может управлять силой и скоростью удара только в момент соприкосновения с ней) — поэтому тембр звучания ин- струмента в очень большой степени зависит от физико-механиче- ских параметров молоточков, струн, деки, клавишного механизма и других элементов конструкции. Рассмотрим вклад в общую систему звукоизвлечения основных элементов фортепиано. Клавишный механизм, полная структура которого показана на рис. 4.3.42, представляет собой систему рычагов: при нажатии клавиши (14) от струны отводится демпфер (1, 2) и с помощью системы рычагов (13, 12, 5, 8, 7) приводится в действие молото- чек (3), который последние 2-3 мм летит в свободном движении, т. к. шпиллер (12) ударяется об ограничитель (11), отсоединяется от репетиционного рычага (5) и выходит из зацепления с барабан- чиком (8). Упрощенная модель этой системы показана на рис. 4.3.43. Рис. 4.3.42. Общий вид клавишного механизма
322 Глава 4 F 0,1 .,001 10 Сила, H 100' Рис. 4.3.43. Упрощенная схема работы Рис. 4.3.44. Зависимость скорости молоточка и времени нажатия клавиши от силы удара клавишного механизма Основное назначение клавишного механизма состоит в транс- формации силы, приложенной к клавише F, в скорость молоточка V0 с которой он подлетает к струне. Зависимость скорости подлета молоточка от величины приложенной к клавише силы показана на рис. 4.3.44 [2]. На этом же графике представлено, как при увели- чении силы воздействия на клавишу меняется время T5, которое клавиша проходит до остановки. Пределы его изменения состав- ляют от 12 мс для сильного удара до 140 мс для слабого. В рас- поряжении исполнителя имеется дополнительная возможность менять значение силы во время нажатия клавиши; при этом время, в течение которого клавиша будет находиться в движении до достижения одной и той же скорости молоточка V0 будет раз- личным. Наращивая силу во время давления на клавишу, можно за более короткое время разогнать молоточек до необходимой ско- рости. Опытные исполнители используют этот прием для акценти- рования какой-либо ноты в аккорде [2]. Таким образом, клавишный механизм можно рассматривать как «интерфейс», т. е. связующее устройство между пианистом и стру- ной [58], эффективность использования которого в значительной степени зависит от профессионального уровня исполнителя. При ударе по клавише энергия движения руки музыканта передается клавишному механизму, при этом часть энергии расходуется в эле- ментах этого механизма, поэтому КПД, т. е. отношение полезной энергии, переданной молоточку, к энергии, приложенной к клавише от руки исполнителя, меняется примерно от 4% до 17%. Следует от- метить, что потеря энергии происходит не только в клавишном ме- ханизме. Часть энергии теряется затем на преодоление внутрен- него трения в материале струны и деки, на отток энергии в опорах и т. д., поэтому общий коэффициент полезного действия, т. е. от- ношение излученной акустической энергии к затраченной механи- ческой энергии, не превышает для фортепиано 0,6-0,8%.
Акустика музыкальных инструментов. Акустика речи и пения 323 Эксплуатационные свойства клавишных механизмов фортепиано определяются их статическими и динамическими характеристиками. Статические характеристики определяются силой статиче- ского сопротивления (т. е. усилием, необходимым для полного по- гружения клавиши): чем она больше, тем сложнее дозировать удар при игре на тихих уровнях. Эта сила зависит от трения в шарни- рах, жесткости пружинок, упругости прокладок в клавишном меха- низме и т. д., у лучших инструментов она составляет 0,5-0,6 Н, у средних — 0,75-0,85 Н. Под динамическими характеристиками понимается: во-пер- вых, зависимость скорости движения молоточка в момент, пред- шествующий удару по струне, от силы воздействия на клавишу; во-вторых, максимально возможное число ударов в единицу вре- мени, при котором клавишный механизм одинаково срабатывает. Последнее свойство характеризуется параметром, который назы- вается «репетиция» и определяется как максимально возможное число ударов молоточка по одной и той же струне в секунду. Это свойство определяется скоростью, с которой элементы клавишно- го механизма возвращаются в исходное состояние, оно зависит от их массы, гибкости, силы удара по клавише и т. д. В промыш- ленных инструментах «репетиция» составляет от 8 до 15 ударов в секунду. Таким образом, время срабатывания клавишного механизма должно быть очень коротким. Например, в одном из эксперимен- тов [58] было установлено, что при исполнении короткой ноты staccato процесс во времени происходил следующим образом: при общей длительности ноты - 100 мс время контакта молоточка со струной составляло -1-2 мс; этому предшествовал подъем демп- фера со струны за 15 мс до контакта и освобождение молоточка для свободного полета за 1 мс до касания со струной. После пре- кращения контакта, во время которого и происходила передача ме- ханической энергии от молоточка к струне, молоточек возвращал- ся в исходное состояние. Примерно через 80 мс после контакта демпфер опускался на струну, после чего колебания струны пре- кращались и механизм был готов к повторению. Интересно отметить [58], что между моментом касания молоточ- ка со струной tmc и моментом tk% когда клавиша останавливается, существует неоднозначная связь, которая зависит от общего дина- мического уровня: при исполнении на уровне mezzo forte (т. е. средней громкости) tmc = tk, т. е. молоточек ударяет струну (начи- нается звучание тона) примерно в тот же момент, когда клавиша доходит до дна и останавливается. При исполнении на очень гром- ких уровнях (ff) клавиша останавливается раньше, чем молоточек ударяет по струне; при тихих уровнях (рр) клавиша отстает от вре- мени удара молоточка. Для контроля этих соотношений должна
324 Глава 4 происходить предварительная регулировка клавишного механизма; обычно изначально устанавливается расстояние между молоточ- ком и струной примерно 45-47 мм [2]. Следует отметить, что поскольку основные элементы клавишно- го механизма сделаны из древесины и войлока, то его свойства существенно зависят от изменения влажности и температуры. Кроме того, при работе клавишного механизма создается неко- торый шум; он влияет на тембр инструмента и придает ему осо- бый колорит (что играет определенную роль при идентификации инструмента). Молоточек является одной из основных действующих частей клавишного механизма. Форма, структура и физические особенно- сти головки молоточка оказывают большое влияние на громкость и тембр получаемого звука. В современных фортепиано применяются молоточки, деревянная головка которых (керн) обтянута прессованным войлоком высокой степени жесткости (так называемый «молоточковый фильц» — рис. 4.3.45). Акустические свойства молоточка определяются формой его ударной части, массой и жесткостью молоточковой головки: — под ударной частью условно понимается область по пери- метру от центра шириной 10-15 мм в басовом и 3-5 мм в дискан- товом регистре инструмента. По мере повышения звука радиус полукруглой части головки (а, следовательно, и ширина ударной части) прогрессивно уменьшается. Из двух возможных конструк- ций, представленных на рис. 4.3.45, вторая геометрическая фор- ма позволяет получить меньший радиус ударной части при сохра- нении массы молоточка, а чем меньше радиус ударной части (т. е. чем меньше площадь соприкосновения молоточка со струной), тем острее получается удар по струне и тем более ярким становится звук [59, 63]; — масса головки молоточков в роялях меняется примерно от 10 г в басовом до 3,8 г в дискантовом регистре. С точки зрения по- вышения КПД клавишного механизма (следовательно, и увели- чения передачи энергии от клавиши к струне) массу молоточка (M ) полезно увеличивать по сравнению с массой остального (L (L механизма (M1), поскольку КПД пропорцио- нален отношению этих масс [11]: ШД~Мм/(Мм + M1) Рис. 4.3.45. Форма молоточков Однако с ростом массы молоточка рас- тет время соприкосновения его со струной; кроме того, увеличиваются силы, действую- щие на рычаги клавишного механизма, что требует соответствующего увеличения его жесткости, а это в свою очередь влияет
Акустика музыкальных инструментов. Акустика речи и пения 325 на скорость молоточка при подлете к струне. Для повышения эффек- тивности необходимо также увеличивать разницу в скорости между подлетом молоточка к струне (V0) и его отлетом (Vk), т. к. КПД про- порционален отношению квадратов этих скоростей КПД ~ (V02 - V2)/V02 Таким образом, с точки зрения повышения эффективности нуж- но найти компромисс между двумя противоречивыми требования- ми: увеличением массы молоточка по сравнению с массой клавиш- ного механизма и обеспечением его максимальной скорости при подлете к струне. Как показали измерения в концертных роялях, при сильных ударах (/) скорость молоточка V0 достигает 5 м/с (18 км/час). Для обеспечения такой скорости и используются моло- точки с указанной выше массой; — жесткость — важнейший параметр, влияющий на акусти- ческие характеристики; малая жесткость молоточка делает звук фортепиано глухим, слабым и бедным высокими обертонами; завышение жесткости делает звук слишком резким, металличе- ским. Пример изменения спектра для тона С4 с молоточками раз- ных жесткостей показан на рис. 4.3.46. Жесткость молоточка зави- сит от толщины и плотности войлока, его модуля упругости, коэффициента сжатия, однородности структуры и др., а также формы ударной части. Толщина и объемная плотность войлока на головках молоточков плавно изменяются от басовой части (16- 30 мм, 0,4-0,5 г/см3) к дискантовой (4-10 мм, 0,52-0,7 г/см3). Следует отметить также, что жесткость молоточковой головки не- линейна, т. е. деформация сжатия головки не пропорциональна ве- личине приложенной силы. Это имеет большое значение для обес- печения качества звучания фортепиано (подробнее об этом будет сказано дальше [2, 59, 60]). Процесс соударения молоточка со струной определяется ме- стом удара, скоростью молоточка при подлете к струне, временем соприкосновения, физико-механическими параметрами струны и молоточка и т. д. Р,дЬ Рис. 4.3.46. Спектр звука С4 с молоточками разной жесткости
326 Глава 4 Место удара молоточка по струне выбирается в определенной точке ее длины ближе к передней опоре. Выбор места удара варьи- руется в зависимости от номера хора. По конструктивным сообра- жениям линия удара для всех струн делается прямой, а линии опор струн имеют изогнутую форму ( рис. 4.3.39). Отношение рабо- чей длины струны L к расстоянию d от точки удара молотка до бли- жайшей опоры называется «отношением линии удара»: к = L/d. Выбор расположения места удара определяется требования- ми к спектральному составу излучаемого звука. Как было показа- но выше (см. гл. 2), спектральный состав импульса, распростра- няющегося по струне, будет зависеть от места удара таким образом, что при ударе в том месте, где находится узловая точ- ка данной гармоники, она возбуждаться не будет, т. е. при к = п, где п = 1, 2, 3... в спектре будут отсутствовать соответствующие гармоники с номером п [61]. Обычно для басового регистра выби- рается к ~ 7-9. Для среднего регистра (примерно до 60-го хора) линию удара размещают на расстоянии Vg-V-io длины рабочей части струны от опоры, т. е. к ~ 9-10. В крайних дискантных диа- пазонах место удара выбирается из условия получения струной максимальной энергии колебаний, для чего линия удара приближа- ется как можно ближе к опоре, при этом к ~ 18-24. Еще ближе к опоре сдвигать место удара нельзя, т. к. увеличивается уровень шумового призвука за счет отклика опорных конструкций. Время удара. Молоточек при подлете к струне освобождается от разгоняющего его механизма, и путь 2-3 мм перед контактом со струной проходит «в свободном полете». Хотя, как считалось ранее, в этот период исполнитель уже никак не может влиять на характер взаимодействия молоточка и струны, исследования последних лет показали [58], что характер изменения скорости и ускорения моло- точка при подлете его к струне имеет разный вид в зависимости от способа касания клавиши (молоточек как бы хранит «память» об этом). При жестком ударе отчетливо видны два компонента движе- ния молоточка: медленный с частотой 50 Гц и быстрый с частотой ~ 400 Гц. В то же время при мягком спо- fco6e удара по клавише видна только одна ==5=, медленная составляющая движения. Эти составляющие соответствуют возбуждению / 50 Гц двух разных резонансов молоточка (рис. Х^^**" 4.3.47). Как видно из рисунка, на втором резонансе стержень молоточка изгибается, 390 Гц с- а головка молоточка приобретает дополни- тельные движения вдоль струны. Таким Рис. 4.3.47. Формы образом, некоторое косвенное влияние на колебаний молоточка пр0цесс взаимодействия молоточка со на первом и втором струной у исполнителя сохраняется. резонансах rjj г
Акустика музыкальных инструментов. Акустика речи и пения 327 к= 1/16 . г к= 1/10 ГО/, к =1/8 к = 1/6 3 t, мс Рис. 4.3.48. Изменение формы импульса силы от величины отношения 1/к Изменение формы импульса силы (т. е. зависимости силы от времени), возникающее при воздействии моло- точка на струну, не происходит мгно- венно, а продолжается некоторое вре- мя, в течение которого сила нарастает до максимального значения, а затем постепенно спадает [59]. Форма им- пульса при таком взаимодействии за- висит от упругих параметров молоточ- ка и струны и от места их соударения. Пример зависимости формы импульса силы от места соударения, т. е. вели- чины 1/к, показан на рис. 4.3.48. Как видно из него, форма импульса силы имеет сложный несимметричный характер. Это объясняется такими причинами, как нелинейная жесткость молоточка, влияние отраженных волн на струне и др. Нелинейная жесткость обусловлена тем, что в момент удара по струне войлок верхушки головки молотка сжимается и дефор- мируется, так что фактически по струне ударяет некоторая пло- щадка, длина которой примерно пропорциональна радиусу ударной части головки. Кроме того, деформация происходит и в попереч- ном направлении, причем войлок частично облегает нижнюю часть окружности струны в виде желобка. Двигаясь по инерции вперед, головка молоточка некоторое время остается в тесном соприкос- новении со струной, отклоняя ее из положения равновесия. Связь деформации молоточка х и силы взаимодействия его со струной F имеет нелинейный характер: F = E хр, где F — сила взаимодей- ствия, E — усредненная жесткость молоточка, х — величина сжа- тия войлока, р — показатель нелинейности, который, как следует из многочисленных экспериментов, изменяется в пределах от 2,2 до 3,5 (для новых молоточков от 1,5 до 2,8). В динамическом ре- жиме эта связь носит гистерезисный характер, т. е. величины E и р имеют разные значения при сжатии и освобождении слоя вой- лока. Эта нелинейность влияет на асимметричность импульса силы, что приводит к появле- нию дополнительных спек- тральных составляющих и, со- ответственно, к изменению тембра излучаемого звука. Величина этой нелинейности возрастает с переходом п ЛО ЛП 0 r I- г-1 рис 4 з 49 Зависимость времени к высоким регистрам, что и^а|1' соприкосновения от номера клавиши
328 Глава 4 оказывает дополнительное влияние на характер частотной зависи- мости времени соприкосновения молоточка и струны. Кроме того, увеличение жесткости струн также приводит к уменьшению дли- тельности их контакта с молоточком при ударе. Экспериментальная зависимость времени соприкосновения молоточка от номера хора (клавиши) для современного рояля показана на рис. 4.3.49. Принципиально важным свойством процесса взаимодействия молоточка и струны является зависимость времени их соприкос- новения не только от частоты, но и от силы удара по клави- ше (например, при силе удара 2 H время соприкосновения равно 9,5 мс; при силе 10 H время 4 мс для басовых струн). Внешние слои войлока более мягкие, поэтому при слабом уда- ре (при уровнях рр) длительность соприкосновения со струной больше и молоточек действует как низкочастотный фильтр, подав- ляя высокие обертоны. На громких уровнях {ff) струна соприкаса- ется с более жесткими внутренними слоями молоточка, время со- прикосновения становится короче, в спектре сохраняется больше высоких обертонов и звук воспринимается как более яркий. Увеличение длительности соприкосновения молоточка со стру- ной при изменении силы удара приводит к тому, что яркость зву- чания, в значительной степени определяемая его спектральным составом, зависит от уровня громкости, на котором исполняется данное музыкальное произведение: при уровне ff звучание будет значительно ярче, чем при исполнении на уровне pp. Поскольку у каждого исполнителя сила удара разная и понимание уровней ff и рр также разное (см. гл. 3), то и тембр одного и того же произ- ведения будет отличаться у разных музыкантов. Кроме того, уровень громкости при исполнении музыкального произведения очень существенно влияет на качество звукозаписи: если звук записывается микрофоном на громких уровнях ff то в спектре сохраняется большое количество обертонов, т. е. полу- чается более насыщенное, яркое звучание (что сохраняется даже при последующих прослушиваниях на более тихих уровнях); если запись была произведена на тихих уровнях рр, то тембр будет беднее, независимо от того, на каких уровнях будет произведено последующее прослушивание. Время нарастания силы взаимодействия молоточка и струны также зависит от силы удара (рис. 4.3.50): при слабом ударе сила взаимодействия нарастает сравнительно медленно, при сильном — процесс нарастания более крутой и короткий, что также приводит к изменению тембра звучания от более мягкого к более жесткому. Взаимодействие молоточка и бегущих волн на струне. По струне в обе стороны от места удара распространяется бегущая волна, которая частично отражается обратно от опоры. При интер- ференции прямых и обратных волн общая форма колебания стру-
Акустика музыкальных инструментов. Акустика речи и пения 329 мс Время (одно деление — 0,2 мс) — слабый удар; 2 — сильный удар Рис. 4.3.50. Зависимость времени нарастания от силы удара ны усложняется [5]. Если молоточек к моменту воз- врата отраженной волны ус- певает отойти от струны, то импульс силы имеет глад- кий спад. Если к моменту возврата отраженной волны от ближайшей опоры моло- точек не успевает отойти от струны, то волна, проходя под ним, вновь вступает во взаимодействие с молоточ- ком и появляется новый пик в импульсе силы (рис. 4.3.48). Особенно сильно это взаимодействие проявляется в среднем регистре (30-60-й хоры). Таким образом, особенности механизмов взаимодействия моло- точка и струны в фортепиано приводят к тому, что время их сопри- косновения и форма импульса силы, воздействующей на струну, существенно зависят от массы и нелинейной жесткости молоточ- ка, жесткости струны, места соприкосновения и силы удара по кла- више. Следовательно, временная структура и спектральный состав излучаемого звука от инструмента в целом также зависят от этих параметров. Зависимость структуры спектра звуков фортепиано от силы удара для низких, средних и высоких нот С2, С4, С6 показа- на на рис. 4.3.51. Интонировка — специальная операция, которой подвергаются молоточки в готовом инструменте с целью выравнивания резких тембровых переходов между сосед- ними звуками и регистрами (за счет переходов от обвитых к необвитым струнам, от двухструнных к трех- струнным хорам, за счет не- однородностей мензуры струн и др.). Это достигается регулировкой жесткости ударной части молоточка: на тех молоточках, которые дают слишком резкие и громкие звуки, производится накалывание войлока специальными интонировочными иглами, что уменьшает его жест- кость; при недостаточной яркости звука, наоборот, производится увеличение жесткости за счет под- прессовывания войлока на ударной части с помощью специальных 5 10 15 20 Число обертонов 25 Рис. 4.3.51. Зависимость спектра от силы удара
330 Глава 4 металлических утюжков или сошлифовывания рыхлого поверхно- стного слоя войлока. Полученные результаты проверяются на слух по качеству (тембру) и ровности силы звука. Интонировка — очень сложная и ответственная операция, которая в значитель- ной степени определяет окончательное качество звучания ин- струмента [59, 62]. Процесс старения (износа): с течением времени верхушки го- ловок молотков от бесчисленных ударов по струнам подвергаются поверхностному уплотнению, износу и деформации (на них оста- ются желобки от струн). Вследствие этого охват нижней части струн постепенно увеличивается, что влечет за собой увеличение времени соприкосновения молоточка со струной и большее демп- фирование высших гармоник (тембр становится более глухим и тусклым). Кроме того, поверхностное уплотнение войлока увели- чивает слышимость стука в момент удара. Все эти факторы со временем сильно изменяют и ухудшают тембр фортепиано. По мере увеличения высоты звука, т. е. при переходе в дискан- товый регистр, возрастает количество и мощность шумовых при- звуков, создаваемых при движении клавишного механизма и мо- лоточка, при взаимодействии струн с опорами и др. Все эти призвуки и шумы формируют ощущение «живого» (не синтезиро- ванного) звучания фортепиано [63]. Струны являются первичным источником звуковых колебаний в фортепиано (вибратором): от их акустических, физико-механиче- ских и игровых параметров зависит в значительной степени каче- ство инструмента. Комплект струн фортепиано называется «струнной одеждой». Общий вид массивной чугунной рамы с натянутыми на нее стру- нами показан на рис. 4.3.40. Как уже было сказано выше, количе- ство струн в концертных роялях изменяется в пределах 235-250, они собраны в хоры, число которых равно примерно 85-90. Соот- ношение числа хоров с одной, двумя или тремя струнами меняет- ся у разных типов инструментов (концертных, кабинетных роялей, больших и малых пианино и др.). Как уже было показано в главе 2, собственная частота идеаль- ной струны с жестко зажатыми концами определяется по формуле: I у L — длина струны, T — натяжение, т — масса f0 = 1/2 J- , где (т = dr, где d — диаметр струны, г — погон- т ная плотность материала струны). Таким образом, чтобы получить заданную частоту настройки струны (частоту ее основного тона), можно менять натяжение, длину, диаметр и плотность материла струны. Для устойчивости строя фортепиано в отношении колебаний температуры необходима приблизительно равномерная сила натя- жения всех его струн. Обычно струны натягивают с силой 70-75 H
Акустика музыкальных инструментов. Акустика речи и пения 331 (для басовых — 100-120 Н), что дает общую сумму натяжения, которую должна выдерживать рама, равную 20-24 тоннам. Натя- жение струн выросло за последнее столетие почти в четыре раза, что привело к увеличению силы звука и изменению тембра звучания, а также потребовало изменения конструкции и материала струн. При сохранении натяжения примерно постоянным по величине изменять частоту можно только меняя длину, плотность и диаметр струн. Если бы струны имели одинаковую плотность материала и диаметр, а изменения происходили бы за счет длины, то при длине струны для самой высокой ноты - 52-60 мм, длина для са- мой низкой должна была бы быть ~ 6200-7600 мм (поскольку диа- пазон изменения высоты звука в рояле составляет семь с полови- ной октав). Изготовление инструментов таких размеров (почти 8 м длиной) и их использование практически невозможно (хотя отдель- ные экземпляры таких концертных роялей были изготовлены). По- этому конструирование струнной одежды пошло по пути постепен- ного увеличения диаметра и массы струн с одновременным уменьшением приращения их длин. С понижением частоты увеличение длины струны с учетом одновременного изменения ее диаметра (при сохранении равного натяжения) определяется следующим образом [11]: где к — мензура струны (отношение диаметра к длине), N — но- мер хора (если первым считать хор с наименьшей длиной рабочей части струн L1). Кроме того, для повышения плотности (общей массы) часть струн басового диапазона делают обвитыми. В каче- стве материала для гладких струн и кернов обвитых струн в совре- менных инструментах применяется стальная струнная проволока, для навивок обвитых струн — медная проволока. Все это в целом позволяет значительно уменьшить разницу в длинах струн: напри- мер, для одной из конструкций рояля длина рабочей части нижней струны равна 1356,5 мм (АО, частота 27,5 Гц), верхней струны — 52 мм (С8, частота 4186 Гц). В соответствии с теоремой Фурье импульсы смещения, которые возникают в струне при ударе по ней молоточком, можно предста- вить как сумму гармонических собственных колебаний струны, частоты которых относятся друг к другу как целые числа 1 : 2 : 3 : 4... При этом высота звука определяется частотой основного тона, а соотношения амплитуд и фаз гармоник и изменение их во вре- мени (нарастание и спад) влияют на тембр слышимого звука (см. гл. 2). Амплитуды различных гармоник в спектре колебаний струн будут зависеть от места удара молоточка по струне, времени и силы его воздействия (т. е. формы импульса силы воздействую- щей на струну — рис. 4.3.48), от характера взаимодействия струн
332 Глава 4 О г 1111» со штегами и декой, от жесткости закрепле- ния струн в опорах и др. (рис. 4.3.52). Как уже было сказано выше, поскольку форма импульса силы меняется нелинейно при изменении силы удара молоточка по стру- не, то и форма колебаний струны (а следова- тельно, и ее спектральный состав) изменяет- ся нелинейно: при большей силе удара импульс, распространяющийся по струне, имеет более острую форму огибающей, что соответствует большему числу высокочас- тотных гармоник в спектре и, соответствен- но, более яркому тембру. Наконец, реальные струны обладают не- идеальными свойствами из-за неоднородной плотности, овальности, конечной собствен- ной жесткости, нежесткого закрепления на концах, за счет передачи энергии подвижным опорам и т. д. Это приводит к тому, что соот- ношение частот для гармоник будет отли- чаться от целочисленных значений, т. е. спектр будет обладать негармоничностью. Как уже было отмечено выше, под негармо- ничностью понимается отклонение реальной частоты п — обертона f'n от значения часто- ты п — гармоники nf0. Для фортепиано эти отклонения за счет вли- яния конечной жесткости приближенно могут быть определены по следующей формуле [59,62]: п2В fVnfo= 1+Xrs~v где В — коэфициент негармоничности, который для гладкой стальной струны может быть опре- делен как: В = 3,3 х 109d2/L%2 Например, струна для ноты А4 с основной частотой f0 = 440 Гц, длиной L = 415,4 мм и диаметром d = 0,95 мм имеет коэффици- ент негармоничности В = 0,51. Из этого соотношения следует, что негармоничность пропорци- ональна квадрату диаметра струны (т. е. у толстых струн она боль- ше); кроме того, она обратно пропорциональна длине струны в четвертой степени, т. е. у коротких дискантовых струн негармо- ничность возрастает по мере увеличения высоты тона. На негар- моничность оказывают влияние и другие перечисленные выше па- раметры струн, но их вклад оказывается меньшим по сравнению с жесткостью. Эта негармоничность сказывается при настройке частота Рис. 4.3.52. Импульс, распространяющийся по струне, и его спектральный состав
Акустика музыкальных инструментов. Акустика речи и пения 333 инструментов и приводит к некоторым отклонениям настройки основных тонов звуков фортепиано от точных значений частот равномерно темперированного строя. Усредненные кривые таких отклонений показаны на рис. 4.3.53. Таким образом, анализ процессов колебания струн фортепиано с учетом их реальной жесткости, подвижности опор, демпфирова- ния и т. д. представляет собой сложную проблему, которая эффек- тивно решается с помощью численных компьютерных методов [60, 63, 64, 65]. Дека фортепиано представляет собой деревянную резонансную пластину сложной изогнутой формы с приклеенными к ней с ниж- ней стороны рипками (ребрами жесткости из древесины хвойных пород) и двумя изогнутыми штегами (деревянными брусками из твердолиственных пород древесины) на верхней стороне (рис. 4.3.39). Эта пластина (щит) склеивается из отдельных досок резо- нансной древесины, располагаемых в диагональном направлении. Рипки приклеивают к щиту по возможности перпендикулярно к на- правлению досок. Вся дека приклеивается по контуру к жесткой опорной раме (футору). Главное назначение деки состоит в том,чтобы обеспечить опти- мальные условия передачи энергии колебания струн окружающей воздушной среде, т. к. дека является резонатором. Струна из-за своей малой площади создает звук малой интенсивности, но ког- да колебания струн через штеги передаются деке, воздух по всей большой площади деки вовлекается в колебания и создается звук достаточно большой мощности. Поскольку в деке при этом возбуж- даются резонансные колебания со своим сложным спектром, то они совместно с колебаниями струны определяют спектральный
334 Глава 4 состав излучаемого звука и формируют процесс его атаки и затуха- ния, т. е. оказывают существенное влияние на тембр звучания фортепиано. Дека, как всякая распределенная колебательная система, имеет набор собственных частот, которые зависят от ее геометрических размеров и формы, а также плотности и жесткости материала, из которого она изготовлена. При этом амплитуда и ширина резонанс- ных пиков, образующихся при возбуждении деки на этих частотах, определяется прежде всего ее добротностью, которая зависит как от внутреннего трения в материале, так и от потерь энергии в опо- рах и др. Расчет колебательных процессов в такой конструкции представляет значительные сложности и выполняется компьютер- ными численными методами, хотя различные приближенные ме- тоды оценок также достаточно широко используются при проекти- ровании [2, 11, 61, 63-66]. Как уже было сказано выше, амплитуда колебаний и время переходных процессов для струны с жестко закрепленными краями определяются физико-механическими свой- ствами материала струны (силой натяжения, длиной, массой, ко- эффициентом внутреннего трения) и количеством энергии, полу- ченной при ударе молоточка. Если часть энергии передается через опоры (штеги) деке и расходуется на возбуждение в ней колеба- ний, то процесс затухания колебаний происходит гораздо быстрее. Поэтому при анализе взаимодействия струн и деки необходимо учитывать, что чем меньше жесткость деки и чем меньшее сопро- тивление она будет оказывать колебаниям струны, тем больше энергии ей будет передано. Следовательно, излучаемый ею звук будет более громким, но более коротким (т. к. колебания будут быстро затухать). Если жесткость деки будет выбрана слишком большой, то звук будет более тихим, но более длительным. Поэто- му искусство создания дек состоит в выборе их механических со- противлений и оптимальном согласовании последних с механиче- скими сопротивлениями струн, чтобы звук был достаточно громким и достаточно продолжительным. Жесткость деки зависит от свойств ее материала и технологии его использования. Для дек подбирают специальную хвойную дре- весину. Качество материала деки определяется по его излучатель- ной способности, которая приближенно оценивается по величине «акустической постоянной» Акустические качества деки тем лучше, чем выше величина акустической постоянной ее материала.Поэтому для дек исполь- зуются в основном ель (С = 11-14 м4/кг*с) или сосна (С = 8,6-13,5 м4/кг - с), лиственные породы имеют более огра- Е — Р — модуль упругости материала, плотность материала.
Акустика музыкальных инструментов. Акустика речи и пения 335 ничейное применение С [59]. Существенное значение для каче- ства дек имеет однородность каждой дечной дощечки, наклон во- локон дерева внутри дощечки, длительность выдержки древеси- ны при естественной сушке. Выдержанная древесина обладает большей стабильностью физико-механических параметров, мень- шей плотностью, меньшим внутренним трением на низких часто- тах, меньше подвержена воздействию окружающей среды и др., поэтому применяется лучшими фирмами-производителями, на- пример Steinway [2]. Коэффициент полезного действия деки в целом, т. е. отношение излучаемой акустической мощности к мощности, переданной от струны, приблизительно пропорционален величине h = С/Ад, где Ад — логарифмический коэффициент затухания колебаний в деке (см. гл. 2). Чем больше потери энергии в деке (и соответ- ственно, больше Ад), тем менее эффективно дека излучает звук и тем быстрее он затухает. Однако малое значение Ад приводит к недостаточному демпфированию резонансов, большой длитель- ности переходных процессов и искажению тембра. Кроме выбора материала, существенное влияние на акустиче- ские характеристики оказывают размеры, форма и распределение толщин деки. Экспериментальные амплитудно-частотные характеристики из- лучения идеализированной деки (без рипок и штегов) приведены на рис. 4.3.54. Для АЧХ характерен резкий спад к низким частотам
336 Глава 4 ниже 100 Гц и постепенный спад начиная с 1000 Гц к верх- ним. Малая эффективность из- лучения в области низких частот связана с эффектом «короткого замыкания» за счет сложения в противофазе излучения от двух стороны деки. Для увели- чения эффективности излуче- ния в области низких частот деки делают достаточно боль- шими: например, для концерт- Рис. 4.3.55. Формы колебаний деки концертного рояля ного рояля длина деки достигает 2,9 м. Формы колебаний такой деки, измеренные методом лазерной интерферометрии, показаны на рис. 4.3.55. Как видно из рисунков, на низких частотах дека ко- леблется как единое целое, по мере повышения частоты проихо- дит разделение поверхности узловыми линиями, что обуславлива- ет появление пиков и провалов на амплитудно-частотной характеристике и приводит к ее спаду на высоких частотах. Толщина деки в центральной части составляет 8-11 мм, иног- да ее уменьшают к периферической части [59]. Обычно щиту деки придают форму купола, обращенного вершиной к струнам. Выпук- лая форма делает деку прочнее, она становится более устойчивой при динамических воздействиях и статическом давлении струн. Высота купола выбирается небольшой (от 1-5 мм), при этом необ- ходимо, чтобы она сохранялась при длительной эксплуатации. При недостаточно жестком креплении деки к футору много энергии рас- сеивается в опорах, поэтому требуется контроль плотного приле- гания ее краев к опоре. Существенное влияние на форму амплитудно-частотной харак- теристики излучаемого звука оказывает выбор количества, распо- ложения и высоты ребер жесткости (рипок) под нижней частью деки. Ребра жесткости (рипки) используются для того чтобы увели- чить жесткость относительно тонкой (по сравнению с ее размера- ми) деки, а также сделать ее более однородной (т. е. уменьшить разницу в жесткости в продольном и поперечном направлениях). Обычно рипки изготавливаются из тех же пород хвойной древеси- ны, что и дека. Подбирая расстояния между рипками (при этом узкие и высокие рипки оказывают более существенное влияние чем широкие и низкие) и регулируя тем самым резонансные час- тоты участков деки, расположенных между ними, можно увеличить уровень излучения от нее. Передача колебаний от струн к деке происходит через ште- ги (подставки). Штеги — басовый и дискантный — представляют собой два изогнутых ребра жесткости, изготовленные из твердых пород дерева. Ширина штега у вершины составляет 32-45 мм;
Акустика музыкальных инструментов. Акустика речи и пения 337 в нижней части, где штег приклеивается к поверхности деки, его ширина обычно делается меньше (22-24 мм), чтобы не ограничи- вать подвижность деки на высоких частотах. Для обеспечения плотного контакта струны со штегом в него вбивается два метал- лических штифта. Рабочая часть струны длиной L ограничивается винтом-аграфом на передней части чугунной рамы и передним штифтом на штеге (рис. 4.3.56). Остальная часть струны между задним штифтом штега и штифтом на задней части рамы является нерабочей. Для того чтобы колебания струны эффективно переда- вались деке через штег, он должен быть очень плотно к ней прижат, поэтому штег делают с некоторым наклоном, что обеспечивает пе- региб струны и создает силу статического давления со стороны струны на штег P - Ту, где T— натяжение струн, у— вертикаль- ный угол перегиба струны. Эта сила статического давления (в про- изводстве называется «друк») составляет в пересчете на одну струну 18-35 Н, она не дает струне отрываться от штега при пе- ременных колебаниях [59]. Передача энергии от струны к деке будет тем больше, чем больше амплитуда колебаний струны, масса струны и усилие ее натяжения. Если частота колебаний основного тона струны или ее обертонов совпадает с резонансными частотами деки, то на этих частотах происходит максимальная передача энергии от струны к деке, при этом штеги также колеблются с максимальной амплиту- дой. Если частоты колебаний струн не совпадают с резонансами деки, то большая часть энергии отражается и дека возбуждается слабо. Если резонансные частоты струн и деки не совпадают, но близки по частоте, то могут возникать биения (как у скрипки или ги- тары). Характер взаимодействия струн, подставки и деки влияет не только на эффективность возбуждения колебаний в деке, а сле- довательно, и на общий уровень излучаемой акустической мощности, но также и на характер переходных процессов, в зна- чительной степени определяющих тембр звучания фортепиано [2, 58, 62, 64, 66]. Механическое сопротивление деки больше сопротивления струны, поэтому процесс затухания колебаний в ней происходит довольно медленно: время реверберации (т. е. спада на 60 дБ)
338 Глава 4 ДБ составляет на низких частотах 10- 50 с, на высоких — 2-5 с [2]. > с 20 Причем интересно отметить, что процесс затухания звуковых коле- баний имеет две стадии: сначала быстрый спад, затем более мед- ленный (рис. 4.3.57). Это происхо- дит потому, что в начальный мо- мент в струне при ударе молоточка возбуждаются только поперечные Рис. 4.3.57. Две стадии процесса колебания, затем из-за появления спада колебаний для звуков рояля круТЯЩИХ MOMeHTOB В ОПОраХ ПОЯВ- сти, параллельной деке (меняется поляризация), а поскольку со- противление деки в параллельном направлении значительно выше, чем в перпендикулярном, то эти колебания плохо передают- ся и медленно затухают. Существует и другая причина наличия двух стадий переход- ного процесса в фортепиано: как уже было сказано выше, боль- шинство клавиш связаны с двумя или тремя струнами; когда мо- лоточек ударяет, например, по трем струнам, то в начальный момент они все колеблются в фазе и передают энергию через штег с максимальной скоростью, но со временем из-за малых разностей в частотах настройки струн, небольших различий в их жесткости и по другим причинам происходит рассогласование их по фазе и скорость передачи энергии деке уменьшается. Таким образом, регулируя степень настройки в унисон струн хора, мож- но несколько менять время переходных процессов в них и, соот- ветственно, тембр звучания. Чем ближе настроены струны, тем больше время переходных процессов; однако если эта расстрой- ка достаточно велика, то отчетливо прослушиваются биения, по- этому обычно она не превышает 1-2 цента [63]. При использова- нии левой педали (una corda) неударные струны также стартуют не в фазе с ударными и энергия медленнее передается через подставку деке [12, 58, 59]. Такое изменение амплитудных и фа- зовых соотношений в процессе передачи колебаний деке придает фортепианным звукам «живость», что также служит их отличием от синтезированного звука. Педали и демпферы. Демпферы имеют форму деревянных брусочков, оклеенных войлоком, которые лежат на струнах. При нажатии клавиши в момент, предшествующий удару, подушечка демпфера отходит от струны, давая ей возможность колебаться. При возвращении клавиши подушечка прижимается к струне и быстро прекращает колебания. Демпферами обычно снабжены только струны нижних октав фортепиано, звуки верхних октав ляются колебания струн в плоско-
Акустика музыкальных инструментов. Акустика речи и пения 339 из-за малой длины струн, быстро затухают, что не требует допол- нительного демпфирования. Правая педаль приподнимает сразу все демпферы, освобождая струны фортепиано. При этом удар по какой-либо одной струне приводит в колебания соседние струны, резонансы которых совпа- дают с обертонами звучащей струны, что обогащает тембр и де- лает его более певучим. Левая педаль (una corda) сдвигает клавиатурную раму вправо, так что молоточки начинают ударять не по всем струнам хора (вместо трех по двум, вместо двух по одной; на басовые одиноч- ные струны она не действует), происходит уменьшение силы зву- ка и изменение тембра за счет неударяемой струны хора, которая начинает колебаться несколько иначе, чем при обычном ударе. В вертикальных пианино и некоторых роялях левая педаль сдви- гает молоточки ближе к струнам до нажатия клавиши, уменьшая путь их разгона и, соответственно, их ударную силу; звук при этом получается более тихим. В некоторых больших роялях есть третья «задерживающая» пе- даль (sostenuto). Она позволяет задерживать отдельные демпфе- ры (клавиши которых уже были нажаты до ее использования) под- нятыми; в то же время она не оказывает влияния на демпферы других клавиш. В некоторых инструментах центральная педаль — это басовая педаль, которая держит поднятыми демпферы толь- ко на басовых струнах. Умелое использование педалей позволяет создавать разнообразие тембровых и динамических оттенков. Таким образом, общие процессы звукообразования в системе клавишный механизм — молоточек — струна — дека носят чрез- вычайно сложный характер. В настоящее время активно разра- батываются компьютерные физические модели механизмов звуко- образования в фортепиано, что позволяет надеяться на получение новых результатов в исследовании этих процессов [64, 65]. АКУСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ Частотный диапазон основных тонов фортепиано изменяется от самого низкого тона 27,5 Гц (АО) до самого высокого 4186 Гц (С8). В низких регистрах общий диапазон с учетом обертонов до- стигает 3 кГц, в верхних регистрах до 10 кГц и выше. Спектральный состав звука существенно различается в разных диапазонах: если в нижних регистрах (ниже 100-250 Гц) в спект- ре содержится много обертонов (рис. 4.3.58 ), при этом амплиту- да фундаментальной (основной) частоты ниже, чем амплитуды первых обертонов, то при переходе к более высоким регистрам количество слышимых обертонов в спектре звука уменьшается, амплитуда основной частоты начинает доминировать и тембр су- щественно изменяется. Формантные области в спектре нечетко выражены и находятся в области 500-2000 Гц [13, 58-65]. В спектре имеются шумовые
340 Глава 4 0 -25 -50 О -25 -50 О -25 Il I ш G2 Ii дБ компоненты, особенно в области 200- 500 Гц для низких регистров и 2 кГц для высоких [13]. Динамический диапазон фортепи- ано достигает 45-50 дБ [16, 57]. Для отдельно сыгранной ноты динамиче- ский диапазон 35 дБ, самый громкий уровень 85 дБ-С (на 10 м) и тихий 50 дБ-А [17]. Изменение громкости оказывает существенное влияние на изменение спектрального состава звука и изменение тембра [2]. Переходные процессы. В звуках фортепиано преобладают в основном нестационарные процессы (атаки и спада), стационарная часть звука очень короткая (поскольку после уда- ра молоточком струна и дека нахо- дятся в режиме затухающих колеба- ний). Звук состоит из короткой атаки и длительного спада (рис. 4.3.59). В нижних регистрах время атаки достигает 20-30 мс, в верхних — 10- 15 мс. Для атаки характерно появле- ние шума до начала установления основных обертонов. Этот шум связан с работой клавишного ме- ханизма, а также с появлением продольных колебаний басовых струн. Звуковой уровень продольных компонентов может быть в начальный момент только на 10-20 дБ ниже основного звука, -50 0 -25 -50 К G3 I .I G4 1 Il о 5 10 15 20 25 Число обертонов 30 N 35 Рис. 4.3.58. Спектр четырех нот фортепиано Gl, G2, G3, G4 1Od 0 12 3 4 0 1 2 3 J Время, с Рис. 4.3.59. Процесс нарастания и спада звука для различных нот фортепиано
Акустика музыкальных инструментов. Акустика речи и пения 341 t,c Рис. А3.62. Характеристика Рис. 4.3.60. Зависимость времени направленности рояля затухания от частоты но они быстро затухают со скоростью 100 дБ/с [2]. Процесс зату- хания колебаний значительно более длительный и может дости- гать без демпферов 10 с (время, в течение которого уровень зву- ка уменьшается на 60 дБ). Как уже было отмечено выше, демпферы опускаются на струну и прекращают ее звучание при- мерно через 80-100 мс после отлета молоточка. Скорость и харак- тер процесса затухания существенно различается у разных обер- тонов (высокие обертоны затухают быстрее). Зависимость времени затухания струн от частоты для двух концертных роялей показа- на на рис. 4.3.60. Трехмерный спектр представлен на рис. 4.3.61. Характеристика направленности рояля существенно видоиз- меняется с повышением частоты (рис. 4.3.62). На частотах выше 500 Гц начинает сказываться экранирующее влияние крышки роя- ля. При открытой крышке максимальный уровень излучения сосредо- точен в углах между 15° и 35° в вертикальной плоскости, для высо- ких регистров угол излучения уменьшается. Разница в уровнях излучения при открытой и закрытой крышке достигает 5- Ю дБ [13]. Рис. 4.3.61. Трехмерный спектр 20 44 115 255 640 1440 3620 8130 20500 для А2*(116,54 Гц) / Гц
342 Глава 4 Тембр фортепиано обладает огромными возможностями по со- зданию большого тембрального и динамического многообразия звучаний. Он отличается рядом особенностей, обусловленных нестационарным характером звука, сильной зависимостью спект- рального состава от уровня громкости и высоты тона, наличием шумовых компонентов, а также негармоничностью обертонов в спектре. Эти особенности используются в настоящее время для компьютерной идентификации инструмента [1]. 4.4. АКУСТИКА УДАРНЫХ МУЗЫКАЛЬНЫХ ИНСТРУМЕНТОВ Ударные инструменты — особая группа музыкальных инстру- ментов, в которых звук извлекается (генерируется) ударом или близким к нему движением. Ударные инструменты имеют древнейшую историю — вероятно, это старейшие музыкальные инструменты после человеческого го- лоса. В музыкальной культуре Древнего Востока и античного мира было известно уже множество их разновидностей. Достаточно давно ударные инструменты стали составной частью симфониче- ских оркестров. В двадцатом столетии роль ударных инструментов значительно расширилась как в современной симфонической музыке, так и в других жанрах. Вопросам истории развития, кон- струирования и применения этих инструментов посвящено доста- точно много исследований [2, 4-7, 11-13, 16-24, 69-70, 72]. Классификация ударных музыкальных инструментов произво- дится по различным признакам, в частности: по виду применяемых в них вибраторов, по используемым для них материалам, по воз- можности настройки их на определенную высоту тона и т. д. Как и во всех музыкальных инструментах, в них можно выде- лить три основные части: генератор, вибратор и резонатор. Гэнератором является мышечная сила музыканта, передавае- мая к вибрирующему телу инструмента с помощью деревянных или металлических молотков, палочек, колотушек или языков (например, у колоколов) и т. д. Способ возбуждения, общий для этой группы инструментов, — удар, т. е. мгновенное приложение силы к инструменту с последу- ющим предоставлением ему свободы. Такой способ передачи энергии приводит к созданию звуков с особой временной струк- турой: короткий период атаки, практически полное отсутствие ста- ционарной части и длительная затухающая часть колебаний. Вибраторы, используемые в ударных инструментах, представ- ляют собой: струны, мембраны, бруски, стержни, цилиндрические трубки, пластинки, оболочки и т. д. Резонаторы — устройства, которые применяются в некоторых ударных инструментах для усиления звука, имеют форму резонанс-
Акустика музыкальных инструментов. Акустика речи и пения 343 ных трубок (маримба, вибрафон и др.), котлов (литавры), прямо- угольных коробок (челеста) и др. Одна из принятых классификаций ударных музыкальных инстру- ментов по виду вибраторов следующая: мембранофоны (membranophones) — инструменты, в которых в качестве вибраторов используются тела, требующие натяжения (мембраны), — например литавры, барабаны и др; идиофоны (idiophones) — инструменты, в которых вибратора- ми являются упругие тела, не требующие натяжения в отличие от мембран. Инструменты этой группы подразделяются на метал- лофоны (в которых вибраторы изготовлены из металла) и ксило- фоны (материал вибратора — дерево). Форма вибраторов также позволяет классифицировать идиофоны на группы: с вибраторами в форме брусков деревянных (ксилофон, маримба и др.) или ме- таллических (вибрафон, челеста, колокольчики и др.); трубок (трубчатые колокола); пластинок (тарелки, гонги и др.); оболочек (колокола). Кроме того, идиофоны подразделяются на инструменты [11, 23]: — настраиваемые по высоте тона — ксилофон, маримба, челеста и др; — ненастраиваемые по высоте тона — большой барабан, тарелки и др.; хордофоны (chordophones) — инструменты, в которых в каче- стве вибраторов используются натянутые струны. К инструментам этой группы, т. е. струнным ударным, относится фортепиано, рас- смотренное в разделе 4.3. 4.4.1. Мембранофоны. Литавры. Барабаны В оркестрах и ансамблях используется большое количество инструментов, в которых в качестве вибраторов применяются мембраны. Мембрана — это тело, которое не обладает собственной жест- костью, а приобретает ее только при натягивании. Обычно это тонкие пленки из выделанной кожи животных, различных синтети- ческих полимерных материалов и др. Будучи натянутой по пери- метру, такая пленка приобретает жесткость, пропорциональную ее натяжению, — только тогда при ударе по ней молотком, палочка- ми и т.п. возбуждаются колебания и извлекается звук. По конструкции вибрирующих элементов все мембранофоны можно разделить на три группы [4], в которых: — мембрана сопряжена с замкнутой воздушной полостью (на- пример, литавры); — две мембраны соединены через объем воздуха (большие и малые барабаны); — мембрана открыта на воздух с обеих сторон (бубен).
344 Глава 4 Процессы звукообразования в каждой из этих групп инструментов несколько отличаются друг от друга из-за разного вида нагрузки. Колебания круглых мембран достаточно подробно исследованы в литературе, построены точные аналитические решения для рас- чета их собственных частот, распределения амплитуд свободных и вынужденных колебаний при разных условиях возбуждения и т. д. [2, 11, 12, 18, 21, 28, 71]. При ударе по натянутой мембране в ней возбуждаются колеба- ния на ее собственных частотах, которые могут быть приближен- но определены следующим образом [21]: основная фундаменталь- ная частота рассчитывается по формуле f0= (0,766/2а)(Т//?)0'5 где T — натяжение мембраны, а — радиус, р — поверхностная плотность. Например, для мембраны радиусом а = 0,3 м (для литавр), натяжением T = 2000 Н/м, плотностью р = 0,26 кг/м2, фундамен- тальная частота оказывается равной= 112 Гц. Более высокие собственные частоты, которые относятся друг к другу не как целые числа (т. е. это обертоны, но не гармоники — Моды 0,1 Моды 4,1 3,16/ 3,50/ 3,60/ 3,65/ 4,06/ 4,15/ Моды: 0,1 Моды: 0,2 1,59/ Рис. 4.4.1. Формы (моды) колебаний круглой зажатой на краях мембраны (m, п — число узловых диаметров и окружностей): а — вид в плоскости, б —колебания мембраны в трехмерной форме
Акустика музыкальных инструментов. Акустика речи и пения 345 см. гл. 2), определяются из следующих соотношений: 1 : 1,59 : 2,14 : 2,30 : 2,65 : 2,92... При колебаниях на собственных частотах мембрана разделя- ется на нулевые диаметры (т) и окружности (п); формы (моды) колебаний и соответствующие отношения частот мембраны пока- заны на рис. 4.4.1а, б. По мере повышения частоты моды колебаний мембраны час- тично гасят друг друга и излучение звука уменьшается (т. к. отдель- ные элементы мембраны колеблются в противофазе). Полученные соотношения относятся к «идеальной» мембране. В реальных мембранах имеет место сдвиг собственных частот за счет нагрузки со стороны воздуха (с учетом его массы и упру- гости), а также за счет некоторой собственной изгибной и сдвиго- вой жесткости и др. В конструкциях некоторых инструментов пре- дусмотрена возможность изменения силы натяжения мембраны и возможность применения воздушных резонаторов различной кон- струкции, что позволяет изменять соотношения собственных час- тот колебаний мембраны, приближая их к гармоническому ряду, и тем самым получать звуки определенной музыкальной высоты. Примером таких инструментов могут служить литавры. ЛИТАВРЫ (timpani) — один из очень важных инструментов ор- кестра. Это древний инструмент, широко распространенный в Азии, Африке, Греции и др. С Vl века он становится известен в Европе, где получил особое распространение в X веке после крестовых походов. Литавры больших размеров попали в Европу только в XV веке через Турцию и Венгрию. В XVII веке были изобретены винты для натяже- ния мембран, и литавры вошли в состав оркестров; в XIX веке появи- лись механические педали для регулировки натяжения (созданы ма- стером Г. Пфунтом в 1835 г. в Германии). Обычно в современном оркестре используется от трех до пяти литавр разных размеров. Наи- более употребительны большие, средние и малые литавры с диамет- рами соответственно 711,2 мм (28"), 635 мм (25"), 584 мм (23"); име- ются также бас-литавра — 762 мм (30") и даже 810 мм (32"), и высокая литавра — 480 мм (18,9") [23, 70]. Литавры представляют собой полушаро- образные котлы из кованой меди, иногда из стеклопластика и других материалов (рис. 4.4.2). На верхнее широкое отверстие котла натянута мембрана из кожи или синте- тической пленки (типа майлар, ПЭТФ и др.) толщиной 0,12 мм [4, 69, 70]. По ней ударяют палочками с головками различных размеров и жесткости (из дерева, пробки, губки, войло- ка и др.) [23]. На верхушке котла имеется от- _ Рис- 4А'2' с Общий вид литавр верстие для выхода избытка воздуха. F
346 Глава 4 Современные литавры снабжены педальным механизмом для регулирования натяжения мембран, которое может изменяться в пределах по меньшей мере 3 : 1 (что позволяет менять высоту настройки в достаточно широком диапазоне: например, для боль- шой литавры от 82,41 Гц до 130,81 Гц). Кроме того, имеются шесть или восемь специальных винтов вокруг отверстия котла, с помощью которых также можно менять натяжение мембраны. В литаврах при ударе по мембране происходят связанные колебания двух систем: мембраны и объема воздуха в котле. Частоты собственных колебаний идеальной мембраны, как было показано выше, являются негармоническими (рис. 4.4.2), однако жесткость и масса воздуха в замкнутом объеме котла в литаврах оказывают существенное влияние на частоты и формы колебаний мембраны. Собственная изгибная жесткость мембраны также вно- сит некоторые изменения в спектр собственных частот, в основном в области высоких частот. Связанные колебания такой системы можно определить числен- ными методами. Программы для расчета собственных частот и амплитуд вынужденных колебаний разработаны и используются для физического моделирования литавр в современных компью- терных технологиях синтеза [1-4]. Пример расчета собственных частот мембраны для литавр диаметром 650 мм с учетом и без учета влияния котла показан в таблице 4.4.1. Номер Мембрана с учетом Мембрана моды объема котла без котла п, т Частота Отношение Частота Отношение f,r4 fn, Jf 1,] f.r4 fn, Jf 1,1 0,1 127 0,85 82 0,53 1,1 150 1,00 155 1,00 2,1 228 1,51 229 1,48 0,2 252 1,68 241 1,55 3,1 298 1,99 297 1,92 1,2 314 2,09 323 2,08 4,1 366 2,44 366 2,36 2,2 401 2,67 402 2,59 0,3 418 2,79 407 2,63 5,1 434 2,89 431 2,78 Как следует из полученных результатов, несимметричные фор- мы колебаний при учете влияния котла, т. е. формы с узловыми диаметрами 1,1; 2,1; 3,1; 4,1..., образуют почти гармонический ряд fm п tf\ г 1'00; 1'51; 1,99; 2>44; 2'89--- Этот РЯД очень близок к гар- моническим соотношениям частот 1; 1,5; 2; 2,5; 3... и поэтому
Акустика музыкальных инструментов. Акустика речи и пения 347 можно ожидать появления «виртуального» тона с часто- той, равной половине от фун- даментальной (0,5 Z17), однако при прослушивании отчетли- во слышен тон с частотой, равной фундаментальной ча- стоте Z1 j (он соответствует моде колебаний с одним уз- ловым диаметром и одной узловой окружностью). По-ви- димому, обертоны оказыва- ются слишком слабыми, что- бы сформировать ощущение виртуального тона с половин- ной частотой 0,5fj 7 по срав- нению с сильным фундамен- тальным тоном. Этот тон Z1 j и является основным при оп- ределении высоты звучания литавр [2]. Выбор места удара игра- ет существенную роль в фор- мировании воспринимаемого тембра звучания литавр. При ударе на обычном расстоянии V4 диаметра от внешнего края в спектре подчеркиваются несимметрич- ные моды колебаний, в первую очередь обертоны с частотами /;/, f2], f3], настроенные по отношению к основному тону в квинту (3 : 2) и октаву (2:1). На рис. 4.4.3 (1) показан состав такого спек- тра через 0,3 с после удара (а), и через 1 с после удара (б). При ударе точно в центре подчеркиваются симметричные формы коле- баний, т. е. моды (0,1), (0,2) и т. д., которые быстро затухают (рис. 4.4.3 (2), поэтому тембр звучания получается более глухой. Существенную роль играет выбор объема котла. Как показали измерения, уменьшение объема котла при заданном диаметре су- щественно повышает симметричные моды мембраны и несколько сдвигает несимметричные, что приводит к потере гармоничности спектра (этот эффект существенно сказывается при уменьшении 337 Гц 385 Гц 537 Гц 655 Гц 566 Гц 747 Гц 816 Гц Рис. 4.4.4. Формы колебаний объема воздуха в котле литавр 11 21 31 4151 Г0Д 0Т2 0 0,2 0,4 0,6 0,8 1,0 > кГц кГц "ОД OA Щ> р *Г,0 Рис. 4.4.3. Спектр звучания литавр при ударе на расстоянии V4 диаметра от края (1) и при ударе в центре (2): а — через 0,3 с после удара; б — через 1 с после удара
Глава 4 объема больше чем на 25% от оптимального). Поскольку воздух внутри котла обладает собственной упругостью, то в нем также воз- никают сложные формы колебаний на его собственных частотах (рис. 4.4.4) [2]. Выбор объемов котла не только сказывается на гармони- ческой настройке собственных частот мембраны и на скорости за- тухания обертонов, но и имеет значительное влияние на формиро- вание характеристики направленности литавр. АКУСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ Диапазон воспроизводимых частот для литавр зависит от их размеров: для больших литавр (28") диапазон основных тонов 87,3 Гц (F2)-130,8 Гц (СЗ); для средних (25") 116,5 Гц (Вь2)- 173,6 Гц (F3); для малых (23") 146,8 Гц (D3)-220 Гц (A3); для бас- литавр (30") 73,4 Гц (D2)-110 Гц (А2); для высоких литавр (19") 196 Гц (G3)-293,6 Гц (D4), с учетом обертонов до 1,5 кГц [23, 70]. Анализ спектра показывает, что в нем много шумовых ком- понентов, энергия концентрируется в области низких частот (до 220 Гц рис. 4.4.5). Динамический диапазон у литавр один из самых больших сре- ди оркестровых инструментов — 80 дБ. Максимальный уровень звукового давления на расстоянии один метр 122 дБ-С, излучае- мая акустическая мощность достигает 20 Вт. Переходные процессы характеризуются коротким временем атаки (12-16 мс) и длительным временем затухания до 2 с (при снижении уровня на 60 дБ). При этом формы симметричных коле- баний (0,1), (0,2), (0,3)... затухают в среднем за время 0,3-0,5 с, в то же время несимметричные формы колебаний (1,1), (2,1), (3,1) затухают гораздо медленнее (до 1,7- 2,0 с), и именно они в основ- ном формируют тембр звучания литавр. Характеристика направленности литавр зависит от формы колебаний мембраны: на симметричной моде колебаний (0,1) мем- брана излучает как ненаправленный источник (рис. 4.4.6 а), но ко- лебания с этой формой быстро затухают; на основной моде (1,1) диаграмма направленности имеет вид диполя (восьмерки) в экране Рис. 4.4.5. Спектр звука литавр
Акустика музыкальных инструментов. Акустика речи и пения 349 (рис. 4.4.6 б); на следующей моде (2,1) форма диаграммы на- правленности приобретает ха- рактер квадруполя (рис. 4.4.6 в). Тембр звучания литавр зави- сит от материала и величины на- тяжения мембраны, размеров котла, места удара и от типа па- а Рис. 4.4.6. Характеристики направленности литавр б в лочек. Жесткий тип палочки (го- ловки сделаны из дерева или пробки) создает резкий тембр за счет подчеркивания высокочастотной части спектра; мягкий тип (го- ловки из губки, мягкого войлока с фланелью и др.) создает тембр более глухой и мягкий, при этом спектр получается более низко- частотный. Иногда при игре используется демпфирующая ткань, которой накрывается часть поверхности мембраны, создавая до- полнительное демпфирование (ее можно рассматривать как осо- бый тип сурдины) и соответственно более глухой тембр. БАРАБАНЫ (Bass-drum, snare drum и др.) — ненастраиваемые инструменты, дающие глухие звуки неопределенной высоты. Бара- баны имеют древнюю историю (были известны уже в IV тысячеле- тии до н. э.), они постоянно использовались в музыке различных культур Индии, Африки, Азии и др. и в настоящее время чрезвы- чайно широко применяются в симфонических оркестрах, ансамб- лях и т. д. Имеется огромное многообразие барабанов различной конструкции, значительно различающихся по своим акустическим параметрам: индийские, латиноамериканские, индонезийские и др. (томтомы, табла, конга, бонго и т. д.) [2, 5, 12]. Необходимо отметить, что хотя большинство из них относится к ненастраиваемым инструментам, игра на некоторых барабанах дает достаточно отчетливое ощущение высоты тона. Например, барабаны типа табла имеют на верхней мембране вставку из более плотного материала, что позволяет сдвинуть спектр собственных ча- стот мембраны и сделать его близким к гармоническому ряду (звук получается бочкообразный, но с отчетливо выраженной высотой тона) [12]. Барабаны имеют обычно цилиндрический корпус с натянутыми на него верхней и нижней мембранами. Общий вид большого и малого барабанов показан на рис. 4.4.7. Большие концертные барабаны (Bass-drum) имеют диаметр от 610 до 920 мм, высоту корпуса (кадла) 400-500 мм [23]. На больших барабанах играют колотушками с шарообразным или ци- линдрическим наконечником, обтянутым войлоком или резиной. В качестве материала корпуса используются дерево, металл, пластмасса. Для мембран применяются пленки из натуральной кожи или синтетические пленки из майлара толщиной ~ 0,25 мм.
350 Глава 4 Рис. 4.4.7. Общий вид большого и малого барабанов В отличие от литавр барабаны имеют цилиндрический корпус с натянутыми на него верхней и нижней мембранами, т. е. корпус не имеет жесткой задней стенки и поэтому не создаются условия для образования резонансных колебаний внутри корпуса (нижняя мембрана прогибается под действием столба воздуха при ударе по верхней мембране и поэтому не образуется стоячая волна на ре- зонансных частотах). Колебательная механическая система представляет собой две мембраны, соединенные через объем воздуха. Обычно верхняя мембрана настраивается на большее натяжение, чем нижняя. Однако имеются рекомендации для разного соотношения величин натяжений обеих мембран в зависимости от применения бараба- нов (музыка оркестровая, джазовая и т. д.). Изменение этих соотношений сдвигает нижние собственные частоты мембран, изменяет время затухания и оказывает влияет на тембр звучания барабана. Возбуждение происходит обычно при ударе по центру мембра- ны, при этом моды колебаний с числом узловых окружностей и диаметров (0,1), (1,1), (2,1), (3,1)... дают почти гармонический ряд, что могло бы дать ощущение определенной высоты тона в области низких частот, но наличие большого количества негар- монических обертонов в диапазоне 200-1000 Гц с достаточно большими амплитудами, по-видимому, маскирует слабый виртуаль- ный тон, и ощущение высоты звука не возникает [12]. Значения собственных частот для различного натяжения мембран большого барабана с диаметром 820 мм даны в таб- лице 4.4.2: Таблица 4.4.2 Мода колебаний Нижняя мембрана с более низким натяжением, чем верхняя, Гц Обе мембраны с одинаковым натяжением, Гц 0,1 39 44 1,1 80 76 2,1 121 120 3,1 162 160 4,1 204 198 5,1 248 240
Акустика музыкальных инструментов Акустика речи и пения 351 Рис. 4.4.8. Трехмерный спектр большого барабана t, мс 44 /,Гц 20 Интересно отметить, что при колебаниях сдвоенных мембран могут возникать «дуплеты», т. е. формы колебаний с одинаковым числом узловых линий, но с несколько различающимися часто- тами, а это способно вызвать ощущение биений. Этот эффект свидетельствует о нелинейных колебательных процессах в мем- бране; последние проявляются также следующим образом: при сильном ударе прогиб мембраны оказывается настолько большим, что это приводит к существенному увеличению натяжения мембра- ны и повышению первой частоты (0,1) почти на 10%. Однако по- скольку это происходит в области очень низких частот, влияние этого сдвига не ощущается на слух. Таким образом, хотя большие барабаны не имеют определен- ной высоты тона, изменение натяжения мембран, а также измене- ние высоты цилиндрического корпуса влияют на воспринимаемый тембр (плоские корпуса дают более яркий тембр, глубокие — более глухой). Способ возбуждения также оказывает существенное влияние: например, при возбуждении колотушкой с мягкой голов- кой получается более глухое и мягкое звучание. АКУСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ Диапазон воспроизводимых частот составляет 50-2000 Гц, максимальная энергия в диапазоне до 300 Гц, спектр имеет шумо- вой характер. Трехмерный спектр показан на рис. 4.4.8. Динамический диапазон достигает 75-80 дБ, общая акустиче- ская мощность может достигать 20 Вт (это также один из самых громких инструментов оркестра). Переходные процессы: время атаки — 10 мс, время затухания достаточно большое — 0,2-1 с (в зависимости от силы и места удара может продолжаться до 3 с). Рис. 4.4.9. Характери- стики направленности большого барабана 270 135 190
352 Глава 4 Характеристика направленности барабана показана на рис. 4.4.9. Поскольку звук излучается от обеих мембран, то харак- теристика направленности имеет двунаправленный характер. Тембр звучания большого барабана низкий, глухой, длительный. При ударе у края барабана звук получается выше и суше. МАЛЫЕ БАРАБАНЫ (Snare drum) — имеют диаметр 320- 450 мм, высоту 75-270 мм (рис. 4.4.7 б ). Внутри корпуса у них часто натянуты через нижнюю мембрану шнуры — 2-4 струны (жильные, шелковые с вплетенной медной или серебряной кани- телью или металлические спиральки), которые создают специфи- ческий шумовой эффект [70]. Степень взаимодействия мембраны и шнуров зависит от массы и натяжения мембраны. При достаточно большой амплитуде смеще- ния нижней мембраны в определенные периоды колебаний наруша- ется контакт мембраны и шнуров, при обратном движении мем- брана ударяется по ним, создавая характерный трескучий звук. Чем больше сила натяжения шнуров, тем больше должна быть ам- плитуда колебания мембраны, чтобы получился слышимый удар. Расстояние между мембраной и шнурами может регулироваться. Для этих барабанов используются жесткие палочки (из палисан- дрового или эбенового дерева), что способствует появлению высо- ких обертонов в спектре и более «жесткому» тембру звучания. Осо- бый эффект достигается при использовании металлических щеток. Взаимодействие при колебаниях верхней и нижней мембраны осу- ществляется через воздушный объем и через стенки корпуса бараба- на. Формы колебаний двух связанных мембран показаны на рис. 4.4.10. При колебаниях, соответствующих первой моде колебаний мембраны (0,1), обе мембраны движутся в одном и том же направ- лении; на следующей моде (1,1) верхняя и нижняя мембрана движут- ся в противоположных направлениях; затем по мере усложнения форм колебаний совмещенные колебания мембран приобретают бо- лее сложный характер. При наличии узловых диаметров на мембране воздух в корпусе начинает перемещаться также и в продольных на- правлениях вдоль мембраны, и присоединенная масса воздуха при этом снижает несимметричные частоты. Необходимо отметить, что при больших амплитудах смещения мембран в корпусе барабана также возникают сложные формы (0,1) (1,D (2,1) (0,2) 182 330 278 341 403 445 Рис. 4.4.10. Формы колебаний двух связанных мембран малого барабана
Акустика музыкальных инструментов. Акустика речи и пения колебаний (рис. 4.4.11) с узловыми диаметрами (т) и узловыми окружнос- тями (п). Такая сложная форма колебаний корпуса влияет на излучаемый спектр собственных час- тот и, соответственно, тембр звучания барабанов этого типа. Зависимость излучаемого спектра от силы удара при натяжении струн 0,03 H показана на рис. 4.4.12. АКУСТИЧЕСКИЕ ХАРАК- ТЕРИСТИКИ Диапазон воспроизво- димых частот составляет 80-10000 Гц, основная энергия в области 200- 1000 Гц [16]. Трехмерный спектр показан на рис. 4.4.13. Как видно из пред- ставленных результатов, спектр звука у шнуровых барабанов значительно смещается в сторону вы- соких частот по сравнению с большими (басовыми) барабанами Динамический диапазон составляет 60 дБ, макси- мальная выходная мощ- ность 12 Вт. Переходные искажения: время атаки — 7 мс, время затухания 0,2-0,4 с (спад на 30 дБ). (2,0) (3,0) Рис. 4.4.13. Спектр малого барабана (4,10) (5,0) е © т = 2 m = 3 m = 4 т = 5 Рис. 4.4.11. Формы колебаний корпуса малого барабана '0 100 200 300 400 500 /,Гц L, 70, дБ 60 р Д 50 40 30 20 10 0 0 100 200 300 400 500 /,Гц 0 100 200 300 400 500 А Гц Рис. 4.4.12. Зависимость спектра от силы удара t, MC 20 44
354 Глава 4 Характеристика направленности имеет такой же характер, как и у больших барабанов (рис. 4.4.9). Тембр — сухой, трескучий, его можно варьировать за счет из- менения расстояний между шнурами и нижней мембраной и изме- нения силы удара. 4.4.2. Идиофоны. Ксилофоны. Тарелки Идиофоны (idiophones) — инструменты, в которых используют- ся в качестве вибраторов тела, обладающие собственной упруго- стью. Как уже было сказано выше, вибраторы такого типа можно разделить на одномерные (бруски, стержни, трубки и др.), двухмер- ные (пластины различной формы), трехмерные (оболочки). К первой группе относятся музыкальные инструменты с виб- раторами простейшей формы — брусками, стержнями, трубками. Используемые в них вибраторы могут быть изготовлены из дере- ва и различных пластмасс (фиберглас, келон, клиперон и др.), как, например, у ксилофона, маримбы и др., или из металла, как у челесты, вибрафона, оркестровых колокольчиков, треугольников Колебания брусков (стержней, трубок) имеют ряд особенно- стей, отличающих их от колебаний натянутых мембран, что, есте- ственно, приводит к особому тембру звучания использующих их ин- струментов. Брусок (разновидность пластинки) — твердое упругое прямоу- гольное тело, вытянутое в одном направлении (длина существен- но превосходит ширину), стержень — брусок круглой формы, трубка — полый внутри стержень. Колебания прямоугольного бруска могут быть трех видов: попе- речные, продольные, крутильные. Формы и частоты поперечных колебаний бруска зависят от условий закрепления его краев, которые могут соответствовать следующим видам: «свободен-свободен», «зажат-зажат», «оперт- оперт» или их различным сочетаниям. Большинство музыкальных инструментов (ксилофон, маримба и др.) использует бруски со сво- бодными краями. Формы поперечных колебаний брусков с краевы- и др. 0,224 L ми условиями «свободен- свободен» показаны на рис. 4.4.14. Рис. 4.4.14. Формы поперечных колебаний брусков со свободными краями Приближенно частоты поперечных колебаний бруска можно определить следующим образом [12, 18, 21]: фундаментальная частота рассчитывается по формуле
Акустика музыкальных инструментов. Акустика речи и пения 355 /„ = l,028h/L2 (Е/р)0'5, по ней определяются высшие частоты для п = 2, 3, 4...: /я = 0,*/7(л + 1/2)% где /г — толщина бруска, L — длина, E — модуль упругости материа- ла, р — плотность материала. Таким образом, частоты поперечных колебаний бруска зависят от условий его закрепления, жесткости, плотности, толщины и длины бруска. Собственные частоты поперечных колебаний обратно про- порциональны квадрату длины бруска, зависят от его толщины и находятся друг с другом в негармонических соотношениях: fn/f0 равны 1,0; 2,76; 5,40; 8,90 (рис. 4.4.14). Собственные частоты продольных колебаний бруска определяют- ся по формуле: fn = n(v!2L), где v — скорость звука в материале бруска (дерево, металл); последняя определяется жесткостью E и плотностью материала р: v = (Е/р)0'5. Частоты продольных колебаний зависят от жесткости, плотно- сти, длины бруска, но не зависят от его толщины. Частоты про- дольных колебаний бруска много выше частот его поперечных колебаний и находятся друг с другом в гармонических соотноше- ниях « = 1,2, 3,.. Крутильные колебания имеют сложные формы (моды) с негар- моническими частотами. При ударе по такому бруску молоточком или палочками в нем возбуждаются все три вида колебаний: поперечные, продольные и крутильные. Основной вклад в излучение звука вносят попе- речные колебания, однако на возбуждение продольных и кру- тильных колебаний расходуется часть энергии. Кроме того, при сильных ударах начинает сказываться нелинейный характер колебаний бруска, при котором происходит сложное взаимодей- ствие всех трех видов колебаний; при этом продольные и кру- тильные колебания оказывают свое влияние на форму попереч- ных колебаний [2]. Поскольку собственные частоты поперечных колебаний брусков находятся в негармонических соотношениях, то их возбуждение при ударе не может дать ощущения определенной высоты тона. Поэтому чтобы создать тональный звук в музыкальных инструмен- тах, применяют бруски со специально подобранным неравномер- ным профилем (ксилофон, маримба, вибрафон), регулируют мес- то удара по бруску, расположение демпфирующих материалов на нем и др. Процессы звукообразования в ударных инструментах, исполь- зующих колебания брусков, например в ксилофоне, маримбе, вибрафоне и др., имеют много общих особенностей.
356 Глава 4 Рис. 4.4.15. Внешний вид ксилофона КСИЛОФОН (xylophone) — настраиваемый ударный ин- струмент (рис. 4.4.15), имею- щий очень долгую историю. Он широко распространен в Южной Америке, Африке и Азии. В XV веке ксилофон стал известен в Европе, в 1830 году был усовершен- ствован и превратился в по- пулярный концертный ин- струмент. Ксилофон содержит два ряда укорачиваемых по дли- не брусков с размерами Рис. 4.4.16. Форма бруска в виде h = 20 ММ, В = 30-35 ММ, тавливаются из дерева (палисандра, ели и др.), сейчас их часто делают из стекловолокна (келон, клиперон и др). В инструменте используются бруски со свободными краями, уложенные на опо- ры-жгуты или жильные струны, закрепленные на специальной раме. Расположение этих двух струн подбирается таким образом, чтобы они совпадали с узловыми линиями основного тона (рис. 4.4.14). Звуки извлекаются ударами деревянных палочек с неболь- шими деревянными головками. Настройка брусков (в соответствии с хроматическим звукорядом равномерно темперированного строя) производится путем подбора их размеров и формы. Для сдвига частот обертонов и создания гармонического спектра ис- пользуют бруски переменной толщины (типа арки). При глубине арки hf/h = 0,75 (рис. 4.4.16) первый обертон становится пример- но равным третьей гармонике f3 : fx = 3 : 1, т. е. выше основной частоты на дуодециму (октава плюс квинта). В современных ксилофонах (ксиломаримбах) часто использу- ются трубчатые резонаторы. Такие резонаторы имеют нечетный набор гармоник с соотношением частот 1 : 3 : 5... (труба, закры- тая с одного конца, — см. раздел 4.2), поэтому вторая гармони- ка такой трубки и бруска совпадают. Это усиливает вторую час- тоту бруска и делает тембр звучания более резким (особенно при использовании жестких молоточков). Поскольку пластинки ксило- фона изготавливаются в основном из дерева и других материа- лов, имеющих большой коэффициент затухания, то верхние обертоны быстро затухают, и их обычно не подстраивают к гар- моническому ряду. арки для ксилофона L = 200-400 мм. Бруски изго-
Акустика музыкальных инструментов. Акустика речи и пения 357 Рис. 4.4.17. Трехмерный спектр ксилофона t, мс 44 8130 20 .АКУСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ Диапазон воспроизводимых частот — 174 ( F3)-2093 Гц (С7) [23, 70], т. е. 3,5 октавы, за счет обертонов до 6000 Гц. Большой ксилофон (ксиломаримба) имеет диапазон 130,81 Гц (СЗ) до 4186 Гц (С8), т. е. 5 октав [4]. Спектр ксилофона показан на рис. 4.4.17. Количество оберто- нов в спектре ксилофона невелико и высшие обертоны негармо- ничны. В спектре много шумовых компонентов. Динамический диапазон небольшой и составляет 25-30 дБ. Мак- симальный уровень звукового давления 75-85 дБ-С (на 1 м) [11]. Переходные процессы — время атаки 3 мс (при жестком моло- точке) и 2 мс (при мягком), время спада (на 30 дБ) — 0,1-0,6 с. Характеристика направленности имеет на средних и высоких частотах вид восьмерки, т. к. бруски излучают как дипольный ис- точник (вверх и вниз от плоскости расположения брусков). Тембр ксилофона сухой, острый, щелкающий [70]. МАРИМБА (marimba ) — инструмент, пришедший в европей- скую музыкальную культуру из Гватемалы, широко используется в настоящее время в музыке Европы, Африки, Южной Америки и др. С 1910 года производится в больших объемах в США [7]. Сейчас занимает значительное место в оркестрах (рис. 4.4.18 а). Рис. 4.4.18. Маримба: а — общий вид, б — формы колебаний бруска
358 Глава 4 Маримба имеет набор брусков из дерева или стекловолок- на (келон, клиперон и др.) шириной 45-65 мм. Они настроены по равномерно темперированному раду. Их количество подобрано та- ким образом, чтобы воспроизводить диапазон 3-4,5 октавы (некото- рые инструменты воспроизводят диапазон до 5 октав). Бруски имеют свободные края. Они уложены на жильные опоры (струны или шну- ры). Снизу у каждого бруска находятся трубчатые резонаторы [11]. Основные факторы, которые определяют акустические характе- ристики маримбы, следующие: выбор конструкции брусков, подбор размеров и настройка трубок-резонаторов, подбор параметров па- лочек, используемых для извлечения звука, и выбор места удара. Для настройки брусков по гармоническому ряду и получения определенной высоты звука от каждого из них в инструменте используется специальная геометрия брусков: они имеют вид глу- боко аркированных балочек. В отличие от ксилофоновых бруски имеют более высокую выемку снизу {}г0/h = 0,42), что позволяет снизить основной тон и настроить первый обертон к фундамен- тальной частоте как 4 : 1 (при этом первый обертон становится выше фундаментальной частоты на две октавы). Значения соб- ственных частот и формы колебаний такого аркированного бруска показаны на рис. 4.4.18 б. Для тонкой настройки обертонового ряда необходимо точно подобрать место выборки и форму выреза. Обычно выбирается форма, близкая к параболической, хотя точная настройка на соот- ношение частот для второго обертона 4 : 1 требует некоторого отклонения от точно параболической формы [2]. Анализ спектра излучения такого бруска показывает, что третий обертон имеет отношение частот к основному тону как 9,2 : 1, однако поскольку он быстро затухает, то некоторая негармоничность в его настрой- ке не сильно влияет на воспринимаемую высоту тона. Существенное влияние на излучаемый спектр имеет выбор места удара по бруску: если удар производится в точке, где нахо- дится узел данного обертона, то он не возбуждается, — и наобо- рот, при ударе в точке его максимальной амплитуды этот обертон будет подчеркнут. Например, при ударе точно в центре бруска (рис. 4.4.17) второй обертон отсутствует. Чтобы дать бруску максималь- ную свободу для колебаний на основной частоте, шнуры, на кото- рые опираются бруски у маримбы (как и у ксилофона), располага- ют в узлах основного тона. Выбор массы, формы и жесткости палочки также влияет на характер спектра возбуждаемого звука (соответственно и на его тембр). При ударе жесткой палочкой с твердой резиновой головкой сохраняется значительное количество высоких обертонов, исполь- зование мягких палочек (головка из мягкой резины или пластмассы) приводит к возбуждению только первых гармонически настроенных обертонов, создавая мягкий тембр звучания. Время контакта па- лочки с бруском зависит от ее массы и скорости. Оптимальная
Акустика музыкальных инструментов. Акустика речи и пения 359 передача энергии на фундаментальной частоте происходит, когда масса палочки составляет примерно 30% от массы бруска. Тяже- лые палочки остаются в контакте после удара более длительное время, что приводит к демпфированию высоких обертонов. Более легкие находятся в контакте короткое время и, соответственно, меньше демпфируют обертоны, но передают меньше энергии бруску при ударе, и звук получается тише. Таким образом, меняя место удара, места расположения демпфирующих материалов, длительность удара и т. д., можно возбуждать в бруске разные моды колебаний — следовательно, менять состав его спектра и тембр звучания. Цилиндрические резонаторы, т. е. алюминиевые трубки, уста- новленные у нижней стороны брусков маримбы (рис. 4.4.18 а), на- строены на соответствующий фундаментальный тон бруска — fQ. Трубки закрыты у одного конца и открыты у другого, поэтому (см. разд. 4.2) первый резонанс возникает, когда вдоль длины трубки укладывается четверть длины волны — L = А/4, где Л — длина волны, соответствующая фундаментальной частоте бруска —fQ. Собственные частоты колебаний столба воздуха в трубке пред- ставляют собой только нечетные гармоники. Поскольку собствен- ные частоты в вибраторе маримбы настроены примерно как 1 : 4 : 9..., а собственные частоты резонансной трубки имеют от- ношения 1 : 3 : 5..., то резонаторы не усиливают второй обертон (только фундаментальную частоту). Присоединение резонаторов усиливает громкость звука, подчеркивает фундаментальную часто- ту, но при этом уменьшает время переходных процессов: время спада (на 60 дБ) на низких частотах изменяется от 3,2 с до 0,75 с, на высоких от 0,5 с до 0,2 с. Меняя расстояние между открытым концом трубки и вибратором, можно подстраивать резонансную ча- стоту трубки. Уменьшение этого расстояния снижает резонансную частоту (иногда это можно использовать для компенсации повыше- ния частоты из-за повышения температуры окружающего воздуха). Как у всякой трубы с открытым концом, в трубке имеет место кра- евой эффект (раздел 4.2), который как бы увеличивает ее длину и немного снижает резонансную частоту, что необходимо учитывать при точной настройке. АКУСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ Диапазон воспроизводимых частот: для основных частот кон- цертной маримбы составляет от 110 Гц ( А2) до 2093 Гц (С7), т. е. четыре с половиной октавы; за счет обертонов он расширяется до 9000 Гц; для бас-маримбы диапазон начинается с 65,41 Гц (С2) [70]. Пример спектра для звуков маримбы показан на рис. 4.4.19. Динамический диапазон составляет 30-35 дБ. Переходные процессы, время атаки 2-3 мс, время спада (на 30 дБ) составляет 0,75 с для низких регистров и 0,2 с —
360 Глава 4 Рис. 4.4.19. Трехмерный спектр маримбы для высоких. Причем вторые и третьи обертоны быстрее уста- навливаются во время атаки и быстрее затухают, чем основной тон, что создает своеобразие тембра звучания [11]. Характеристика направленности: присоединение трубок-резо- наторов нарушает симметрию излучения брусков, поэтому характер излучения перестает быть дипольным, характеристика направлен- ности изменяется с частотой от сферической к сужающемуся ле- пестку в вертикальной плоскости. Тембр зависит от выбора палочек: твердые палочки дают сухое, резкое звучание, мягкие — своеобразный «зыбкий» тембр [70]. ВИБРАФОН (vibraphone) — очень популярный сейчас инстру- мент, который был сконструирован в США мастером Винтерхофом в 1923 году (рис. 4.4.20). Вибрафон состоит из глубоко аркированных алюминиевых или стальных брусков (отношение первого обертона к фундаменталь- ной частоте 4:1), настроенных по равномерно темперированно- му ряду на диапазон частот 175-1397 Гц. Поскольку у металла время затухания большое, то бруски демпферы электрический В инструменте ИСПОЛЬЗУЮТСЯ мотор демпферы, управляемые пе- далью. Вибрафон имеет трубчатые резонаторы, как и маримба. Однако их особенностью явля- ется возможность создания амплитудно-модулированного звукового колебания. Для этого используются находящиеся на вершине резонаторов круглые диски (лопасти), которые вра- щаются с помощью электромо- тора, то закрывая, то открывая резонаторы, что и создает ам- плитудную модуляцию (частота Рис. 4.4.20. Внешний вид вибрафона
Акустика музыкальных инструментов. Акустика речи и пения 361 модуляции обычно 6 Гц). При игре мягкими палочками вибрафон из- дает мягкий (медовый) тон, за это его часто называют виброарфой. АКУСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ Диапазон воспроизводимых частот: для основных тонов 174,6 Гц (F3)-1396,9 Гц ( F6) ) [70], с учетом обертонов до 9 кГц. Динамический диапазон составляет 30-35 дБ. Переходные процессы: время атаки 2-3 мс, время спада очень большое — 4-5 с (спад на 30 дБ). Регулировать время спада мож- но с помощью демпфера. Характеристика направленности изменяется от сферической к сужающемуся лепестку в вертикальной плоскости (как у маримбы). Тембр — очень своеобразный, плывущий (мерцающий) с дли- тельным отзвуком [70]. ЧЕЛЕСТА (celesta) — самый молодой из клавишных ударных инструментов, был изобретен в 1886 году парижской фирмой «О. Мюстель» [23, 25, 30]. Ее внешний вид напоминает фортепиано (рис. 4.4.22), только вместо струн челеста имеет металлические пла- стинки разной величины (разновидность колокольчиков). Каждая пла- стинка лежит на деревянном прямоугольном ящике-резонаторе, кото- рый усиливает звук за счет своих резонансов. Кроме того, челеста снабжена педалями и демпферами. Для возбуждения звука применя- ются обтянутые войлоком молоточки, для управления которыми ис- пользуется клавишный механизм. АКУСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ Диапазон воспроизводимых частот: основные частоты 261,63 Гц (С4Н186,01 Гц (С8) [23]. Динамический диапазон: очень небольшой (менее 20 дБ), из этого инструмента можно извлекать только тихие звуки. нотная подставка клавиатура (4 или 5 октав) стальные пластинки демпфирующая педаль Рис. 4.4.22. Внешний вид челесты
362 Глава 4 деревянная рама стальные пластинки прокладки из фильца Рис. 4А.21. Внешний вид колокольчиков Переходные процессы: короткое время атаки (2 мс), длитель- ный процесс затухания — 0,1-0,6 с (спад на 30 дБ). Тембр — нежный, чистый, серебристый [70]. КОЛОКОЛЬЧИКИ (Glockenspiel) — настраиваемый инструмент, в котором используются тонкие стальные пластинки (25-32 шт.) равномерной толщины (6-9 мм), шириной 25-32 мм, расположен- ные в два ряда на шнуровых опорах в специальном ящике-резо- наторе (рис. 4.4.21). Пластинки настроены по основному тону. Со- став спектра однородных пластинок (брусков), как показано выше, содержит негармонично настроенные обертоны. Однако обертоны на высоких частотах быстро затухают и мало влияют на тембр звучания, поэтому для их гармонизации никаких специ- альных мер не применяется. Для удара используются две метал- лические палочки с маленькой круглой головкой. АКУСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ Диапазон воспроизводимых частот: основные частоты 783,9 Гц (G5)-4186 Гц (С8) с учетом обертонов до 10 кГц [23, 70]. Динамический диапазон составляет 25-30 дБ, уровень звуково- го давления достигает 80-90 дБ-С/м. Переходные процессы: короткое время атаки (2 мс), длитель- ный процесс затухания — 0,1-0,6 с (спад на 30 дБ). Характеристика направленности имеет вид как у маримбы, т. е. по мере повышения частоты формируется сужающийся лепе- сток в вертикальной плоскости. Тембр — звонкий, серебристый, напоминает звучание малень- ких колокольчиков [23]. ТРУБЧАТЫЕ КОЛОКОЛА (chimes) представляют собой набор полых стальных труб разной длины диаметром 25-50 мм, подве- шенных на раме, которые возбуждаются специальным молот- ком в точке ближе к верхнему концу (рис. 4.4.23). Верхняя часть трубок частично или полностью закрыта медной вставкой с выступающим кольцом, с помощью которого происходит настройка на требуемый основной тон. Формы (моды) колебаний трубок близки к формам колебаний брусков. Спектр колебаний не-
Акустика музыкальных инструментов Акустика речи и пения 363 периодический. Однако если настроить некоторые обертоны трубок (за счет дополнительной массы и за счет вставок) гармонически, то можно услышать тон, которого нет в объектив- ном спектре: слух замечает некоторую периодичность и по ней вычисляет основной тон, по которому определя- ет «виртуальную» высоту тона (strike tone) (гл. 3). Обычно четвертый, пятый и шестой обертоны удается настроить близко к соотно- шению частот 2 : 3 : 4 по отношению к некоторому основному тону, который и воспринимается как «вирту- альная высота» Г2, 121. Если моды (формы) колебаний трубок оказываются близко распо- ложенными по частоте, то могут быть слышны биения. Обычно они возникают при наличии неоднородностей по толщине трубок или от- клонении их диаметра от идеально круглого, поэтому, чтобы избежать биений, необходимо тщательно подгонять толщину стенок. Для уменьшения длительности переходных процессов использу- ется педаль, приводящая в действие общий для всех труб демпфер. АКУСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ Диапазон воспроизводимых частот: 261,3 Гц (С4)-698,46 Гц (F5), с учетом обертонов до 10 кГц [23]. Динамический диапазон — 30 дБ. Переходные процессы: время атаки 2 мс, время затухания 0,3- 0,7с [11] . Тембр — светлый, торжественный, «плывущий» [70]. ТРЕУГОЛЬНИК (triangle) — стальной стержень, согнутый в форме равностороннего треугольника с одним открытым углом (рис. 4.4.24 ). Он подвешивается с помощью жильной струны *за один закрытый угол. По нему ударяют специальной металлической (или деревянной) палочкой. Длина одной стороны треугольника 150-250 мм. При ударе стальной палочкой возбуждается много собственных частот и они не гармоничны, поэтому звучание не имеет определенной высоты тона (это ненастраиваемый инстру- мент). Амплитуды первых мод колебаний малы и не оказывают
364 Глава 4 Рис. 4.4.24. Внешний вид треугольника Рис. 4.4.25. Трехмерный спектр треугольников сильного влияния на тембр звучания, который в основном опреде- ляется высокочастотными модами (с частотами до 10 кГц). Тембр зависит от точки удара и жесткости палочки. Вибрации могут быть как в плоскости треугольника, так и перпендикулярно к ней. Недав- но [2] австралийский композитор М. Хендерсон (М. Henderson) создал новый вид инструментов, получивший название алемба. В этих инструментах треугольники соединены с резонаторами, что позволяет усилить нижние моды вибраций и создать необычный тембр звучания. АКУСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ Диапазон воспроизводимых частот: основных частот — 800- 16000 Гц. Спектр показан на рис. 4.4.25. Динамический диапазон — 30 дБ. Переходные процессы: короткое время атаки (3 мс), длитель- ный процесс затухания — 5-10 с (спад на 30 дБ); иногда звук за- глушается рукой исполнителя [11]. Тембр — металлический, звонкий, яркий, с длительным отзву- ком [70]. Вторая группа идиофонов включает музыкальные инструмен- ты с двухмерными вибраторами в виде круглых пластин разной конфигурации. Группа ударных инструментов, использующая в ка- честве вибрирующих элементов плоские или почти плоские круг- лые пластины, достаточно разнообразна: тарелки, гонги, кротали, там-тамы и др. Колебания пластин отличаются от колебаний мембран тем, что значение резонансных частот определяется не натяжением, а их собственной упругостью (жесткостью). Собственные частоты круглой пластины определяются по фор- муле: п (ph) со =fi2 m,n J ) т,п
Акустика музыкальных инструментов Акустика речи и пения 365 где с — плотность материала, h — толщина, rQ — радиус, D — изгибная жесткость (D = Eh3ZfH(I-O2)], где E — модуль Юнга, ст— коэффициент Пуассона, Ътп — собственные числа пластины, значения которых даны в таблицах) [11]. Для больших чисел т, п они приближенно определяются по формуле: bmn~ п (т + 0,5п), где т — число узловых окружностей, п — чис- ло узловых диаметров. Формы колебаний пластин похожи на формы колебаний мем- браны. При вибрациях также возникают узловые радиусы и окруж- ности, но расположение их зависит не от натяжения, а от распре- деления толщины (формы профиля), жесткости, плотности материала и размеров пластин. Спектр колебаний пластин не- гармоничный: например, собственные частоты с модами (1,1), (2,1), (3,1)...относятся друг к другу как: 2,78; 5,55; 9,24... ТАРЕЛКИ (cymbals) — древнейшие музыкальные инструменты, известные во многих музыкальных культурах (особо высокий уро- вень их изготовления был достигнут в Турции и Китае). В Европе они стали популярны в конце XVII века, сейчас применяются в сим- фонических, военных оркестрах и джаз-ансамблях (рис. 4.4.26). Оркестровые тарелки представляют собой две круглые бронзовые пластины диаметром 250-600 мм и толщиной 1,5-2,5 мм. Обычно в оркестре используются две пары 380/405 мм и 460 мм в диаметре [23]. Тарелки имеют слегка вогнутый профиль, т. к. их цен- тральную часть делают в виде сферического сегмента (за счет про- ковки). Колебания в них возбуждаются ударом: или друг о друга по кольцевой линии (затем скользящим движением тарелки разводятся друг от друга в стороны, при этом получаются резкие, звенящие зву- ки без определенной высоты, но с преобладанием средних и высо- ких частот); или мягкой палочкой (звук получается более мягким); или металлической метелочкой (возникает звенящий шелест). Расчет и голографический анализ форм колебаний тарелок (рис. 4.4.27) показывает, что они практически совпадают с форма- ми колебаний плоских пластин, но на высоких частотах могут возбуждаться близкие собствен- ные частоты — «дуплеты» — и может происходить наложение Рис 4 4 2в. различных форм колебаний. Оркестровые тарелки
366 Глава 4 2,0 3,0 4,0 5,0 6,0 !Гц 93 Гц 164 Гц 2,1 7,0 + 2,1 7,0+3,1 244 Гц 331 Гц 8,0+ 4,1 8,0+ 4,1 414 Гц 426 Гц 430 Гц 9,0+4,1 10,0 + 5,1 4,3 542 Гц 552 Гц 13,0 + 2,2 14,0+ 13,0 664 Гц 789 Гц 1080 Гц 1243 Гц 1414 Гц Ж # * 1^Г' Рис. 4.4.27. Формы колебаний и их голографический анализ для тарелок (диаметром 38 см) ft, с #6,0 ® $ ТОО 200 300 400 500 600 700 '/,Гц Рис. 4.4.28. Звуковой спектр тарелок в разные моменты времени Исследования показали [10], что колебания тарелок при ударах большой силы носят нелинейный характер. Это проявляется в раз- личных эффектах: образовании «бегущей волны», т. е. смещении узловых линий в процессе звучания, что создает особый эффект «плавания» звука; появлении вибраций хаотического характера; образовании особого вида переходных процессов с выраженными би- ениями.
Акустика музыкальных инструментов. Акустика речи и пения 367 Как показано на рис. 4.4.28, в момент удара в тарелках возбуж- дается очень широкий спектр шумового типа (до 20 кГц), затем че- рез 2 с низкие частоты начинают затухать и за счет нелинейных процессов происходит конверсия энергии в высокочастотную часть спектра, причем в течение 1-4 с после удара начинает формиро- ваться пик энергии в районе 300^00 Гц, что придает звучанию ха- рактерный тембр. Через 10 с в спектре остаются в основном низ- кочастотные составляющие. Максимальная интенсивность звука получается при ударе на половине радиуса тарелки. АКУСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ Диапазон воспроизводимых частот: 80-16000 Гц, один из са- мых широких среди оркестровых инструментов. Динамический диапазон достигает 66 дБ. Максимальный уро- вень звукового давления 116 дБ-С/м (средний — 90-95 дБ-С/м). Излучаемая акустическая мощность 9,5 Вт. Переходные процессы: время атаки — 3 мс. Время затухания (на 30 дБ) от 7 до 5 с в диапазоне до 1 кГц и 4 с в диапазоне до 16 кГц. Тембр — блестящий, звучный, звенящий, существенно зависит от способа возбуждения и манеры игры [70]. ударная поверхность ГОНГ (Gong) является еще одной разновидностью ударных инструментов, использующих круглые пластинки. Гонги широко используются в музыке Индонезии, Китая, Индии, Филиппин и др. В европейскую симфоническую музыку они были введены во вто- рой половине XVIII века [5, 6, 7]. Гонг представляет собой круглую пластинку с загнутыми краями (рис. 4.4.29 а, б). Центр его слегка поднят (иногда имеется цен- тральный купол). Разме- ры гонгов довольно боль- шие — диаметр 0,5-1 м. Гонги изготавливаются обычно из кованой брон- зы, что позволяет получить длительные незатухающие колебания, особенно при ударе вблизи центра. В них так же, как и в та- релках, происходит не- прерывное перемещение узлов и пучностей, что со- здает ощущение биений и вибраций в звуке. Рис. 4.4.29. Общий вид и формы гонга
368 Глава 4 дБа Анализ их спектра позволяет выделить две аксиально симмет- ричные моды (с узловыми окруж- ностями), которые появляются в первый момент после удара. За- 10дБ Д Алл/ Jf ЮО 200 300 400 6(Ю ТвМ ЧвРе3 °'5 С П0СЛв УДЗР3 П0" частотные моды), однако они быстро затухают. В итоге в звуке гон- гов остаются две выраженные симметричные моды с отношением частот 2 : 1 (рис. 4.4.30), это октавное соотношение между глав- ными обертонами позволяет услышать в затухающем звуке гонга отчетливую высоту тона. Соответственно в процессе затухания тембр звука меняется: сначала слышны низкочастотные тоны, за- тем появляются высокочастотные обертоны, тембр становится бо- лее резким; наконец, остаются два октавных обертона и слышен один глухой низкий тон. Следует отметить, что тамтамы (разновидность больших гонгов с более плоской средней частью пластины) не имеют в спектре выраженных октавных обертонов, и поэтому их звучание не позво- ляет выделить отчетливую высоту тона [2]. АКУСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ Диапазон воспроизводимых частот: основная энергия распре- делена в диапазоне от 30 Гц до 180 Гц [2, 69], пример спектра показан на рис. 4.4.31. Динамический диапазон достигает 60 дБ. Переходные процессы: время атаки — 10 мс, время затуха- ния — до 10 с. Тембр — глухой, плывущий [70]. К числу инструментов аналогичного типа, использующих пласти- ны различных форм, относятся также стальные барабаны, кротали и др. Результаты исследования их акустических характеристик даны в работе Н. Флетчера и Г. Россинга [2]. Огибающая спектра гонга Рис. 4.4.30. является много высокочастотных мод (при этом за счет не- линейных процессов происходит перекачка энергии в эти высоко- t, MC 44 /Гц Рис. 4.3.31. Трехмерный спектр гонга 20
Акустика музыкальных инструментов. Акустика речи и пения 369 4.4.3. Идиофоны. Колокола Третья группа ударных музыкальных инструментов (идиофо- нов), использующая в качестве вибраторов трехмерные упругие тела — оболочки вращения, включает в себя большую и разнооб- разную семью колоколов. КОЛОКОЛ — один из самых древних музыкальных инструмен- тов мира. Слово колокол, вероятно, происходит из древнеиндий- ского «kalakalas» — шум, крики (греч. «калео», лат. «kalare» — со- зывать). Колокола используются в религиозных обрядах, в качестве музыкальных инструментов, сигнальных устройств и др. Хотя точную дату происхождения колоколов установить, по-видимому, невозможно, известно, что наиболее ранние литые колокола, открытые археологами в Китае, датируются - 2500 годом до н. э. Искусство литья достаточно больших по размерам и совершенных по форме колоколов достигло своего расцвета в Китае в период XI-III в. до н. э. Большинство из них имело овальную или минда- левидную форму. Образцы таких колоколов имеются во многих со- временных музеях мира. Их акустические характеристики достаточ- но детально исследованы, полученные результаты представлены в многочисленных докладах, статьях и книгах [2, 4, 73]. За 1000 лет до н. э. колокола появились на Ближнем Востоке в Палестине. В Греции и Риме они достаточно широко использовались в религи- озных обрядах и праздниках. Появление их в Европе связано с рас- пространением христианства. Считается, что первое применение колоколов в христианских храмах произошло при епископе Павли- не в 394 году в городе Нола в Кампании (провинции Италии). В конце V — начале VII века использование колоколов в христи- анских церквах зафиксировано в Италии, Галлии и Британии. В Германии они появились в VIII веке. Первые колокола были не- большими, четырехугольными в плане, они изготавливались из жести или листового железа на заклепках; только в конце VIII века их научились отливать из меди. Поскольку лучшие колокола отли- вались из кампанской меди, наука о колоколах получила название кампанология [74]. В XVII столетии в Нидерландах братьями Франсуа и Питером Хемони (Нетопу) и Якобом ван Эйком (Jacob van Eyck) была освоена техника отлива колоколов, позволяющая настраивать их гармонически. К этому времени уже была известна идея объеди- нения колоколов в единый набор и присоединения веревок, соединяющих их языки с клавиатурой [2, 4, 73]. В XVII-XVIII веках был сделан еще ряд механических приспособлений — в частности, введены ножные педали для игры на больших колоколах. В XIX веке появилась работа К. Симпсона (Canon Simpson), пока- завшая, что настройка первых пяти обертонов должна производит- ся по простым музыкальным интервалам (соотношения частот
370 Глава 4 Рис. 4.4.32. Расположение колоколов на карильоне в церкви г. Дельфта (Голландия) первых обертонов должны быть следующими: 0,5; 1; 1,2; 1,5; 2...). С этого времени практика точной настройки колоколов была широ- ко освоена изготовителями, что позволило наладить производство карильонов. Карильон (по определению Всемирной ассоциации карильоне- ров) — это «инструмент, состоящий из двадцати трех или более колоколов, настроенных по хроматическому ряду на диапазон от двух октав и более, на котором исполнение музыки выполняется с помощью клавиатуры» [73]. Обычно колокола закреплены непод- вижно, в них ударяют укрепленные внутри языки. Они соединены с помощью проволочной трансмиссии с двумя рядами ручной и дву- мя рядами ножной клавиатуры. Самый большой из известных ка- рильонов используется в церкви Riverside Church в Нью-Йорке, он состоит из 74 колоколов (на диапазон шесть октав), вес самого большого колокола 20 т. Пример расположения коло- колов на карильоне показан на рис. 4.4.32. Механизм возбуждения звуковых коле- баний в таких колоколах представлен на рис. 4.4.33. тумблер верхнее крепление Рис. 4.4.33. Механизм возбуждения звука в карильонном колоколе
Акустика музыкальных инструментов. Акустика речи и пения 371 Рис. 4.4.35. Колокола на звоннице Псково-Печерского монастыря Рис. 4.4.34. Вид больших церковных колоколов В русских летописях первое упоминание о колоколах отно- сится к 1066 году (Новгород). На протяжении нескольких столетий формы колоколов постоянно со- вершенствовались, в результате были созданы громадные по раз- мерам и необычайные по красоте звучания колокола, характерные только для России. Колокольный звон стал одним из важнейших элементов русской культуры, являясь обязательной частью церков- ных православных обрядов. Примерами таких больших колоколов могут служить: колокол «Сысой» Ростовского кафедрального собо- ра, отлитый в 1689 году, весом 32,76 т (нижний диаметр 3590 мм, высота 2730 мм); «Царь-Колокол», отлитый в Москве в 1743 году, весом 197,24 т, и др. Вид больших церковных русских колоколов по- казан на рис. 4.4.34. Развитие искусства игры на колоколах в Западной Европе и в России шло различными путями. В то время как в Европе развивался мелодический стиль игры, основанный на настройке колоколов по равномерно темперированному строю, в России за длительный период, начиная с Xl века, был создан особый стиль колокольного звона, в котором основная роль принадлежа- ла тембру и ритму. Русские колокола отличаются от европейских по размерам и форме, по способу возбуждения колебаний, спосо- бу настройки, принципам подбора ансамбля колоколов на одной звоннице (специальное помещение на церковной колокольне) и стилю игры на них. Пример расположения колоколов на звонни- це Псково-Печерского монастыря показан на рис. 4.4.35 [75]. Изучению вибрационных и акустических характеристик колоколов разных стран, а также анализу различных стилей музыкального исполнения на них посвящены многочисленные исследования [2, 4, 12, 73-82]. Полученные результаты позволяют выявить некоторые
372 Глава 4 общие закономерности в системе звукообразования и акустических параметрах колоколов различных типов. Система звукообразования: несмотря на большие различия по форме и размерам среди колоколов разных культур и разного назначения, общим для них является то, что в качестве вибратора используются симметричные оболочки вращения переменной толщины и сложной формы профиля. Примеры таких оболочек для различных типов колоколов показаны на рис. 4.4.36а, б, в. Форма большого церковного русского колокола показана на рис. 4.4.36в. Каждая часть его имеет специальное название — губа, вал, тулово, плечо, корона и др. Колокол имеет утолщенную верхнюю часть, где подвешивается тяжелый язык, который при раскачивании бьет по его нижней части (точка боя показана на рис. 4.4.36в). Существуют и другие способы возбуждения коло- колов, достаточно широко распространенные в Европе, когда язык закрепляется неподвижно, а раскачивается тело колокола. Тембр звучания колокола (а значит, и временная и спектраль- ная структура создаваемых им звуковых сигналов) зависит от вы- бора формы и распределения толщины оболочки, материала и технологии ее изготовления, конструктивных параметров языка, выбора места и силы удара и др., а также от акустических харак- теристик помещения, где колокол установлен (например, звонницы или др.). Основные параметры, определяющие механизм звукообразова- ния в колоколах, следующие. Частоты и формы колебаний вибратора: при ударе тяжелым языком по нижней части колокола в его оболочке возбуждаются ко- лебательные процессы сложной структуры, которые складывают- ся из поперечных, продольных и сдвиговых форм колебаний. По- скольку основной вклад в излучение вносят поперечные (по отношению к срединной поверхности оболочки) формы колебаний, то их изучению было уделено наибольшее внимание специалистов [73, 74, 76-79]. Колебательные процессы в оболочке колокола были исследованы как с помощью экспериментальных методов (путем измерения вибраций его поверхности с помощью вибродат- чиков или лазерной интерферометрии), так и с помощью числен- ных компьютерных расчетов методами конечных или граничных элементов (МКЭ, МГЭ). Пример рассчитанных форм (мод) колеба- ний колокола, выполненный в работе Б. Нюнина и др. [81], пока- зан на рис. 4.4.37. Формы колебаний оболочек, так же как мембран и пластин, ха- рактеризуются определенным количеством узловых диаметров — т и узловых окружностей — п. Первые восемь форм колебаний для настроенных по голландской системе колоколов (обертоны
Акустика музыкальных инструментов Акустика речи и пения 373 щ IQi 9 ! R I о / 7/ 5 Л 4/ Il 3: /1 1 2 3 4 5 6 7 Основные элементы конструкции колокола маточник проушина (петля, серьга) сковорода (дно) нижний край (основание, устье) , Ударный пояс (звуковой пояс, боевая часть звуковое/ударное кольцо) стержень языка (ось) головка языка (груша, ядро, яблоко) \ концевик (шейка) Рис. 4.4.36. Различные формы оболочек (вибраторов) колоколов: а — немецких, б — французских, в — русских а б в г Рис. 4.4.37. Рассчитанные формы колебаний оболочки колокола
374 Глава 4 Hum Prime Minor third Fifth (гудящий) (фундаментальный) (минорная терция)(квинта) О О О О щ-0,5 1,0 1,2 1,5 tone Octave (nominal) Upper third Twelfth Upper octave (октава-номинал) (децима) (дуодецима) (двойная октава) о О О О 2,0 j9s 3,0 4,0 Рис. 4.4.38. Формы (моды) колебаний оболочки колокола, настроенного по голландской системе Strike Симпсона) показаны на рис. 4.4.38 [2, 12]. Первый обертон назы- вается «гудящий» (hum) и имеет форму колебаний с двумя узло- выми диаметрами (га = 2, п = 0) и отношением частоты к часто- те фундаментального тона f/f = 0,5; второй тон имеет форму колебаний с двумя узловыми диаметрами и одной узловой окруж- ностью (га = 2, п = 1), расположенной на 0,3 высоты от нижней кромки колокола, этот тон называется «фундаментальным» (prime) f/fs = 1; следующий обертон имеет форму колебаний с тремя узловыми диаметрами и одной узловой окружностью на 0,54 высоты (га = 3, п = 1), отношение его частоты к частоте фундаментального тона равно f/fs = 1,2, т. е. составляет минорную терцию; следующий тон (га = 3, п = 1) (узловая окружность на 0,19 высоты) имеет отношение частот f/f = 1,5, что составляет квинту\ затем следует форма колебаний с числом узловых диа- метров и окружностей га = 4, п = 1 и отношением частот /^f = 2, т. е. октава, этот обертон называется «номинал» (nominal); следу- ющие тоны имеют соответственно отношение узловых линий (га = 4, п = 1) и частот /^T = 2,5 (децима), затем (га = 5, w = 1) и //^ = 3,0 (дуодецима) и (га = 6, w = 1) и f/fs = 4,0 (двойная октава) и др. В некоторых колоколах гармонически настраиваются только первые пять тонов. Такая структура мод (форм) колебаний на резонансных частотах оболочки колокола определяет ряд особенностей в восприятии тембра его звучания.
Акустика музыкальных инструментов. Акустика речи и пения 375 Возникновение «виртуального тона»: как уже рассмотрено в главе 3, слуховой аппарат определяет высоту звука по частоте фундаментального тона, если в спектре излучения содержатся гармоники, находящиеся в целочисленных соотношениях, т. е. ча- стотные расстояния между гармониками равны частоте фундамен- тального тона. Выполненный выше анализ спектра колебаний обо- лочки колокола показывает, что соотношения частот его обертонов равны: 0,5; 1; 1,2; 1,5; 2; 2,5; 3; 4...., т. е. частотные расстояния между ними не являются постоянными, однако в звучании колоко- ла можно услышать определенную высоту тона — это так называ- емый «виртуальный» тон. Слуховой анализ обнаруживает не- сколько обертонов с постоянным соотношением частот (в данном случае это пятый, седьмой, восьмой обертон с соотношением ча- стот f/fs = 2, 3, 4), и по ним определяется высота тона, которая близка к фундаментальной частоте (на рис. 4.4.38 показана высота виртуального тона на нотном стане). Однако поскольку это имен- но «виртуальный» тон (который создается слуховой системой), то звучит он гораздо более неопределенно, неясно и определить его высоту оказывается достаточно трудно. Эксперименты показали, что наибольший вклад в образование виртуального тона вносят следующие обертоны: пятый — октава («номинал»), седьмой — дуодецима, и восьмой — верхняя октава; другие обертоны, как верхние, так и нижние, включая второй обертон — фундаменталь- ный (prime), вносят меньший вклад в его формирование, хотя по высоте он практически совпадает с фундаментальным тоном (в не- которых церковных колоколах такого строгого совпадения может не быть). Следует отметить, что для четкого прослушивания вир- туального тона необходимо присутствие, кроме «номинала», еще и первого и третьего обертона (hum, tierce), которые как бы на- правляют слух в сторону низких частот. Таким образом, виртуаль- ный тон — это слуховая иллюзия, которая создается в первую оче- редь самым сильным после удара обертоном (номиналом). Интересно заметить, что хотя фундаментальный тон (prime) и виртуальный тон (strike) близки по частоте, из-за разной природы происхождения они практически не создают биений. Оба эти тона можно различить в первый момент после удара языка, когда фун- даментальный тон (prime) звучит громче (на формирование ощуще- ния виртуального тона нужно некоторое время). Поэтому неточная его настройка (выше или ниже чем 1/2 частоты номинала) оказыва- ет существенное влияние на тембр звучания колокола [76, 77]. Поскольку «номинал» играет определяющую роль в слышимой высоте колокола, то именно по этому обертону производят на- стройку колоколов и определяют высоту их звучания. В очень больших колоколах может быть услышан иногда вто- рой виртуальный тон, который на кварту выше первого виртуаль- ного тона и иногда даже громче его. Этот второй тон создается
376 Глава 4 четырьмя обертонами, находящимися выше номинала, с соотно- шением узловых диаметров и окружностей (6,1), (7,1), (8,1), (9,1), которые имеют соотношение частот почти 3:4:5:6. Высота второго виртуального тона равна половине тона, следующего за «номиналом», с отношением частот^ = 2,5 (децима) (рис. 4.4.38). Эффект появления второго виртуального тона объясняет- ся способностью слуха выслушивать виртуальный тон только в определенном диапазоне частот (примерно 200-2000 Гц) [77]. Поэтому в больших колоколах, когда первый виртуальный тон попадает в диапазон ниже 200 Гц, и появляется второй виртуаль- ный тон. Однако определение высоты его звучания (и его йотиро- вание) очень затруднено. В малых колоколах эти четыре оберто- на с соотношением частот 3, 4, 5, 6 лежат слишком высоко по частотному диапазону, и виртуальная высота может определяться по первому, второму и пятому обертонам (hum, prime, nominal), которые настроены в октаву (1, 2, 4); частота его оказывается рав- ной половине частоты фундаментального тона (prime). В 1980-е годы в Голландии был создан новый тип колоколов. В нем профиль был рассчитан с помощью метода конечных эле- ментов (МКЭ) таким образом, что третий обертон был настроен в мажорную терцию (вместо минорной терции, как в традиционных колоколах). Это полностью изменило тембр его звучания, что еще раз подтверждает важность третьего обертона в формировании общего тембра. Необходимо отметить, что такая строгая настройка (рис. 4.4.38) встречается в основном в колоколах для карильонов. Анализ ста- ринных церковных колоколов Западной Европы показывает до- вольно значительные отклонения [76]. Исследования настройки русских церковных колоколов [74, 79], особенно старинных (XVI-XVII веков), которые отличаются своеоб- разием формы и размеров, показали статистически значимые от- клонения от голландской настройки. Распределения частот основ- ных обертонов для русских церковных колоколов и их сравнение с голландской настройкой показаны на рис. 4.4.39. Отчетливо вид- ны отклонения в настройке, в первую очередь первого и второго обертонов (интервал между ними меньше октавы), что отчасти объясняет особенности их звучания. Смещение узловых линий: анализ структуры узловых линий на поверхности оболочки колокола показывает, что в процессе звуча- ния происходит смещение узловых линий, — они перемещаются вдоль поверхности колокола, что приводит к эффекту «плавания» звука, своеобразной амплитудной модуляции. Это явление проис- ходит вследствие нелинейного характера колебательных процес- сов в колоколе при сильных ударах. Изменение высоты тона и тембра в процессе затухания: в момент удара в колоколах возбуждается большое количество
Акустика музыкальных инструментов. Акустика речи и пения 377 Рис. 4.4.39. Гистограммы распределения частот первых пяти обертонов для русских колоколов и их сравнение с голландской настройкой гармоник, определяя металлический звенящий тембр, затем проис- ходит процесс затухания отдельных обертонов с разной скоростью. Некоторые затухают очень быстро; основные обертоны с соотно- шением частот fj : f2 : f3 = 0,5 : 1,0 : 1,2 имеют очень большое время затухания (52 с, 16 с, 16 с), поэтому через некоторое вре- мя именно это минорное трезвучие начинает определять тембр звучания (см. рис. 4.4.40) [2, 12, 74]. Характер спада также существенно отличается у разных обер- тонов: например, низкий тон с отношением частот f0 : /у = 0,5 (hum) начинает процесс затухания на низкой интенсивности, затем (через несколько секунд) его интенсивность увеличивается, после этого начинается медленный спад, причем он имеет самое боль- шое время затухания, т. е. остается в звуке последним. Фундамен- тальный тон 1,0 (prime) стартует на высоком уровне, затем его ин- тенсивность поднимается и снова медленно начинает спадать, минорная терция ведет себя аналогично, номинал начинает с вы- сокой интенсивностью, затем быстро спадает. Примеры различного характера затухания обертонов показаны на рис. 4.4.41. Скорость и характер спада обертонов у разных колоколов сильно отличают- ся (они зависят от их размеров, формы, материала, способа отли- ва, места и способа удара и др.), поэтому у каждого колокола свой особый «голос». Появление «биений» в процессе затухания звука: колокол мо- жет не быть строго симметричным относительно вертикальной оси или иметь другие дефекты формы, возникшие при его отливе. Тог-
378 Глава 4 Ь,дБ а L, дБ О 200 400 600 80010001200 1600 2000 б Рис. 4.4.40. Переходный процесс: а — через 2 с после удара, б — через 10 с после удара (колокол «Полиелейный» Ростовского собора [74]) Рис. 4.4.41. Характер спада различных обертонов
Акустика музыкальных инструментов. Акустика речи и пения 379 Рис. 4.4.42. Биения, возникающие в процессе затухания первых четырех обертонов да при ударе языком по оболоч- ке колокола могут возникать две близко расположенные формы колебаний — расщепленные моды, или «дуплеты». Появле- ние двух близких по частоте обертонов (с разницей частот меньше 15 Гц) приводит к появ- лению отчетливо слышимых би- ений. Поскольку добиться стро- гой симметрии формы, особенно для больших колоколов весом несколько тонн, оказывается прак- тически невозможным, в больших церковных колоколах биения до- статочно сильно выражены (рис. 4.4.42). Изменение высоты тона за счет частотной модуляции из-за эффекта Доплера: при ударе тяжелым языком большие колокола получают значительное ускорение, при этом может возникать изме- нение высоты тона за счет эффекта Доплера (при движении коло- кола к слушателю высота немного поднимается, при удалении уменьшается — см. гл. 2). Анализ движения «раскачивающихся» колоколов (когда язык неподвижен, а раскачивается колокол), вы- полненный в работе [82], показал, что при движении колокола его скорость может достигать 0,67% от скорости звука, что дает до- вольно значительный, замечаемый слухом сдвиг высоты тона. Все вышеуказанные процессы связаны с выбором физико-меха- нических и конструктивных параметров оболочки колокола и языка. Существенное значение для звучания колокола имеет материал, из которого он отливается: основной состав для церковных колоко- лов и для карильонов — сплав 78-80 % меди и 20-22 % олова, «колокольная бронза». Оболочка колокола изготавливается путем отлива. При изготовлении колокола соблюдаются определенные пропорции между его диаметром, толщиной и высотой. Если срав- нить основные частоты (номиналы) колоколов, изготовленных из одного и того же сплава, диаметр, толщина и высота которых меняются в равных пропорциях, то их частоты изменяются об- ратно пропорционально диаметрам: /; = (d2/d])f2. Для точного расчета формы профиля и толщины, обеспечивающих требуе- мое распределение обертонов, разработаны соответствующие компьютерные программы [76, 79]. В случае необходимости произ- водится опытная подгонка распределения толщины колокола вдоль его профиля. Особую роль в тембре звучания колокола играет выбор раз- меров языка, его формы, жесткости, места удара и силы удара, Языки в церковных колоколах обычно делают из литого железа, для карильонов — из стали. Эксперименты с языками разной мас- сы показали, что более тяжелые языки увеличивают амплитуды
380 Глава 4 первых обертонов, но уменьшают амплитуду «номинала», а по- скольку именно он в первую очередь определяет «виртуальный» тон, то тяжелые языки уменьшают его интенсивность (т. е. высо- та тона становиться менее определимой). Более «мягкие» языки подглушают высокие обертоны, тембр становится более глухой, что особенно характерно для старых колоколов. Необходимо отметить также, что при очень сильных ударах по колоколу (как показывает спектральный анализ звукозаписей) четко выявляется наличие вторых и третьих гармоник по отношению к номиналу, что также является результатом нелинейных искаже- ний при больших уровнях. Подбор колоколов в ансамбле производится в зависимости от их применения. Например, колокола, предназначенные для кари- льонов, настраиваются по «номиналам» по равномерно темпери- рованной шкале. При этом, поскольку при одновременных ударах по нескольким колоколам высокие, близко расположенные оберто- ны могут давать биения, стараются избегать одновременного удара по нескольким колоколам, т. к. при наличии временных промежутков между ударами высшие обертоны быстро затухают, а совместно звучат только низшие долгоживущие обертоны. При подборе колоколов для церковных звонов важное значение имеют определенные отношения «номиналов» для всех колоколов на звоннице. Например, для сохранившегося ансамбля колоколов Ростовского собора отношения частот к частоте базового, само- го большого колокола «Сысой» имеют следующие значения: 1,221; 1,486; 1,597; 2,526; 3,103; 3,984... [74, 75]. Кроме того, важное значение имеет точность настройки фундаментального тона относи- тельно номинала, относительная свобода от дуплетов (т. е. биений), интенсивность и частота высших обертонов каждого колокола, со- вместимость общей схемы настройки, особенно по низшему обер- тону (hum). Существенное значение имеет также выбор акустики помещений (звонницы), где устанавливаются колокола. К сожале- нию, письменных свидетельств о принципах подбора колоколов на различных звонницах практически не сохранилось. АКУСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ Диапазон воспроизводимых частот зависит от размеров и на- значения колокола. Для колоколов Ростовского собора нижняя гра- ничная частота для колокола «Сысой» (вес 32,7 т) равна 58 Гц; для колокола «Полиелейный» (16,3 т) — 74 Гц; для колокола «Лебедь» (вес 8,2 т) — 91 Гц и т. д. (частота увеличивается про- порционально уменьшению веса [74]). Основная энергия самого большого колокола сосредоточена в диапазоне 60-600 Гц, для ко- локолов меньших размеров в диапазоне 100-1500 Гц. Уровнеграм- ма и трехмерный спектр звучания колокола «Сысой» показаны на рис. 4.4.43 а, б.
Акустика музыкальных инструментов. Акустика речи и пения 381 Динамический диапазон достигает 90 дБ. Колокол — это один из самых громких музыкальных инструментов: в момент удара уровни звукового давления могут достигать 120 дБ-С/м . Переходные процессы: время атаки 10-40 мс, время спада для низших обертонов составляет 52-16 с (для низшего тона «hum», например, колокола «Сысой» время спада на 60 дБ достигает 165 с), для высших обертонов 8-2 с. Характеристика направленности имеет вид объемного креста (квадруполя) с минимальным уровнем звукового давления в центре. Тембр: в момент удара тембр шумовой с металлическим оттен- ком, через несколько секунд после удара прослушивается печаль- ный, плывущий звук (минорное трезвучие с отчетливо идентифици- руемой высотой тона и амплитудной модуляцией). 4.5. АКУСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ ОРКЕСТРА Оркестр может быть определен как «группа музыкальных инструментов, предназначенных для совместного исполнения музыкальных произведений» [7]. Современный оркестр включает в себя несколько основных секций инструментов: струнные, духо- вые (деревянные и медные) и ударные [7, 10, 24-26, 57, 83, 84]. Слово «оркестр» происходит от древнегреческого названия полу- круглой площадки в театре между сценой и зрителями, на которой размещался хор («орхестра»). Зарождение оркестра современного типа относится к периоду с 1600 по 1750 год, когда в Италии начала активно развиваться светская музыка и стали возникать такие жанры музыкального
382 Глава 4 искусства, как опера, концерт, оратория и др. [7, 10]. Первоначаль- но в оркестрах использовались в основном струнные инструменты, позднее начали широко применяться духовые, и в начале XX века значительную роль среди инструментов оркестра стали выполнять ударные. До конца XVIII века оркестр обычно включал 20-30 че- ловек, к началу XX века численность больших оркестров достигла 100 человек и более. В XIX веке устанавливается состав большого симфонического оркестра, оркестровая техника достигает в этот период своего высочайшего развития. Такие выдающиеся компо- зиторы, как Берлиоз, Чайковский, Вагнер, позднее Малер, Штраус, Стравинский и многие другие внесли огромный вклад в развитие оркестровой музыки и техники. Для исполнения симфонической музыки были созданы профессиональные коллективы музыкантов и построены специальные концертные залы с великолепной акус- тикой (см. гл. 5). Подробнее с историей развития оркестров мож- но ознакомиться в специальной литературе [25, 26, 85]. В настоящее время существует большое разнообразие оркест- ров по жанру исполняемой музыки и количеству музыкантов: боль- шой симфонический, оперный, эстрадный, духовой и др. В данном разделе будут рассмотрены акустические характеристики только симфонического оркестра [13, 16, 19, 84]. Состав симфонического оркестра в различные периоды разви- тия музыки существенно менялся. В настоящее время состав большого симфонического оркестра в основном тройной (по чис- лу деревянных духовых инструментов в каждой группе), однако имеются четверные и выше составы. Он включает в себя: скрип- ки первые — 12-16, скрипки вторые — 10-14; альты — 8-12; виолончели — 6-10, контрабасы — 6-10, флейты — 3, гобои — 3, кларнеты — 3, фаготы — 3, валторны — 4, трубы — 3, тром- боны — 3, туба — 1; кроме того, литавры — 1, ударные — 1-5, арфы — 2; и другие, например рояль [7, 13, 16, 19, 25]. Имеются существенные различия и в расположении музыкальных инструментов в оркестре. Наиболее распространенные схемы, при- нятые в настоящее время для симфонического оркестра, показаны на рис. 4.5.1 а, б, в [13 ]. Подбор, размещение и выбор количества музыкальных инструментов в симфоническом оркестре связаны в первую очередь с задачей достижения музыкальной выразительнос- ти, однако с акустической точки зрения они в значительной степени определяются проблемами звукового баланса. Отдельные виды инст- рументов значительно отличаются по своему динамическому и час- тотному диапазону, характеристикам направленности, тембру и дру- гим параметрам, как было показано в предыдущих разделах. Такое большое различие в свойствах неизбежно привело бы к маскировке одной группы инструментов другими, поэтому оказался необходимым пропорциональный подбор их количества и правильный выбор их размещения на сцене.
Акустика музыкальных инструментов. Акустика речи и пения 383 ударные литавры тромбоны4 туба j арфы УI валторны % ь трубы | [кларнеты» » фаготы| I флейты % ♦ гобои] BT°№e\V контра-' басы контрабасы туба тромбоны трубы валторны кларнеты фаготы флейты гобои ^ виолончели! J скрипки первые скрипки литавры ударные 4\s арфы вторые скрипки арфа ударные валторны трубы кларнеты рлеиты J !флейты-. I , ^тромбоны фаготы гобои туба англий- ский i рожок альты вторые скрипки первые скрипки контра- басы виолончели Рис. 4.5.1. Схема расположения инструментов симфонического оркестра: а — немецкая; б, в — американская
384 Глава 4 С позиций слушателей «оркестр представляет собой единый пространственно распределенный звуковой источник с таким со- ставом и численностью инструментов, который обеспечивает музы- кальный баланс звучания во всех точках зала, включающий баланс по громкости, по тембру и по различимости (четкости)» [13, 57]. Разумеется, обеспечение этих требований в значительной сте- пени зависит от акустических характеристик концертных залов (см. гл. 5). Принципиально важным является также обеспечение необ- ходимого баланса как для слушателей, так и для музыкантов в ор- кестре, в противном случае они не смогут слышать звучание сво- его инструмента или звучание других инструментов (аналогичные проблемы возникают при хоровом пении — см. раздел 4.6). Если рассматривать симфонический оркестр как единый про- странственный звуковой источник, то можно оценить его общие акустические параметры, основные из которых следующие. Частотный диапазон симфонического оркестра занимает область от низшей частоты самого низкочастотного инструмента до высшей наиболее высокочастотного. Частотные диапазоны основных музыкальных инструментов, входящих в оркестр, пока- заны на рис. 4.5.2. Например, низшая частота основного тона кон- Духовые инструменты Деревянные I I | | | |||| | | | | | | | | | | >1ЪВД I ! Сопрано-саксофон си-бемоль Тенор-саксофон си-бемоль I I 1 1 I 1 I Бас-саксофон си-бемолы I I I I I I „ Сопрано-кларнет си-оем< Бас-кларнет си-бем Медные ВалторШфЦоЪмЩ^ I Тгюмбон си-бемоль! ' Ударные инструменты Бас-т^аси'-беТ^ »' Бас-барабан. I I 11 U Струнные инструменты Певческие Орган ■ s s Синтезатор Ноты Клавиатура r-j фортепиано 16,35 32,7 65,41 130,8 261,63 523,25 1046,5 2093,0 4186,0 /Гц Рис. 4.5.2. Частотные диапазоны основных музыкальных инструментов
Акустика музыкальных инструментов. Акустика речи и пения 385 31,5 63 125250 500 1000 4000 16000 трафагота равна А2 — 27,5 Гц, высшая частота основного тона флейты-пиколло состав- ляет С5 — 4186 Гц. Однако за счет наличия обертонов, шумо- вых призвуков, использования таких ударных инструментов как тарелки, треугольники и др. с большим уровнем высоко- частотного шума в спектре, частотный диапазон может расширяться до 16-17 кГц. В результате частотный диапазон большого симфонического орке- стра составляет 30-16000 Гц. Усредненный спектр симфонического оркестра показан на рис. 4.5.3 (в процентах указана вероятность превышения данного уровня). Область максимальных уровней находится в диапазоне 500-1000 Гц; выше 4-5 кГц и ниже 250 Гц происходит спад при- мерно 10 дБ/окт. Следует отметить, что такое распределение ха- рактерно для классического симфонического оркестра, для совре- менных джаз- и рок-ансамблей, особенно с использованием электронных инструментов, спектральная область пиковых значе- ний сместилась в диапазон более высоких частот (2-8 кГц), что Рис. 4.5.3. Спектральное распределение пиковых уровней для симфонического оркестра 14с 100 200 300 400 500 600 мс Я1~п 20500 3620 8130 у; Гц Рис. 4.5.4. а — уровнеграмма, б — трехмерный спектр симфонического оркестра
386 Глава 4 i крип ^a. создает определенные проблемы для современной звуковоспроиз- водящей аппаратуры [19]. На рис. 4.5.4 показан пример распределения уровней звукового давления во времени (уровнеграмма) большого симфонического ор- кестра и трехмерный спектр выделенного отрывка, который позво- ляет судить о его сложнейшей спектрально-временной структуре. Динамический диапазон: для обеспечения баланса по громкос- ти в современном симфоническом оркестре группа струнных со- ставляет около 70% от всего количества инструментов (доля скри- пок - 35%, альтов ~ 15%, виолончелей и контрабасов по 10%), группа деревянных духовых инструментов ~ 12%, группа медных - 10% и ударных ~ 5%. Струнные инструменты имеют небольшой динамический диапазон (в среднем 30-35 дБ), деревянные и мед- ные духовые в среднем 35-45 дБ, ударные до 80 дБ. Динамиче- ские диапазоны некоторых инструментов, используемых в оркестре, показаны на рис. 4.5.5 [16]. Полный динамический диапазон для большого симфонического оркест- ра при указанном выше соотношении количества инструментов достигает 75-80 дБ. Для разных типов оркестров динамические диапазоны существенно различаются от 40 до 70 дБ. Акустическая мощность современ- ного оркестра составляет в среднем примерно 1 Вт, на пиках она может до- стигать значения 20 Вт и даже 70 Вт [19]. Распределение по частоте уров- ней акустической мощности для различных групп инструментов при исполнении на уровне mf показано на рис. 4.5.6. Максимальные уровни мощности находятся в частотных об- ластях 250 Гц — 2 кГц. Между разны- ми типами инструментов имеются к OHTPi бас 4лейт1. o]jraH_ клав нет саксе гобо i Фапт га эмон_1ка тромбон туба Фон л лащ ы 5ас-б: !раба i PIHV M)BOf таре1ки бара )ан 0 20 40 60 80 100 120 ДБ Рис. 4.5.5. Динамические диапазоны инструментов 63 125 5001000 4000 10000 Рис. 4.5.6. Распределение уровней акустической мощности для различных групп инструментов
Акустика музыкальных инструментов. Акустика речи и пения 387 _Р Pm Рис. 4.5.7. Временное распределение звукового давления ®£ для симфонического (1), о 2 эстрадного (2) оркестров и фортепиано (3) 0 20 40 60 Wb большие различия в излучаемой акустической мощности: напри- мер, контрабас — 0,16 Вт, кларнет — 0,05 Вт, труба — 0,3 Вт, рояль — 0,44 Вт, тромбон — 6,4 Вт, тарелки — 9,5 Вт, большой барабан — 25 Вт и т. д. [57, 86]. Распределение максимальных уровней звукового давления в зву- чании симфонического, эстрадного оркестров и фортепиано показа- но рис. 4.5.7. Из него следует, что для эстрадного оркестра испол- нение на повышенном уровне звукового давления (не менее чем 0,4-0,6 от максимального) составляет 50% общего времени, тогда как для симфонического оркестра исполнение на таких уровнях за- нимает только 18% от общего времени исполнения, для фортепиа- но только 10%, т. е. основную часть времени оркестр играет на уров- нях значительно ниже максимальных. Большие максимальные уровни звукового давления, доступные симфоническому оркестру, обеспечивают пик-фактор 27 дБ. Это предъявляет особые требования к аппаратуре звукозаписи, кото- рая должна иметь большие запасы по мощности, с тем чтобы не было клипирования пиков при записи звучания симфонического оркестра. Для слушателей в зале средний уровень обычно составляет 70-90 дБ SPL. В то же время внутри оркестра уровни звукового давления могут быть значительно выше: в одном метре от медных инструментов уровень может достигать 130 дБ, внутри струнной группы до 90-100 дБ (для сравнения: внутри хоровых ансамблей уровень достигает значения 80-100 дБ, на кафедре органиста до 100 дБ и т. д.). В современных джаз- и рок-ансамблях зву- ковое давление на сцене может быть на уровне болевых порогов (до 140 дБ). Работа на таких звуковых уровнях должна быть строго ограничена по времени (см. гл. 3). Статистические данные позволили установить примерное соот- ветствие реально измеренных уровней звукового давления в зале при звучании симфонического оркестра и уровней громкости, ука- занных в партитуре ( см. табл. 4.5.1) [11, 13, 19, 84]:
388 Глава 4 Таблица 4.5.1 Указанные значения громкости PPP PP P тр mf / ff fff Измеренный уровень зву- кового давле- ния, дБ 30 40 50 60 70 80 90 100 Переходные процессы: процессы атаки и спада звука сильно отличаются у каждой группы инструментов в зависимости от их конструктивных особенностей и системы звукоизвлечения. Общая структура переходных процессов для разных типов инструментов показана на рис. 4.5.8 [16]. Для струнных щипковых и ударных инструментов (гитара, арфа, рояль и др.) характерно короткое время атаки (10-50 мс), почти полное отсутствие стационарной части и длительное время затухания колебаний; при использова- нии демпферов, например, в рояле оно может быть существенно уменьшено (рис. 4.5.8 а, б). У струнных смычковых (скрипка, альт, виолончель и др.) время атаки также короткое (50 мс), но значи- тельно более длительная стационарная часть звучания (рис. 4.5.8 в). Органные трубы имеют длительное время атаки (до 100-300 мс), длительный стационарный участок и достаточно длительный спад (до 5-6 с). Все духовые инструменты имеют очень короткое вре- мя атаки (10-30 мс) и очень короткий спад; наконец, для ударных инструментов (е, ж) характерны короткая атака (3-10 мс), длинный спад (например, у колокола до 50 с) и почти полное отсутствие Рис. 4.5.8. Общая структура переходных процессов для разных групп инструментов: а — щипковые струнные; б — ударные струнные; в — смычковые струнные; г — органные лабиальные трубы; д — духовые; е — ударные; ж — барабаны; з — гласные звуки голоса.
Акустика музыкальных инструментов. Акустика речи и пения 389 стационарной части; у голосового аппарата характер переходных процессов аналогичен духовым инструментам. Тембр: обеспечение баланса звучания оркестра по тембру и четкости (различимости) зависит от искусства дирижера и музы- кантов, музыкального содержания произведения, выбора количе- ства инструментов и их размещения на сцене, а также, как было отмечено выше, в значительной степени определяется акустикой залов и сцены (см. гл. 5). Вопросам влияния акустических харак- теристик залов и сцены на тембральные свойства звучания орке- стра посвящено большое количество публикаций (см. гл. 5) [13, 19, 83, 84, 87]. Симфонический оркестр обладает огромными тембральными и динамическими возможностями и по праву считается вершиной музыкально-исполнительского искусства [7]. 4.6. АКУСТИКА РЕЧИ И ПЕНИЯ Речь и пение создаются с помощью сложнейшего музыкально- го инструмента — голосового аппарата, возможности которого человек пытается копировать столетиями, создавая различные виды музыкальных (прежде всего духовых) инструментов. Одна- ко достиг он в этом весьма относительных успехов, поскольку человеческий голос остается непревзойденным по своим каче- ствам: тембру, гибкости, многогранности, возможности передачи тончайших нюансов звучания и т. д. Изучение акустики человече- ского голоса представляет собой задачу громадной сложности. Только в последние годы появились современные методы изуче- ния динамических и акустических характеристик процесса голосо- образования (кинорентгенография, оптико-волоконная эндоскопия, электромиография, компьютерная томография, компьютерное артикуляционное моделирование и др.), которые открыли новые перспективы и создали базу для развития многочисленных иссле- дований в этой области. Наиболее существенные результаты этих работ приведены в трудах таких известных ученых как Й. Сандберг (J. Sundberg), И. Титце (I. Titze), К. Стевенс (К. Stevens), Г. Фант (G. Fant), Й. Фланаган (J. Flanagan), С. Тернстрём (S. Ternstrom), В. П. Морозов, В. И. Галунов, Л. А. Чистович, М. А. Сапожков и др. [88-134]. В первой части данного раздела будет выполнен анализ процессов звукообразования и акустических характеристик речи, затем будут рассмотрены особенности акустики вокальной речи (пения).
390 Глава 4 4.6.1. Основные механизмы звукообразования речи Речевой сигнал является средством передачи разнообразной информации — как вербальной (словесной), так и невербальной (эмоциональной). Для быстрой передачи информации в процессе эволюции был отобран особым образом закодированный и струк- турированный акустический сигнал. Процесс образования и восприятия речевых сигналов, схемати- чески показанный на рис. 4.6.1, включает в себя следующие основ- ные этапы: — создание речи — формулировка сообщения, кодирование, нейромускульные действия, движения элементов голосового тракта и звукового источника (создание акустического сигнала), излучение акустического сигнала; — восприятие речи — спектральный анализ и выделение акустических признаков в периферической слуховой системе, пе- редача выделенных признаков по нейронным сетям, распознава- ние языкового кода (лингвистический анализ), понимание смысла сообщения. Для создания такого специализированного акустического сигна- ла используется специальный «голосовой аппарат», совмещенный с физиологическим аппаратом, предназначенным для дыхания и приема пищи. Голосовой аппарат, как уже отмечено выше, является своего рода духовым музыкальным инструментом. Все способы звукоиз- влечения, которые имеются в духовых инструментах, используются и в процессе образования речи (в т. ч. вокальной речи), однако они могут быстро перестраиваться по приказам мозга и имеют широчай- шие возможности, не доступные ни одному инструменту. Создание речи Восприятие речи Рис. 4.6.1. Основные процессы создания и восприятия речи
Акустика музыкальных инструментов. Акустика речи и пения 391 Рис. 4.6.2. Структура голосового аппарата: Структура голосообразующего аппарата показана на рис. 4.6.2. Подоб- но духовому музыкальному инструменту, он состоит из следующих основных час- тей [88, 90, 91, 100, 103, 104, 109]: — генератора — дыхательной систе- мы, состоящей из воздушного резервуара (легких), где запасается энергия избыточ- ного давления, мускульной системы и вы- водного канала (трахеи) со специальным аппаратом (гортанью), где воздушная струя прерывается и модулируется; — вибраторов — голосовых связок, воздушных турбулентных струй (создаю- щих «краевые тоны» — см. раздел 4.2), импульсных источников (взрывов); — резонаторов — разветвленных и перестраиваемых резонансных полос- тей сложной геометрической формы (глот- ки, ротовой и носовой полости и др.), на- зываемых артикуляционной системой. Гэнерация энергии происходит в легких, которые представляют собой своеобразные меха, создающие поток воз- духа при вдохе и выдохе за счет разницы атмосферного и внутрилегочного давле- ния (рис. 4.6.2). Процесс вдоха и выдоха происходит за счет сжатия и расширения грудной клетки, который осуществляется с помощью двух групп мышц: межребер- ных (используются в основном при речи) и верхнебрюшных вместе с диафрагмой — мускульной тканью в форме двойного купола, которая напрягается и опускается при вдохе, расширяя грудную клетку, (используются в основном при пе- нии). Увеличение грудной клетки растягивает легкие. Это приводит к падению внутрилегочного давления по отношению к атмосфер- ному, за счет чего в легкие устремляется воздух. При вдохе мускулы расслабляются, диафрагма поднимается и выталкивает воздух. Таким образом, вдох — процесс активный, требующий за- трат энергии, выдох — процесс пассивный. При обычном дыхании этот процесс происходит примерно 17 раз/мин; управление им как при обычном дыхании, так и при речи происходит бессознательно; при пении процесс постановки дыхания происходит сознательно и требует длительного обучения. Количество энергии, которое может быть израсходовано на создание речевых акустических сигналов, зависит от объема - ротовая полость, - твердое нёбо, - мягкое нёбо, - язычок, - язык, - носовая полость, - глотка, - надгортанник, - пищевод, голосовая щель, 11 — перстневидный хрящ, 12 — щитовидный хрящ, 13 — трахея, 14 — бронхи 9 10 -
392 Глава 4 запасенного воздуха и, соответственно, от величины дополнитель- ного давления в легких. Общий объем легких составляет в среднем 4-5 л (дм3). Примерно 1-1,2 л воздуха постоянно сохраняется в них. При обычном дыхании перемещается около 0,5-0,8 л воз- духа. Таким образом, объем воздуха, который может быть исполь- зован при речи и пении, составляет 2-3 л. За счет этого создает- ся дополнительное давление в легких [12, 91, 100, 101]: при речи — 0,2-1 кПа, при пении до 2-3 кПа. Учитывая, что уровень звукового давления, который можно создать при речи, составля- ет 74-94 дБ (что соответствует звуковому давлению 0,1-1 Па), оче- видно: голосовой аппарат является не очень эффективным преоб- разователем акустической энергии, КПД при речеобразовании составляет - 0,1 %; однако это компенсируется его другими досто- инствами. Вибрации голосовых связок и создание подглоточного избы- точного давления происходят в гортани, за счет чего и обеспечи- вается модуляция воздушного потока. Гортань (larynx) — это сво- его рода клапан (рис. 4.6.2), который находится на конце трахеи (узкой трубки, по которой воздух поднимается из легких). Гортань образована с помощью набора хрящей и мышц, спереди ее охваты- вает щитовидный хрящ (thyroid), сзади — перстневидный хрящ (cricoid), на котором находятся два подвижных черпаловидных хря- ща. Сверху гортани расположен еще один хрящ — надгортанник (epiglottis), типа клапана, который опускается при глотании и за- крывает гортань (рис. 4.6.3). Все эти хрящи соединены мышцами, от подвижности которых зависит скорость поворота хрящей (с возрастом подвижность мышц уменьшается, хрящи также ста- новятся менее эластичными, поэтому возможности виртуозного владения голосом при пении уменьшаются). Внутри гортани нахо- дится мышечная перегородка, прикрепленная основанием к нижне- му краю перстневидного хряща. На верхнем крае ее находятся две складки, образующие щель. Они прикреплены к переднему щи- Рис. 4.6.3. Общий вид гортани: а — вид спереди, б — вид сбоку а б товидному хрящу гортани (в точке, называемой «ада- мово яблоко») и протянуты к задним подвижным черпа- ловидным хрящам, обра- зуя V-образную щель, кото- рая при дыхании обычно открыта (рис. по 4.6.4). Эти складки называются голо- совыми связками (термин принят в акустической и во- кальной литературе, в ме-
Акустика музыкальных инструментов. Акустика речи и пения 393 щитовидный хрящ (мышечная перегородка) эластичный конус перстневидный хрящ голосовая щель,. голосовые связки ложные надгортанник голосовая щель голосовые связки трахея задняя перстнечерпаловидная мышца (расширяет голосовую щель) Рис. 4.6.4. Голосовая щель и голосовые связки Рис. 4.6.5. Поперечное сечение трахеи и гортани дицинской литературе они называются голосовыми складками [90]). Они образуют голосовую щель (glottis). Размеры голосовой щели в открытом состоянии: примерно 20 мм в длину и 10 мм в ширину. Именно голосовые связки и являются основным (но не един- ственным) источником голосообразования (вибратором). Связки состоят из трех слоев: верхний слой — кожа, средний слой — уп- ругие волокна и плотная соединительная ткань, внутренний слой — вокальные мускулы (рис. 4.6.5). Над истинными голосовыми связ- ками находятся ложные голосовые связки, они выделяют специаль- ный слизистый секрет, который помогает смазывать истинные связки и предохраняет их от повреждения при трении во время фонации. Обычно они не задействуются в процессе звукообразования, од- нако при некоторых патологиях истинных связок могут участвовать в образовании звуков. Между ними находятся небольшие полости, которые позволяют беспрепятственно двигаться истинным связкам и играют роль акустических фильтров, уменьшая уровень высо- ких гармоник (скрипучесть голоса). При движении черпаловидных хрящей голосовые связки могут сдвигаться и раздвигаться, откры- вая проход воздуху. При поворотах щитовидного и перстневидно- го хряща они могут растягиваться и сжиматься, при активации во- кальных мышц — расслабляться и напрягаться. Процесс образования звуков речи (гласных и звонких соглас- ных) определяется колебаниями связок, что приводит к модуляции потока воздуха, выдыхаемого из легких. Такой процесс называется фонацией (существуют и другие механизмы звукообразования, они будут рассмотрены дальше). Начнем с рассмотрения процесса фонации: перед началом речи голосовые связки должны быть сведены черпаловидными
394 Глава 4 хрящами, что приводит к запиранию потока воздуха и возникнове- нию избыточного подглоточного давления (происходит «предфона- ционная настройка»). Воздух, который выталкивается легкими из трахеи, накапливается в подсвязочном пространстве и начинает давить на них; когда избыточное давление повышается до опреде- ленной величины, связки размыкаются и воздух устремляется в го- лосовую щель; в момент максимального открытия щели скорость потока воздуха становится максимальной, давление внутри щели падает по закону Бернулли (см. раздел 4.2.2). Причем скорость протекания воздуха неодинакова, в самой узкой части голосовой щели она максимальна. Внутри голосовой щели образуется зона пониженного давления, поэтому более высокое окружающее давле- ние, а также собственная упругость заставляют связки сомкнуться. Процесс аналогичен возбуждению колебаний тростей в деревянных духовых инструментах. Таким образом, чередование избыточного давления в подсвязочном пространстве и отрицательного давления из-за эффекта Бернулли заставляет связки смыкаться-размыкать- ся, т. е. обеспечивает нормальный режим их колебаний (рис. 4.6.6). С помощью этого процесса происходит модуляция потока воздуха, который толчками (как в духовых инструментах) «вталкивается» в резонансные полости. Последовательность воздушных толчков, возникающих в результате колебаний голосовых связок, называет- ся глоттальной волной [91, 100, 103, 105], обычно она представ- ляется в виде зависимости объемной скорости воздуха от време- ни (рис. 4.6.7). Как видно из графиков, такой сигнал S(t) 1. Голосовые связки в покое 2. Сведение связок 3. Подсвязочное давление начинает превышать надсвязочное 4. Разница в давлении раздвигает связки 5. Связки размыкаются 6. Возникает воздушный импульс 7. Связки сближаются 8. Связки сомкнуты, в результате действия снова накапливается упругих сил и эффекта Бернулли подсвязочное давление Рис. 4.6.6. Процесс колебаний голосовых связок
Акустика музыкальных инструментов. Акустика речи и пения 395 Слабый спокойный голос S(t) 54 3 IL S(O Время Частота Сильный, напряженный голос 4 Время CjA Пиши Частота Рис. 4.6.7. Формы голосовых импульсов и их спектр представляет собой последовательность импульсов, форма которых зависит от со- отношения време- ни открытия связок (скорость потока по- степенно нарастает) и времени закрытия (скорость быстро уменьшается). Период такой волны опреде- ляется длительностью общего цикла коле- баний связок, т. е. связан с основной (фундаментальной) частотой их колебаний f0 следующим соотношением: т =1//0- Основная частота колебаний связок определяет высоту голоса. У мужских голосов при речи частота равна в среднем 110 Гц, у женских — 220 Гц, у детских — 300 Гц. Амплитуда колебаний связок определяет громкость речи. Если записать микрофоном звук непосредственно вблизи голо- совых связок, то он напоминает «гудение» или «жужжание» (это как бы исходный материал; чтобы получить из него звуки речи, его еще надо обработать в артикуляционном тракте). Спектр такого звука показан на рис. 4.6.7. Поскольку колебания голосовых свя- зок создают периодический сигнал (строго говоря, реальный сигнал не является точно периодическим [90]), то спектр его является гар- моническим с крутизной убывания примерно 12 дБ/окт (при нор- мальной фонации) [12]. Для увеличении громкости речи необходи- мо увеличить подсвязочное давление (затратить больше энергии), при этом фронты голосовых импульсов становятся более крутыми (связки быстрее открываются), а время, когда голосовая щель остается закрытой, увеличивается: от 40-50% от общего периода колебаний при среднем уровне до 65-70% при громкой речи. Спектр при этом изменяется (рис. 4.6.7), в нем появляется боль- ше гармоник, что соответственно изменяет тембр голоса (делает его ярче — см. гл. 3). Способы смыкания связок при фонации могут быть разными: например, если связки смыкаются не полностью, т. е. между ними имеется щель, тогда форма импульсов становится почти симмет- ричной, скорость потока не падает до нуля, в голосе слышен шум (придыхательный голос, шепот). Наоборот, если связки смыкают-
396 Глава 4 ся слишком сильно (голос делается зажатым), форма импульсов становится резко несимметричной, что также меняет спектр и тембр голоса. Все перечисленные характеристики — фундаментальная часто- та колебаний голосовых связок, форма голосовых импульсов, их амплитуда, спектральный состав и форма огибающей их спектра — играют существенную роль при слуховом восприятии речи. Особую роль выполняет фундаментальная частота: в рече- вом потоке она определяет высоту голоса, ее изменение исполь- зуется также для изменения интонации, логических ударений, а иногда и смысла слов (например, в тональных языках, таких как китайский). В обычной речи частота основного тона меняется в пре- делах менее одной октавы, при пении эта частота может изменять- ся в широких пределах (более двух октав — хотя известны уникаль- ные певцы с возможностью изменения высоты основного тона до четырех октав). Фундаментальная частота (частота основного тона), т. е. число колебаний голосовых связок в секунду, зависит от их длины, мас- сы и натяжения. Приближенно эту связь можно представить как для струны (хотя связки больше похожи на резиновые шнуры) в виде: Таким образом, чем длиннее и тяжелее связки (это их врожден- ное свойство), тем ниже основной тон голоса; чем они короче и тоньше, тем основная частота голоса выше. В соответствии с ла- рингологическими критериями тип голоса соотносится с длиной связок следующим образом: у басов — 25 мм, у теноров — 19-22 мм, у сопрано — 15-18 мм [90]. Масса зависит от длины, толщины и плотности связок; в процессе речи и пения их толщи- на и плотность могут значительно меняться за счет натяжения. Натяжение используется для повышения высоты голоса и мо- жет осуществляться за счет напряжения внутренних вокальных мускулов (в основном при речи) и поворота основных хрящей (щи- товидного и перстневидного) относительно друг друга (в основном при пении). Поскольку при увеличении громкости голоса растет подсвязочное давление (а оно также оказывает некоторое влия- ние на натяжение связок — мускулы рефлекторно напрягаются), то обычно при повышении громкости речи растет и высота тона (например, при крике). Только тренированные ораторы и певцы мо- гут удерживать высоту тона при увеличении громкости в известных пределах (что требует специального обучения). Таким образом при образовании звуков речи с помощью про- цесса фонации (т. е. колебаний голосовых связок) формируется T — натяжение (упругость), L — длина, M — поверхностная масса.
Акустика музыкальных инструментов. Акустика речи и пения 397 звуковой сигнал S(YJ, кото- рый затем трансформирует- ся в голосовом тракте, где он превращается из «исход- ного» материала в по- следовательность речевых акустических сигналов (дру- гие способы создания ис- точников звука будут рас- смотрены ниже). излучающие отверстия (рот и ноздри) глотка носовая полость // голосовые связки^ Функцию резонатора выполняет вокальный тракт: он усиливает и фильтрует входной сигнал (аналогично Рис. 4.6.8. Схематическая модель тов). Форма труб вокального тракта показана на рис. 4.6.2. Тракт состоит из трех основных ре- зонансных полостей: глотки (7), ротовой полости (1), носовой поло- сти (6). Схематически его вид показан на рис. 4.6.8. Отличия такой системы резонаторов от любых труб в музыкаль- ных инструментах заключаются в следующем: — сложная геометрическая форма: вокальный тракт можно рас- сматривать как трубу переменного сечения с подключением парал- лельной трубы (носовой полости, которая может подключаться при опускании заднего мягкого язычка); — возможность быстрой перестройки формы труб, площади их поперечного сечения, плотности и жесткости стенок за счет изме- нения положения языка, мягкого язычка, губ, зубов, расширения глотки, опускания гортани и др. Возможности перестройки параметров вокального тракта огром- ны и присущи только человеку, что и позволяет ему произносить все многообразие звуков речи. Этот процесс перестройки называ- ется артикуляцией. Каждому звуку речи соответствует либо оп- ределенное статическое положение, либо определенная динамика изменения положения языка, челюстей, губ, нёбной занавески, т. е. определенная артикуляция [109]. Общая длина речевого тракта у взрослого человека (от голо- совых связок до губ) находится в пределах от 160 до 250 мм, длина носовой полости — 125 мм (от нёбной занавески до нозд- рей), площадь переменного сечения тракта в среднем составляет примерно 500-600 мм2 [90, 100]. Простейшей моделью вокального тракта можно считать цилин- дрическую трубу, например длиной 170 мм, закрытую на одном конце (аналогично трубе кларнета). Собственные моды (фор- мы) колебаний такой трубы показаны на рис. 4.6.9. Частоты трубам духовых инструмен- голосового тракта
398 Глава 4 определяются из соотношений; L = Я/4; L = ЗЯ/4; L = 5Я/4 и т. д.; таким образом, частоты равны (см. гл. 2): где п — целое число; f = (2n-l)c/4L, L — длина трубы; с — скорость звука. В спектре такой трубы присутствуют только нечетные гармони- ки 1 : 3 : 5... Для длины L = 170 мм собственные частоты оказы- ваются равными 500 Гц, 1500 Гц, 2500 Гц. Если у трубы менять в разных точках площадь поперечного сечения, то положение ее собственных частот будет смещаться. Совершенно аналогичные процессы происходят в вокальном тракте (рис. 4.6.9): в нем также имеется свой набор собственных частот с соответствующими модами колебаний, т. е. определенным распределением узлов и пучностей вдоль его длины. Меняя площадь поперечного сечения в вокальном тракте, можно также менять положение собственных частот. Если на вход такой трубы (системы труб) подать сигнал, сформи- рованный при колебаниях голосовых связок S(t) (рис. 4.6.7), то на вы- ходе можно записать сигнал, который будет иметь форму, показанную на рис. 4.6.10, т. е. гармоники, совпадающие с собственными часто- тами вокального тракта, будут усилены за счет его резонансов. Области спектральных максимумов, соответствующие резонанс- ным частотам вокального тракта, называются формантами (ино- гда их просто называют резонансами вокального тракта). Каждому звуку речи (простейший звук речи называется фонемой) соответ- ствует своя форма вокального тракта, которая варьируется за счет изменения положения языка, губ, зубов и т. д., и свое положение формант на частотной шкале (F-картина). Примеры показаны на рис. 4.6.10. Существуют некоторые общие закономерности в управлении расположением соб- Форма колебаний на третьей частоте 3/0 Рис. 4.6.9. Формы колебаний для цилиндри- ческой трубы и голосового тракта ственных частот труб-ре- зонаторов. Если по- перечное сечение трубы уменьшается в области, где форма колебаний (мода), соответствующая данной резонансной час- тоте (форманте), имеет максимум давления, то частота увеличивается; если в точке, где мини- мум давления, то часто- та уменьшается. Изуче-
Акустика музыкальных инструментов. Акустика речи и пения 399 ние движения артикуляци- онных органов во время речи с помощью рентгено- графических съемок показа- ло, что аналогичные зако- номерности имеют место и в вокальном тракте: при подъеме языка вперед и вверх сужается передняя часть ротовой полости, при этом понижается первая форманта (F7) и повышает- ся вторая (F2). При сдвиге языка назад сужается попе- речное сечение тракта в об- п л ,. Л л r г Рис. 4.6.10. Форма тракта для разных ласти глотки; при этом по- звуков речи и спектр звукового сигнала вышается F7 и понижается с формантами F2 и т. д. [100, 105]. При сдвиге формант происходят по определенным закономерностям из- менения в соотношении их амплитуд, что приводит к изменению формы огибающей. Все эти признаки — расположение формант на частотной шкале и соотношение их амплитуд — и являются отличительными акустическими признаками гласных звуков речи. При беглой речи происходит настолько быстрая перестройка позиции артикуляционных органов (языка, губ и др.), что часто имеет место наложение позиции, соответствующей одному звуку, на позицию другого, обычно гласного на соседний согласный, — такое явление называется коартикуляцией и очень осложняет вос- приятие и распознавание речи [109]. Таким образом, вокальный тракт действует на звуковой сигнал источника как параметрический эквалайзер, при этом существен- ное значение имеют частоты резонансов, соотношения их ампли- туд и ширина резонансных пиков (их добротность). Примерные частотные области расположения первых трех формант для глас- ных русского языка даны в табл. 4.6.1 [109]. Таблица 4.6.1 Форманта Частотный диапазон формант, Гц Ширина формантной полосы*, Гц мужской голос женский голос F1 200-800 250-1000 40-70 F2 600-2800 700-3300 50-90 F3 1300-3400 1500-4000 60-180 «И» «А» Шп Ж.ЛЩГ У «У» ГГггп 1000 2000 3000 Гц * B ширину полосы включаются частоты, соответствующие уровню 70,7% от максимального уровня сигнала на частоте форманты.
400 Глава 4 Гц I О I Cd I а 1800 1200 600 • heed head • heam) • had • .whod hard • hawed • • hod Гц Частота первой форманты Рис. 4.6.11. Первые две форманты английских гласных Распознавание каждой фонемы происходит в ос- новном по положению первых двух формант (F1 и F2), более высокие форманты определяют тембральные различия (для пения чрезвычайно существенное значение имеет третья формантная область — «певческая форманта»). Частотное расположение формант для гласных английского языка показано на рис. 4.6.11. Если подходить к про- цессу образования звуков речи с помощью фонации в терминах пе- редаточных функций (передаточная функция есть отношение выход- ного сигнала к входному сигналу), то этот процесс может быть описан следующим образом: P (со) = S(co) ® Т(со) ® R(CO)9 где S(co) — спектральная характеристика входного сигнала, Т(со) — передаточная функция тракта, R(co) — активная составляющая сопротивления излучения (рис. 4.6.12), ®—операция свертки [105, 106]. Импульсы голосовых связок Излучаемая волна Спектр источника Характеристика Спектр передающего тракта излучаемого звука 1 2 0 Частота, кГц а Рис. 4.6.12. Последовательные этапы преобразования сигнала в голосовом тракте: а — спектральная характеристика входного сигнала S(ftj); б — передаточная функция тракта T((d); в — спектр суммарного излучаемого сигнала ?((0)
Акустика музыкальных инструментов. Акустика речи и пения 401 Под передаточной функцией тракта понимается отношение ком- плексных амплитуд объемной скорости на губах U0 к объемной скорости у голосовой щели U2: Т(со) = U0ZU2. В реальном голо- совом тракте передаточная функция имеет сложный характер (она может быть измерена и вычислена современными цифровыми ме- тодами); на резонансных частотах тракта, т. е. на формантах, она имеет максимумы, которые называются полюсами. Таким образом, форманты еще можно определить как «полюса передаточной функции». Описанные выше процессы голосообразования относятся, в основном, к гласным звукам. Процессы образования согласных звуков существенно сложнее. Механизм образования согласных звуков речи В отличие от гласных звуков согласные гораздо разнообразнее по способам образования, что соответственно усложняет их анализ и распознавание. Во-первых, при образовании согласных могут использоваться различные виды генерации звука и их сочетания — фонация, турбулентный шум, импульс; во-вторых, месторасположе- ние источника звука также может сильно варьироваться — если при образовании гласных резонаторы всегда находятся впереди источ- ника звука (рис. 4.6.2 ), поскольку положение голосовых связок за- креплено в гортани, то источник звука при образовании согласных может находиться в любом месте тракта (у зубов — с, у заднего нёба — к); в-третьих, при образовании согласных часто используется подключение дополнительной носовой полости (на- пример, м, н). Кроме того, они отличаются значительно большим разнообразием спектров и более короткими стационарными пери- одами, как бы служа переходом от одной гласной к другой (сред- няя длительность гласных звуков 0,18 с, средняя длительность со- гласных 0,095 с для русской речи [120]). Способы генерации звука: кроме процесса фонации (т. е. моду- ляции потока с помощью колебания голосовых связок) при обра- зовании согласных звуков используются другие виды генерации. Турбулентный шум: как уже было рассмотрено в разделе 4.2.1, при прохождении струи воздуха с большой скоростью через узкое отверстие в ней происходит вихреообразование, сопровож- дающееся турбулентным шумом. Такой способ звукообразования используется в лабиальных музыкальных инструментах (например, флейте — см. раздел 4.2.1), такой же способ используется и в го- лосовом тракте: в определенном месте тракта создается сужение, и при продувании воздуха через него образуется шум, который за- тем определенным образом трансформируется в резонансных по- лостях тракта. Турбулентный шум, который создается в различных местах голосового тракта, называется фрикативным (от слова «friction» — трение) — и, соответственно, согласные, образуемые с его помощью, называются фрикативными, например с, ш, х, ф.
402 Глава 4 Л Гц р, ДБа Амплитуда такого шума зависит от размеров и места сужения, а так- t9 с же от наличия дополни- тельных препятствий при выходе струи: например, при произнесении звука с препятствие создается '0 верхними зубами, что Рис. 4.6.13. Спектральное распределение усиливает интенсивность кий участок в диапазоне 500-3000 Гц, выше и ниже которого он спадает со скоростью ~ 6 дБ/окт. Уровнеграммы и спектральное распределение шума (спектрограммы или сонограммы) для звуков ф, с, ш, х показаны на рис. 4.6.13. Импульсный источник звука образуется при скачкообразном изменении давления воздуха. Для образования звукового импуль- са необходимо создать в речевом тракте значительное избыточное давление, полностью перекрыв выход воздуха на некоторый интер- вал времени (примерно 30 мс). Поэтому звуку, создаваемому с помощью импульсного источника (например, взрывным соглас- ным типа т, к, л), предшествует определенный период полного смыкания в определенном месте голосового тракта. При быстром размыкании скорость воздушного потока на выходе резко возрас- тает, что приводит к скачкообразному изменению давления. Амплитуда такого импульса зависит от величины давления позади смычки, поэтому в речи более громкими будут те согласные, мес- то скачка давления для которых находится ближе к гортани, там уровень давления выше. Импульсный звук такого типа имеет сплошной спектр. Каждый из трех перечисленных выше способов (фонация, тур- булентный шум, импульс) может выступать как самостоятельный источник при образовании звуков речи, а может использоваться в различных сочетаниях способов друг с другом. В некоторых языках мира используются особые формы модуляции воздушного потока — например, при образовании щелкающих звуков (в ряде языков Южной Африки они имеют смыслоразличительные фун- кции). В этом случае образуется две преграды в задненёбной и передне- нёбной области: при движении языка в заднем направлении в ротовой области создается отрицательное давление, и при быстром размыкании передней смычки происходит всасывание воздуха — щелчок [109]. Расположение источника звука: поскольку при образовании гласных звуков источник возбуждения всегда находится в начале тракта и все резонансные полости располагаются перед ним, шума для согласных ф, с, ш, х шума. Спектр турбулент- ного шума имеет плос-
Акустика музыкальных инструментов. Акустика речи и пения 403 то для количественного описания процесса речеобразования достаточной является F-модель (формантная), в которой учиты- вается последовательная обработка спектра исходного сигнала со спектром находящегося впереди резонатора (рис. 4.6.12). При образовании согласных звуков процесс образования фор- мантных областей значительно усложняется: поскольку, как уже было отмечено выше, источник возбуждения (вибратор) может располагаться в любом месте голосового тракта, то в этом слу- чае резонансные полости располагаются как перед источником, так и сзади него. Резонансы полости перед источником создают пики в спектре выходного сигнала. Такие резонансы называются «полюсами» (формантами); резонансы задних полостей называются «нулями» передаточной функции и проявляются в виде провалов. Таким об- разом, передаточную функцию можно представить в виде двух функций: Т(со)= T1(CO)ZT2(CO). Частоты, на которых обращается в нуль T1(Co)1 называются ну- лями (они соответствуют резонансам задней полости); частоты, на которых обращается в нуль знаменатель T2(Oo), называются по- люсами, — это резонансы (форманты) передней полости. Модель тракта для согласных к, n, т и соответствующая передаточная функция тракта показана на рис. 4.6.14; на графике отчетливо видны пики (полюса) и провалы (нули) [105]. Гц Рис. 4.6.14. Модель тракта и передаточная функция для звуков к, n, т
404 Глава 4 Ь,дБ 0 -10 -20 -30 нуль F1=ZSl)O tk полю|с /,f 2у0ф полюс /2==15000 Гц Ф 0,2 0,3 0,5 1 2 3 4 5 10 15 Рис. 4.6.15. Спектр для согласной ф Когда нули и полюса находятся близко к друг к другу, происхо- дит их нейтрализация, и на выходной характеристике не видно ни нулей, ни полюсов — в таком случае они называются «связанны- ми» (пример для согласной ф показан на рис. 4.6.15). Аналогичная ситуация имеет место, когда включены две параллельных полос- ти — ротовая и носовая: резонансы носовой полости — полюсы (пики), резонансы ротовой — нули. Для ряда согласных звуков, например для с, ширина полос высоких резонансов так велика, что близлежащие форманты сливаются в единую формантную об- ласть; при этом первые форманты мало выражены, а спектраль- ная энергия содержится в основном в области 8000 Гц. Для описания процессов образования согласных звуков вводит- ся понятие локусной формантной картины [12, 109]. При образо- вании гласных звуков передаточная функция тракта, как уже было отмечено выше, полностью зависит от структуры ее формант (F-картины), которые в процессе беглой речи быстро изменяются, поскольку непрерывно перестраиваются артикуляционные органы. Эта плавность изменения конфигурации речевого тракта и его ре- зонансных частот имеет место и при произнесении согласных зву- ков, только эти резонансы не всегда видны в передаточной функции (в случае «связанных» полюсов и нулей). Под локусной F-картиной понимается совокупность резонансов (формант) ротовой полости тракта, которая соответствует положению q 5 артикуляционных органов при произ- несении данного согласного звука. 0 | ^ Таким образом, локусы — это те форманты, которые должны быть при данной конфигурации голосового 2,0 1,5 CS 11,0 е- -эе- -А- / Рис. 4.6.16. Локус звука д
Акустика музыкальных инструментов. Акустика речи и пения 405 тракта (независимо от того, видны они или нет на частотной харак- теристике). Их положение можно восстановить из уровнеграмм сиг- нала, оно имеет существенное значение для процессов восприя- тия согласных. Пример локуса второй форманты F2 для звука д перед разными гласными показан на рис. 4.6.16, из которого вид- но, что частота локуса равна 1800 Гц, а время перехода к форман- там последующих гласных составляет 30-40 мс. Артикуляционные возможности речевого тракта при образовании звуков чрезвычайно разнообразны и могут быть использованы для создания огромного многообразия звуков. Однако для речи ис- пользуется ограниченный набор звуков (количество фонем в раз- ных языках мира в основном не превышает 50-70). Такой разрыв между возможностями голосового аппарата и его применением объясняется с помощью квантальной теории [109]: в соответствии с ней из всех звуков используются в речи только те, которые создают достаточно четкие слуховые контрасты и легко различимы слуховой системой (т. е. речь была приспособлена к слуху). На- пример, гласные и, у, а резко контрастируют на слух, поэтому они используются почти во всех языках мира. При этом эти гласные обладают известной устойчивостью к смещению артикуляционных органов (широкой квантальной зоной). Поэтому для разных звуков речи были отобраны те виды артикуляции, которые создают суще- ственные акустические и слуховые различия. Указанные выше механизмы звукообразования с учетом кван- тальных артикуляционно-акустических и слуховых отношений и лежат в основе классификации звуков, краткое ознакомление с которой необходимо для анализа акустических характеристик речи. 4.6.2. Классификация звуков речи В основе классификации всех звуков речи, участвующих в раз- личении слов, лежит классификация Международной фонетиче- ской ассоциации (МФА), основанная на артикуляционных призна- ках. Однако поскольку все звуки, с одной стороны, представляют собой сложные артикуляционные жесты органов речи, а с другой являются акустическими сигналами, восприятие которых создает сложные слуховые образы, существуют классификации, основан- ные на акустических признаках. Признаки, используемые в класси- фикации МФА, делятся на группы в зависимости от того, какой из перечисленных ниже процессов они описывают [109]: — способы формирования воздушного потока — тип генера- ции (инициации)] — способы участия голосовых связок в образовании звука — тип фонации]
406 Глава 4 — способы формирования структуры вокального тракта — тип артикуляции. Все звуки речи можно разделить на две большие группы: глас- ные и согласные, существенно отличающихся друг от друга по всем вышеперечисленным признакам. Как уже было отмечено выше, несмотря на разницу в произ- ношении, существует некоторый типизированный простейший звук речи, называемый фонемой. Фонема — это лингвистическая единица речи. Непрерывная картина речи сводится к последова- тельности произношения во времени отдельных фонем и их аку- стического окружения. В русском языке используется 42 фонемы, из них 6 гласных, 36 согласных; в то же время, например, в ан- глийском языке 44 фонемы, из них 20 гласных (12 чистых глас- ных и 8 дифтонгов), 24 согласных [109, 110, 120]. В русском язы- ке соотношение гласных и согласных звуков примерно 1 : 6; в то же время в английском это соотношение 5 : 6, в немецком и французском 3 : 4 и т. д., то есть в русском языке имеется суще- ственное преобладание согласных звуков (хотя в ряде дагестан- ских языков это соотношение еще больше — например, в арчин- ском языке 1:12). Поскольку согласные звуки несут в основном смысловую нагрузку в тексте речи, а гласные прежде всего эмо- циональную нагрузку, то разное количественное сочетание этих звуков в разных языках определяет различие в избыточности речи и разные требования к их обработке в каналах звукопере- дачи и звукозаписи. Классификация гласных: при образовании гласных звуков всегда используется один способ формирования воздушного пото- ка (генерации или инициации) — модуляция потока воздуха за счет колебаний голосовых связок (фонация), поэтому этот признак не может использоваться для их классификации. В основе классификации гласных лежит такой признак как тип артикуляции, который в свою очередь включает в себя два основ- ных параметра: — подъем тела языка относительно твердого неба — верхний, средний и нижний. Этот признак тесно связан с положением пер- вой форманты F1 — чем выше подъем языка (больше закрытость гласного), тем ниже частота первой форманты; — ряд — положение тела языка относительно границ ротовой полости, в качестве точки отсчета выбираются губы (передний] средний или центральный] задний). Этот признак связан прежде всего с частотой второй форманты F2 — чем более передней яв- ляется артикуляция гласного, тем выше частота второй форманты. Существует система стандартных (кардинальных) гласных, которые по этим признакам могут быть представлены в виде таблицы 4.6.2 [109].
Акустика музыкальных инструментов. Акустика речи и пения 407 Таблица 4.6.2 Классификация русских гласных и значения их формантных частот Подъем Ряд Передний Средний Задний Верхний «И» 240, 2250, 3200 Гц «Ы» 300, 1480, 2230 Гц «У» 300, 600, 2500 Гц Средний «Е» 440, 1800, 2500 Гц «0» 500, 750, 2500 Гц Нижний «А» 700, 1200, 2600 Гц По ряду гласные русского языка делятся на три группы: пере- дние (и, е); средние (ь/, а) и задние (у, о). По степени подъема языка — также на три группы: верхние (U1 ы, у), средние (е, о) и нижние (а). В разговорной и вокальной речи используется дополнительная тембровая окраска гласных, которая требует сложной вокальной артикуляции с дополнительными движениями, модифицирующими свойства вокального тракта, — для их учета вводятся следующие классификационные признаки: огубление — такое движение удлиняет речевой тракт и снижает первую и вторую форманту, такие гласные называются «лабиали- зованными». Например, в русском языке гласные (о, у); ширина глотки — расширение глотки достигается сдвигом корня языка вперед, это усиливает третью и четвертую форманту и делает гласные более яркими, что используется в вокальной речи (пении). Обратное движение языка делает глотку более узкой и создает приглушенный тембр; назализация — свободный проход воздуха как через ротовую, так и через носовую полость, при этом появляются носовые фор- манты, ослабляются ротовые, изменяется тембр гласного звука. В русском языке назализация гласных используется редко (в отли- чие от французского); ретрофлексность — загнутость кончика языка вверх у альве- ол, например в американском произношении слов sir, bird. При этом третья форманта снижается в область 1,5-2 кГц — туда, где обычно располагается вторая форманта. Наконец, при создании гласных могут использоваться такие признаки как:
408 Глава 4 hid Ik^X Ь had IZVV^ fau,wj& 1000 20003000 Гц 1000 20003000 Гц 1000 20 долгота — в русском языке она не несет смыслового разли- чия, а в других языках, например английском, это существенный различительный признак (bit |i| — кусочек, beat |i:| — бить); напряженность — этот различительный признак также исполь- зуется в ряде языков (например, в англ. pot — горшок, part — часть), ненапряженные гласные отличаются меньшей длительно- стью и интенсивностью, некоторым изменением в артикуляции. Кроме чистых гласных во многих языках используются сложные гласные, в которых происходит плавный переход от одного типа артикуляции к другому. Если в этом участвуют два гласных, то та- кой звук называется дифтонгом. Например, в русском языке: я [иа], ю [иу], в английском языке: date [ei], file [ai], now [au] и др. Существуют сочетания, где используются три звука — трифтон- ги: hour [аие]. Поскольку в английском языке гласные различаются, кроме подъема и ряда, по долготе и степени напряженности, то их клас- сификация значительно сложнее. Примеры расположения органов артикуляции и соответствующие им форманты для некоторых глас- ных показаны на рис. 4.6.17. Классификация согласных: артикуляция согласных звуков связана с созданием препятствия на пути воздушного потока в различных частях голосового тракта; кроме того, при их обра- зовании используются все три типа генерации (инициации) звука — фонация, турбулентный шум и звуковой импульс (взрыв) и их все- возможные сочетания, поэтому классификация согласных осуще- ствляется по всем вышеперечисленным критериям. По типам генерации и фонации: основной способ создания воздушного потока у большинства согласных — легочный выдыха- тельный механизм (как и у гласных). Модуляция воздушного потока может происходить с участием или без участия голосовых связок (т. е. фонации). Для учета Рис. 4.6.17. Расположение органов артикуляции и формант английских гласных
Акустика музыкальных инструментов. Акустика речи и пения 409 различий по способам фонации вводятся следующие призна- ки [109, 110]: — отсутствие/наличие голоса (глухие/звонкие согласные), на- пример б — п, д — ш и т. д.; — тип фонации (придыхательный/нейтральный/скрипучий)', — аспирация (аспирированный/неаспирированный отступ), под отступом понимается разница во времени между размыкани- ем шумообразующей преграды и началом колебаний связок для последующего гласного, — если имеется между этими действиями разница во времени, то возникает аспиративный шум (как легкий выдох), например h. По типам артикуляции: при классификации по этим спосо- бам используются такие признаки как способ образования прегра- ды и место ее образования. Способ образования преграды — здесь учитывается степень препятствия и способ прохождения воздуха через нее в речевом тракте. По этому признаку согласные делятся на следующие груп- пы: шумовые (фрикативные и аспираторные), смычные (взрыв- ные и носовые), аппроксиманты (плавные согласные и полуглас- ные), аффрикаты. Шумовые согласные образуются при создании в тракте значи- тельного сужения, приводящего к возникновению турбулентного шума. Они могут быть глухими и звонкими (з — с, ж — ш и др.). В зависимости от того, образуется ли эта преграда в голосовом тракте или в гортани, шумовые согласные делятся на фрикатив- ные и аспираторные. Смычные согласные характеризуются полным замыканием воз- душного прохода в гортанно-речевой части тракта. Они образуют- ся с участием или без участия голосовых связок и также разделя- ются на звонкие/глухие, например б — п, д — т. Кроме того, они могут подразделяться по признаку назальности (наличие/отсут- ствие прохода в носовую полость). По этому признаку различа- ются носовые смычные согласные, например м, н; ротовые смыч- ные (взрывные) — п, б, т, д, к, г. Аппроксиманты (плавные согласные и полугласные) образуют- ся, когда сужение для прохода воздушной струи меньше, чем у гласного звука, но больше, чем требуется для образования турбу- лентного шума. В эту группу входят русские звуки — л, р, й, анг- лийские — w, г, j. Аффрикаты образуются при сочетании двух способов органи- зации прохождения воздушной струи, т. е. когда происходит посте- пенный переход от полной смычки к постепенному образованию узкой щели: например ц, ч, английское /tj/(church). Классификация русских согласных по способу образования преграды дана в таблице 4.6.3.
410 Глава 4 Таблица 4.6.3 Тип преграды Виды согласных Шумовые {фрикативные) звонкие глухие В — В\ 3 — 3', Ж — Ж'. Ф — Ф\ С — С, Ш — LLT1 X-X' Смычные взрывные HOCOBl звонкие глухие ые Б - Б', Д - Д', Г - Г' П — IT1 T — T', К — К' M — M', H — H' Аффрикаты Ц.ч Аппроксиманты л — л*, р — р, йс) Значок (') означает «мягкий» вариант согласного звука. Место образования преграды: преграда обычно образуется при движении некоторого активного органа — «артикулятора» к пассивному органу, например языка к нёбу. В зависимости от того, в каком месте нёба образуется смычка, осуществляется классификация фрикативных и взрывных согласных. Например, для фрикативных согласных можно выделить следующие группы: губно-зубные (между верхними зубами и нижней губой) — в, ф; альвеолярные (между языком и верхними деснами) — з, с; твер- до-нёбные (между языком и твердым нёбом) — ж, ш. Для взрыв- ных согласных: губные — б, л; альвеолярные — <Э, т\ твердо- и мягконёбные — г, к. Классификация русских согласных по ме- сту образования преграды приведена в таблице 4.6.4. Таблица 4.6.4 Губные Губно-губные Губно-зубные П — П\ Б — Б', M — M' Ф — Ф\ В — В' Язычные Передне- Зубные язычные Передне- нёбные T — Г, Д — Д\ С — C1 3 — 3\ Ц, H — H', Л — Я Ш — LLT, Ж — Ж', Ч\ P-P' Среднеязычный J Заднеязычные К — К', Г — Г, X — X' Согласные, в первую очередь аппроксиманты (плавные соглас- ные — л, р, или полугласные — й), могут также подразделяться: — по месту прохождения воздушной струи (т. е. воздух прохо- дит по центральному проходу в ротовой полости, например звук U1 или обтекает по боковым проходам, например л); — по наличию или отсутствию дрожания (например, при ко- лебаниях передней части языка образуется русский согласный р). Образование согласных может сопровождаться сложными до- полнительными артикуляционными движениями: например, можно
Акустика музыкальных инструментов. Акустика речи и пения 411 выделить согласные, которые образуются с двойной преградой (их называют иногда двухфокусными) — ш, ж. Кроме того, имеются согласные с дополнительной артикуляци- ей, например широко распространенные в русском языке мягкие согласные ль (л'), мь (мг), которые образуются путем наложения дополнительной язычной артикуляции (этот процесс называется палатализацией). Наконец, согласные могут различаться по долготе и степени напряженности (в русском языке они не несут смыслоразличи- тельных функций). Кроме того, все согласные, при извлечении которых не образу- ется сильного турбулентного шума, поскольку имеется дополнитель- ный проход для воздуха, объединяются под названием «сонорные», к их числу относятся: носовые согласные (м, н), аппроксиманты (л, р) и полугласные (й). В процессе артикуляции любого звука имеется три фазы: подго- товительная (экскурс), когда органы речи начинают устанавливать- ся в исходную позицию; стационарная (когда все органы находятся в точной позиции, соотвествующей данному звуку); и рекурсия, когда органы речи начинают перестройку для следующего звука. Если бы для каждого звука все эти позиции точно выдерживались (как при четком произношении отдельного звука), то речь происходила бы в слишком медленном темпе; при быстрой речи (средний темп 14-18 звуков в секунду) происходит переслаивание этих фаз меж- ду соседними звуками за счет коартикуляции [109]. 4.6.3. Акустические характеристики речи Речевой сигнал имеет двойственную природу. С одной стороны, это обычный акустический сигнал, представляющий собой процесс распространения звуковых волн, формы фронта которых зависят от свойств источника и условий распространения. Поэтому, как и другие акустические сигналы, речь характеризуется определенным набором объективных параметров — зависимостью звукового давления от времени (временной структурой звуковой волны); длительностью звучания; спектральным составом; местом рас- положения источника в пространстве и пр., которые вызывают оп- ределенные субъективные слуховые ощущения (громкости, высо- ты, тембра, локализации, маскировки и др.). С другой стороны, речь предназначена для передачи смысло- вой информации, поэтому в ее акустических характеристиках со- держатся специальные фонетические и семантические признаки, для расшифровки которых используются особые механизмы про- цессорной обработки в специальных отделах коры головного мозга (зоне Брока и зоне Вернике) [108]. На протяжении уже многих десятилетий, особенно интенсивно в последние годы, в связи
412 Глава 4 с развитием направления автомати- ческого распознавания и синтеза речи изучаются акустические характе- ристики речевых сигналов и предпри- мс нимаются попытки установления свя- зи между ними и их фонетическими признаками. Проблема заключается в Рис. 4.6.18. Уровнеграмма том, чтобы понять, как мозг, получив звукового сигнала информацию о характере изменения звукового давления во времени, из- влекает информацию о смысловом содержании речи. В этом на- правлении получено уже очень много результатов [108, 109, 112- 116], в качестве примера можно привести одну из книг знаменитого ученого М. Шредера «Компьютерная речь: распознавание, ком- прессия, синтез» [111]. Однако изучение чисто акустических характеристик речевых сигналов представляет значительную самостоятельную ценность для систем звукозаписи, радиовещания, компьютерной обработки речи и др. Анализ акустических характеристик речевого сигнала начинается с записи изменения звукового давления во времени с помощью мик- рофона и построения уровнеграммы (см. гл. 2). Пример уровнеграм- мы речевого сигнала показан на рис. 4.6.18. Полученные уровне- граммы позволяют провести статистический, корреляционный и спектральный анализ, что можно делать с помощью обычных му- зыкальных редакторов, а также с помощью специальных про- грамм, предназначенных именно для речевых сигналов с учетом их специфики: например, программ Praat (Голландия), Viper (Германия), Ultrasound (Австралия), CSRE (Англия), Phonograph (Россия) и др. Поскольку речевой сигнал (как и музыкальный) представляет собой сигнал квазислучайный, т. е. предсказать его будущие зна- чения можно только с определенной вероятностью, то к его харак- теристикам могут быть применены методы статистического анали- за, а именно: может быть исследовано распределение во времени мгновенных значений и уровней речевого сигнала, длительностей непрерывного существования разных уровней, длительностей пауз; распределение максимальных уровней по частоте; распределение текущей и средней мощности, спектральной плотности мощности; кроме того, могут быть определены динамический диапазон и пик- фактор; вычислено распределение основной фонационной часто- ты, спектральное распределение формант и др. Исследование этих характеристик для русской речи было выполнено в работах В. В. Фурдуева, А. В. Римского-Корсакова, М. А. Сапожкова, Б. В. Бел- кина, Л.В.Шитова, В. Г. Михайлова и др. [86, 117-120]. Знание
Акустика музыкальных инструментов. Акустика речи и пения 413 0,5 1,0 1,5 2,0 2,5 Рис. 4.6.19. Частотное распределе- ние формантных областей в русской речи статистических характеристик ре- чевых сигналов необходимо для оптимальной организации систем звукового вещания, систем звуко- записи, современных систем сжа- тия речевого сигнала и др. При анализе акустических пара- метров речевого сигнала в совре- менных специализированных про- граммах обычно оцениваются уровнеграммы и все связанные с ними параметры (динамический диапазон, распределение мгновен- ных значений сигнала, текущая мощность и др.); одномерный спектр (распределение формантных областей); трехмерный спектр — 3D (изменение формы огибающей во времени) и спек- трограммы, или сонограммы (широкополосные, узкополосные, слуховые), из которых могут быть получены такие характеристики как изменение основной фонационной частоты во времени, изме- нение формантных областей, распределение гармоник голосового источника и др., а также информация о фонетическом содержании речевого сигнала. Прежде всего речевой сигнал, как и рассмотренные выше сиг- налы, создаваемые музыкальными инструментами, характеризует- ся следующими акустическими параметрами. Диапазон воспроизводимых частот в среднем составляет 100— 7000 Гц (для мужских голосов 80-5000 Гц, для женских 220-7000 Гц). Расчет огибающей спектра для звуков русской речи позволяет уста- новить среднестатистическое распределение формантных облас- тей по частоте, по амплитуде и по ширине полосы (добротности) (рис. 4.6.19). Анализ спектров дает возможность также рассчитать среднее значение частоты основного тона, которое для русской речи составляет 139 Гц (мужская речь) и 249 Гц (женская речь) [120]. Для интегральной оценки свойств речевого сигнала может быть рас- считан спектр мощности и постро- ено распределение спектральной плотности мощности, которая для речевого сигнала показана на рис. 4.6.20. Анализ его позволяет уста- новить, что основная энергия рече- вого сигнала сосредоточена в поло- се 250-1000 Гц, спад в сторону высоких частот происходит со ско- ростью - 6 дБ/окт после 500 Гц. в,дБ_ 35 30 25 20 15 10 5 0 500 1000 5000 /,Гц Рис. 4.6.20. Распределение спектральной плотности мощности
414 Глава 4 Динамический диапазон: значения динамических диапазонов речевых сигналов находятся в пределах 35-45 дБ, значения пик- фактора 10-12 дБ. Некоторые данные для речевого сигнала приведены в табл. 4.6.5 [86]. Таблица 4.6.5 Условия Расстоя- Среднее зву- Пик-фактор, Область ние, ковое давление, ДБ максимальных CM Па (дБ) уровней, Гц Речь телефонная: уровень 2,5 • средний, 2 (100)* 10 250-500 • громкий, 4 (106)* 12 500-1000 • тихий 1 (94)* 8 250-500 Разговор (средний) 100 0,05 ( 68) 10 250-500 Оратор 100 0,1 (74) 12 250-500 * Если пересчитать уровни звукового давления для телефонной речи на рас- стоянии 100 см, то получатся следующие значения. 68 дБ, 74 дБ, 62 дБ. Следует отметить, что для вокальной речи (пения) эти уровни существенно выше и могут достигать значений 115 дБ на 1 м. Анализ спектров дает возможность построить очень важную для практики звукозаписи кривую распределения уровней речи, пример для диапазона 1000-1400 Гц показан на рис. 4.6.21 (для других ча- стотных диапазонов кривые распределения подобны). Анализ этих данных показывает, что в речевом потоке амплитуды с уровнем 45 дБ составляют более 80%, амплитуды с уровнями 70 дБ и выше — менее 10%. Это значит, что при обработке речевых фонограмм стремление «вычистить» шумы может привести к по- тере значительной части информации, поскольку низкие уровни амплитуд свя- заны в основном с согласными звука- ми, а они являются носителями основ- ной смысловой нагрузки в речи. Переходные процессы: как и у ду- ховых инструментов, голосовой аппа- рат создает звуки с короткой атакой (20-30 мс) и коротким временем Рис. 4.6 21. Кривая распределения 45 50 55 60 65 70 75 80 амплитудного состава речи N дБ (в полосе частот 1-1,4 кГц)
Акустика музыкальных инструментов. Акустика речи и пения 415 спада (30-40 мс) [16], хотя величины эти существенно варьируются в зависимо- сти от типа звуков и спосо- ба их произношения. Характеристика на- правленности: излучение речевого сигнала проис- ходит от относительно небольшого по площади отверстия (рта), поэтому на низких частотах излуче- ние равномерное во всех направлениях (источник не- направленный), на высоких частотах излучение концен- трируется в передней (и верхней) полуплоскости. Диаграммы направленно- сти голоса в вертикальной и горизонтальной плоскости показаны на рис. 4.6.22. Тембр речи отличается огромным многообразием и служит средством инди- видуальной идентифика- ции говорящего, а также отражает широкий спектр эмоциональных оттенков речи (см. раздел 4.6.5). Для анализа речи ис- пользуются специальные типы трехмерных спектров, получивших название спек- трограмм (сонограмм). Впервые они были получе- ны в 1940 году в лаборато- рии Bell Lab (США), где был построен прибор — «спектрограф видимой речи». В этих спектрах по оси абсцисс отложено время, по оси ординат — частота, а амплитуда пока- зана интенсивностью цвета (чем интенсивнее цвет, тем 270 270 10000 Гц 90 10000 Гц а Рис. 4.6.22. Характеристики направлен- ности речевого источника: а — в горизонтальной плоскости, б — в вертикальной плоскости
416 Глава 4 Р,дБа больше амплитуда). Кроме акустических параметров, о которых было сказано t, мс выше, из анализа этих спект- рограмм может быть получена информация о фонетической сегментации речевого сигна- ла. Для того чтобы произвес- ти фонетическую сегментацию —► t, MC [м] [л] [л'] [и] [н] [ъ] г> мс в сигнале, надо, во-первых, но с их артикуляцией, а что — с коартикуляцией, ритмом, интона- цией и т. д. Пример такой сегментации спектрограммы (сонограммы) и уровнеграммы при записи слова «малина» показан на рис. 4.6.23. Отчетливо видны увеличение интенсивности и выраженная формантная структура на гласных звуках, значительное снижение уровней интенсивности и уменьшение высокочастотных составля- ющих на носовых согласных [109]. Исследование акустических характеристик в беглой речи пока- зывает, что трудно выделить постоянные акустические участки с неизменной формой, поскольку все время происходят коартику- ляция и редукция, т. е. влияние соседних согласных на гласные и наоборот (в быстрой речи не достигается полностью положение артикуляционных органов, которое имеется при четком произнесе- нии отдельных звуков); кроме того, обычно невозможно выделить стационарные участки, т. к. происходит быстрая перестройка артикуляции и, соответственно, быстрое изменение акустических характеристик. Для того чтобы производить фонетическую сег- ментацию отрезков речи, обычно изучаются акустические свойства звуков в изолированном произношении (или в виде слогов) и вы- деляются признаки, необходимые для их опознания в беглой речи. Подробнее о фонетических признаках в трехмерных акустических спектрах (спектрограммах) можно прочитать в литературе [104, 106-109, 111-116]. 4.6.4. Субъективные и объективные методы оценки разборчивости речи Поскольку речевой сигнал имеет двойственную структуру (как было отмечено в предыдущем разделе), т. е. кроме обычных аку- стических признаков, которые вызывают определенные субъектив- ные ощущения (громкости, высоты, тембра, локализации и др.), он Рис. 4.6.23. Уровнеграмма и спектрограмма слова «малина» выделить акустические отрез- ки, которые соответствуют определенным фонемам; во- вторых, определить, что связа-
Акустика музыкальных инструментов. Акустика речи и пения 417 передает закодированную смысловую информацию, то для него используются особые методы оценки. На протяжении уже нескольких десятилетий применяются интегральные методы оценки правильной передачи смысловой информации, заключенной в речевом сигнале (в т. ч. и в вокаль- ной речи — пении), это методы оценки разборчивости. Оценка разборчивости необходима как при разработке и ис- пользовании различных систем звукоусиления, так и при оценке акустического качества помещений (театральных и концертных залов, студий, кинозалов и др.), поскольку в конечном итоге каче- ство зала определяется тем, насколько слушатели хорошо понима- ют смысловое содержание речи (и пения). Разумеется, понимание смыслового содержания не исчерпывает всех аспектов восприятия речи, в ряде случаев не менее важна передача ее эмоционального содержания (тембра, интонации, темпа и др.). Вопрос о связи аку- стических характеристик речи (особенно вокальной речи — пения) с ее эмоциональным содержанием будет рассмотрен далее (см. раздел 4.6.6). В соответствии с международными стандартами, в частности ISO/TR 4870, под разборчивостью понимается «степень, в кото- рой речь может быть понята (расшифрована) слушателями», т. е. в которой слушатели могут идентифицировать фразы, слова, слоги и фонемы (понять их смысл). В соответствии с этим разли- чаются различные виды разборчивости: фонемная, слоговая, сло- весная и фразовая, которые связаны друг с другом и могут быть пересчитаны одна в другую, о чем будет сказано несколько позже. Потеря информации при передаче речевого сигнала неизбежна, и хотя последний обладает определенной избыточностью, она бла- годаря различным шумам, искажениям и реверберационным поме- хам может быть столь значительна, что это способно привести к невозможности понимания смысла речи, т. е. снижению уровня разборчивости. Все известные в настоящее время методы оценок разборчиво- сти могут быть разделены на две большие группы: субъективные экспертные методы (стандарты ГОСТ 25902-83, ГОСТ 51061-97, ANSI S3.2 и др. ) и объективные методы, оценивающие следую- щие параметры: AI (articulation index) — индекс артикуляции; SII (speech intelligibility index) — индекс разборчивости речи; % ALCONS (percentage Articulation Loss of Consonants) — процент артикуляционных потерь согласных; STI (speech transmission index) — индекс передачи речи; RASTI (rapid speech transmission index) — быстрый индекс передачи речи и др. (стандарты ISO/TR-4870, ANSI S3.2, S3.5; IEC 268-16 и др.). Субъективные методы оценки разборчивости зависят от ряда факторов, основные из которых следующие: выбор эле- ментов речи для прослушивания (звуки, слоги, слова, фразы),
418 Глава 4 наиболее полно отражающих статистику данного языка; подбор со- става экспертов и степень их тренированности; качество голоса диктора, его дикция, интонация и др.; требования к помещению и условиям в нем (уровню шумов и др.); методика проведения изме- рений и методы статистической обработки результатов [86, 119- 121, 124, 125]. Для регламентации таких испытаний созданы отечественные стандарты ГОСТ 25902-83 «Зрительные залы. Методы определе- ния разборчивости речи», ГОСТ 51061-97 «Параметры качества речи и методы ее измерения», международные стандарты ISO/ TR4870, IEC 268-16 (сейчас разрабатывается новый стандарт AES), а также многочисленные национальные стандарты, напри- мер американский стандарт ANSI S3.2-1999 — Method for measurement the Intelligibility of Speech Over Communication Systems. Стандартизованные правила прежде всего касаются отбора испытательного материала, т. е. специально составленных таблиц фраз, слов или слогов, которые записываются или пере- даются с помощью диктора для оценки помещения, системы зву- коусиления или других систем коммуникации. В зависимости от типа используемых при испытаниях элементов речи различают звуковую, слоговую, словесную и фразовую разборчивость. На рис. 4.6.24а показана зависимость фразовой разборчивости от словесной, на рис. 4.6.246 — словесной от слоговой. Из-за нали- чия таких связей можно использовать различные элементы речи для оценки разборчивости. В отечественных стандартах чаще ис- пользуется оценка слоговой разборчивости, поскольку она имеет ряд преимуществ (меньшую запоминаемость, удобство при обра- ботке и др.). В международных стандартах, в частности ANSI S3.2-89, процедура предъявления речевого материала значитель-
Акустика музыкальных инструментов. Акустика речи и пения 419 но сложнее. В этом стандарте используется три вида тестовых ма- териалов: MRT (the Modified Rhyme Test), DRT (the Diagnostic Rhyme Test), PB (Phonetically Balanced Word Lists). Тест MRT вклю- чает список из 50 строк в каждой по шесть слогов, состоящих из согласной — гласной — согласной. DRT состоит из таких же сло- гов, но здесь 192 слога сгруппированы в 96 ритмических пар, каж- дая из которых отличается только начальной согласной. Этот тест определяет ошибки в идентификации начальных согласных. Нако- нец, тест PB использует списки из 20 фонетически сбалансирован- ных слов, предъявляемых в случайном порядке. Существуют и другие тестовые списки, которые упоминаются как рекоменда- тельные. Во время испытаний каждый диктор зачитывает минимум по три списка из MRT, DRT, PB. При проведении таких испытаний специально подобранные дик- торы (носители данного языка с хорошей дикцией и хорошим слу- хом) зачитывают в определенном ритме стандартизованные сло- говые таблицы в выбранном помещении (с естественной акустикой или через звукоусилительную систему). Количество дикторов должно быть не менее четырех, причем желательно, чтобы они имели ми- нимальную разницу по акустическим характеристикам голосов. Для проведения испытаний группа слушателей размещается в разных местах помещения и записывает прослушиваемый текст. Отноше- ние правильно записанных на слух фонетических элементов к об- щему количеству переданных и определяет процент разборчивости. Для получения статистически достоверных результатов необхо- димо привлечение достаточно большого числа слушателей. Для зала вместимостью более 2000 человек привлекаются две группы слушателей, а если вместимость зала более 5000 человек — три группы слушателей по 20 человек в каждой группе. Для сокраще- ния времени испытаний в каждой группе проводится цикличная смена мест, при которой каждый слушатель с занимаемого им места переходит на место другого эксперта. Цикл заканчивается, когда все слушатели побывают на всех местах испытаний. Места, на которых определяется разборчивость, должны быть равномер- но распределены по залу, а их количество должно соответствовать числу участвующих в испытаниях слушателей. Большое влияние на результаты определения разборчивости речи оказывает не только количественный состав группы слушате- лей, но и другие факторы: их образование, профессия, социальная принадлежность, а также память и сообразительность. Все слуша- тели должны: быть носителями данного языка; обладать нормаль- ным слухом; быть знакомыми со всеми тестовыми словами. Воз- растной состав ограничен 35 годами. В процессе испытаний могут привлекаться как тренированная бригада экспертов, показания которой проверены на эталонной системе, так и нетренированные слушатели (при этом их количество должно быть больше).
420 Глава 4 В международных стандартах, в частности ANSI S3.2-89, пред- лагается использовать пять дикторов и пять экспертов (удовлетво- ряющих уже упомянутым требованиям), но при этом используется более сложный предъявляемый материал. Среднее значение слоговой разборчивости на данном слуша- тельском месте вычисляется по формуле: 1 N рср= ^рсг «да N — число слушателей; Pci — слоговая разборчивость на данном месте для отдельного слушателя, определяемая как отношение числа правильно записанных слогов к числу переданных. Для ориентировочной оценки результатов испытаний в стандарте ГОСТ51061-97 приведены требования к средним значениям разборчивости речи, указанные в табл. 4.6.6. Таблица 4.6.6 Класс Условия Средние значения слоговой разборчивости в % I отличные Свыше 90 Il хорошие От 80 до 90 III удовлетворительные От 70 до 80 IV плохие Ниже 70 Таким образом, процедура организации субъективных экспертиз по оценке разборчивости речи — дело сложное, длительное и достаточно дорогостоящее, хотя и наиболее достоверное. Поэто- му в последние годы большое внимание было уделено созданию объективных методов оценки разборчивости, что позволило внедрить в практику целый ряд новых достаточно эффективных компьютерных методов расчета разборчивости речи в различных условиях. Объективные методы оценки разборчивости речи можно разделить на две группы [121, 124, 125]. Первая, аддитивная группа базируется на том предположе- нии, что результирующая разборчивость речи определяется суммой вкладов от отдельных частотных полос, а величина вклада зависит от отношения сигнала к шуму в каждой полосе. К этой группе отно- сятся: — индекс артикуляции — Al. Использование индекса артикуляции было предложено Г. Флетче- ром в лаборатории Bell Telephone Laboratories (США) в 1940 году. Идея заключается в том, что весь частотный диапазон речевого сигнала разделяется на некоторое количество полос (обычно на 20), в пределах которых определяется отношение сигнала к шуму. Предполагается, что каждая частотная полоса вносит свой незави- симый вклад в разборчивость речи. Ширина полос выбирается
Акустика музыкальных инструментов. Акустика речи и пения 421 таким образом, чтобы вклад каждой полосы в результирующую разборчивость был одинаковый. В каждой полосе рассчитывается отношение «сигнал/шум», взвешивается и суммируется для получе- ния индекса артикуляции: Al = ZAIj9 где AI — индекс артикуляции (О < AI < 1); AIj — вклад в индекс j полосы частот (0 < AIj < 0,05). Причем для отношения S/N (сигнал/шум) больше 30 дБ значение AIj принимается равным 0,05, а для отношения «сигнал/шум» меньше 30 дБ эти значения определяются как: AIj = 0,05{(S/N)j7 30}. Отношение сигнала к шуму в отдельных полосах частот опре- деляется по пиковым значениям речевого сигнала и по эффектив- ным величинам шума. Причем в шум включаются все мешающие передаче речи сигналы: шумовой фон помещения, шум электроаку- стического тракта и т. д. Значения AI ниже 0,3 соответствуют пло- хой разборчивости; от 0,3 до 0,5 — удовлетворительной; 0,5-0,7 — хорошей; выше 0,7 — очень хорошей. Соотношение между арти- куляционным индексом и словесной разборчивостью для англий- ской речи показано на рис. 4.6.25. Необходимо отметить, что в России этот метод был подробно разработан в трудах М. А. Сапожкова и др. [86]. Он получил назва- ние метода формантной разборчивости, при этом методика ее оп- ределения приобрела некоторые изменения. Несмотря на простоту применения, метод расчета артикуляционного индекса имеет ряд существенных недостатков: он учитывает только влияние шума на разборчивость и не учитывает влияния других факторов (времени реверберации, структуры отражений и др.), поэтому больше под- ходит для оценки разборчивости в системах связи; при оценке раз- борчивости в помещении с временем реверберации Трев > 0,5 с он дает не очень хорошее совпадение с субъективными оценками. Этот метод считается устаревшим, и в современной практике ис- пользуются в основном другие кри- терии; — индекс разборчивости речи — SII — был предложен как дальней- шее развитие метода Al и даже включен в американский стандарт для оценки разборчивости речи ANSI S3.5-1997. В стандарте пред- лагается четыре измерительные процедуры, каждая использует различное число и размер частот- ных полос в пределах диапазона 150-8500 Гц: критические полосы (21 полоса); третьоктавные полосы (18 полос); равные по вкладу в разборчивость критические по- Очень хорошо 0,1 0,3 0,5 0,7 0,9 Индекс артикуляции (Al) Рис. 4.6.25. Соотношение между индексом артикуляции и словесной разборчивостью
422 Глава 4 лосы (17 полос); октавные полосы (6 полос). В каждой из них вычисляется отношение «сигнал/шум» и затем рассчитывается суммарный коэффициент SII1 который может изменяться в пределах от 0 до 1. Поскольку здесь используются критические полосы (см. гл. 3), метод дает несколько лучшую корреляцию с субъективными экспертизами. Однако проблемы учета искаже- ний во временной области (реверберация, эхо и др.) по-прежнему остаются; — % ALCONS — процент артикуляционных потерь согласных. Этот метод был разработан В. Пейтцем (V. М. A. Peutz), его первая статья была опубликована в 1971 году в JAES [124]. Идея заключа- ется в том, что для объективной оценки разборчивости вычисляется процент потери согласных, которые, в основном, и определяют смыс- ловое содержание речи. Чем больше этот процент, тем хуже разбор- чивость речи в помещении. Если значения коэффициента % ALCONS оказываются меньше 10-12%, то разборчивость в помещении счита- ется хорошей. Коэффициент этот зависит от времени реверберации и от расстояния от излучателей до слушателей. Приближенно его можно определить по формуле [124]: % ALCONS = 0,652 (rLH/rR)2T %, где rLH — расстояние от излучателя до слушателя, rR — радиус гулкости, — критическое расстояние, на котором энер- гия прямого звука равна энергии отраженных звуков в помещении, T— время реверберации (см. гл. 5). Зависимость коэффициента потерь от отношения гьн^гя и време- ни реверберации в помещении T показана на рис. 4.6.26. Однако при применении этого критерия остаются определенные проблемы (возможность эффективного применения в основном в помещени- ях сравнительно небольшого объема, невозможность учета ранних отражений, эхо и др.), поэтому работы по усовершенствованию этого критерия все время продолжаются. Вторая группа методов для объективной оценки разборчи- вости построена на оценке модуляционной передаточной функции системы. К их числу относятся методы STI, RASTI, STIPA и др.: — STI — индекс передачи речи. Особая группа методов, позволяющая объективно оценить раз- борчивость речи в помещении, была разработана на основе ис- пользования модуляционной передаточной функции — MTF (The Modulation Transfer Function) [121, 123, 124, 125]. . Идея методов заключается в том, что, как видно на уровнеграм- мах (рис. 4.6.23), речевой сигнал можно приближенно рассматри- вать как некоторый широкополосный сигнал (с полосой 125- 8000 Гц), модулированный другим сигналом с низкой частотой.
Акустика музыкальных инструментов. Акустика речи и пения 423 Рис. 4.6.26. Связь % ALCONS с отношением rLf/rR и временем реверберации T Частота модуляции определя- ется скоростью, с которой че- ловек произносит форманты (скоростью артикуляции), Эк- сперименты показали, что частоты модуляции в обыч- ной речи находятся в диапа- зоне от 0,63 до 16 Гц, при- чем наиболее вероятные частоты модуляции находят- ся в области 5-7 Гц. Уменьшение глубины мо- дуляции делает речевой сигнал более похожим на шумовой и, следовательно, приводит к уменьшению его разборчивости. При про- хождении речевого сигнала через любой тракт передачи или помещение за счет ре- верберации, искажений и шумов происходит уменьшение разборчивости сигнала, что может быть оценено по степени уменьшения его глубины модуляции (изменению формы огибающей сигнала). Поэтому в работах Хоутгаса и Стинекена был предложен сле- дующий метод оценки разборчивости [123, 124]: весь речевой ди- апазон от 125 до 8000 Гц разбивается на семь октавных полос. На вход акустической системы, установленной в точке помеще- ния, где должен находиться диктор (оратор), подается октавный шумовой сигнал с центральными частотами 125 Гц, 250 Гц, 500 Гц, 1 кГц, 2 кГц, 4 кГц и 8 кГц, распределение интен- сивности которого по октавным полосам совпадает с распределе- нием интенсивности речевого сигнала. Сигнал этот модулируется гармоническим сигналом, частоты которого меняются в пределах от 0,63 до 12,5 Гц с третьоктавным интервалом (всего четырнад- цать частот). В точке, где должен располагаться слушатель, сиг- нал принимается микрофоном (ненаправленным), при этом за счет шумов и процессов реверберации в помещении форма сиг- нала изменяется и глубина модуляции его уменьшается. Коэффициент т, характеризующий уменьшение глубины моду- ляции, является функцией частоты модуляции F и зависит от времени реверберации в помещении T (с) и отношения «сигнал/шум» — S/N (дБ) следующим образом:
424 Глава 4 1 l + [2nF 1 + 10 I (S/N)/\0 • 13,8 Зависимость величины 20 Ig m (F) от частоты модуляции F на- зывается модуляционной передаточной функцией. В предлагаемом методе измерения проводятся для 7 октавных полос подаваемого шума и 14 значений частот модуляции, полу- ченная матрица из 98 точек используется для расчета индекса пе- редачи речи STI (speech transmission index) путем взвешивания среднего значения m(F) в каждой полосе частот в соответствии с их общим вкладом в разборчивость. Методы измерения разборчивости с помощью STI введены в международный стандарт IEC 268-16. Метод этот предполагает проведение измерений в широком диапазоне частот и поэтому учи- тывает частотную зависимость времени реверберации, неравно- мерность АЧХ и другие частотно-зависимые эффекты, в силу чего и дает достаточно хорошую корреляцию с субъективными оценками. Для возможности сравнения результатов оценки разборчивости, полученных различными методами, была разработана общая шкала разборчивости — CIS (стан- дарт IEC-60849), позволяю- щая пересчитывать значения разборчивости, полученной разными методами (как субъективными, так и объек- тивными), одно в другое (рис. 4.6.27). Например, значение STI, равное 0,7, соответству- ет значению % ALCONS 3,8%, что соответствует 94% слоговой разборчивости и обеспечивает хорошую разборчивость речи в по- мещении. Пределы изме- нения STI для обеспече- ния хорошей разборчивости составляют 0,6-1,0; — RASTI — быстрый индекс передачи речи. Поскольку расчет раз- борчивости вышеуказанным методом представляет собой довольно трудоемкую проце- 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1 ▼ словесные оценки (256 слов) а короткие предложения О % ALCONS ■ фонетически сбалансированные словесные оценки (1000 слов) □ 1000 слогов х AI • STI-100% Рис. 4.6.27. Шкала CIS
Акустика музыкальных инструментов. Акустика речи и пения 425 дуру, фирмой «Брюэль и Кьер» (Bruel & Kjer) был разработан аль- тернативный упрощенный метод [123], предусматривающий изме- рения только в двух октавных полосах 500 Гц при частотах моду- ляции 1,02 Гц, 2,03 Гц, 4,07 Гц и 8,14 Гц, а также 2 кГц при частотах модуляции 0,73 Гц, 1,45 Гц, 2,90 Гц, 5,81 Гц и 11,63 Гц. Дальше процедура измерений происходит как и в предыдущем случае: строится матрица, рассчитывается усредненное значение модуляционной передаточной функции в полосах частот и по нему определяется нормализованный индекс RASTI. Для реализации этого метода фирмой были разработаны соот- ветствующая аппаратура (В & К 3361 RASTI Meter) и программное обеспечение, поэтому данная методика принята практически во всех международных стандартах. Однако поскольку измерения проводятся только в двух октавных полосах, то они дают несколь- ко завышенные значения (не учитывают неравномерность АЧХ и ФЧХ в системе). С целью еще большего ускорения процедуры измерений фирма предложила метод, при котором сигналы предъявляются в двух октавных полосах со всеми модулирующи- ми сигналами одновременно. Измерения производятся в непре- рывном режиме и позволяют выполнять параллельный анализ в двух октавных полосах. Интервал времени для анализа требуется не менее 8 с. Для хорошей разборчивости необходимо, чтобы зна- чения RASTI в разных точках помещения были не ниже 0,6 [124]. Для его оценки проводятся измерения в разных точках помещения и по результатам строятся кривые распределения. В ходе выполненных за последние годы работ были получены, в частности, достаточно простые аналитические соотношения между разными коэффициентами по оценке разборчивости речи, которые могут быть полезны в практической работе по оценке помещений. Например, связь между STI и % ALCONS может быть представлена в виде: % ALCONS = 170e"5'4STI В заключение следует отметить, что проблема оценки разбор- чивости речи чрезвычайно сложна, поскольку она зависит не толь- ко от факторов, которые поддаются объективным измерениям (время реверберации, уровень шумов, структура ранних отражений и др.), но и от таких субъективных факторов, как степень владения языком, дикция оратора, степень знакомства слушателя с содер- жанием сообщения, состоянием его слуха и др. Поэтому создание автоматизированной компьютерной системы объективной оценки разборчивости речи — проблема трудная, но поскольку она чрезвычайно важна для развития коммуникационных систем и к ее решению привлечены значительные силы специалистов в различных странах, можно надеяться, что такая достаточно на- дежная система будет создана.
426 Глава 4 4.6.5. Особенности звукообразования и акустические характеристики вокальной речи (пения) Информацию, которую несет речевой сигнал, принято делить на семантическую (смысловую, логическую) и эмоционально-эсте- тическую. Если в речи основным является первый вид информации, то в вокальной речи главные задачи состоят в передаче эмоциональ- но-эстетической информации. «Вокальная речь» обозначает то же, что и «пение», но пение — это прежде всего музыкально-эстетический термин («искусство пе- ния»); под термином «вокальная речь» понимается рассмотрение процесса пения с акустических научных позиций, поэтому при дальнейшем изложении будет использоваться в основном первое определение. Эти задачи, а также особенности их реализации (оперное, кон- цертное, хоровое, эстрадное пение и др.) привели к тому, что во- кальная речь, несмотря на наличие общего механизма звукообра- зования, имеет ряд существенных отличий от обычной речи, заключающихся прежде всего в следующем: специфике организа- ции дыхания; наличии особой структуры формант, характеризую- щейся появлением особых певческих формант; способности к подстройке формант в верхнем диапазоне певческого голоса; использовании различных регистров; наличии амплитудной и ча- стотной модуляции (вибрато и тремоло); больших флюктуациях акустических параметров при выражении эмоций, особой систе- ме обратной связи (эффект Томатиса) и др. [12, 90-95, 100-103, 126-131]. Все это обуславливает специфику акустических характеристик вокальной речи — более широкий частотный диапазон, большой динамический диапазон, особое спектральное распределение мощ- ности и др., — а также создает определенные проблемы с разбор- чивостью. Процесс звукообразования вокальной речи включает в себя все основные этапы, которые используются при создании обыч- ной речи: генерацию, фонацию (для гласных и звонких соглас- ных), артикуляцию и излучение звука. Однако перечисленные выше особенности вокальной речи вносят свои коррективы в организацию процессов, связанных с использованием как го- лосовых источников (генерация и фонация), так и резонаторных полостей (артикуляция). Проблемы организации дыхания при пении являются сложнейшей задачей, связанной с постановкой голоса, и рассматриваются в специальных руководствах [91, 100, 101, 103, 127-129]. В данном разделе будут кратко рассмотрены особенности обра- зования формант, использования вибрато и тремоло и образова- ния регистров в вокальной речи.
Акустика музыкальных инструментов. Акустика речи и пения 427 Рис. 4.6.28. Сравнительный уровень звукового давления при пении и речи (а — мужчины, б — женщины): 1,2 — громкое и тихое пение; 3, 4 — громкая и тихая речь Особые требования к тембру певческого голоса, существенно отличающиеся от требований к обычной речи, приводят в первую очередь к отличиям в настройке резонансов голосового тракта, т. е. его формантных частот [12, 90, 92, 100, 103, 104]. Певческая форманта: для того чтобы голос оперного певца (или концертного исполнителя) был слышен на фоне оркестра, не- обходимо прежде всего развивать значительно более высокий уро- вень звукового давления (петь громче); сравнительный анализ уровней звукового давления на расстоянии 0,5 м при пении и речи для разных частот фонации (высоты тона) показан на рис. 4.6.28. Однако одного увеличения громкости оказывается недостаточно для решения этой проблемы, поэтому в процессе многолетнего со- вершенствования техники пения, прежде всего оперного (belcanto), были отработаны особые приемы перестройки спектральных ха- рактеристик голоса, в частности создание особой — «певческой» форманты. Если сравнить расположение формантных частот (т. е. резонан- сов вокального тракта) для одних и тех же гласных в обычной и вокальной речи, то отчетливо видно, что для всех гласных поло- жение первой форманты на шкале частот мало меняется, вторая форманта сдвигается по частоте вниз, значительно изменяется по- ложение третьей, четвертой и пятой формант в сторону их совместного сближения (рис. 4.6.29). Если проанали- зировать спектральную оги- бающую любого из гласных звуков в речи и пении (рис. 4.6.30), то отчетливо видно наличие выраженного пика в области 2-3 кГц. Этот пик создается в результате объединения (кластериза- ции) третьей, четвертой —Речь Пение Рис. 4.6.29. Расположение формант при речи и пении
428 Глава 4 ДБ а и пятой формант и носит название «певческой фор- манты». 1000 2000 3000 рц Такая группа подчеркнутых формант, как показано в рабо- тах В.П.Морозова, Й.Сандберга [90-92, 100] (наиболее извест- ных ученых, занимающихся про- блемами акустики певческого голоса), наблюдается только 0 Рис. 4.6.30. Форма огибающей в спектрах хорошо поставлен- полагается в зависимости от типа голоса в области: у басов и бари- тонов — 2100-2500 Гц, у теноров — 2500-2800 Гц, у сопрано — 3000-3500 Гц. Для одного и того же певца эта форманта не смещается по ча- стоте, стабильно занимает одно и то же положение при пении нот разной высоты или разных гласных, т. е. положение этой форман- ты не зависит ни от фундаментальной частоты (это свойство под- стройки есть у других формант, как будет показано дальше), ни от позиции других резонансов (нижних формант). Амплитуда певческой форманты зависит как от амплитуд объе- диняемых формант (третьей, четвертой и пятой), так и от ампли- туд соответствующих обертонов в спектре голосового источника, а это в свою очередь зависит от особенностей его использования (в частности, скорости и силы сведения при колебаниях голосовых связок). Кроме того, поскольку при увеличении громкости огибаю- щая спектра звука голосового источника меняется, т. к. увеличива- ются амплитуды высоких обертонов, то и амплитуда певческой форманты при этом возрастает. Выполненные исследования [90, 91] показали, что при прослу- шивании записей певческих голосов, из которых отфильтровыва- лась высокая певческая форманта, в голосе терялась звонкость, чистота и ясность тембра, полетность, он звучал глухо и невыра- зительно. Звучание высокой певческой форманты в изолированном виде воспринимается как звонкий мелодичный звук (типа соловь- иной трели). Он прослушивается при пении любой гласной, усили- ваясь при увеличении громкости. Эти опыты позволили установить, что от наличия и амплитуды высокой певческой форманты зависит звонкость певческого голоса. В работах В. П. Морозова [91] была даже предложена количественная величина «коэффициент звонко- сти голоса»: К = Iвпф/19 где / впф — интенсивность спектра в обла- сти высокой певческой форманты, / — общая интенсивность голо- са. Проведенные измерения у разных категорий певцов показали, спектра при речи и пении ных, чаще оперных голосов, при этом центральная частота рас-
Акустика музыкальных инструментов. Акустика речи и пения 429 что у оперных певцов он достига- дБА ет 33-35%, у неквалифицирован- ных певцов 5-11%, у детей — 3%. Однако основной причиной ис- пользования певческой форманты в оперных голосах является, по-ви- димому, повышение помехоустой- чивости голоса. Средний уровень оркестра при достаточно громком — оркестр _ — речь ... оркестр + пение исполнении в концертном зале со- ставляет 90-100 дБ (на 10 м). Со- Рис. 4.6.31. Огибающая звуков кового сигнала выше возможностей человеческого голоса. Кроме того, маскирующее действие оркестра зависит от частотного распределения спектральных уровней. Если сравнить огибающую долговременного спектра для звуков ор- кестра и для звуков нормальной и вокальной речи (пения) (рис. 4.6.31), то видно, что максимум энергии в звуках оркестра на- ходится в области 400-500 Гц, затем ее уровень быстро спадает и в области 2,5-3 кГц уменьшается на 20 дБ. Примерно такое же распределение энергии и в звуках обычной речи (только ниже по уровню громкости), и поэтому она полностью маскируется звуками оркестра. В певческом голосе до 30% энергии может быть сосредо- точено в певческой форманте в области 2-3 кГц (которая, к тому же, совпадает с областью максимальной чувствительности слуха). Такая спектральная перестройка голоса позволяет получить зна- чительный энергетический выигрыш, повысить помехоустойчивость и звонкость голоса без увеличения энергетических затрат голосового источника (не удивительно, что найденный в процессе совершен- ствования техники пения прием получил такое широкое распростра- нение). Существуют виды пения, где певческая форманта не исполь- зуется, например хоровое пение, пение под гитару, современное эстрадное пение (где баланс регулируется системой звукоусиления, и певческая форманта, т. е. усиление особой группы обертонов, мо- жет быть введена звукорежиссером). Механизм образования певческой форманты служит предме- том многочисленных исследований [90-92, 100, 103, 104, 126]. В большинстве работ считается, что основной способ образова- ния певческой форманты реализуется за счет снижения позиции гортани и значительного расширения глотки. Резонансы образую- щегося при этом надгортанного объема (2,57-4,83 см3) усилива- ют высокочастотные гармоники в спектре голосового источника в области 2,5-3,5 кГц [90]. Имеются и другие теории образования высокой певческой форманты, например благодаря краевым здание такого среднего уровня зву- оркестра, речи и пения
430 Глава 4 тонам, возникающим при прохождении турбулентной струи возду- ха через щель голосовых связок (как у флейты) и др. [126]. Следующей характерной особенностью акустических свойств вокальной речи является способность к подстройке формант. Подстройка формантных частот: при пении на высоких тонах, особенно женском, перестройка формант, приводящая к появле- нию «певческой форманты», часто не используется: во-первых, по- тому, что у высоких женских голосов другая структура вокального тракта (меньше длина, труднее реализуется опускание гортани и расширение глотки и др.); во вторых, наличие значительного подъема в области 3 кГц может привести к «пестроте» голоса, по- тому что при высокой фонационной частоте, например 700 Гц, обертоны находятся на расстоянии 700 Гц друг от друга, и в фор- мантную область будут то попадать, то не попадать отдельные обертоны при сдвиге основной частоты (в отличие от обычной кар- тины заполнения формантных областей при низкой фонационной частоте — рис. 4.6.12). Поэтому в женском (и теноровом мужском) пении используется другой способ повышения помехоустойчивости голоса, обеспечивающий его слышимость на фоне оркестра, кото- рый получил название «подстройка формант» [91, 100]. В пении используются значения фундаментальной частоты су- щественно выше, чем в обычной речи. В речи средняя частота со- ставляет 110 Гц для мужского голоса и 220 Гц для женского (мак- симальный предел 200 Гц и 350 Гц соответственно). В то же время при пении в верхних регистрах значения фундаментальной частоты могут быть равны: для сопрано 1319 Гц (Е6), для тенора 523 Гц (С5). Поэтому в речи первая форманта находится обычно выше на частотной шкале, чем фундаментальная частота, но в пении первая форманта оказывается ниже ее во многих случаях. При этом способность вокального тракта усиливать звук на ее ча- стоте не будет использоваться, т. к. никакой энергии от голосово- го источника не поступает. Как только первая форманта становится ниже фундаменталь- ной частоты, певцы стараются подтянуть форманту, широко откры- вая рот [12], поскольку его открытие вызывает повышение — подстрой- ку первой форманты ближе к часто- те фонации. На рис. 4.6.32 показа- но, как сдвигаются первые три форманты в женском оперном пении при повышении тона (соответствен- но и фундаментальной частоты). Эта стратегия используется для боль- Рис. 4.6.32. шинства гласных в верхнем регист- Подстройка формант ре сопрано, а также в верхнем
Акустика музыкальных инструментов. Акустика речи и пения 431 диапазоне тенорами. Открытие губ не увеличивает эффективность излучения, т. к. источник не производит больше энергии, но это сдвигает форманты, что изменяет перераспределение энергии в определенных диапазонах и улучшает помехозащищенность. Подстройка формант под первую фундаментальную частоту позволяет получить выигрыш по звуковому давлению до 28 дБ. Это усиление звука является, как и «певческая» форманта, чисто резонансным процессом и происходит без увеличения затрат энер- гии от вокального источника (голосовых связок). Для большинства гласных значение первой форманты лежит в области 300-800 Гц. Если фундаментальная частота превышает 500 Гц и происходит подстройка формант (т. е. сближение, кластеризация формантных частот), то общая громкость усиливается, поскольку первая и вто- рая форманты, где имеет место максимальное усиление звука, сдвигаются по частотному диапазону и сближаются друг с другом, поэтому высокие женские голоса становятся хорошо слышны даже на фоне громкого оркестра (т. е. достигается такой же эффект, как и в мужских и низких женских голосах, где используется другой ме- ханизм для этих целей — певческая форманта). В пении при повышении высоты тона используется еще один прием, получивший название «модификация качества гласных». Модификация качества гласных: как пение с подстройкой формант, так и пение с певческой формантой требует перестрой- ки вокального тракта — расширения глотки, снижения гортани и др., что, естественно, влияет на две низшие формантные частоты, которые критичны для идентификации гласных. Сравнение всех формантных частот при речи и пении (рис. 4.6.30) показывает, что у них вторая и третья форманты значительно различаются (вторая форманта при пении ниже по частоте), что оказывает влияние на разборчивость гласных. Поэтому при пении используется прием модификации гласных (например, (э) заменяется на (а) и т. д.), чтобы перейти на гласные звуки, формантные области которых ближе к областям, формируемым при вокальной речи с высокой певческой формантой [91]. Интегральные характеристики вокальной речи: если произ- вести статистическую обработку спектров вокальной речи большо- го количества певцов с их индивидуальными формантами, то в среднем получаются кривые, показанные на рис. 4.6.33, на кото- рых отчетливо видны три области максимумов (чего нет на обобщенной спектральной кривой для речи). Наибольших уровней достигает в мужских голосах третья область — это высокая пев- ческая форманта, о которой уже было сказано выше. Первую область называют первой (нижней) певческой форман- той, она определяет мягкость, массивность голоса; вторая область, которую называют артикуляционной (фонетической) формантой, ниже по уровню и совпадает со второй формантой звука «А»
432 Глава 4 (по-видимому, при пении все гласные становятся ближе к «А» по артикуляции). Различия между басами, баритонами и тенорами отчетливо видны по расположению этих трех максимумов [90]: Таблица 4.6.7 Тип голоса F1, Гц F2, Гц F3, Гц Басы 380-540 760-1100 2100-2500 (ср. 460) (ср. 930) (ср. 2300) Баритоны 450-540 1100 2500 (ср. 495) Тенора 540-640 1300 2500-3000 (ср. 590) В женских певческих голосах также отчетливо видны три ста- бильные области максимумов. Первая (низкая) певческая форманта связана с резонансами всего ротоглоточного тракта от гортани до губ, смещение ее в вы- сокочастотную область для разных типов голосов связано с разли- чием в длине тракта, который, по данным измерений [127], состав- ляет 233-250 мм для басов, 215-240 мм для баритонов, 190- 220 мм для теноров, 160-180 мм для сопрано. Существенную роль в усилении обертонов в этой области играют также резонансы грудного (трахеобронхиального) резонатора, которые находятся в области 470-610 Гц [90]. В обычной речи при произнесении различных гласных формант- ные области все время смещаются в процессе речевого потока, эта вариабильность обеспечивает разборчивость речи. Одним из требований к хорошему певческому голосу является ровность тембра, т. к. если при пении произносить гласные, как и при речи, то имеет место «пестрота» пения. Это требование приводит к вы- равниванию гласных: по-видимому, в начальный период атаки звука устанавливаются все форманты для опознания звуков, затем голосообразующий аппарат перестраивается для пения
Акустика музыкальных инструментов. Акустика речи и пения 433 и стабилизирует форманты [91]. Это, конечно, не сглаживает тембральных различий при исполнении произведений разными певцами, поскольку сохраняются существенные различия в вы- сших обертонах, характере атаки и спада звука и др. Однако эту специфику спектральных характеристик вокальной речи следует учитывать при ее обработке и записи. Разборчивость вокальной речи: спектральная перестройка голоса для повышения его помехоустойчивости неизбежно при- водит к изменению первых формантных областей (по частоте, амплитуде, добротности и др.), а поскольку именно первые две формантные области в значительной степени влияют на распозна- вание звуков, то это вызывает ухудшение разборчивости вокальной речи. Хотя главная задача вокальной речи состоит в передаче эмоционально-эстетической информации, передача семантической информации (т. е. понимание смысла содержания) также имеет су- щественное значение (во всяком случае в классической вокаль- ной культуре). Исследования по количественной оценке разборчи- вости вокальной речи и влияния на нее перестройки формант были выполнены в работах В.П.Морозова [90, 91]. За основу был взят субъективный метод оценки слоговой разборчивости (раздел 4.6.4): группа тренированных экспертов проводила прослу- шивание слогов из стандартных артикуляционных таблиц — как произносимых в обычной речи, так и пропетых на разной высоте тона. Статистическая обработка большого количества испытаний позволила выявить некоторые общие закономерности: средняя разборчивость вокальной речи оказалась у всех испытуемых (пев- цов) ниже, чем разборчивость обычной речи (у них же), процент упал в среднем с 87 до 70,7%. Причем если у мужчин эта разни- ца составляла 86,7 и 75%, то у женщин 88 и 65%, т. е. разборчи- вость женских голосов в вокальной речи падает гораздо значитель- нее, что, очевидно, связано с высотой их голоса. Зависимость слоговой разборчивости от высоты основного тона голоса показана на рис. 4.6.34 для мужских (1), женских (2) и детских (3) голосов. Как следует из полученных данных, область максимальной разбор- чивости соответствует частоте основного тона для мужских голосов в области 110-262 Гц и для женских голосов в области 330- 524 Гц. При повышении А% частоты основного тона 10оА° до 500 Гц разборчивость в 80 мужских голосах падает, ^ но все-таки сохраняется на 40 уровне примерно 50%; 20 в женских голосах при по- Q ВЫШеНИИ ОСНОВНОГО TOHa 98 131165 196 262 330 524 660 784 1<&8Гц ДО 1048 Гц разборчивость рис. 4.6.34. Зависимость разборчивости становится очень НИЗКОЙ. вокальной речи от высоты тона 2 --*^*¾¼ \ ч
434 Глава 4 Таким образом, зона хорошей разборчивости находится в сред- ней части диапазона для различных типов голосов. Она немного падает к низким частотам и значительно — к высоким, причем у женских голосов в большей степени, чем у мужских. Существу- ет несколько основных причин этого явления: при значительном повышении частоты основного тона остается слишком мало обер- тонов, которые попадают в слышимый диапазон, это меняет тембр звуков и затрудняет их опознание; основной тон попадает в об- ласть за пределами формантных частотных областей, и певец ста- рается произвести подстройку формант, как уже было сказано выше, но сдвиг первых формант резко ухудшает распознавание звуков речи и, соответственно, разборчивость; более 30% энергии концентрируется в области певческой форманты — соответствен- но снижается уровень первых формант, что также сказывается на разборчивости. Наконец, в вокальной речи особенно сильно про- является разница по уровню и по длительности между гласными и согласными звуками: уровень гласных может достигать 110- 115 дБ, уровень согласных 40-70 дБ, что приводит к явлениям мас- кировки согласных. Поскольку согласные передают основную семан- тическую информацию, то значительная потеря разборчивости в во- кальной речи обусловлена также нечеткой артикуляцией согласных, что важно учитывать при записи и обработке вокальной речи. В це- лом, если ставится задача передачи смысловой информации в пе- нии, то лучше, если произведение написано для средних (и низких) регистров. При пении в высоких регистрах передача смыслового содержания происходит плохо; в качестве основной выполняется задача передачи эстетической информации. Вибрато и тремоло. Одним из средств музыкальной вырази- тельности пения является использование в процессе исполнения различных видов модуляции (изменения) параметров звукового сигнала. Такие изменения воспринимаются как тембровая осо- бенность исполнения, придающая ему живость, полетность, при- ятность и др. Модуляция параметров широко используется не только в пении, но и при исполнении музыки на различных инст- рументах: скрипке, виолончели, духовых инструментах и т. д. Спектральный анализ записей голосов оперных певцов показы- вает, что чаще всего в их пении используется частотная модуляция (пример показан на рис. 4.6.35), т. е. вибрато, которая сопровож- дается небольшой амплитудной модуляцией. В некоторых других видах пения (поп-музыке, народном пении и др.) иногда применя- ется амплитудная модуляция, т. е. тремоло. В современной рок- музыке, где исполнение идет с огромным напряжением связок, мо- дуляция (вибрато и тремоло) практически отсутствует, звук получается «прямой». Анализ особенностей модуляции в голосах выдающихся пев- цов, выполненный в работах [20, 90, 91, 100, 103], показал:
Акустика музыкальных инструментов. Акустика речи и пения 435 — в оперном пении выдающихся мастеров используется в ос- новном частотная модуляция с частотой 5,5-7 Гц и глубиной мо- дуляции ± 50 центов; — важной особенностью голоса мастеров оперного вокального искусства является хорошая периодичность (ритмичность) виб- рато; для голосов непрофессиональных певцов характерен нерит- мичный характер вибрато, что воспринимается как неустойчивость, неуверенность пения; — значение частоты модуляции является характерной особен- ностью данного певца, хотя она (так же, как и глубина модуляции) может слегка видоизменяться в зависимости от высоты основно- го тона, силы голоса, типа гласной, длительности ее звучания и ряда других факторов. Следует отметить, что такие параметры вибрато, как частота и глубина модуляции, могут изменяться в зависимости от эмоци- ональной настроенности певца. Механизм создания модуляции в вокальной речи (пении) исследовался с помощью электромиографии (измерения электри- ческой активности мышц). Это позволило установить, что наряду с колебаниями связок на основной частоте происходят ритми- ческие сокращения всех основных мышц гортани, что и служит причиной появления частотной модуляции. При этом, поскольку в колебаниях участвуют и мышцы сведения связок, в такт с час- тотой модуляции меняется сила их сведения, что приводит к из- менению подглоточного давления. Последнее служит причиной изменения амплитуды сигнала, что и порождает сопровождаю- щую амплитудную модуляцию. Существует и другая причина [100]: при вибрато происходит изменение значений фундамен- тальной частоты, при этом варьируются и значения частот всех обертонов синхронно с фундаментальной. Амплитуда каждого обертона зависит от того, как далеко он находится от формант- ной области. Частоты формант при вибрато не смещаются, 6 7 8 9 t, мс^ Рис. 4.6.35. Спектрограмма (сонограмма) женского голоса (сопрано) при пении с вибрато
436 Глава 4 поэтому при сдвиге частот обертонов с частотой модуляции про- исходит увеличение или уменьшение их амплитуды — в зависи- мости от того, дальше или ближе они перемещаются к формант- ной области, а поскольку общая громкость излучаемого сигнала зависит в основном от амплитуд обертонов внутри формантных областей, то происходит изменение громкости сигнала с частотой модуляции. Таким образом, при частотной модуляции, т. е. ис- пользовании вибрато при пении, происходит и амплитудная мо- дуляция сигнала, но она не так значительна. Основные преимущества использования вибрато заключаются прежде всего в улучшении эстетического восприятия пения, при этом звук имеет более живой тембр (за счет обогащения спектра при мо- дуляции). Кроме того, существуют и объективные причины использо- вания этого приема при пении, основные из которых следующие: — применение вибрато уменьшает требования к точности на- стройки фундаментальной частоты, т. е. высоты тона. Исследова- ния показали, что хотя при модуляции и меняется основная час- тота (а следовательно, и высота тона), но если частота модуляции лежит в пределах 6-7 Гц и глубина модуляции ± 40 центов, то слух как бы усредняет значения частоты и воспринимает некото- рую среднюю высоту тона. Если частота модуляции ниже 5 ^,ста- новятся слышны колебания высоты, голос кажется очень напря- женным (старческим). Если частота модуляции выше 7 Гц, голос воспринимается нервным. Таким образом, диапазон изменения ча- стоты модуляции 6-7 Гц оказывается оптимальным; — использование вибрато уменьшает требования к точности настройки интервалов и помогает скрыть биения ( к которым слух очень чувствителен), возникающие при неточной настройке голосов; — применение вибрато повышает помехозащищенность голоса, поскольку, как показали результаты исследований, максимальная чувствительность слуха к частотно-модулированным сигналам со- впадает с областью 5-7 Гц, а это позволяет лучше выделять этот сигнал на фоне помех; — вибрато повышает разборчивость звуков, особенно при пе- нии в высоких диапазонах, поскольку смещение обертонов по ча- стоте, как было отмечено выше, приводит к увеличению или уменьшению их амплитуд в зависимости от их позиции по отноше- нию к формантным частотам, что помогает также идентифициро- вать формантные области (а именно они служат основой распоз- навания звуков). Таким образом, выбор частоты модуляции в диапазоне 5-7 Гц оказывается наилучшим образом согласованным с возможностями слуховой системы (с одной стороны, максимальная чувствитель- ность к этой области частот модуляции развилась у нее, по-види- мому, в процессе восприятия речи; с другой стороны, именно эти
Акустика музыкальных инструментов. Акустика речи и пения 437 частоты модуляции легче всего могут быть реализованы мышеч- ным аппаратом человека) [90,91]. Использование модулированных (меняющихся во времени) зву- ков свойственно практически всем видам исполнения, поскольку они учитывают особенность организации слуховой системы чело- века, в которой при монотонном исполнении выключаются ней- роны, реагирующие на изменение звуковых сигналов (нейроны «новизны»), и у слушателя теряется интерес к исполнению, т. е. модуляция сигналов поддерживает его внимание. Следует отметить, что поскольку вибрато и тремоло являются средствами для выделения голоса (привлечения к нему внимания), то использование его в хоровом пении нежелательно (это наруша- ет слаженность ансамбля). В целом наличие модуляции в голосе является дополнительным средством художественной выразительности. Регистры: специфической особенностью вокальной речи явля- ется использование различных певческих регистров (в обычной речи они используются только в случаях крайних эмоциональных состояний). В идеале голос должен производить все доступные ему высоты без переломов и резких изменений в тембре, но это не всегда достижимо. По поводу определения и классификации регистров в научной литературе имеются противоречивые сведе- ния; наиболее распространенным является следующее определе- ние: «Регистр — фонационный ряд частот, в котором все звуки звучат одинаково по тембру (при этом, по-видимому, они и созда- ются подобным образом)» [12, 91, 100, 103]. Переход от одного ре- гистра к другому отражает изменения в фонационной технике, т. е. изменения взаимодействия мускулов гортани и голосовых свя- зок. Смена регистров ощущается как сдвиг в фонационной часто- те (высоте тона) и как изменение тембра. При этом происходит и изменение других акустических характеристик звукового сигнала (изменение формы спектральной огибающей, структуры атаки и спада и др.). Для классификации и названий регистров в разных вокальных школах используются совершенно разные понятия. В итальянской школе [12], например, выделяется три регистра: грудной (chest), средний (middle), головной (head) в женском голосе или грудной (modal, normal), головной (head) и фальцет (falsetto) в мужском голосе, со звуковысотными диапазонами, показанными на рис. 4.6.36. Обычно принято считать, что механизмы голосообразования сильно различаются в нижних («тяжелых») и верхних («легких») ре- гистрах; средние регистры комбинируют качества их обоих. Отдельные регистры перекрываются по частоте. Например, в женских голосах области перекрытия: грудной — средний (chest — middle) 400 Гц, средний — головной (middle — head) 660 Гц. В мужских голосах первая зона перекрытия 200-350 Гц.
438 Глава 4 С = 128 Гц Сопрано[ С = 256 Гц C = 512 Гц C= 1024 Гц F# 1 Альт (меццо-сопрано): РЖ- Контральто [ EkBl РР# ВС EkBl A EkBi C#D Тенор Баритоне BC Бас [ F# ABI» EkBl JZ G Ak C# D Первый регистр Второй регистр Третий регистр Четвертый регистр Рис. 4.6.36. Диапазоны певческих регистров Механизм образования регистров лежит в изменении свойств голосового источника (гортани и голосовых связок). На колебания связок оказывают влияние аэродинамические факторы (величина подглоточного давления), мышечные факторы, зависящие от на- тяжения основных видов мышц: вокальных, щитовидно-перстневид- ных, щитовидно-черпалобидных и др., а также упруго-механические свойства всех трех слоев самих голосовых связок (см. разд. 4.6.1). Частота фонации зависит от натяжения (T) и массы (т) связок (см. раздел 4.6.1), поэтому при пении на низких частотах связки расслабленные, толстые и короткие, а на высоких — тонкие, длин- ные и напряженные. Повышение основной частоты почти линейно связано с удлинением связок. Можно выделить два вида натяжения в голосовых связках — внутреннее и внешнее, при изменении которых происходит изме- нение массы, упругости и общей формы связок, т. е. их длины, толщины, ширины и т. д. Внутреннее натяжение определяется сжатием вокальных мышц, находящихся непосредственно внутри голосовых связок; при этом связки становятся короче и жестче, за счет чего меняется фундаментальная частота их колебаний. Внешнее натяжение происходит за счет мышц, которые обеспечивают при вращении щитовидного хряща относительно перстневидного (рис. 4.6.3) натяжение и удлинение голосовых связок. Взаимодействие этих двух видов мышц, а также мышц, которые сдвигают и раздвига- ют черпаловидные хрящи на концах голосовых связок, обеспечи- вает как изменение фундаментальной частоты, так и изменение тембра звучания, т. е. переход к разным регистрам.
Акустика музыкальных инструментов. Акустика речи и пения 439 В «тяжелых» и «легких» регист- рах механизм взаимодействия мышц гортани и, соответственно, формы колебаний голосовых связок суще- ственно различаются. В грудном регистре вокальные мышцы активны, они делают связки толстыми и короткими, натяжение связок при этом сравнительно низкое: — связки колеблются целиком, всей массой и плотно прилегают друг к другу (закрытие и открытие вокальных связок начинается у их нижней поверхности), пока сила давления не разомкнет их по всей толщине, при этом вдоль толщины связок возникает волна смещения; — длительность их смыкания превосходит время размыкания (форма воздушных импульсов при колебаниях связок в разных регист- рах показана на рис. 4.6.37); — периодические резкие толчки воздуха дают полный звук, богатый обертонами, амплитуда которых сла- бо убывает с частотой; — энергия, подводимая от лег- ких, довольно эффективно преоб- разуется в звуковую энергию (т. е. КПД преобразования энергии отно- сительно высокий); при этом потребляемый объем воздуха до- статочно большой; — моды колебаний связок в этом регистре показаны на рис. 4.6.38а, б, в. Как видно из рисунков, в связках возникают разные формы (моды) колебаний в трех разных плоскостях (полуволновый резонанс в горизонтальной плоскости, полуволновый — в верти- кальной плоскости, четвертьволновый — вдоль толщины связок); — при таком звуке на передней стенке грудной клетки происхо- дят сильные вибрации, поэтому его называют «грудным». Пока вокальные мышцы активны, голос держится в модальном грудном регистре; когда начинает ослабевать напряжение вокаль- ных мышц, голос начинает переходить в легкие регистры. Легкий регистр (фальцет, головной) — в нем голосовые связки колеблются иначе: — внутренние вокальные мышцы расслаблены, натяжение определяется в основном внешними мышцами, связки длиннее Голос с придыханием (68 дБ) Поднятая гортань (70 дБ) g Грудной регистр (71 дБ) s a 1 о Фальцет (73 дБ) Опущенная гортань (82 дБ) А t, MC Рис. 4.6.37. Модуляция потока воздуха в различных регистрах для t = 10 мс
440 Глава 4 (примерно на 30%) и тоньше, меньше масса на единицу длины; — продольное напряжение в связках сравнительно высокое, причем во всех трех слоях; амплитуда их вибраций до- вольно мала, в колебаниях принимает уча- стие только внешняя кромка связок, голо- совая щель сужается-расширяется, происходит только ослабление-усиление струи воздуха, а не полное ее прерывание, как при грудном регистре (рис. 4 6 376); — закрытие голосовой щели короткое и неполное из-за большого натяжения связок (в течение более чем 70% цикла они остаются открытыми). Это приводит к изменению модуляции воздушного пото- ка и более дыхательному качеству голоса; — в фальцетном регистре голос небо- гат обертонами; соответственно, тембр его беден; — конверсия воздушной энергии в зву- ковую менее эффективна, и звуки получа- ются не такими громкими; — формы колебаний связок в этом ре- гистре показаны на рис. 4.6.386 в гори- зонтальной плоскости полуволновый ре- зонанс, по толщине резонанс отсутствует, в вертикальной плоскости — тричетверти- волновый резонанс (вид сбоку). Колебаний грудной клетки почти нет. При дальнейшем повышении звука голосовая щель укорачивается и подвига- ется к передней половине голосовых связок (ближе к черпаловид- ным хрящам), при этом задняя половина связок остается плотно сжатой и в колебаниях не участвует (связки имеют вид Y). Та- кие частичные колебания связок возможны благодаря особому строению голосового мускула. В этом диапазоне частот начина- ют превалировать аэродинамические факторы, мускулы уже не могут сокращаться при дальнейшем повышении тона Воздух, проходя мимо сильно напряженных связок, создает турбулентный шум (поэтому иногда эту часть диапазона называют свистящим регистром). Певцы редко пользуются только грудным или только фаль- цетным регистром и избегают быстрых переходов от одного к другому. Одним из средств незаметного перехода от грудного регистра к фальцетному служит механизм смешанного голоса Грудной регистр Фальцет а в Рис. 4.6.38. Формы колебаний голосовых связок в грудном регистре и в фальцете: а — вид сбоку в верти- кальной плоскости, б — вид сверху, в — вид сбоку в плоскости колебаний
Акустика музыкальных инструментов. Акустика речи и пения 441 (средний регистр), когда характерное для грудного регистра напря- жение вокальных мышц начинает ослабевать и заменяется посте- пенно увеличивающимся напряжением внешних растягивающих мышц. Протяженность этого регистра зависит от типа голоса (рис. 4.6.36). Таким образом, смена регистров — сложный процесс, связанный в первую очередь с изменением свойств голосового ис- точника (формой колебаний голосовых связок, изменением взаимо- действия различных мышечных структур гортани, формой модуля- ции воздушного потока и др.), который требует отработки при постановке голоса. АКУСТИЧЕСКИЕ ХАРАКТЕРИСТИКИ вокальной речи (пения) в свя- зи с перечисленными выше особенностями звукообразования от- личаются от характеристик обычной речи: — диапазон воспроизводимых частот для основных (фонаци- онных) частот зависит от типа голоса: бас — 82,4 Гц (Е2)- 329,6 Гц (F4); баритон — 110 Гц (А2)-415,3 Гц (G>4 ); тенор — 130,8 Гц (С3)-523,25 Гц (С5); меццо-сопрано — 207,7 Гц (АЗ)- 932,3 Гц (В5); сопрано — 261 Гц (С4)-1046,5 Гц (С6); колоратур- ное сопрано — 61,6 Гц (С4)-1318,5 (Е6). Следует учитывать, что это среднестатистические данные, при этом имеются значительные индивидуальные различия. Диапазон частот с учетом обертонов расширяется до 8-10 кГц [12, 90, 91, 100]; — динамический диапазон при пении значительно шире, чем для обычной речи. Оперные певцы могут развивать уровни звуко- вого давления до 100 дБ/м и даже до 120 дБ/м [100]; при том, что давление в гортанной полости может достигать значений 2-3 кПа, КПД увеличивается. Динамический диапазон при этом расширяется до 70 дБ. В среднем динамический диапазон для вокальной речи составляет 50-60 дБ; — переходные процессы существенно зависят от вида атаки («жесткая» или «мягкая») и способа звукообразования. В среднем время атаки может изменяться от 30 до 300 мс; — характеристика направленности изменяется с увеличением частоты аналогично изменению для речевого сигнала (рис. 4.6.22); — тембр вокальной речи обладает огромной эмоциональной выразительностью и возможностями. Влияние эмоционального содержания на акустические парамет- ры речи и пения будет рассмотрено в следующем разделе. 4.6.6. Связь акустических параметров с эмоциональной выразительностью речи и пения. Обратная связь. Эффект Томатиса Как уже было отмечено выше, речевой (вокальный) звуковой сигнал предназначен для передачи не только смысловой (вербаль- ной), но и эмоционально-эстетической (невербальной) информации
442 Глава 4 [91-96, 100]. При восприятии слухом речи (или пения) информа- ция как о смысле речи, так и о ее эмоциональном содержании поступает из анализа акустических характеристик (иногда только из одних акустических характеристик, например при прослушивании звукозаписей или речи по телефону). Следовательно, эмоции коди- руются определенными акустическими параметрами в речевом сиг- нале. Понимание этих особенностей акустического кодирования эмоций не только важно для исполнителя, но принципиально для звукорежиссера, поскольку, управляя акустическими характеристика- ми, он может сделать речь или пение более эмоционально вырази- тельными. Поэтому изучению вопросов, каким образом эмоциональ- ная информация закодирована в акустических характеристиках речевого сигнала, уделяется много внимания [12, 90-96, 100,108]. Общие результаты, полученные в процессе изучения речи и пе- ния, показывают, что основными акустическими средствами пере- дачи эмоциональной информации являются: динамический спектр (тембр голоса); изменение фонационной частоты речевого сигна- ла во времени (интонация); энергетические характеристики звуко- вого сигнала и их временные изменения (вариации громкости); темпо-ритмические свойства речи, индивидуальные особенности произношения и др. Общеизвестно, что при сильном стрессе (горе, ярости, страхе и др.) меняются тембр голоса (вплоть до его пол- ного пропадания), ритм, темп и интонация речи. Измерения основных акустических характеристик речевого сиг- нала при выражении различных эмоций (с помощью анализа спек- трограмм, записанных в основном при чтении актерами текстов с различным эмоциональным содержанием) позволили выявить следующие закономерности [91, 100]: — важнейшим средством выражения эмоциональной информа- ции является динамика изменения основной частоты фонации (в европейских языках она не носит смыслоразличительного харак- тера). Результаты измерений сдвигов фонационной частоты при выражении разных видов эмоций показаны на рис. 4.6.39. Общие выводы из измерений могут быть сделаны следующие: среднее значение частоты фонации поднимается при выражении радости и понижается при печали. Величины средних значений частоты фонации (для разных видов эмоций) находятся в следующих соотношениях: / печаль < f нейтраль < f страх < f ярость. На- пример, как следует из представленных результатов, если частота фонации при нейтральной речи была 120 Гц, то при «печали» она снижается до 100 Гц, при «ярости» поднимается до 200 Гц и т. д. Кроме того, меняется и характер изменения частоты фона- ции: при нейтральной речи изменение частоты плавное, при «ярости» имеются высокие отдельные пики, при «страхе» наблю- даются быстрые всплески и спады, резкие контрасты. Пределы изменения частоты фонации наименьшие для «печали» и наи- большие для «страха»;
Акустика музыкальных инструментов. Акустика речи и пения 443 Голос А Голос В Голос С А Рис. 4.6.39. Сдвиг частоты фонации при разных эмоциональных состояниях: S (sorrow) — печаль, N (neutral) — нейтраль, F (fear) — страх, A (anger) — гнев — темпо-ритмические характеристики речи существенно изме- няются — число произносимых звуков в секунду в среднем оказы- вается равным: - 4,3 — для нейтральной речи, - 4,2 — для яро- сти, - 3,8 — для страха; - 1,75-1,9 — для печали, т. е. темп речи замедляется. Статистические данные показывают, что изменение среднего темпа речи связано и с возрастными изменениями: в группе 17-25 лет — - 3,52 слога в секунду, в группе 38- 45 лет — - 3,44, в группе старше 75 лет - 2-2,5 слога, так что этот параметр несет информацию не только об эмоциональном состо- янии, но и о возрасте говорящего при «гневе» и «страхе»; — при «гневе» и «страхе» стабильность речевого потока нару- шается, имеются сильные флюктуации основной частоты фонации, усиливается негармоничность спектра звукового источника; — долговременный среднестатистический спектр, содержащий информацию о распределении обертонов в частотном диапазоне, также изменяется. Наибольшее число обертонов в спектре имеется при выражении «ярости», а наименьшее — при выражении «печали» (голос слаб и надтреснут). По-видимому, «ярость» связана с более высоким подглоточным давлением и, соответственно, с более высо- кой активностью мышц сведения, — при этом связки не только бы- стрее колеблются, но и смыкаются с большей силой; при «печали» происходит обратный процесс. Кроме того, при «ярости» первая фор- манта сдвигается за счет напряжения мышц голосового тракта. Особенностью кодирования эмоциональной информации в речи является взаимодействие различных акустических средств, т. е. происходит не только изменение спектра (тембра) голоса, но и характерное для каждого вида эмоций изменение высоты, ин- тенсивности, темпо-ритмических характеристик. Например, эмоции печали характеризуются замедлением темпа, падением силы и звонкости голоса, удлинением процессов нарастания и спада звуков и т. д. Вышеуказанные результаты были не только получены с помощью актеров, читавших тексты с разным эмоциональным содержанием, но также проверены в реальных ситуациях [100].
444 Глава 4 Спи, ди тя мо е... Вокальное искусство предназначено прежде всего для передачи эмоционально-эстетической информации, и поэтому в вокальной речи связь акустических характеристик с эмоциональной выразительно- стью оказывается более значительной. Все имеющиеся в вокальной речи (пении) дополнительные акустические средства — большая сила голоса, увеличение диапазона воспроизводимых частот, особый спектральный состав с высокой певческой формантой, применение вибрато и тремоло и др. — используются для передачи различных эмоциональных состояний. Измерения объективных акустических характеристик в певческом голосе при выражении различных эмоций показали следующие ре- зультаты [12, 90-96, 100, 103, 127]: — анализ мелодического рисунка фразы, спетой с разными эмоциями (уровнеграмма представлена на рис. 4.6.40), показывает, что при «радости» наблюдается ин- Радость тонационный подъем звука за счет JiILil высокочастотных составляющих; при «гневе» видны резкие звуко- W 1 il М* 1 высотные скачки; при «страхе» J 1л\Уп/гА-/'Н^ мелодический рисунок выглядит наименее устойчивым и точность интонирования уменьшается. Как видно из этих результатов, эмоцио- нальное содержание оказывает чрезвычайно существенное влия- ние на динамические параметры акустического сигнала; — изменение характеристик амплитудной и частотной моду- ляции (тремоло и вибрато) в пев- ческом голосе, показанное на рис. 4.6.41, позволяет установить, что амплитуда модулирующего сигна- ла при «безразличии» уменьшает- ся, при «радости» и «гневе» воз- растает. При «страхе» нарушается периодичность вибрато. Наимень- шая модулирующая частота при «горе» равна 5-6 Гц; при «радо- сти» и «гневе» она увели- чивается до 6-6,5 Гц; при «стра- хе» может возрасти до 8 Гц, что создает эффект дрожания голоса. Таким образом, частота и глубина амплитудной и частотной модуля- ции в голосе также служат сред- ством выражения эмоций; Спи, ДИ_ тя МО е... Безразличие Спи, ди_тя мо_ Гнев Спи, ди__тя мо_е... Страх Спи, ди_тя мо_е... Рис. 4.6.40. Мелодический рисунок вокальной речи с разным эмоциональным содержанием
Акустика музыкальных инструментов. Акустика речи и пения 445 294 /,Гц 294f M Радость Горе Спи, ди_тя мо_е... /VWl Спи, ди_тя мо_ е.. I Безразличие Страх * Гнев Спи, ди_тя мо_е... Спи, дитя мое... Спи, дитя мо_е... Рис. 4.6.41. Изменение параметров вибрато и тремоло при различных эмоциях — интегральные спектральные характеристики вокальной речи (т. е. спектрограммы, снятые и усредненные для фраз, пропетых с разным эмоциональным содержанием), показанные на рис. 4.6.42, позволяют выявить изменение распределения энергии в спектре голоса и сдвиг певческих формант. Рис. 4.6.42. Интегральные характеристики вокальной речи при разных видах эмоций
446 Глава 4 При «радости» частотный максимум, соответствующий певче- ской форманте, сдвигается в более высокую частотную область; на слух это воспринимается как легкое светлое звучание. При «гне- ве» частота максимума высокой певческой форманты сдвигается вниз; это, по-видимому, определяет «потемнение» голоса. При «страхе» и «горе» интенсивность высоких частот снижается, и ам- плитуда высокой певческой форманты уменьшается; при крайнем выражении страха спектрограмма теряет свои вокальные черты и приближается по свойствам к речевому сигналу — теряется блеск, звонкость, голос становится глухим, сдавленным. Обработка статистических данных позволила построить сред- ние зависимости основных акустических параметров вокальной речи от различных типов эмоционального состояния (рис. 4.6.43) [100]. Как видно из представленных результатов, уровень звуко- вого давления достигает максимальных значений при «гневе» (до 100 дБ); измерения атаки и спада звуков показывают, что наибо- лее значительно время спада удлиняется при «горе», достигая значений ~ 600 мс, при этом длительность слогов увеличивается дБ S 100- § 95 cq I « 9Q I пТЙ и 9 H Ь N мс 1200 800- 400- мс 800- 500 _ §400- <i> PQ 400 200 0 % &15 И g Юг- 5- N А Л' J Ж А L: N Рис. 4.6.43. Графики зависимости основных акустических параметров (уровня звукового давления, времени атаки и спада, длительности слогов, длительности пауз) от вида эмоций: J — радость, S — печаль, N — нейтраль, А — гнев, F — страх
Акустика музыкальных инструментов. Акустика речи и пения 447 до 1240 мс; изменяется длительность пауз, наибольшее возра- стание происходит при «страхе» на 12,6%. Эмоции в вокальной речи также кодируются сразу несколькими акустическими параметрами. При этом был получен интересный результат: для выражения «страха», «гнева» и «горя» используется наибольшее число информативных признаков, для выражения «радости» наименьшее (поэтому первые виды эмоций лучше раз- личаются на слух). Выполненные за последние годы под руководством профессо- ра В. П. Морозова исследования [90] показали также, что и такой параметр, как негармоничность спектра, может служить характер- ным признаком эмоционального содержания пения: для пения с преобладанием положительных эмоций (преимущественно у пев- цов академического жанра) спектр голоса сохраняет гармонич- ность обертонов (отклонения не превышали 0,1-3%); для пения с отрицательными эмоциями (гнев, страх и др.), например для рок- певцов, отклонения от гармоничности достигают 4-9% (рис. 4.6.44). Таким образом, практически любой из акустических парамет- ров вокального звука (интенсивность, частота, структура спектра, параметры вибрато и тремоло, переходные характеристики и др.) и их сочетания могут использоваться для передачи эмоци- ональной информации. В результате исследований [91] было высказано предположение о тесной корреляции между видимыми движениями тела при эмо- циональных состояниях и невидимыми движениями артику- ляционных органов при этом (например, движением гортанных хрящей, голосовых связок и др., которые участвуют в регуляции высоты тона). Каждая эмоция имеет свой образец («pattern») дви- жения, который отражается в движении всего тела, мимике лица и, в том числе, в движении артикуляционных органов и голосо- вого источника. Например, при депрессии и печали все мускулы U У I U I J L дБ' I к L L Д J v I La I.; j 21 {, Л . \ j а А [J Ii L j \1 L 1Ц I 1 id Ai L Гц а б Рис. 4.6.44. a — спектр для классического пения, б — для рок-пения
448 Глава 4 пассивны, движения замедлены и т. д., при этом снижается темп речи, понижается фундаментальная частота, снижается активность дыхательных мускулов, поэтому снижается подглоточное давление, уменьшается число обертонов и т. д. Наоборот, при гневе уровень частоты фонации высокий, звук от голосового источника богат обертонами, темп быстрый, это отражает большую активность всех видов мускулов, участвующих в голосообразовании. Наличие внут- ренней закономерной связи между характером звука голоса, выра- жающего ту или иную эмоцию, и физиологическим состоянием организма, испытывающего это эмоциональное состояние, по-ви- димому, является физиологической базой универсальности основ- ных средств выражения эмоций голосом (при речи и пении). Было установлено, что слушатели правильно идентифицируют эмоции в речи (и пении) независимо от понимания языка, текста и нацио- нально-культурной среды (в Азии, Африке, Америке и др.). Таким образом, способы выражения эмоций являются общечеловечески- ми, т. е. можно предположить, что существует некий единый эмо- циональный код. Обратная связь. Эффект Томатиса Любой лектор, певец, артист прекрасно ощущает, как по-разно- му звучит его голос в различных условиях: в маленькой сильно заглушённой аудитории, большом зале, на открытом пространстве и т. д. Естественно, он произвольно или непроизвольно подстраи- вает свой голос под окружающие условия; однако опытный певец и артист может сохранять основные свойства своего голоса (тембр, звуковысотные соотношения и др.) в самых разных окру- жающих условиях — иначе голос бы менялся до неузнаваемости и петь и говорить в изменяющихся условиях шумов и акустической обстановки было бы практически невозможно. Таким образом, существуют механизмы, которые позволяют певцу, лектору и др., с одной стороны, все время контролировать окружающую обста- новку, с другой стороны — поддерживать постоянство акустических параметров (до определенной степени) своего голоса. Изучение этих механизмов чрезвычайно важно как для исполнителей (осо- бенно это актуально в настоящее время, когда исполнителю при- ходится выступать в больших залах с системой звукоусиления или записывать свой голос в студиях звукозаписи, — см. гл. 5), так и для звукорежиссеров, поскольку, осуществляя запись голосов в разной акустической обстановке, они должны понимать, насколь- ко может сохраняться стабильность акустических параметров голо- са. Анализ системы обратной связи, с помощью которой исполни- тель получает информацию о свойствах собственного голоса (громкости, точности интонирования, тембре и др.), каковые он и передает слушателю в различной акустической обстановке, является важнейшей задачей в ходе оценки качества пения и речи. Отсутствие обратной связи о звучании голоса или ее
Акустика музыкальных инструментов. Акустика речи и пения 449 неверная интерпретация могут испортить исполнение, именно поэтому системы организации обратной связи и их правильное восприятие служат предметом многочисленных исследований [91, 96, 99, 100, 106, 108, 113]. Когда певец (или оратор) находится в помещении, то к нему, как и к другим слушателям в зале, приходят как прямые звуки его го- лоса, так и отраженные сигналы. Если певец находится на сцене, то структура отраженных звуков существенно отличается от их структуры в зрительном зале, поскольку сцена представляет собой большое сильно поглощающее пространство из-за наличия деко- раций, — поэтому акустика присценической части зала должна быть спроектирована таким образом, чтобы часть отраженных зву- ков обязательно попадала к исполнителю (см. гл. 5). Ситуация зна- чительно усложняется, когда певец поет в зале, где есть система звукоусиления, — там в его слуховой аппарат поступает информа- ция не только об отраженных звуках его голоса, но и о звуках, из- лучаемых установленными в зале громкоговорителями. Как известно из практики, ощущение собственного голоса зна- чительно отличается от восприятия его другими людьми. Он име- ет другую тембральную окраску и воспринимается более низким. Собственный голос в записи обычно трудно узнать, необходимо к нему привыкнуть. Существует две причины этого явления. Первая: высокие частоты обладают узкой характеристикой направленности и поэтому не достигают ушей; разница в уровнях звукового давле- ния, записанных около ушей и около рта исполнителя, на низких частотах равна нулю, а на высоких достигает 15 дБ. Только при на- личии сильно отражающих поверхностей (твердых стенок) можно услышать в собственном голосе высокие частоты. Поэтому ощуще- ние тембра собственного голоса зависит от отделки помещения (наличия ковров, занавесей), степени заполненности слушателями и др. Вторая причина состоит в том, что звуковой сигнал, образу- ющийся при фонации (т. е. за счет колебаний голосовых связок), достигает слухового аппарата не только по воздуху. При фонации в гортани развиваются очень большие уровни звукового давления (до 3-5 кПа) [100 ]. Звук достигает слухового анализатора (органа Корти — см. гл. 3) за счет проводимости костей головы и тела и проводимости мышц; при этом значительная часть энергии погло- щается. Затухание высоких частот в плотных тканях выше, чем в воздухе, поэтому высокие частоты таким путем не поступают к слу- ховому анализатору. Следовательно, информации только от слухового анализатора о звучании собственного голоса и его акустических характеристи- ках оказывается недостаточно, хотя она и служит главной опорой для точного звуковысотного интонирования. Как показывает прак- тика, опытные певцы могут достаточно точно петь и без опоры на свой слух (например, при достаточно сильных шумах, высоком
450 Глава 4 уровне аккомпанемента или других условиях). Следовательно, кро- ме информации от слуха, исполнитель опирается еще и на другие пути получения информации о качестве собственного голоса. Как показали исследования [91, 100], существует два основных канала получения информации о качестве собственного голоса: первый — через слуховой анализатор, второй — через специаль- ную систему вибро- и барорецепторов, т. е. специальных нервных клеток, расположенных в мышечных тканях, чувствительных к виб- рациям и изменению давления. Этот второй канал обратной связи не зависит от акустики помещения. Частотный диапазон воспринимаемых человеком вибраций — 35-8000 Гц, при этом максимум чувствительности находится в области 200-300 Гц (в от- личие от слуха, где максимальная чувствительность находится в области 2-3 кГц). Амплитуда улавливаемых вибраций примерно 1 мк, точность до 2-8%. Как уже было рассмотрено выше, при речи и пении возникают резонансы в речевой, носовой полости и глотке, которые и опре- деляют формантные области различных звуков [90, 91, 100, 126, 127]. Кроме того, резонансы возникают в трахее с крупными брон- хами (т. е. в дыхательном аппарате), а также в верхних отделах го- ловы: лобных, гайморовых пазухах и др. При этом появляются вибрации стенок резонаторов, которые улавливаются многочислен- ными нервными клетками (виброрецепторами), расположенными на их внутренней поверхности, и параллельно со слухом переда- ют в мозг информацию о работе артикуляционных органов, т. е. о технологическом процессе образования звуков. Благодаря этому исполнитель может в определенной степени управлять настройкой резонансов, изменяя объем и форму соответствующих полостей. Кроме этого, происходит передача вибраций при колебаниях голо- совых связок через плотные ткани. Поэтому при речи (и особенно при пении) вибрации появляются и на внешних поверхностях тела, особенно в области гортани. Исследования спектров вибраций, выполненные с помощью специальных контактных вибродатчиков [90, 91], показали, что на грудной клетке сильно выражены вибрации в области частоты основного тона (низкой певческой форманты), а в носовой части — в области высокой певческой форманты (рис. 4.6.45). Выполнен- ные измерения позволили установить, что интенсивность вибраций у квалифицированного певца выше, чем у неквалифицированного. На основе вибрационных ощущений могут регулироваться такие параметры звука как интенсивность, длительность, а также частот- ные и даже тембровые особенности звука голоса. Следует отме- тить, что вибрации в известных пределах также стимулируют ра- боту голосового аппарата. Однако вибрационные раздражения большой силы и продолжительности могут вызвать и обратный эффект, т. е. падение тонуса голосового аппарата, что иногда
Акустика музыкальных инструментов. Акустика речи и пения 451 НПФ Рис. 4.6.45. Частот- ная характеристика вибраций при речи 3 4 5678 11 встречается у представителей «речевых» профессий: артистов, лекторов, педагогов и т. д. Ощущение вибрации еще недостаточно для создания хорошей фонации (поскольку связь между ними сложная и неоднозначная). Певец, актер и оратор всегда должны пользоваться и другими кри- териями для определения качества своего голоса. Общая схема обратной связи показана на рис. 4.6.46. Из нее видно, что в про- цессе речи и пения используется сложный звуковой образ, полу- ченный с помощью информации от слуха, зрения, виброрецепто- ров, а также барорецепторов (т. е. информации об уровне внутреннего звукового давления) и мышечных рецепторов. Итак, воспринимаемый исполнителем звуковой образ склады- вается из акустического представления звука, а также из зритель- ной информации и информации о технологическом способе его образования. В последние годы в связи с развитием технологий мультимедиа все большее внимание в научных исследованиях уделяется проблемам комплексного аудиовизуального восприятия пространственного образа. Способность восприятия сложного звукового образа лежит в основе особого «вокального слуха». Вокаль- ный слух использует информацию не только от слухового анализатора, но и от зрительного и вибрационного анализаторов. Он связан не только со способностью различать музы- кальные (тембровые) оттенки, но и со способностью определять, какие группы мышц и в какой степени задействованы в пении, а также какие вибрационные ощущения возни- рис 4 6м 0бщая схема кают при этом. Таким образом, во- обратных связей [91] зрение — —< — слух Ц.Н.С голосовой аппарат — Ui проприо рецепция вибро- рецепция баро- рецепция
452 Глава 4 кальный слух — это сложное чувство, которое возникает в резуль- тате взаимодействия многих сенсорных систем. По определению, данному в книге профессора В. П. Морозова [90], «вокальный слух — это специфическая особенность певцов и вокальных педагогов, основанная на взаимодействии слуховых ощущений певческого голоса с мышечными, вибрационными, кожно-тактильными ощуще- ниями, а также зрительными ассоциациями и представлениями, сопровождающими процесс пения». Исследования эффектов обратной связи при речи и пении, вы- полненные в работах В. П. Морозова, Й. Сандберга и др. [90-92, 99, 100], проводились в основном по трем направлениям. Влияние шума на акустические характеристики голоса: при исполнении вокального произведения подавался достаточно силь- ный широкополосный шум через стереотелефоны (ситуация типич- ная, например, для современных эстрадных исполнителей, когда голос заглушается шумом музыкального сопровождения, шумом толпы и т. д.) и записывался голос исполнителя. Результаты изме- 0,8 дБ Рис. 4.6.47. Увеличение уровня громкости голосового сигнала при наличии шумов At, % AV= 17,2% 20 16 12 8 4 0 -4 N 4* =7,9% J i W N At, % 2Oh 16 12 8 4 0 -4 AC=I 5% 1 N Рис. 4.6.48. Увеличение длительности отрезков речи и пения при воздействии шумов
Акустика музыкальных инструментов. Акустика речи и пения 453 рений, представленные на рис. 4.6.47 и 4.6.48, показывают, что действие шума увеличивает громкость и длительность речи и пе- ния. Эффект непроизвольного увеличения громкости речи и пения при воздействии достаточно сильных шумов (с уровнем не менее 70 дБ) известен давно и получил название «эффект Ломбарда». Измерения показали, что у невокалистов при речи происходит увеличение громкости на 6,6 дБ (а), а у вокалистов при речи — на 2,8 дБ (б), при пении — на 0,8 дБ (в). Увеличение длительности заданного отрывка речи у невокалистов на 17,2%, у вокалистов при пении — на 1,5%. Таким образом, хотя действие шума при- водит к непроизвольному увеличению громкости и длительности речи и пения, опытные вокалисты обнаруживают гораздо меньшую подверженность влиянию шума (они продолжают петь достаточно уверенно; правда, тембр голоса изменяется на более плотный). Было отмечено, что высокочастотный и «белый» шум оказывают более сильное влияние на качество пения — по-видимому, пото- му, что они сильнее маскируют высокую певческую форманту, и ис- полнитель быстрее теряет контроль над ситуацией. Можно наме- тить два принципиально различных механизма изменения речевой функции человека при действии шума: изменение вследствие ут- раты слухового самоконтроля, т. е. в результате ослабления обрат- ной связи; изменение вследствие физиологического воздействия шума, приводящего к общему замедлению двигательной активно- сти человека, что и вызывает общее повышение громкости и за- медление темпа речи. Действие задержки сигнала на обычную и вокальную речь: для исследования влияния задержки звукового сигнала в процессе пения исполнителю через стереотелефоны подавалась задержан- ная вокальная речь (задержка примерно 200-300 мс) [91, 100]. Этот процесс моделирует влияние сильной реверберации в раз- личных помещениях прослушивания и воздействие задержанных сигналов при наличии системы звукоусиления. Результаты измере- ний показаны на рис. 4.6.49 и 4.6.50. Из них видно, что средняя сила голоса при обычной речи возрастает на 11,9 дБ (а), у про- фессиональных певцов при пении на 0,8 дБ (в). Изменение сред- ней длительности фразы также у вокалистов при пении значитель- но меньше (51% против 124%). При этом наличие задержанных сигналов приводит к значительной потере разборчивости в обыч- ной речи, при пении же у опытных исполнителей разборчивость су- щественно не ухудшалась. Интересно отметить, что добавление задержанных сигналов вызывает более значительные изменения акустических параметров речи, чем шумовые помехи. В основе этого лежат проблемы обработки слуховыми отделами коры корре- лированных (как в случае с задержанными копиями одного и того же сигнала) и некоррелированных (как в случае дополнительного
454 Глава 4 Аср AP,^ п 12 8 4 О ДРСп =11,9 дБ 12 АР, дБ ДРСр = 4,2дБ АР, дБ Дрср=0,8дБ а At =124% At,% А 120 80 40 At,% 120 80 40 At4,= 64% At,% 80 40 At =51% Рис. 4.6.49. Увеличение уровня сигнала при введении задержки на 200-300 мс Рис. 4.6.50. Увеличение длительности сигнала при введении задержки на 200-300 мс N N N шума) сигналов. В первом случае мозг решает значительно более сложную проблему распознавания собственной речи на фоне похожих помех. Во втором речь идет о распознавании разных сигналов с отличающимся спектром, с такой системой слуховой анализатор справляется значительно легче. По этой же причине как лектору, так и певцу очень трудно сохранять параметры голо- са в сильно реверберирующих помещениях. Влияние спектральных искажений в обратной акустической связи: определенное влияние на свойства вокальной речи оказы- вают спектральные искажения в канале обратной акустической связи. Этот эффект особенно важен в современных системах зву- козаписи, звуковоспроизведения, звукоусиления и др., когда певец слышит свой голос или через громкоговорители, или через стерео- телефоны со значительными спектральными искажениями, по- скольку любой излучатель вносит свои амплитудно-частотные ис- кажения. Опыты показали, что при искажении сигнала за счет обратной акустической связи в голосе певца возникают спектраль- ные изменения противоположного знака, т. е. изменения, направ-
Акустика музыкальных инструментов. Акустика речи и пения 455 ленные на компенсацию слышимых искажений тембра голоса. Именно так действует в норме любая адаптивная обратная связь, стабилизирующая деятельность многих функций организма. Однако наряду с подобного рода обратной связью наблюдают- ся явления противоположного характера, т. е. дополнительное уси- ление певцом тех спектральных составляющих в голосе, которые уже усилены обратной связью (это явление называется «эффек- том Томатиса»). Этот последний тип реакции певцов на спек- тральные искажения сигнала обратной связи, являющийся своего рода рефлексом самоимитации (самоподражания), обнаруживается достаточно часто. Например, если акустические колонки в систе- ме звукоусиления (или стереотелефоны при контроле записи) име- ют подъем АЧХ в определенной области частот, то исполнитель, получив такую информацию о своем голосе, может начать усили- вать именно эти частоты. В современной технике звукозаписи и звукопередачи, а также при пении на эстраде через систему звукоусиления этот эффект может приводить к разрушительным последствиям. Поэтому певец и оратор должен быть хорошо натренирован на исполнении в нормальных условиях, должен за- помнить все виды своих ощущений (двигательные, дыхательные, слуховые и т. д.) и уметь их поддержать. Для этого в современном музыкальном образовании используются компьютерные модели голосового аппарата, с помощью которых можно моделировать влияние акустики различных залов, шумов, реверберации и спек- тральных искажений на параметры речи и пения. Таким образом, результаты измерений показывают, что профес- сионально подготовленные певцы, актеры, ораторы и др. могут сохранять основные акустические характеристики (уровень звуко- вого давления, длительность, спектральный состав и пр.) своего голоса в известных пределах в любых акустических условиях, опи- раясь не только и не столько на информацию от своего слуха, сколько на внутренние ощущения (вибрационные, мышечные и пр.). Способность сохранять акустические характеристики голо- са при различных условиях может служить критерием профессио- нальной подготовленности исполнителя. 4.6.7. Акустика хорового пения Запись хорового пения является важным и достаточно слож- ным направлением в деятельности звукорежиссеров, поэтому ре- зультаты, полученные в исследованиях акустики хорового пения за последние годы, могут быть полезными в практике звукозаписи [130-134]. К хоровому пению предъявляются особые акустические тре- бования. К числу наиболее важных из них относятся: степень унисона, точность интервального интонирования и спектральная (тембральная) однородность.
456 Глава 4 Степень унисона определяет степень согласованности певцов хора по их фонационной частоте (основной частоте колебания свя- зок). Анализ записей хора с помощью спектрограмм, выполненный в работах Тёрнстрема [133, 134 ] для профессиональных хоров, показал, что разброс основной частоты фонации составляет в среднем 13 центов. Не менее важным критерием качества хорового пения являет- ся точность настройки интервалов. Как показали исследования [133], средние разбросы при настройке интервалов для професси- ональных хоров оказались равными значениям, приведенным в таблице 4.6.8. Таблица 4.6.8 Ширина интервалов (полутоны) Ширина чистых интервалов (центы) Средние размеры интервалов для четырех хоров (центы) Среднее отклонение от чистых интервалов (центы) 3 — минорная терция 316 275 -27 4 — мажорная терция 386 421 +25 5 — кварта 498 501 +3 7 — квинта 702 697 -5 8 — минорная секста 814 795 -21 9 — мажорная секста 884 905 +21 12 — октава 1200 1200 0 Из этих результатов следует, что совершенные, или консонант- ные, интервалы, такие как октава, квинта, кварта (см. гл. 3), име- ют почти точную настройку (разница 0, +3, -5 центов). Настройка менее консонантных интервалов (терция, секста ) имеет значи- тельно больший разброс (21-27центов). Интересно отметить, что при хоровом пении мажорная терция обычно настраивается не- сколько шире (+25 центов), минорная уже (-21 цент), чем чистый интервал, что отражает некоторую общую тенденцию увеличения контраста между мажором и минором. Исследования акустики хорового пения были направлены в первую очередь на то, чтобы выяснить, какие причины оказыва- ют влияние на точность унисона и точность настройки интервалов. Как показали результаты экспериментов, на точность интонирова- ния влияют прежде всего следующие факторы: соотношения в уровнях звукового давления между собственным голосом и голо- сами других певцов хора; спектральные характеристики окружаю- щих голосов и собственного голоса; выбор способа артикуляции, а также слуховое восприятие окружающего реверберационного процесса в помещении и др. Все это в целом определяет, как исполнитель слышит свой голос и голоса окружающих.
Акустика музыкальных инструментов. Акустика речи и пения 457 ПО 90 80 70 60 50 ч. _5~ P 10 20% Рис. 4.6.51. Гистограмма распределения уровней звукового давления в хоре Соотношения уровней звукового дБ давления собственного голоса и ок- 114 ружающих голосов: для определения распределения уровней звукового дав- ления (SPL) внутри хора были прове- дены измерения в различных секциях хора во время репетиций. Результаты измерений представлены в виде гис- тограммы (рис. 4.6.51), которая показы- вает процент распределения по време- ни уровней звукового давления. Из этих данных видно, что наибольшее время (более 20%) уровень звукового давления внутри хора составляет 80 дБ. Примерно 10% времени занимают звуки с уровнем более 90 дБ и меньше 70 дБ. Наконец, уровни более 100 дБ и менее 60 дБ составляют примерно 7%. Таким образом, большую часть времени исполнитель слышит голоса других певцов на уров- не 80 дБ и выше. При этом максимальные спектральные уровни находятся в частотной области 500-700 Гц. Поскольку для нормальной настройки исполнитель должен уве- ренно слышать собственный голос и голоса других певцов, то при неправильно выбранном со- отношении уровней соб- ственный голос будет маски- ровать другие голоса в достаточно широкой полосе частот — либо, наоборот, другие голоса будут заглу- шать собственный голос. Разность в допустимых уровнях между собственным голосом и голосами других певцов зависит от расстоя- ния между ними и уровня ре- верберации в помещении. На рис. 4.6.52 показано, как меняется эта разница в уровнях SPL для разного расстояния между исполни- телями (от 400 до 1500 мм) и для разного времени ре- верберации (от 0,5 до 10 с). Естественно, что при увели- чении расстояния между см между певцами 0,5 1 2 5 10 Время реверберации, с MM Конференц- Большая Большая Огромный зал церковь, пустая храм заполненная церковь людьми Рис. 4.6.52. Зависимость разницы в уровнях от расстояния между исполнителями
458 Глава 4 певцами слышимость своего голоса становится лучше, поэтому опросы участников хора показали, что они предпочитают более широкую расстановку в хоре при пении (интересно отметить, что более широкую расстановку предпочитают опытные певцы; менее опытные лучше чувствуют себя при более плотной расстановке хора). Время реверберации также играет существенную роль, посколь- ку уровень отраженной энергии в сильно реверберирующем поме- щении существенно выше, и слышимость собственного голоса из- меняется. В реверберационном процессе любого помещения можно выделить две стадии (см. гл. 5): ранние дискретные отра- жения, которые поступают к слушателю в первые 80 мс, и поздние сплошные отражения, спад которых на уровень 60 дБ определяет время стандартной реверберации. В специальной заглушённой ка- мере имитировались обе стадии реверберационного процесса, при этом выяснялось путем анкетирования, при каких параметрах ре- верберации певцам удавалось легче петь в хоре (в смысле точ- ности настройки, сохранения тембральной однородности и пр.). Оказалось, что при сильных ранних отражениях во временном интервале 15-35 мс (что соответствует расстоянию до ближайшей отражающей поверхности примерно 6,5-7 м) их влияние было оп- ределяющим, т. е. чем выше уровень этих отражений, тем легче петь в хоре. Существенную роль играет направление прихода пер- вых отражений; в частности, боковые ранние отражения оказыва- ются более значимыми, чем вертикальные. Если расстояние до ближайшей отражающей поверхности превышало 7 м, то решаю- щими факторами становились уровень и время второго этапа про- цесса реверберации. Эти результаты объясняют, почему позиция хора в помещении имеет такое большое значение. Значительно легче производить настройку хора в помещениях, где имеется достаточное количе- ство отражающих поверхностей, — тогда слышимость собствен- ного голоса повышается. Из этого следует, что настройка и ис- полнение хора в разных помещениях происходит по-разному. Например, было отмечено, что в сильно заглушённых помещени- ях певцы используют даже несколько другую систему артикуля- ции — с более высоким положением гортани. Для количественной оценки необходимой разницы в уровнях между собственным голосом и голосами других исполнителей был поставлен эксперимент, когда «опорный» уровень, т. е. суммарный уровень звукового давления от других певцов (звук подавался на стереотелефоны), менялся от 60 до 100 дБ, а певец должен был петь на постоянном уровне 90 дБ, который при этом контролиро- вался микрофоном. Певца просили спеть определенный интервал к опорному тону или точно повторить опорный тон. Эксперименты
Акустика музыкальных инструментов. Акустика речи и пения 459 центы 20 I I I I I I1F1' □ а : 15 □ *:п V I \о а 1 10 V ^<°Ч - у 5 I I I I I I I 62 70 80 90 100 дБ Рис. 4.6.53. Ошибки в настройке хора в зависимости от разницы в уровнях звукового давления были проведены на большом ко- личестве хоровых исполнителей. Результаты позволили количе- ственно оценить влияние разницы в уровнях звукового давления между собственным голосом и го- лосами соседей: когда опорный уровень составлял примерно 80- 90 дБ, т. е. был равен уровню го- лоса певца, ошибки в настройке были минимальными и составля- ли 5-8 центов. Когда опорный уровень был выше 90 дБ, певцы переставали слышать собствен- ный голос, ошибки возрастали до 20-25 центов; наоборот, когда опорный уровень становился меньше 65 дБ, т. е. собственный голос исполнителя заглушал голоса соседей, ошибка снова возра- стала и составляла больше 20 центов (рис. 4.6.53). Из этих экспе- риментов следует очень важный вывод: для слаженного пения пев- цы должны слышать голоса своих соседей примерно на том же уровне, на котором они поют сами. Исследования [134] показали, что допустимые различия между уровнем собственного голоса и уровнем голосов соседей не дол- жны превышать +6 дБ (обычно это выполняется для певцов в цен- тре хора от +1 до + 4 дБ). На краю хора разница повышается до +8 дБ и выше; следовательно, в центре хора точность настройки выше. Поэтому расстановка певцов в хоре, акустические характе- ристики помещения, в том числе структура и расположение отра- жающих поверхностей в зале, а также отработанная техника пения имеют решающее значение в слаженности звучания хора и точно- сти интонировки. Следующим важнейшим фактором, определяющим точность на- стройки при хоровом пении, являются спектральные характери- стики окружающих голосов и собственного голоса. При пении в хоре исполнитель должен все время ориентиро- ваться на информацию, которую он получает от окружающих го- лосов. Для того чтобы выяснить, какие именно факторы являются наиболее значимыми для точности настройки в спектральных характеристиках (а следовательно, и в тембре) окружающих голо- сов и собственного голоса, были проведены эксперименты, кото- рые показали, что к числу этих факторов можно отнести: наличие «общих» обертонов, присутствие высоких обертонов и отсутствие вибрато.
460 Глава 4 Певец 1 /о= 300 Гц Под «общими» обертонами по- нимается следующее: если одно- му певцу предложить взять опор- ный тон, например ноту ля первой октавы (частота 440 Гц), а друго- му взять второй тон, настроенный в квинту по отношению к первому (т. е. соотношение частот соста- вит 3 : 2), то второй тон имеет ча- стоту 660 Гц, а спектры обоих зву- ков находятся в отношениях, показанных на рис. 4.6.54, из ко- торого видно, что каждый третий обертон в этих спектрах совпада- Певец 2 /о = 200 Гц 0,2 ^6^1^j2; Общие обертоны 1,2 ♦2,O кГц Рис. 4.6.54. «Общие» обертоны при настройке интервалов ет. Такие обертоны называются «общими». Если интервал взят не- точно, то между этими обертонами возникают «биения» (если раз- ница частот между ними меньше 15 Гц), эти биения служат признаком неточности настройки интервалов для исполнителей. Поскольку низкие обертоны в окружающих голосах могут маски- роваться собственным голосом (в связи со спецификой его вос- приятия), то очень важным является присутствие высоких оберто- нов в звуках окружающих голосов (настройка тогда происходит по общим обертонам в высокочастотной части спектра). Наконец, в отличие от сольного пения, где использование виб- рато (частотной модуляции) помогает выделению голоса на фоне аккомпанемента и других голосов, при пении в хоре оно крайне нежелательно, т. к. его использование уменьшает вероятность возникновения биений между обертонами и поэтому уменьшает точность настройки в унисон или точность настройки интервалов. Для количественной оценки влияния этих факторов были по- ставлены эксперименты, когда в заглушённой камере через гром- коговорители подавался опорный тон, в котором можно было варь- ировать частоту и амплитуду обертонов. Исполнителя просили спеть относительно опорного тона второй тон в квинту или мажор- ную терцию. Оказалось, что отсутствие общих и высших оберто- нов, введение вибрато и т. д. значительно ухудшали точность на- стройки — от 15 центов для оптимального случая до 40 центов для наихудшего сочетания параметров. Одним из способов облег- чить настройку хора является выбор такой гласной (например, а, у, и...), у которой форманты совпадают с общими обертонами. Например, если надо настроить кварту с отношением тонов 300 Гц и 400 Гц, то общий обертон у них будет 1200 Гц, — это практически совпадает со второй формантой гласной а; если использовать эту гласную для настройки, то общий обертон суще- ственно усиливается, и настройка значительно облегчается.
Акустика музыкальных инструментов. Акустика речи и пения 461 1000 2000 5000 10000 Гц Рис. 4.6.55. Спектральные различия при сольном и хоровом пении При пении в хоре происходит некоторая подстройка положения формант. Поскольку они имеют ин- дивидуальный разброс, по-видимо- му, лучше всего звучат те хоры, где форманты исполнителей близ- ки друг к другу. Таким образом, различные спектральные характеристики го- лосов и фонем, выбранных для настройки, существенно влияют на способность певцов петь в уни- сон друг с другом. Исследования тембральных различий при пении в хоре и соло проводились на протяжении ряда лет различными исследователями [100, 134]. Были поставле- ны эксперименты, когда профессиональных певцов, хорошо владе- ющих техникой пения, записали при пении соло и в хоре. Оказа- лось, что спектральный состав их голосов отличался (рис. 4.6.55): при пении соло была сильно подчеркнута высокая певческая фор- манта и общий уровень верхних обертонов был выше, при пении в хоре певческая форманта была ниже по уровню, при этом уро- вень низших обертонов был поднят. При пении соло певцы актив- но использовали вибрато в среднем с частотой 5-7 Гц, при пении в хоре вибрато практически не применялось. Общий уровень гром- кости в сольном пении выше. В хоровом пении исполнитель подстраивает уровень громкости своего голоса под уровень других голосов. При этом голос звучит не только тише, но и «мягче», т. к. в нем заглушены верхние обер- тоны. При пении соло и в хоре исполнитель решает разные зада- чи: в первом случае ему необходимо выделить свой голос из дру- гих голосов, из аккомпанемента и т. д. и привлечь к нему внимание, для этого используются всевозможные приемы: высокая певческая форманта, вибрато, различные средства эмоциональной выразительности и т. д.; при пении в хоре необходимо добиться максимального слияния голосов, поэтому и по тембру и по уров- ню громкости исполнитель должен добиться нивелирования свое- го голоса среди других. Такие отличия в тембре голоса при пении в хоре и соло требуют некоторых различий в постановке голоса. Таким образом, на качество хорового пения, в первую очередь на точность настройки, влияют такие факторы как: разность в уровнях громкости своего голоса и голоса других исполнителей; стабильность фонационной частоты; наличие общих обертонов при настройке обертонов и степень близости к ним формантных частот; спектральный состав настраиваемых звуков и др. Все это
462 Глава 4 зависит от техники звукоизвлечения, а также от окружающей обста- новки, прежде всего таких акустических параметров помещения, как время реверберации, структура и уровень ранних отражений и др. Поэтому при выступлении или записи хора требуется реше- ние целого ряда акустических проблем: правильное размещение хора в помещении, выбор оптимального времени реверберации, наличие боковых отражающих поверхностей на определенном рас- стоянии (не более 7 м), расстановка певцов на оптимальном рас- стоянии внутри хора и т. д.
Акустика музыкальных инструментов. Акустика речи и пения 463 Контрольные вопросы 1. Привести международную классификацию музыкальных инстру- ментов. 2. Дать определение основных элементов музыкального инструмента: генератора, вибратора, резонатора. 3. Привести классификацию духовых музыкальных инструментов и указать их основные отличия. 4. Что такое «краевой» тон в лабиальных духовых инструментах, чему равна его частота? 5. Привести значения собственных частот и мод колебаний для от- крытых цилиндрических труб. 6. Описать роль и назначение боковых отверстий в лабиальных ин- струментах. 7. В чем заключается краевой эффект и как он учитывается при вы- боре длины резонаторов? 8. Описать основные элементы конструкции и механизм звукоизвле- чения флейты. 9. Привести акустические параметры флейты. 10. В чем заключаются различия конструкции вибраторов и резона- торов в тростевых и лабиальных инструментах? 11. Привести основные конструктивные особенности, механизм зву- коизвлечения и акустические параметры кларнета. 12. Дать описание конструкции и механизма звукоизвлечения двутро- стевых музыкальных инструментов (гобоя и фагота). 13. Описать отличительные особенности механизмов звукоизвлечения амбушюрных (медных) инструментов. 14. Привести акустические характеристики трубы, тромбона, валтор- ны, тубы. 15. Дать описание общей конструкции органа и системы звукообра- зования в лабиальных и язычковых трубах органа. 16. Привести акустические характеристики и особенности тембра органа. 17. Привести систему звукообразования и акустические параметры мембранофонов (литавры, барабаны и др.) 18. Дать описание системы звукообразования и акустические пара- метры идиофонов (ксилофон, маримба, тарелки, гонги и др.). 19. Привести особенности звукообразования и акустические харак- теристики колоколов. 20. Описать особенности конструкции, основные механизмы системы звукообразования и акустические параметры скрипки. 21. Привести описание конструкции, механизмов звукообразования и акустические параметры щипковых музыкальных инструментов (гитары, арфы).
464 Глава 4 22. Указать конструктивные особенности и принципы звукообразо- вания в фортепиано (процесс взаимодействия молоточка со струнами, особенности возбуждения струн, влияние деки и др.). 23. Привести акустические характеристики фортепиано. 24. Дать описание структуры голосообразующего аппарата, функции генератора, вибратора, резонаторов. 25. В чем заключается процесс фонации? Чему равна основная час- тота колебаний голосовых связок и что она определяет? Форма голосо- вых импульсов и их роль в определении тембра голоса. 26. Какие неголосовые источники акустического возбуждения исполь- зуются при образовании согласных звуков? 27. В чем заключается процесс артикуляции? Что такое форманты, какова их роль в распознавании звуков речи? 28. В чем различия в процессах звукообразования и акустических па- раметрах согласных звуков? 29. Дать классификацию звуков речи. Привести методы определения разборчивости речи. 30. В чем заключаются отличительные особенности механизмов зву- кообразования вокальной речи? 31. Что такое певческая форманта, какова ее роль в пении? 32. Способ образования и роль вибрато и тремоло в певческом голосе. 33. Указать связь акустических характеристик с эмоциональным со- держанием речи. 34. В чем заключаются эффекты обратной связи и эффект Томатиса?
Акустика музыкальных инструментов. Акустика речи и пения 465 Список литературы 1. Kostec В. Soft Computing in Acoustics. Heidelberg; N. Y.: Physica- Verlag, 1999. 2. Fletcher N. H, Rossing T. D. The Physics of Musical Instruments. N. Y.: Springer-Verlag, 1991. 3. Smith J. 0. Digital Waveguide Modeling of Musical Instruments. 2003. ht1p://www-ccrma.stanford.edu/~jos/waveguide/. 4. Encyclopedia of Acoustics / Ed. by M. Crocker. V. 1-4. N. Y: Jonh Wiley & Sons, 1997. 5. Музыкальные инструменты мира I Пер. с англ. Минск.: Энц., 2001. 6. Музыка. Большой энциклопедический словарь. M.: Большая Россий- ская Энциклопедия, 1998. 7. The New Grove dictionary of music and musicians I Ed. Sadie S. V. 1-20. London.: Macmillan Press. 1994. 8. Музыкальный словарь Гроува I Пер. с англ. M.: Практика, 2001. 9. Шаповалова О. Музыкальный энциклопедический словарь. M.: Ри- пол, 2003. 10. Музыкальная энциклопедия. M.: Сов. энциклопедия, 1981. Т. 1-6. 11. Кузнецов Л. А. Акустика музыкальных инструментов. Справочник. M.: Легпромбытиздат, 1989. 12. Rossing Т. D. The Science of Sound. N. Y: Addison-Wesley Publ., 1982. 13. Meyer J. Acoustics and the Perfomance of Music. Frankfurt.: Verlag das Musikinstrument, 1978. 14. Backus J. The Acoustical Foundation of Music. N. Y: W. W. Norton & Company, 1969. 15. Benade A. Fundamentals of Musical Acoustics. London.: Oxford University Press, 1995. 16. Olson H Music, Physics and Engineering. N. Y: Dover Publ., 1967. 17. Strong W., Plitnik G. Music, Speech, High-Fidelity. USA: Soundprint, 1983. 18. Hall D. Musical Acoustics. An Introduction. N. Y: Wadsworth Publ. 1980. 19. Eargle J. Music, Sound and Technology. N. Y: Van Nostrand Reinhold, 1995. 20. Howard D., Angus J. Acoustics and Psychoacoustics. G.-B.: Focal-Press, 2001. 21. http://hypeфhysics.phy-astr.gsu.edu./hbase/music/index.html 22. Музыкальная акустика/ Под общ. ред. Н. А. Гарбузова. M.: Гос. муз. изд-во, 1954. 23. Пирсон У. Оркестровка. M.: Советский композитор, 1990. 24. Чулаки М. Инструменты симфонического оркестра. M.: Музыка, 1972. 25. Барсова И. А. Книга об оркестре. M.: Музыка, 1978. 26. Рогаль-Левицкий Д. Р. Современный оркестр. Т. 1-4, M.: Муз. изд- во, 1956. Т. 1^.
466 Глава 4 27. Fletcher N. Н. Recent progress in the acoustics of wind instruments. Acoust. Sci. & Tech., 22, 3 (2001). 28. Морз Ф. Колебания и звук. M.: Гостехтеориздат, 1949. 29. Тризно Б. Флейта. M.: Музыка, 1964. 30. Отюгова Т., Галембо А., Гурков И. Рождение музыкальных инстру- ментов. Л.: Музыка, 1986. 31. Verge M., Causse R. and others. Jet oscillations and jet drive in recorder- like instruments)). Acta Acustica. V. 2, № 5, 1994. 32. Физика. Большой энциклопедический словарь. M.: Научное изд-во «БРЭ», 1999. 33. Благодатов Г. И. Кларнет. M.: Музыка, 1965. 34. Иванов В. Д. Саксофон. M.: Музыка, 1990. 35. Левин С. Духовые инструменты в истории музыкальной культуры. 1973. Ч. 1; 1983. Ч. 2. (http://www.gnesin.ru/teach/historywind.html) 36. Газарян С. С. В мире музыкальных инструментов. M.: Просвещение, 1989. 37. Klotz К Das Buch von der Orgel. N. Y.: Barenreiter, 1988. 38. Бакеева К К Орган. M.: Музыка, 1977. 39. Кравчун П. Н. Органы Бриндли и Фостера в России. M:. Ассоциация органистов России, 1999. 40. Кравчун П. К, Шляпников В. А. Органы Ленинграда и Ленобласти. M.: Прогресс, 1989. 41. ПроцюкД. Б. Исполнительское искусство органиста. СПб.: Компози- тор, 1997. 42. http://g23.relcom.ru/staff/ivl/Organs/Russia.htm 43. Витачек Е. Очерки по истории возникновения смычковых инстру- ментов. M.; Л.: Музгиз, 1952. 44. Cremer L., Allen J. The Physics of the Violin. Cambridge.: MIT Press, 1984. 45. Musical Acoustics, part 1 / Ed. by C. Hutchins. N. Y.: Wiley & Sons, 1975. 46. Musical Acoustics, part 2 I Ed. by C Hutchins. N. Y.: Wiley & Sons, 1976. 47. Galembo A. Russian (Soviet) Contribution to Musical Acoustics. JASA, 1996. V. 98. № 6. 48. Colin Gough. «Science and the Stradivarius». Physics World. April, 2000. 49. Research Papers in Violin Acoustics 1975-1993: With an Introductory Essay 350 Years of Violin Research. Vol. 1, 2. Ed. Hutchins C 1996. 50. Atwood W. A. Bridge Collection Examined. CAS Journal. Vol. 3, № 4 (Series II), 1997. 51. Hutchins C. The Air and Wood Modes of the Violin. JAES. V. 46. № 9., 1998. 52. Вольман Б. Л. Гитара. M.: Музыка, 1972. 53. Арзуманов С. Секреты гитарного звука. M.: Изд-ль Смолин, 2003. 54. Тэйлор Ч. А. Физика музыкальных звуков. M.: Легкая индустрия, 1976.
Акустика музыкальных инструментов. Акустика речи и пения 467 55. Язвинская Е. Арфа. M.: Музыка, 1968. 56. http://www.si.umich.edu/CHICO/MHN/pages/haф_gnrl.html 57. Маньковский В. С. Основы звукооператорской работы. M.: Искусство, 1985. 58. Five Lectures on the Acoustics of the Piano I Ed. A. Askenfelt. Stockholm: Royal Swedish Acad, of Music, 1990. 59. Галембо А. С. Фортепиано. Качество звучания. M.: Легпромиздат, 1987. 60. http://www.gmi.edu/~drussel/Piano/Dynamics.html; http://www.ptg.org. 61. Римский-Корсаков А. В., Дьяконов H А. Музыкальные инструменты. M., 1952. 62. Галембо А. С. Разработка методов оценки интонационной ясности музыкальных звуков. Автореферат дисс. СПб.: СПИКИТ, 1994. 63. Boutillon X. Model for piano hammers: Experimental determination and digital simulation. JASA. V. 83, 1988. 64. Suzuki H, Nakamura I. Acoustics of pianos. Appl. Acoust. 30, P. 147— 205, 1990. 65. Askenfelt A., Jansson E. V. From touch to string vibrations. Part. I—III. J. Acoust. Soc. Am. V. 88. P. 52-62 (1990); V. 90. P. 2383-2393 (1991); V. 93. P. 2181-2196 (1993). 66. McFerrin W. V. The piano: its acoustics. Boston.: Tuners Supply Co., 1972. 67. Бражников M. Фортепиано. M.: Музыка, 1967. 68. Розанов И. В. От клавира к фортепиано. СПб.: Лань, 2001. 69. Montagu J. Timpani and percussion. Yall. 2002. 70. Дмитриев Г. Г. Ударные инструменты. Трактовка и современное состояние. M.: Советский композитор, 1991. 71. Скучик Е. Основы акустики. M.: Мир, 1976. Т. 1-2. 72. Берлиоз Г. Большой трактат о современной оркестровке и инструмен- товке. M., 1971. 73. Acoustics of bell / Ed. Т. D. Rossing. N. Y.: Van Nostrad Reinhold Company, 1984. 74. Музыка колоколов I Отв. ред. А. Б. Никаноров. СПб.: РИИИ, 1999. 75. Никаноров А. Б. Колокола и колокола звоны Псково-Печерского мо- настыря. СПб.: РИИИ, 2000. 76. www.keltek.org 77. Terchardt Е. Akustische Kommunikation: Grundlagen mit Horbeispielen. Berlin. Heidelberg.: Springer, 1998. 78. http://www.msu.edu/-carillon/batmbook/chapter5.htm 79. Aldoshina L, Nicanorov В., Matcievski L, Puchkov S., Tovstik E., Cherniav S. The analysis of peculiarities of Russian bells acoustics parameters. The 114th Convention AES, 2003., March 22-25. Amsterdam, pr. 5794. 80. Пухначев Ю. В. Загадки звучащего металла. M.: Наука, 1974.
468 Глава 4 81. Нюнин Б. H., Ларюков А. С, Юдин С. И. Расчетно-эксперименталь- ное исследование виброакустических характеристик старых русских и современных колоколов // Сб. Музыка колоколов. Отв. ред. A. Б. Никаноров. СПб.: РИИИ, 1999. 82. Sankiewicz M., Budzynski G. Pecularities in Swinging Bell Sounds. ThelOlth Convention AES, 1996. November 8-11. Los-Angeles, pr. 4336. 83. Taschenbuch Akustik. Berlin.: VEB Verlagtechnik, 1984. V. 1-2. 84. Reuter Ch. Die Auditive Diskrimination von Orchesterinsrtumenten. Berlin.: Peter Lang. GMBH, 1996. 85. Благодатов Г. И. История симфонического оркестра. Л.: Музыка, 1969. 86. Акустика. Справочник / Под ред. М. А. Сапожкова. M.: Радио и связь, 1989. 87. Beranek L. Music, Acoustics and architecture. 2-nd ed. N. Y.: John Wiley, 1996. 88. Чистович Л. А. и др. Физиология речи: Восприятие речи человеком. Л.: Наука, 1976. 89. Акустика речи. Медицинская и биологическая акустика // Сб. трудов XIII сессии РАО. M.: ГЕОС, 2003. Т. 3. 90. Морозов В. 77. Искусство резонансного пения. Основы резонанс- ной теории и техники. M.: ИПРАН, МГК им. П. И. Чайковского, 2002. 91. Морозов В. 77. Биофизические основы вокальной речи. Л.: Наука, 1977. 92. Морозов В. П. Тайны вокальной речи. Л.: Наука, 1967. 93. Морозов В. П. Психоакустические аспекты восприятия речи // Ме- ханизмы деятельности мозга / Под ред. Н. П. Бехтеревой. M.: Наука, 1988. 94. Художественный тип человека / Под. ред. В. П. Морозова. M.: МГК, 1994. 95. Морозов В. П. Искусство и наука общения: невербальная коммуни- кация. M.: ИПРАН, 1998. 96. Чистович Л. А., Венцов А. В. и др. Слуховые уровни восприятия речи. Функциональное моделирование // Акустика речи и слуха. Л.: Наука, 1986. 97. Мясникова Е. К Объективное распознавание звуков речи. Л.: Энер- гия, 1967. 98. Бондарко Л. В. Фонетика современного русского языка. СПб.: Изд-во СПбГУ, 1998. 99. Морозов В. П., Вартанян И. А., Галунов В. И. и др. Восприятие речи. Вопросы функциональной ассиметрии мозга / Под ред. B. П. Морозова. M.; Л.: Наука, 1988. 100. Sundberg J. The Science of the Singing Voice. Illinois.: Dekalb, 1987. 101. Proctor D. F. Breathing, Speech and Song. N.Y: Springer-Verlag, 1980.
Акустика музыкальных инструментов. Акустика речи и пения 469 102. Titze I. R. The Human Vocal Chords: A Mathematical Model. Phonetica. 1973. V. 28-29. 103. Titze I. R. Principles of Voice Production. N. Y.: Prentice-Hall, 1994. 104. Stevens K. N Articulation-Acoustic-Auditory Relationships Il The Handbook of Phonetic Sciences. Oxford, 1999. 105. Фант Г. Анализ и синтез речи / Пер. с англ. M.: Наука, 1970. 106. Фланаган Дж. Анализ, синтез и восприятие речи. M.: Связь, 1968. 107. Галунов В. И., Родионов В. Д. Моделирование процессов переда- чи информации в звуковом диапазоне частот. Л: Внешторгиздат, 1988. 108. Чистович Л. А., Венцов А. В., Люблинская В. В. и др. Слуховые уровни восприятия речи. Функциональное моделирование // Акустика речи и слуха. Л.: Наука, 1986. 109. Кодзасов С. В., Кривнова О. В. Общая фонетика. M.: РГГУ, 2001. 110. Меркулова Е. М. Английский язык для студентов университетов. Введение в фонетику. СПб.: Союз, 2001. 111. Schroeder М. R. Computer Speech. Recognition, Compression, Synthesis. Berlin.: Springer, 1999. 112. Сорокин В. H. Синтез речи. M.: Наука, 1992. 113. Венцов А. В., Касевич В. Б. Проблемы восприятия речи. СПб.: Изд-во СПБГУ, 1994. 114. Винцюк T К. Анализ, распознавание и интерпретация речевых сиг- налов. Киев.: Наукова думка, 1987. 115. Rabiner L. R., Juang В. Н. Fundamentals of Speech Recognition. New Jersey.: Prentice-Hall, 1993. 116. http://www.ling.lu.se/research/speechtutorial/tutorial.htm 117. Фурдуев В. В. Акустические основы вещания. M.: Связьиздат, 1960. 118. Римский-Корсаков А. В. Электроакустика. M.: Связь, 1973. 119. Сапожков М. А. Речевой сигнал в кибернетике и связи. M.: Связь- издат, 1963. 120. Михайлов В. Г, Златоустова А. В. Измерение параметров речи. M.: Радио и связь, 1987. 121. Макриненко Л. И. Акустика помещений общественных зданий. M.: Стройиздат, 1986. 122. Радиовещание и электроакустика. Учебник / Под ред. Ю. А. Ковал- гина. M.: Радио и связь, 1998. 123. Steeneken H., Houtgast Т. RASTI: A tool for evaluating auditoria. Technical Review. B & К. 1986. № 3. 124. Анерт В., Стеффен Ф. Техника звукоусиления. М: Эра, 2003. 125. http://www.meyersound.com/speech/intro.htm; http://www.gold-line.com/ dspsti.htm. 126. Юссон P Певческий голос. M.: Музыка, 1974. 127. Дмитриев Л. Основы вокальной техники. M.: Музыка, 2000. 128. Бернд Вайкл. О пении и прочем умении. M.: Аграф, 2002. 129. Назаренко И. К. Искусство пения. M.: Музыка, 1968.
470 Глава 4 130. Кузнецов Ю. М. Тембр как специфическое качество хорового уни- сона. M.: Музыка, 1995. 131. Василенко Ю. С. Голос. Фониатрические аспекты. M.: Медицина, 2002. 132. Ternstrdm S. Choir acoustics — an overview of scientific research published to date. Stockholm.: TMH-QPSR, KTH, 2002. Vol. 43. 133. Ternstrdm S. Acoustical Aspects of Choir Singing. Ph. D. Thesis. Stockholm. KTH (Royal Institute of Technology), 1989. 134. Ternstrdm S., Sundberg J. Acoustics of Choir in Singing //Acoustics for Choir and orchestra. Stockholm.: KTH, 1986.
Глава 5. АКУСТИКА ПОМЕЩЕНИЙ (КОНЦЕРТНОТЕАТРАЛЬНЫХ ЗАЛОВ И СТУДИЙ) Как уже было отмечено в главе 1, одной из главных задач му- зыкальной акустики является изучение законов распространения звуков, так же как и законов их создания и восприятия. В сферу интересов музыкальной акустики входят музыкальные и речевые сигналы, распространяющиеся в основном в закрытых помещени- ях (концертных залах, залах оперных и драматических театров, речевых аудиториях, студиях и т. д.), хотя и в условиях открытых пространств также исполняются музыкальные произведения (на открытых эстрадах, стадионах и др.). Проблемами распро- странения звука в закрытых и открытых пространствах занимается архитектурная акустика; однако основные сведения об акустике кон- цертных, театральных залов, студий и др. являются также необхо- димым элементом изучения музыкальной акустики, поскольку нельзя не учитывать огромное влияние, которое оказывает окру- жающее пространство на исполнение и восприятие музыкальных и вокальных произведений. В данной главе даются краткие сведения о процессах форми- рования звукового поля в различных помещениях и методах их анализа, об установлении связи между объективными параметра- ми звукового поля и субъективными критериями оценки различ- ных помещений (раздел 5.1); об акустических характеристиках концертных и театральных залов, студий и контрольных комнат (раздел 5.2); залов многоцелевого назначения с системами озву- чивания и звукоусиления (раздел 5.3); а также о современных ме- тодах компьютерного моделирования акустики помещений (мето- дах аурализации) (раздел 5.4). 5Л. ОБЪЕКТИВНЫЕ АКУСТИЧЕСКИЕ ПАРАМЕТРЫ И СУБЪЕКТИВНЫЕ КРИТЕРИИ ОЦЕНКИ ПОМЕЩЕНИЯ Влияние помещения на качество исполнения и восприятия музыки и речи хорошо известно любому исполнителю, лектору и слушателю. Достаточно вспомнить звучание оркестра, хора или органа в хорошем концертном зале или соборе с «прекрасной
472 Глава 5 ДБ Прямой звук Отражения Rl ^ Начальная задержка^ | R3 R2 ■ R5 MlIi MC Рис. 5.1.1 Процесс распространения звука в помещении и структура отраженных сигналов акустикой» или, наоборот, в помещениях с «плохой акустикой» (с большим уровнем отражений или слишком переглушенных и т. д.), чтобы оценить, насколько велика роль помещения в про- цессе формирования слухового образа. Влияние помещения на звуковой сигнал можно рассматривать как его обработку особым пространственным фильтром (рис. 5.1.1). Помещение производит линейную фильтрацию сигнала, в резуль- тате которой меняется его временная структура и АЧХ (следова- тельно, и его тембр) — рис. 5.1.2а, б, — а также баланс громкос- тей, пространственные характеристики и др. Следует отметить, что при обычных уровнях звукового давления (в залах с естественной акустикой) помещение можно рассматривать как линейную систе- му, однако, как показали последние исследования, в современных залах с мощными системами озвучивания (например, дискотеках) начинают проявляться нелинейные свойства воздушной среды,
Акустика помещений 473 и помещение оказывает влияние на нелинейные характеристики сигнала. Задачи анализа акустики помещений (концертных, теат- ральных залов и др.) включают в себя ряд взаимосвязанных про- блем: исследование физических процессов формирования звуко- вых полей в помещениях различной формы; установление связей объективных акустических параметров с субъективными оценками слушателей; создание методов расчета и проектирования и пр. Все эти проблемы активно исследовались на протяжении длитель- ного периода и находятся в настоящее время на разной стадии изученности [1-14].
474 Глава 5 5.1.1. Физические процессы формирования звукового поля в помещении. Методы расчета Когда источник звука работает в замкнутом помещении, то про- исходит сложный процесс формирования звукового поля в нем — за счет отражений от стен, потолка, пола и т. д. При этом звуко- вая энергия частично поглощается за счет затухания в воздухе, в стенах и различных предметах, находящихся в помещении, а также за счет прохождения звука во внешнюю среду. Кроме того, имеет место процесс дифракции звуковых волн при наличии раз- личных препятствий (сравнительно небольших размеров) внутри помещения — колонн, экранов, кресел и т. д. В каждую точку помещения, например в ту, где находится микро- фон или слушатель, приходит сначала прямой звук (см. рис. 5.1.1), затем первые отраженные звуки с некоторой задержкой во време- ни, затем двух-, трех- и четырехкратно отраженные звуки и т. д.; при каждом отражении часть энергии поглощается, а часть приходит в рассматриваемую точку и накладывается на прямой звук. При этом происходит постепенный процесс нарастания плотно- сти энергии в данной точке. Но так как при каждом следующем приходе N отражения величина прибавки энергии уменьшается, поскольку за счет поглощения отраженные звуки приходят все с меньшим уровнем энергии, то через некоторый промежуток вре- мени (называемый временем атаки) наступает-установившийся режим. В этом режиме источник звука работает и восполняет ту часть энергии, которая поглощается стенами, мебелью и воздухом и др., поэтому в помещении уровень плотности энергии устанав- ливается постоянным. Если источник выключить, то происходит постепенный процесс спада энергии: сначала пропадает прямой звук, затем первые, вторые и т. д. отражения. Этот процесс послезвучания называет- ся реверберацией, а время, в течение которого он происходит, — временем реверберации. Характер этого процесса зависит от раз- меров и формы помещения, от звукопоглощающих свойств поверх- ностей (чем больше поглощается звук, тем короче время ревербе- рации). Хорошо известно на практике, что в больших помещениях, отделанных твердыми материалами (кирпич, камень), звук гулкий, т. е. не исчезает сразу, а постепенно, медленно затухает. В таких помещениях речь звучит неразборчиво, но зато прекрасно может звучать органная музыка (например, в соборах). В помещениях, где много мебели, людей и др., звук затухает быстро; в переглу- шенном помещении звук становится сухим и глухим, музыкальное исполнение лишается сочности и выразительности. Таким образом, можно выделить три фазы в процессе форми- рования звукового поля в любом помещении: период установления (атака), стационарный период, период спада (реверберация) —
Акустика помещений 475 t, MC Рис. 5.1.3. Три фазы формирования звукового поля в помещении рис. 5.1.3. От соотношения этих периодов по длитель- ности, а также от структуры отраженных звуков (их ко- личества, соотношения ам- плитуд, направления прихода и др.) у слушателей и фор- мируются субъективные ощу- щения «акустики» зала, т. е. ощущения пространственно- сти, баланса, полноты, жиз- ненности и т. д. Поскольку любой музыкальный или речевой сигнал имеет свои периоды нарастания, установления и спада, а процессы форми- рования звукового поля в помещении накладывают дополнительно на него свои процессы атаки, установления и послезвучания, ко- торые особенно отчетливо слышны в паузах исполняемого произ- ведения, то это приводит к изменению тембра звучания любой речи, музыки или пения. Достаточно сравнить восприятие любого музыкального произведения на открытом пространстве (стадионе или открытой эстраде ), в концертном зале или в небольшом силь- но переглушенном помещении. Как уже было отмечено в главе 1, методы расчета звуковых полей в помещениях начали активно развиваться в конце XIX — начале XX века в работах В. Сэбина, С. Эйринга, Ф. Морза, Д. Рэ- лея и др. [1-3]. В XX веке был достигнут громадный прогресс в этом направлении трудами таких ученых как Л. Беранек, Г. Ол- сон, X. Кутруф, М. Шредер, В. Кнудсен, М. Барон, И. Андо, В. Иор- дан, В. Анерт, В. Рейхард и др. [4-20, 46]. В России большой вклад в решение этих проблем внесли работы В. В. Фурдуева, М. A. Ca- пожкова, А. Н. Качеровича, В. С. Маньковского, Л. И. Макриненко, С. Д. Ковригина, Ю. П. Щевьева, И. Т. Дрейзена, В. В. Давыдова, М. Ю. Лане и др. [21-35]. В последние десятилетия активно раз- виваются методы компьютерного моделирования звуковых полей в помещении (техника аурализации) [36]. В настоящее время при расчете структуры звуковых полей в помещениях, в том числе и с помощью компьютерных программ, например таких как ODEON, САТТ, ORPHEUS [37-39] и др., ис- пользуются три разных подхода, основанные на статистической, геометрической и волновой теориях. Статистическая теория Поскольку музыкальные и речевые сигналы являются квазислу- чайными процессами (см. гл. 2), то применение статистического анализа к исследованию структуры звуковых полей, создаваемых ими в различных помещениях, является допустимым, однако для этого относительно структуры звукового поля должны быть сдела- ны следующие предположения:
476 Глава 5 — средние по времени значения плотности звуковой энергии во всех точках помещения равны (это свойство называется одно- родностью)] — направления прихода потоков энергии в каждой точке поля равновероятны и средние значения энергии по различным направ- лениям одинаковы (это свойство называется изотропностью). Звуковое поле в помещении, которое обладает такими свой- ствами, называется диффузным, т. е. это поле однородное и изо- тропное. Реальное звуковое поле в помещении можно приближенно считать диффузным только если энергия отраженных волн пре- вышает энергию прямых волн. Для этого в помещении должны быть хорошо отражающие поверхности различных форм и раз- меров, обеспечивающие приход в каждую точку поля большого количества отраженных звуков с различных направлений про- странства (примером такого помещения может служить ревербера- ционная камера, т. е. комната с жесткими отражающими непарал- лельными стенками различных форм и размеров, используемая для проведения измерений). Статистический метод анализа звуковых полей является при- ближенным, он применим только в ограниченной области частот и для определенных зон в помещении (например, его нельзя при- менять для анализа звукового поля вблизи сцены или вблизи силь- но заглушённых поверхностей и др.). Кроме того, он не позволяет учесть распределение в пространстве амплитуд и фаз сигнала, т. к. дает только среднеэнергетические значения различных харак- теристик звукового поля. Однако статистическая теория при опре- деленных условиях позволяет дать общее физическое представле- ние о процессах формирования звукового поля в помещении и выполнить достаточно простой расчет некоторых его характери- стик. В настоящее время методы статистической теории широко применяются для оценки параметров звукового поля в студиях, концертных залах и других помещениях. Основные параметры звукового поля в помещении, которые могут быть определены с помощью статистической теории, сле- дующие. Среднее время и средняя длина свободного пробега зву- ковой волны. Поскольку в диффузном поле каждая звуковая вол- на претерпевает многократные отражения от поверхностей поме- щения, можно ввести такое понятие как среднее время между двумя отражениями звука т. Оно может быть статистически опре- делено как: T= 4VZCS9 где V— объем помещения, S— площадь всех поверхностей (стен, пола, потолка) помещения, С — скорость звука.
Акустика помещений 477 Отсюда можно определить среднее число отражений в едини- цу времени: п = 1/т= CS/4V. Кроме того, это позволяет определить среднюю длину свобод- ного пробега: I = Cr = 4V/S. Эти соотношения вначале были получены для помещений пря- моугольной формы (с линейными размерами, близкими к «золото- му сечению», например когда длина L1 ширина В и высота H свя- заны отношением L/B = В/Н при L = В+H), затем было показано, что эти соотношения приближенно сохраняются и для помещений более сложных форм. Средний коэффициент поглощения. Коэффициент поглоще- ния определяется как отношение поглощенной энергии к энергии, падающей на данную поверхность (см. гл. 1): а = Епот/Епад. В об- щем случае коэффициент поглощения зависит от угла падения на поверхность, но в диффузном поле предполагается, что количе- ство отражений в единицу времени велико и направления падения звуковой волны на стену равновероятны, поэтому можно ввести понятие «средний коэффициент поглощения». Если в помещении имеется несколько различных поверхностей S1 (оштукатуренные стены, ковры, деревянные полы и др.), каждая со своим коэффи- циентом поглощения а., а также некоторое количество предметов N. (кресел, инструментов, людей и др.), у которых свои коэффици- енты поглощения aN, то можно определить общее поглощение в помещении как: А = OLjS1 + Ct^2 + a£3....+ ccNiNr Отсюда сред- ний коэффициент поглощения в помещении может быть определен как: a = AJS. ср Коэффициент поглощения измеряется в особых единицах — сэбинах (Сб). Коэффициент поглощения, равный одному сэбину, соответствует поглощению звука открытым окном площадью 1 м2. Время реверберации. Рассмотренные выше условия примени- мости статистической теории и введенные параметры — среднее время свободного пробега и средний коэффициент поглощения a — дают возможность сравнительно просто описать процессы нарастания, установления и спада энергии в помещении, в кото- ром работает источник звука (голос, музыкальный инструмент, громкоговоритель). В работах С. Эйринга было показано, что процесс нарастания и спада плотности энергии в помещении можно рассматривать как происходящий ступенями через промежутки времени, равные среднему времени пробега звукового луча, определенному выше. В этом случае можно показать [23],что процесс нарастания плотности энергии eft) (которая равна е- E/V— см. гл. 2) про- исходит по экспоненциальному закону и может быть представлен в виде:
478 Глава 5 s = S0[I- еП где у = CS ln(l-acp)/4V, S0— значение стационарной плотности энергии, С — скорость звука в воздухе, S — площадь поверхностей, V—объем помещения. Из этого выражения следует, что скорость нарастания плотности энергии в помещении зависит от величины коэффициента погло- щения а и отношения SIV9 т. е. площади и объема помещения. Когда в процессе нарастания поглощаемая в помещении энер- гия становится равной энергии, излучаемой источником звука, наступает состояние равновесия; при этом плотность звуковой энергии устанавливается постоянной и равной: e0 = 4Pa/CcccpS, где Ра — мощность звукового источника. Таким образом, в стаци- онарном режиме плотность энергии в помещении зависит только от мощности источника и общего поглощения в нем. Когда источник звука выключается, начинается процесс умень- шения плотности энергии в помещении, т. е. процесс спада, кото- рый и называется реверберационным процессом. Он происходит также по экспоненциальному закону: s = г#*, где коэффициент допределен выше. Общий характер нарастания, установления и спада энергии в помещении в соответствии с этой теорией показан на рис. 5.1.3. В реальных условиях процесс спада не имеет такого гладкого характера (за счет отклонений от условий диффузности звукового поля — например, при наличии дискретных отражений, выраженных резонансов, концентрации от- ражений в определенных точках помещения и т. д.). Его вид пока- зан на рис. 5.1.4. дБа Импульсный сигнал источника ^ Прямой звук ^Первое отражение О <—Раннее отражение —► t, с Рис. 5.1.4. Структура процесса реверберации в помещении
Акустика помещений 479 Для количественного описания процессов затухания энергии в различных помещениях был введен параметр «стандартное вре- мя реверберации». Стандартное время реверберации — это такой интервал вре- мени T (с), в течение которого плотность звуковой энергии умень- шается в 106 раз по сравнению с первоначальной, при этом ее уровень снижается на 60 дБ. Отсюда для Г-стандартного времени реверберации из приве- денного выше выражения для спада плотности энергии получается формула [21-23]: T = 0,161 V -SIn (1-Сс) к ср где V — объем помещения, S — площадь внутренних ограничива- ющих поверхностей, a — средний коэффициент поглощения. Это выражение называется формулой Эйринга. При небольших коэффициентах поглощения (я < 0,2) это вы- ражение может быть упрощено и представлено в следующем виде (формула Сэбина): 0,161 V acpS ' Обе эти формулы широко используются при оценке акустиче- ских характеристик различных помещений (студий, концертных залов и т. д.). Следует отметить, что они не учитывают влияние формы поме- щения, места расположения звукопоглотителей и дают несколько завышенные значения времени реверберации, но, несмотря на приближенный характер, позволя- ют получить приемлемую для практических расчетов точность. В больших помещениях и на высоких частотах (больше 2000 Гц) надо учитывать допол- нительное поглощение звука в воздухе за счет вязкости и теплопроводности; при этом в формулы необходимо внести следующие поправки: Т -51п(1-аф) + 4цГ> где ju — показатель затухания в воздухе. Его значение для раз- ных частот дано на рис. 5.1.5. 0,03 0,02 0,01 0 /=819 2 Гц Л V 4096 Гц " 1024 Гц ^2048 rlTf~ _ / 20 40 60 80 Относительная влажность, % Рис. 5.1.5. Зависимость показателя затухания в воздухе от частоты и относительной влажности (%)
480 Глава 5 Таким образом, время стандартной реверберации зависит от объема помещения, площади его внутренних поверхностей, среднего коэффициента поглощения и дополнительного зату- хания в воздухе. Время стандартной реверберации является важнейшей харак- теристикой качества звучания музыкальных и речевых источников в данном помещении. Оно может меняться от 0,1-0,5 с в сильно заглушённых помещениях до 5-6 с в гулких помещениях. Коэффициент поглощения для некоторых видов материалов, используемых в помещениях, дается в таблице 5.1.1 [21]: Таблица 5.1.1 Коэффициент поглощения а в зависимости от частоты Материал Частота 125 Гц 250 Гц 500 Гц 1 кГц 2 кГц 4 кГц 6 кГц Слушатели 0,33 0,41 0,44 0,46 0,46 0,46 0,47 Стул мягкий 0,05 0,09 0,12 0,13 0,15 0,16 0,15 Пол (стена) деревянная 0,15 0,11 0,10 0,07 0,06 0,07 0,06 Стена оштука- туренная 0,04 0,05 0,06 0,08 0,04 0,06 0,06 Мрамор, гранит 0,01 0,01 0,01 0,01 0,01 0,01 0,02 Кирпичная кладка 0,15 0,19 0,29 0,28 0,38 0,46 0,45 Ковер 0,08 0,24 0,57 0,69 0,71 0,73 — Окно 0,35 0,25 0,18 0,12 0,07 0,04 0,03 Дверь (сосновая) 0,10 0,11 0,10 0,08 0,08 0,11 0,11 Драпировка плотная 0,14 0,35 0,55 0,72 0,70 0,65 — Поскольку коэффициенты поглощения частотно зависимы, стан- дартное время реверберации также зависит от частоты. Для из- мерения стандартного времени реверберации в настоящее время используются в основном импульсные методы с последующей компьютерной обработкой [46]. Поскольку трудно обеспечить достаточно большую мощность источника для измерения в усло- виях обычных шумов (30-40 дБ), то в некоторых стандартах, на- пример ANSI 1045-88, предусмотрено измерение времени спада в области от - 5 дБ до - 35 дБ с последующей интерполяцией до - 60 дБ. Для каждого вида речи и музыки разных жанров в результате многочисленных экспериментальных исследований установлены значения оптимального стандартного времени реверберации и их зависимость от объема помещения и от частоты (подробнее об этом ниже).
Акустика помещений 481 Эквивалентное время реверберации. Представленные выше формулы для определения времени реверберации применимы только для диффузного звукового поля, т. е. предполагается, что энергия распределяется равномерно по всему объему помещения. В реальном помещении, где работает источник звука (музыкант, пе- вец, оратор), на малых расстояниях преобладает энергия прямо- го звука, которая убывает обратно пропорционально квадрату рас- стояния (см. гл. 2); на больших расстояниях преобладает энергия отраженных звуков, и поле можно считать диффузным. Для учета взаимодействия прямого и отраженных звуков в реальном помеще- нии было введено понятие «акустическое отношение», которое оп- ределяется как отношение плотности диффузной звуковой энергии к плотности энергии прямого звука: Акустическое отношение зависит от расстояния до источника г, обьема помещения, времени реверберации в нем и среднего по- глощения в помещении: Акустическое отношение определяется для разных точек поме- щения. Оптимальное его значение для речи составляет примерно 0,5-1, для музыки — 6-8, для органной музыки 10-12 [40]. Если R больше этих пределов, то речь становится неразборчивой, а му- зыка звучит слишком гулко; если R < 2,то музыка кажется слиш- ком сухой. Поэтому в каждом зале (в зависимости от его объема и времени реверберации в нем) имеются оптимальные расстояния для прослушивания речи и для прослушивания музыки. На определенном расстоянии, где плотность энергии отражен- ных звуков равна плотности энергии прямого звука, акустическое отношение становится равным единице: R=I. Такое расстояние называется радиусом гулкости г. Радиус гулкости (иногда он обозначается как «радиус ре- верберации» [46]) связан с объемом помещения и временем реверберации следующим приближенным соотношением (для не- направленного источника): При расстояниях больше радиуса гулкости в помещении пре- обладает энергия диффузного звука, и для определения времени реверберации можно применять формулы Сэбина и Эйринга. На расстояниях меньше радиуса гулкости субъективно ощуща- емое время реверберации будет меньше, чем время стандартной реверберации, поскольку слушатель находится в основном в зоне прямого звука. Поэтому на основании субъективных экспертиз было введено «время эквивалентной реверберации»: R R = SIl(Y2TIV)(Ua^.
482 Глава 5 1 1 1 , l + R = - + — Ig Т„ T 1,2 R При больших R (R > 3) время эквивалентной реверберации бу- дет равно времени стандартной реверберации (Тэкв ~ 7). При ма- лых R1 т. е. ближе к источнику Тэкв будет меньше T (стандартно- го времени реверберации), что лучше соответствует слуховым ощущениям. Например, при T = 2 с и R = 1 время эффективной ре- верберации будет 1,33 с. Если в помещении работают микрофоны с направленными свойствами, то время эффективной реверберации будет иметь не- сколько другой вид: 1 1I1 & + R = — +— Ig Тжв T 1.2 R где Q — коэффициент осевой концентрации микрофона. Поэтому, выбирая микрофоны с направленными свойствами, можно в значительной степени управлять эквивалентным време- нем реверберации (что очень важно, например при записи в студиях). Связь Тэкв с T (временем стандартной ревербера- ции) при разных значениях акустического отношения показана на рис. 5.1.6. Результирующее время реверберации относится к случаю связанных помещений, т. е. помещений, в одном из которых нахо- дится источник звука, в другом слушатель (например, студия и контрольная комната, где находится звукорежиссер). Иногда эти помещения связаны акустически, иногда через элек- трический канал. В любом случае на первичный сигнал накладываются звуки, отражен- ные в первичном помещении, а затем на сигнал, воспроизводи- мый во вторичном помещении, дополнительно накладываются отраженные звуки этого по- мещения. При этом следует учитывать, что суммарная реверберация приближенно определяется как [31-33]: т 1 ЭКВ 2,0 1,8 1,6 1,4 1,2 1,0; 0,8 S 8 R=J, 1 1,2 1,4 1,6 1,8 2,0 Т,с Рис. 5.1.6. Связь времени реверберации T с временем эквивалентной реверберации T31 для разных значений акустического отношения R р = сум T 3 + T 3
Акустика помещений 483 Подводя итоги возможностям применения статистической тео- рии, необходимо еще раз подчеркнуть, что она имеет ограничения как по диапазону воспроизводимых частот, так и по объему поме- щения (для не слишком больших и не слишком маленьких поме- щений), а также для помещений с преобладанием какого-то одного линейного размера, с наличием фокусирующих поверхностей и не- равномерным распределением звукопоглощающих материалов. Кроме того, она неприменима к анализу начального участка ревер- берационного процесса, где имеют место отдельные дискретные отражения. Ее область применения — поздний участок процес- са реверберации (рис. 5.1.4), где имеются плотные, почти сплошные отражения. Несмотря на эти ограничения, она явля- ется очень полезным методом анализа звуковых полей в поме- щений, широко используемым в современной практике акусти- ческого проектирования. Гэометрическая (лучевая) теория Для качества звучания музыки и речи в помещениях огромное значение имеют первые дискретные отражения, которые формиру- ют у слушателя ощущение пространства зала, интимности и др. (см. ниже), однако в этот период времени (порядка 80 мс в зави- симости от размера зала) звуковое поле еще нельзя считать рав- номерным — и методы статистической теории здесь неприменимы. В этих случаях применяется другая приближенная теория, которая получила название геометрической (или лучевой). Подробное из- ложение этой теории можно найти в работах [6, 11, 22, 25]. В основе геометрической теории лежит аналогия с законами геометрической оптики, т. е. с распространением световой волны. Если под понятием «звуковой луч» (см. гл. 2) подразумевать ли- нию, совпадающую с направлением нормали к фронту волны (для однородной среды), то можно рассматривать движение звуковых волн как движение световых лучей. При этом соблюдаются все законы геометрической оптики: для зеркальных (отражающих) по- верхностей угол падения равен углу отражения, падающий и отра- женные лучи лежат в одной плоскости, время прихода луча опре- деляется пройденным расстоянием и скоростью распространения звука. Исходя из этого, можно рассчитать уровень звукового дав- ления в данной точке поля, если известно количество пришедших в нее лучей в заданный отрезок времени, с учетом потери энергии за счет поглощения на стенках при каждом отражении и потерь при распространении в воздухе. Общий характер звукового поля в помещении может быть опре- делен путем построения эскизов отраженных лучей для различных точек помещения (лучевой метод). Этот метод используется в со- временных компьютерных программах для расчета структуры зву- кового поля в помещении — таких, как САТТ, Odeon и др.
484 Глава 5 а б Рис. 5.1.7. Эскизы отраженных лучей для разных видов помещений: а — для театрального зала; б — для контрольной комнаты на позиции звукорежиссера Характер отражений зависит от формы отражающей поверхно- сти: вогнутые поверхности фокусируют звук, выпуклые поверхности рассеивают звук и т. д. Отражения от плоских поверхностей могут рассматриваться как, если бы они исходили от мнимого источни- ка, являющегося зеркальным отражением реального источника. Поэтому иногда для анализа звукового поля используется несколь- ко иной алгоритм расчета звукового поля путем построения множе- ственных мнимых источников (метод мнимых источников) [41]. Интенсивность отражений зависит от вида и характера распре- деления звукопоглощающего материала на стенках помещения. Примеры построения эскизов отраженных лучей для различных видов помещений показаны на рис. 5.1.7а, б [40]. Пользуясь таки- ми методами, можно оценить роль отдельных участков помещения в формировании звукового поля в плоскости размещения слуша- телей: от одних участков приходят звуковые волны только после одного отражения, от других после двукратного, трехкратного и т. д. Участки поверхности, отражаясь от которых первый раз, звуковая энергия приходит на всю площадь слушательских мест, называются площадками первых отражений] части поверхностей, где имеет место двукратное отражение, — площадками вторых отражений и т. д. Пользуясь методами геометрической теории [22, 25], можно построить их распределение для любого помещения. Например, для помещения прямоугольной формы с длиной, шири- ной и высотой L, В, H соответственно и расположением источни- ка звука в одной из стен на высоте h (рис. 5.1.8) площадка первых отражений будет располагаться на потолке и иметь размеры: ширина — bj= [(H-h)/(2H-h)]B\ длина — I1= [(H-h)/(2H-h)]L.
Акустика помещений 485 F а б Рис. 5.1.8. Площадки первых отражений в помещении: а — на потолке; б — на боковой стенке Отсюда видно, что чем ниже установлен источник звука, тем больше «площадка первых отражений» на потолке. Аналогично можно построить площадки вторых, третьих и пр. отражений. Если построить такие площадки для всего помещения, то можно выявить некоторые общие закономерности: — площадки первых отражений всегда имеются на потолке и, следовательно, звуковая энергия, упавшая на потолок, обычно приходит на плоскость слушательских мест в начальном интервале реверберационного процесса; — на боковых стенках площадки первых отражений обычно располагаются ниже высоты расположения источника, т. е. в ниж- ней части; — на задней стенке и на полу также есть площадки первых от- ражений, но они значительно меньше по площади, и их вклад в структуру первых отражений не очень значителен. Следовательно, основной вклад в структуру первых отраже- ний вносят форма и степень заглушения потолка и нижней части боковых стен. Для определения структуры первых отражений важна не толь- ко информация о форме и размерах участков помещения, откуда они приходят в данную точку зала, но также информация о вре- мени прихода каждого из первых отражений. Для луча любого порядка отражения время запаздывания относительно прямого луча определяется по формуле: где In — путь отраженного луча после п отражений, I0 — путь прямого луча в данную точку. Временная структура первых отражений показана на рис. 5.1.4. По мере увеличения числа отраженных лучей видно, что их плотность увеличивается и амплитуды после каждого отражения
486 Глава 5 уменьшаются. Этот временной участок общего процесса затухания, где отчетливо видны ранние дискретные отражения, составляет от 60-80 мс до 200 мс в зависимости от размеров зала; с увеличе- нием размеров зала этот временной отрезок увеличивается. Сле- дует отметить, что структура ранних отражений зависит как от объема, так и от формы помещения, а также наличия и распреде- ления звукопоглощающего материала в нем. В силу существенного значения структуры ранних отражений при слуховой оценке качества помещений методы геометрической акустики широко используются в настоящее время при расчете звуковых полей в них [5]. Область применимости геометрической теории ограничивается условием Я « D, где Я — длина волны, D — линейные размеры помещения, т. е. сравнительно высокоча- стотным диапазоном. Одна из причин этого состоит в том, что гео- метрическая теория не учитывает процессов дифракции, которые возникают, когда длина волны становится соизмеримой с раз- мерами отдельных преград в помещении. Однако в настоящее время появились работы [41], позволяющие ввести учет дифракци- онных поправок и тем самым расширить область применения гео- метрической теории. Волновая теория Волновая теория рассматривает помещение как резонатор (аналогично, например, трубе музыкального инструмента). Воздуш- ный объем помещения имеет определенную массу и упругость — и, следовательно, можно рассчитать его собственные частоты и собственные формы колебаний. отражающая отражающая стена стена
Акустика помещений 487 Если бы помещение состояло из двух жестких отражающих сте- нок и между ними был помещен источник звука (рис. 5.1.9а), то в нем на определенных (резонансных) частотах возникали бы сто- ячие волны в результате интерференции падающей и отраженной от жесткой стенки волны. При этом у отражающих твердых стенок звуковое давление всегда оставалось бы максимальным (скорость частиц воздуха была бы равна нулю). В определенных точках по- мещения имелись бы максимумы и минимумы звукового давления (это явление очень часто имеет место в реальных помещениях вдоль длинных стенок). Если помещение имеет прямоугольную форму, то расчет его собственных частот может быть выполнен по следующей форму- ле, полученной Рэлеем в 1896 году: Z Z — — — L в н где к, т, п — целые числа, соответствующие номеру резонансной частоты; L, В, H — длина, ширина и высота помещения. Звуковое поле в трехмерном помещении представляет собой композицию стоячих волн трех видов [28, 40]: — аксиальных (осевых) волн, для которых два из трех чисел (к, т, п) равны нулю, — например, если т, п = 0, а к Ф 0, то это аксиальные волны вдоль длины помещения; если т Ф 0, то вдоль ширины помещения; п ф 0 — вдоль высоты (рис. 5.1.9а); — тангенциальных волн, для которых одно из трех чисел (к, т, п) равно нулю, — например, если к = 0, а т, п Ф 0, то это танген- циальные волны, параллельные плоскости Y, Z (рис. 5.1.96) и т. д.; — косых волн, для которых все три числа не равны нулю (к, т, п ф 0), т. е. это стоячие волны между всеми шестью поверхностя- ми в помещении. Пример расчета различных собственных частот для комнаты с размерами 9,1 х 7,6 х 5,9 м приведен в таблице 5.1.2 и показан на рис. 5.1.10. Таблица 5.1.2 Номер моды Частота, Гц Номер моды Частота, Гц Номер моды Частота, Гц Номер моды Частота, Гц 001 18,79 006 36,66 011 47,41 016 56,76 002 22,54 007 37,58 012 48,85 017 57,81 003 28,90 008 41,19 013 52,50 018 58,81 004 29,35 009 43,82 014 53,56 019 60,71 005 34,47 010 45,09 015 56,37 020 60,79
488 Глава 5 10 20 30 40 50 60 70 80 90 100 ПО 120 Гц спектр осевых волн it I, 10 20 30 40 50 60 70 80 90 100 ПО 120 Гц спектр тангенциальных волн 1 1 1 111 HI 111 111 111H111111 10 20 30 40 50 60 70 80 90 100 ПО 120 Гц спектр косых волн iiiiliihHn IHf 10 20 30 40 50 60 70 80 90 100 ПО 120 Гц суммарный спектр Рис. 5.1.10. Структура спектра в помещении (собственные частоты осевых, тангенциальных, косых волн и суммарный спектр) Как видно из этих расчетов, низшие собственные частоты отно- сятся к осевым волнам, затем возникают тангенциальные волны и только после — косые. Именно поэтому при проектировании сту- дий звукозаписи, где это особенно важно, наибольшее внимание уделяется демпфированию осевых волн, поскольку именно они создают наибольшую неравномерность распределения звукового давления вдоль длины помещения. Вся звуковая энергия, излучаемая источником звука в замкнутое пространство, расходуется на возбуждение аксиальных, т. е. осе- вых (50%), тангенциальных (25%) и косых (12%) волн; если при- нять уровень аксиальных волн за 0 дБ, то тангенциальные будут иметь уровень -3 дБ, косые — —6 дБ. Плотность спектра собственных частот помещения является важнейшей характеристикой его акустических свойств, поскольку при возбуждении воздушного объема в помещении на его собствен- ных частотах происходит усиление соответствующих частот в спек- тре источника за счет резонансов (полосовая фильтрация) и соот- ветственно искажается тембр (появляется «окрашивание» звука). Для оценки плотности спектра, т. е. количества собственных час- тот внутри полосы частот Af (например, в третьоктавной полосе или полосе шириной в 1 Гц), используется следующее выражение [40]: ДЛГ = [(4nV)(f/C)3 + (nS/2)(f/C)2 + (E/8)(f/C)J AfZf9 где E = 4(L + В + H) — сумма длины, ширины и высоты поме- щения, / — центральная частота полосы А/.
Акустика помещений 489 З4 20000 р о 15000 10000 ю о о 5 о G 4 >К о о 5 м 5000 1000 2000 Рис 5.1.11. Зависимость плотности спектра от частоты (в октавных и третьоктавных полосах) Как видно из этого выраже- ния, плотность спектра возраста- ет с увеличением объема поме- щения и с увеличением частоты. Если построить зависимость плотности собственных частот от частоты в полосе шириной 1/3 октавы (что примерно соответ- ствует ширине критических полос слуха — см. гл. 2), то видно (рис. 5.1.11), что при повышении час- тоты плотность спектра резко возрастает, поэтому АЧХ (огиба- ющая спектра) становится более однородной и помещение вносит значительно меньший вклад в изменение спектра (следовательно тембра) источника. Наиболее опасной является низкочастотная область, причем следует отме- тить, что для больших помещений эта часть дискретного спектра располагается в области частот 18-60 Гц, т. е. ниже обычного ди- апазона музыкальных инструментов и голоса. Для малых помещений область дискретного спектра попадает в музыкальный и речевой диапазон и вносит значительное окраши- вание звука. Это одна из причин, по которым запись и прослуши- вание музыки в таких помещениях не дают хороших результатов. В низкочастотном диапазоне основную роль играют аксиальные (осевые) моды (формы) колебаний. Среднее расстояние между ними примерно 20 Гц и средняя ширина каждой резонансной полосы порядка 5 Гц (она определяется как Af'= 2,2/T1 где T — время реверберации). Таким образом, малое помещение имеет частотную характеристику (АЧХ) с большой неравномерностью (например, на рис. 5.1.26 показана АЧХ для небольшого объема помещения — 340 м3). Для оценки допустимой плотности собственных частот при проектировании помещений используются критерии Бонелло [40], которые требуют, чтобы плотность собственных частот в третьок- тавных полосах возрастала монотонно и чтобы совпадающие моды практически отсутствовали. Объем воздуха в помещении, как всякая распределенная меха- ническая система (см. гл. 2), при выключении источника, т. е. вы- нуждающей силы, переходит в режим свободных затухающих ко- лебаний. В области низких частот, где помещение имеет дискретный спектр, процесс затухания происходит на собственных частотах помещения, не совпадающих со спектральными со- ставляющими источника звука, что воспринимается слухом как искажение его тембра. Причем поскольку собственные частоты
490 Глава 5 помещения располагаются достаточно близко друг к другу, в про- цессе затухания могут возникать биения. Наконец, скорость за- тухания различных мод колебаний в помещении будет разная: быстрее всего затухают косые волны, затем тангенциальные и аксиальные (осевые). Поэтому распределение энергии будет изменяться в процессе реверберации (затухания), все большую роль начинают играть осевые волны (направленные параллельно наиболее длинным стенам). Все эти причины приводят к тому, что наличие выраженных дискретных собственных частот и мод колебаний, особенно в ма- лых помещениях, является крайне нежелательным фактором, ухуд- шающим общую «акустику» помещения (т. е. качество звучания в нем музыки и речи). Для борьбы с ними проектировщиками помещений (студий, кон- цертных залов и др.) используются различные методы: выбор про- порций и формы помещения, размещение различных нерегулярно- стей в нем (колонн, отражателей и др.), выбор звукопоглощающих материалов и способов размещения их на стенах и др. Для прямоугольных помещений важнейшим фактором является выбор пропорций помещения. Крайне нежелательна кубическая форма: при ней происходит «вырождение» или совпадение соб- ственных частот, за счет чего некоторые из них становятся наибо- лее выраженными по амплитуде, а это, в свою очередь, приводит к сильному окрашиванию звука. Выбором соответствующих пропор- ций можно добиться более равномерного распределения частот в спектре. Еще в Древней Греции были открыты пропорции «золо- того» сечения, при которых соотношение высоты, ширины и дли- ны помещения подчиняется следующему закону: UB = В/Н при L = В + Я, где L — длина, В — ширина, H — высота помещения. Если учесть, что объем помещения V = LxBxH, то получится: H = 0,62\[у ; В = \[у ; L = 1,62. Именно эти пропорции широко использовались архитекторами прошлых веков при создании кон- цертных залов с прекрасной акустикой. В современных работах приводятся также следующие рекомендации для выбора допусти- мых пропорций помещения H : В : L [40]: 1 : 1,14 : 1,39; 1 : 1,28 : 1,54; 1 : 1,6 : 2,33; 1 : 1,62 : 2,62. Для обеспечения более равномерного распределения собствен- ных частот часто используется непрямоугольная форма помеще- ния, в котором расчет спектра и структуры звукового поля произ- водится на основе волновой теории численными методами, (для чего разработано достаточное количество различных компьютер- ных программ). Пример расчета структуры звукового поля для прямоугольной и непрямоугольной комнаты показан на рис. 5.1.12.
Акустика помещений 491 /= 34,3 Гц /=31,6 Гц /= 98,0 Гц /= 95,3 Гц 100 Рис. 5.1.12. Структура звукового поля в прямоугольном и непрямоугольном помещении (моды колебаний 1.0.0 и 4.0.0) Оптимизация формы помещения, размещение в нем различных отражающих поверхностей и звукопоглощающих материалов про- изводится методами компьютерного моделирования. Таким образом, волновая теория является наиболее точным, но и наиболее трудоемким методом расчета структуры звуковых полей в помещениях, — даже несмотря на широкое использование компьютерных технологий. В настоящее время в практике проектирования помещений используются все три теории: волновая, статистическая и геомет- рическая. Границы их применимости приближенны и зависят от размера помещения и времени реверберации в нем. Условно весь слышимый частотный диапазон можно разделить следующим образом [40] (рис. 5.1.13): начиная с частоты /; = 170/L можно использовать волновую теорию; с частоты f2 ~ 2000(77F)172 — ста- тистическую; и с частоты f3 = Af2 — геометрическую (L — длина помещения, V — объем, T — время реверберации). Например, Низшее значение резонансной частоты, связанной с длиной помещения - \ Область преимущест- венного применения волновой теории f, Область применения статиста ческой теории Верхний предел слуха Область допустимого применения геометрической теории а f fs 0 Частота Гц Рис. 5.3.13. Частотные границы применимости трех теорий расчета (волновой, статистической и геометрической)
492 Глава 5 О 35 70 100 ПО 165 200 Объем комнаты м Рис. 5.1.14. Изменение границ применимости трех теорий расчета с изменением объема помещения для помещения с размерами 6,7 х 5,5 х 4,3 м эти границы составляют/у = 26 Tu^f2 = 107 Гц, f3 = 408 Гц. Зависимость ширины этих областей от размеров помеще- ния показана на рис. 5.1.14. Из этих данных видно, что с увели- чением размеров помещения увеличивается область примени- мости статистической и геомет- рической теории, — и наоборот, для малых помещений их облас- ти применимости очень ограниче- ны и там в основном возможно использование волновой теории. 5.1.2. Связь объективных параметров и субъективной оценки акустики помещений Объективные параметры, полученные с помощью волновой, статистической или геометрической теории, такие как время ревер- берации, структура резонансных частот, время и направления при- хода ранних отражений и др., являются основой для оценки акус- тических свойств различных помещений (концертных залов, студий, театральных залов, аудиторий и др.). Однако поскольку проблему расшифровки процесса формиро- вания пространственного слухового образа на основе полученной информации об объективных параметрах нельзя считать оконча- тельно решенной, то в оценке качества звучания музыки и речи в различных залах существенную роль играют субъективные оценки. Значительные усилия были приложены за последние годы раз- личными исследователями к установлению связи между объектив- но измеряемыми параметрами звукового поля в помещениях и субъективной оценкой качества звучания музыкальных и речевых программ в них. По этим вопросам в литературе опубликованы многочисленные (иногда противоречивые) результаты. Наиболее детальные исследования были выполнены Л. Беранеком [4-7] и М. Шредером [10]. Субъективная оценка акустики помещений для музыкальных и речевых программ представляет значительные трудности, по- скольку требует решения следующих проблем: выбор метода оцен- ки; выбор критериев оценки; установление их связей с объектив- ными параметрами и др.
Акустика помещений 493 Выбор метода оценки: все используемые методы представля- ют собой специально организованные тесты на прослушивание, которые проводятся одним из следующих способов: — в искусственно созданных условиях, например в синтезиро- ванном звуковом поле, создаваемом в заглушённой камере рас- пределенной системой громкоговорителей; — с помощью стереофонических записей, сделанных в испы- туемых зале на «искусственной голове» для последующего прослу- шивания через головные телефоны; — путем непосредственного прослушивания оркестра или ис- полнителей в испытуемых залах опытными экспертами с последу- ющей статистической обработкой их оценок. В любом случае результаты субъективных оценок акустики по- мещений существенно зависят от выбора экспертов: их общей и музыкальной культуры, опыта прослушивания, вкусов, профес- сии и т. д. Выбор критериев оценки: одна из первых попыток составить «словарь» критериев субъективной оценки акустики музыкальных залов была предпринята именно Л. Беранеком [4]. На основе лич- ного опыта, а также бесед с известными дирижерами, музыканта- ми, опытными слушателями он выбрал из многочисленных субъективных оценок различных залов (теплый, холодный, пустой, глухой и др.) восемнадцать наиболее употребляемых субъектив- ных критериев, а из них предложил десять наиболее значимых и независимых. Хотя эта методика вызвала ряд возражений специ- алистов, она послужила толчком к многочисленным исследовани- ям. В настоящее время некоторые из результатов этих исследо- ваний введены в стандарты. К наиболее распространенным субъективным критериям оценки акустического качества помеще- ний относятся: жизненность (liveness), полнота звука (fullness), различимость, или ясность (definition, clarity), интимность (intimacy), теплота (warmth), пространственность (spacious- ness), громкость (loudness), баланс (balance), ансамбль (ensemble), тембр (timbre ), а также отрицательные факторы — эхо, порхаю- щее эхо, мешающие шумы. В ряде работ предлагаются дополни- тельно и другие параметры, например однородность (uniformity), атака (attack), текстура (texture) [40]. Прежде чем приступить к установлению связей субъективных оценок качества звучания и объективных параметров, была выпол- нена общая классификация всемирно известных концертных залов по качеству звучания в них различных музыкальных произведений на основе анкетных опросов музыкантов, музыкальных критиков, опытных слушателей и т. д. В результате все рассмотренные залы (более пятидесяти в разных странах мира) были объединены в три группы — А, В, С — в соответствии с качеством звучания испол- няемых в них произведений.
494 Глава 5 Соответственно в этих залах были проведены измерения объек- тивных параметров реверберационного процесса. Как было показано в разделе 5.1.1, для описания ревербераци- онного процесса обычно используется величина «время ревербе- рации», которая определяется объемом зала и общим коэффици- ентом звукопоглощения в нем, но не зависит от формы зала, структуры распределения поглощающего материала и т. д., т. е. яв- ляется усредненной характеристикой. Однако исследования по субъективной оценке качества звуча- ния в различных помещениях заставили ввести целый ряд допол- нительных параметров, более тонко характеризующих ревербера- ционный процесс. Вот некоторые из них: — «ранний звук» определяется как прямой звук и отражения, поступившие в первые 80 мс после прихода прямого звука. При- чем существенное значение имеет направление прихода этих ран- них звуков. Так, например, звуки, пришедшие от боковых стен в первые 80 мс, создают ощущение пространственного расширения источника звука, что улучшает качество восприятия музыки; — «громкость ранних звуков» определяется энергией прямого звука и энергией отраженных звуков, пришедших в первые 80 мс; — «громкость реверберирующего звука» определяется общей звуковой энергией, которая достигает слушателя после 80 мс; — «раннее время реверберации» — время затухания звука пос- ле выключения источника, когда уровень звукового давления уменьшается на 10 дБ. Кроме того, для сопоставления с субъек- тивными оценками используется также время реверберации (BP) при спаде звукового давления от -5 до -35 дБ при заполненных залах; — «коэффициент внутрислуховой кросс-корреляции» (KBCKK) определяется как коэффициент корреляции сигналов, поступивших на два уха (обычно используется время интеграции от 0 до 80 мс в трех октавных полосах с центральной частотой 500, 1000 и 2000 Гц). Этот коэффициент характеризует степень различия звуковых сигналов на двух ушах как по времени их прихода, так и по амплитуде. Кроме этих, используется для сравнения с субъективными оценками и целый ряд других параметров (эквивалентная ревер- берация, распределение уровней звукового давления и др.). Сравнение результатов субъективных экспертиз, выполнен- ных в вышеуказанных залах, с приведенными выше параметра- ми показало, что имеется отчетливая связь между общим впе- чатлением от акустики зала и временем реверберации [4-7]. В лучших концертных залах, выбранных по результатам субъек- тивной экспертизы, среднее время реверберации равно 2,02 с (табл. 5.1.3).
Акустика помещений 495 Таблица 5.1.3 Название, местонахождение Год строи- тельства Объем, M3 Кол-во мест Объем на одно место, M3 Трев' C Колонный зал Дома Союзов, Москва 1814 12500 1600 7,8 1,72 Гроссер-Мюзик-ферейнсаал, Вена 1870 15000 1680 8,9 2,05 Симфонический зал, Бостон 1900 18740 2631 7,1 1,8 Консертгебау, Амстердам 1878 18780 2047 8,5 2,0 Большой Зал Консерватории, Москва 1901 17000 1800 9,4 1,8 Зал Филармонии, Берлин 1963 24200 2200 11,0 2,2 Ройал-Альберт-Холл, Лондон 1871 86600 6080 14,2 2,5 Карнеги-Холл, Нью-Йорк 1891 24250 2784 8,7 2,15 Концертный зал, Лейпциг 1981 21000 1900 11,0 2,0 На основе полученных результатов была выполнена более диф- ференцированная оценка отдельных субъективных параметров акустики залов и исследована их связь с измеренными объектив- ными характеристиками: — жизненность (гулкость) — эти термины прежде всего свя- заны с оценкой общего впечатления от акустики залов, которая в первую очередь определяется значением времени реверберации (особенно в области средних и высоких частот). Все помещения по этому критерию ранжируются достаточно четко (соборы, концертные залы, студии и др.). Для каждого вида музыки и речи существуют оптимальные пределы изменения времени ревербера- ции, которые зависят от объема помещения и частоты (рис. 5.1.15). Оптимальное время реверберации меняется в пределах от 0,4 до 1 с для речи, от 1 до 1,5 с для камерной музыки, от 1,6 до 2,2 с для симфонической и т. д. Экспериментальные зависимости оптимального времени ревер- берации от объема помещения позволили построить следующие приближенные зависимости [21]: для речи: T = 0,3 Ig V(m3) - 0,05] для камерной музыки T = 0,4 Ig V(m3) - 0,15; для симфонической музыки Трев= 0,5 lgV(m3)- 0,3. Оптимальное время реверберации для музыки должно процен- тов на 15-20% повышаться к низким частотам (рис. 5.1.166), а для речи, наоборот, понижаться, что увеличивает ее разборчивость. Время реверберации в помещении всегда являлось одним из важнейших факторов, который учитывался композиторами при со- здании произведений: например, композиторы органной музыки
496 Глава 5 Coi реме! ные оркест ювые MIlIfI IMII [ классики и Кон (ерты Музыкальные JIeKi ионн] ле MlP Студи MIIMI MaJ ые театры in in in in К» нотеа гры MlMM Ml IM IMIIII Лекционнь е и ко|нфер€нц-за. [ы MMlMlMM I IMIIM MT Танцёвальйые or кестр MlMM ИМИ III* Ц( ркви IMMM IMII nihil hi hi ниш пинии Симфонии (рома ггиче :кие произв» HIHH HIIHI HIHI : 1роизведения дл! боль них хоров I Fl Il Il IHII Il HTl I ~ " Оцера HI IHIIiI I сомед in с перемеренном актрров по сцен)е, оперетты ы алые концертные залы HHlIl IMM г \ аудатории H IHl звукозапиЬи и радиостудии Для речи произведеЕ ия, MlHHIl \ ОЙ MVIIb IHI Il I I 1ыки : использованием Залде уни^ерса^ьногб „ HTIlIl шиши Лекционные за^ы HHHl Hl ■■■ • ' назн пени: i гаи Hh ни «дения) конц ерты 1 каме шая я узык i систем звук* «усиления Cot оры 0,2 0,4 0,6 0.8 1,0 1,2 1,4 1,6 1,8 2,0 2,2 2,4 2,6 2,8 3,0 3,2 3,4 с Рис. 5.1.15. Оптимальное время реверберации на частотах 500-1000 Гц специально делали паузы, чтобы была слышна длинная ревербе- рация в соборе. В помещениях (в том числе в студиях), где вре- мя реверберации слишком короткое для данного вида музыки, звук характеризуется как «мертвый», «сухой»; — полнота тона (звучность) также зависит от времени ревер- берации, но, в первую очередь, от отношения энергии ревербериру- ющих звуков к энергии ранних звуков. Полнота тона определяется как: Л = F /F 11 п после 80 мс 1 п до 80 мс' — энергия звуков, приходящих после первых 80 мс; где£ после 80 мс 'до 80 мс — энергия прямого звука и первых отражений до 80 мс. 50 100 200 500 1000 200Ov, м3 125 250 500 1000 2000 4000/, Гц а б Рис. 5.1.16. Зависимость оптимального времени реверберации от объема помещения и от частоты 1 — речь, 2 — камерная музыка, 3 — симфоническая музыка
Акустика помещений 497 В помещениях, где энергия отраженных звуков мала, звук бу- дет казаться «пустым». В соборах, где звук от хора или органа имеет возможность свободно подниматься и отражаться от высо- ких потолков, энергия в реверберирующих звуках будет достаточ- но большой и звучание будет «полным». Для обеспечения этого качества звучания большое значение имеют выбор формы зала, размещение специальных отражающих панелей и других деталей убранства; — различимость и ясность — степень, с которой отдельные звуки в музыкальном произведении четко разделяются друг от друга. Имеется два вида «ясности» (различимости) — «горизон- тальная» и «вертикальная». Гэризонтальная относится к звукам, следующим друг за другом. Композитор использует специальные приемы, чтобы ее обеспечить: темп, повторение тонов во фразе, относительную громкость последовательных тонов и т. д. Исполни- тель также может влиять на горизонтальную различимость выбо- ром манеры исполнения. Акустические факторы в помещении, которые определяют го- ризонтальную различимость музыкального произведения, — это величина времени реверберации и отношение энергии ранних звуков к энергии реверберирующего звука: т. е. факторы те же, но отношения обратные; таким образом, уве- личение горизонтальной различимости уменьшает «полноту» тона и наоборот. Вертикальная различимость — степень, с которой звуки, зву- чащие одновременно, различаются на слух. Она также зависит от стиля произведения, искусства исполнителя, акустики зала и опыта слушателя. Акустические факторы — баланс звуков различных ин- струментов, который существенно зависит от акустических пара- метров сценического пространства; отношение энергии ранних зву- ков к энергии реверберирующего звука. Таким образом, горизонтальная и вертикальная различимость (ясность) зависят как от музыкальных, так и от акустических фак- торов. Их влияние должно учитываться композитором, чтобы сде- лать музыку доступной аудитории. Например, хоралы Баха для органа, имеющие медленную ме- лодическую линию, медленное нарастание и спад звука, требуют помещений с большим временем реверберации (>3 с) и высоким значением отношения полной реверберирующей энергии к энергии ранних отражений. Они имеют малую горизонтальную различи- мость, но высокую полноту тона. В противоположность им, концер- там Моцарта с быстрыми пассажами и тонким переплетением фортепиано и различных голосов оркестра необходимы помеще- ния с относительно коротким временем реверберации и большим С80 = E до 80 мс /Е после 80 мс '
498 Глава 5 Акустические условия Звуки исполняются медленно Звуки исполняются быстро Время ревербе- рации С80 вид сигнала вид сигнала Звуки одинаковой громкости малое большая ■ IBJL« IUUL большое средняя большое малая Звуки различной громкости большое средняя - I4uv ■ 1Чк большое малая ■ 1^\Г^« Гг^ Рис. 5.1.17. Влияние времени реверберации и темпа исполнения на ясность звучания музыки отношением ранней к реверберирующей энергии, т. е. с высокой горизонтальной и вертикальной ясностью. Влияние темпа исполнения музыки на ощущения «полноты» и «ясности» звучания в помещениях с разными значениями време- ни реверберации и разным отношением Едо 80 мс/f Епосле80 мс пока- зано на рис. 5.1.17. Здесь представлена разделимость отдельных коротких звуков в музыкальном произведении в зависимости от времени реверберации T и «ясности» — С 80. Как видно из таб- лицы, для помещений с коротким временем реверберации и боль- шим значением С80 (первая строка, пример а и б) индивидуаль- ные тоны быстрой и медленной музыки разделяются отчетливо и процессы их атаки и спада хорошо различимы, заметна быстрая часть спада звучания самого инструмента (I) и более медленная часть (R) из-за процесса реверберации. Во второй строке приве- дены данные, которые соответствует помещениям с большим вре- менем реверберации и средним значением «ясности» С80 (пример виг), — атака отдельных звуков будет слышна, а часть участка спада звука инструмента будет «закрыта» реверберацией (т. е. зву- чание инструмента существенно «затягивается» за счет того, что звук в помещении затухает достаточно медленно). При более быстром темпе исполнения уже и часть процесса атаки, так же как и спада звучания инструмента, будет плохо различима из-за ревер- берации.
Акустика помещений 499 Для примеров д и е величина T та же, но отношение раннего звука к реверберирующему звуку меньше, при этом часть атаки и почти весь спад звука инструмента закрыты реверберацией, тоны различимы плохо, «полнота» звука наибольшая. При быстром темпе тоны едва различимы, они скрыты почти полностью ревер- берацией, быстрые отрывистые звуки играть в таком помещении невозможно. Еще больше влияние реверберации и ясности С 80 сказывается на исполнении звуков разной громкости (примеры ж и з и примеры и и к). Как видно из рис. 5.17, слабые тоны прак- тически полностью маскируются процессом реверберации и ста- новятся неразличимыми. Эти процессы в каждом конкретном зале должны иметь в виду композитор и исполнитель, выбирая темп, фразировку и т. д. Таким образом, разные стили музыки требуют различных зна- чений вышеуказанных параметров. О величине времени ревербе- рации для концертных залов (и музыкальных студий) было сказа- но выше. Что касается коэффициента ясности (различимости) С80, то для воспроизведения традиционной классической музыки его значение целесообразно иметь в пределах С80 = (4+/-2) дБ (на расстоянии от источника, равном г — радиусу чуткости). [46]. Современные компьютерные технологии при моделировании процессов реверберации в разных помещениях дают возможность менять параметры в очень широких пределах. Однако, выбирая та- кие параметры, всегда необходимо помнить, что несоответствие характеристик помещения (времени реверберации, отношения энергии ранних звуков к поздним и др.) стилю музыкального про- изведения и темпу его исполнения может привести к совершенно иным субъективным ощущениям, чем это предполагалось. Поэтому при создании новых электронных композиций или обработке уже су- ществующих необходимо учитывать указанные выше критерии; — интимность (присутствие, камерность, близость) опреде- ляет для слушателя кажущийся размер пространства, в котором он слушает музыку. Разные стили музыки требуют разных значений «акустической интимности». Интимность определяется разницей во времени между прямым звуком и первым отраженным звуком, а также, частично, общей воспринимаемой громкостью звучания, (т. к. слушатель предполагает, что звук в маленьком помещении кажется громче, чем в большом). Основной вклад в ощущение «интимности» вносят первые отражения от боковых стен (в залах с достаточно высокими потолками) или от потолков при их сравни- тельно малой высоте). Как видно из рис. 5.1.18, разница путей пря- мого звука D и отраженного звука R1 в первом зале меньше, чем во втором, и, соответственно, во втором зале интервал времени между прямым звуком и первым отражением будет больше: A t -(R-D) /С , где п = 1, 2...; С — скорость звука.
500 Глава 5 зал 1 зал 2 Большая разница во време- ни прихода прямого звука и первого отражения создает у слушателя ощущение ото- рванности (отдаленности) от ис- полняемой музыки. В залах с хорошей акустикой, предназ- наченных для симфонического репертуара, этот временной ин- тервал должен составлять для слушателей, сидящих в центре зала, 15-30 мс. В пределах это- го времени, если отражения имеют похожий спектр и огиба- ющую, а их громкость не выше прямого звука, они не воспри- «—В B2- Рис. 5.1.18. Разница путей прямого и бокового отраженного звукового луча залах различных размеров нимаются как отдельные звуки, лизации прямого звука (это явление известно как эффект Хааса). Задержка на такое время (при скорости звука 340 м/с) со- ответствует разнице в расстоянии примерно 12 м, что требует ши- рины зала порядка 18-20 м. В период до XVII века камерная музыка создавалась в основном для малых ансамблей, исполнявших ее в залах с ма- лой разницей прихода ранних отражений (меньше 15 мс), что создавало ощущение близости («интимности») исполнения. В XVIII-XIX веках увеличилось количество исполнителей и соответ- ственно увеличились размеры залов (оперных, концертных и др.). Соответственно изменился стиль музыки, при этом время задерж- ки выросло до 30 мс. В настоящее время, когда размеры концерт- ных залов еще значительнее увеличились, исполнение в них ка- мерной музыки создает ощущение несоответствия стиля музыки размерам зала. Для улучшения этой ситуации иногда используются дополнительные отражающие поверхности около сцены по бокам или на потолке, что позволяет создать дополнительные ранние от- ражения с меньшим временем запаздывания и тем самым улуч- шить восприятие исполняемой музыки; — пространственность — ощущение слушателя, будто музы- ка от оркестра идет от всей ширины зала и звук окружает его со всех сторон, что обычно характеризует залы с хорошей акустикой. Наиболее полно это ощущение проявляется при прослушивании органа или хора в больших соборах. В противоположность этому в залах с плохой акустикой звук кажется идущим как бы из «окна», по размеру совпадающего с видимой частью исполнителей. Тренированный слушатель может различить две составляющие в восприятии пространственности — кажущееся расширение а помогают в улучшении лока-
Акустика помещений 501 площади источника звука (ASW) и окружение, или обертывание (LEV), когда слушатель чувствует себя погруженным в звук со всех сторон. По мнению многих экспертов, первая составляющая является одним из главных индикаторов акустического качества концертных залов и помещений прослушивания. Она связана с уровнем боко- вых ранних отражений: чем выше уровень боковых отражений в помещении, тем больше кажущееся расширение источника. Ка- жущаяся ширина звукового источника связана также с уровнем громкости на низких частотах — СЗ (в основном в области час- тот 125 и 200 Гц). Однако наибольшую связь с этим параметром показывают ре- зультаты измерений коэффициента внутрислуховой кросс-корреля- ции сигнала — КВСККрГ Этот коэффициент определяет степень различия звуковых сигналов на двух ушах, как по времени их при- хода, так и по амплитуде. Чем менее подобны друг другу звуки на левом и правом ухе, тем меньше этот коэффициент и тем больше кажущееся расширение источника ASW = 1- КВСККр3. В случае, если звуки одинаковы, коэффициент становится равным единице и кажущийся источник звука концентрируется в центре. Эти данные подробно изучены в теории стереофонии [43]. Измерения, выполненные в различных залах с помощью прибо- ра «искусственная голова» на двадцати позициях при разных по- ложениях источников звука, показали, что значения этого коэффи- циента, усредненного в трех октавных полосах с центральной частотой 500, 1000, 2000 Гц, при интеграции по времени в интер- вале 0-80 мс дают хорошую корреляцию с субъективными оцен- ками кажущегося расширения источника — ASW. Все измеренные залы оказались четко ранжированы по этому параметру. Для луч- ших по качеству звучания залов мира значения этого КВСККр3 оказались в пределах 0,3-0,6. Результаты исследований последних лет [42] позволили устано- вить, что наибольшее влияние на эффект ощущения простран- ственности звучания (кажущегося расширения источника) оказыва- ют в первую очередь следующие параметры: коэффициент междуушной корреляции; уровень энергии и время задержки пер- вых (в первую очередь боковых) дискретных отражений. Измере- ния и расчеты для разных позиций в помещении всех трех коэф- фициентов позволили установить достаточно четкую корреляцию между ними: например, коэффициент междуушной корреляции четко связан с уровнем боковых отражений S: КВСККр3 ~ 100—S/1,5. Обертывание, или погружение (LEV) связано с ощущением позднего реверберирующего звука, поступающего со всех сторон (после 80 мс). Оно определяется особенностями конструкции зала: наличием нерегулярностей стен, балконов и т. д., то есть всеми конструктивными элементами, которые обеспечивают приход зву- ка с разных сторон (диффузность звукового поля). Так, например,
502 Глава 5 ощущения звучания музыки у слушателя, к которому отраженные звуки приходят со всех сторон (от потолка, стен, пола и т. д.), будут существенно отличаться от ощущений слушателя, сидящего под балконом, к которому звук приходит только с фронта; — громкость — для оценки залов используется субъективное понятие, характеризующее громкость источника звука при игре фортиссимо по отношению к некоторой «ожидаемой» громкости на месте прослушивания (наиболее благоприятное расстояние по этому параметру в большинстве залов: 18 м для прослушивания прямого звука от оркестра, 6-15 м — от солистов). Громкость определяется субъективным ощущением плотности звуковой энергии на месте прослушивания. Для ее объективной оценки в работах Л. Беранека [4-6] был предложен параметр «сила звука» (СЗ), который определяется как разность между уров- нем звукового давления, измеренного на шумовом сигнале на ме- сте слушателя, и уровнем звукового давления от того же источника на том же расстоянии в заглушённой камере. При этом измере- ния проводятся на шумовом сигнале в октавных полосах с часто- тами 125, 250, 500, 1000, 2000 Гц и 4000 Гц. При измерениях учи- тывается только энергия прямого звука и ранних отражений, пришедших в первые 80 мс. Обычно нормируются два параметра: один усредненный в полосах 125 Гц и 250 Гц — Снч2, другой в по- лосах 500 Гц, 1000 Гц и 2000 Гц — Ср3. Значения этих парамет- ров для лучших залов оказались равными 6 дБ и 6,2 дБ; — теплота — зависит от отношения времени реверберации на низких частотах к времени реверберации на средних (измеряет- ся при заполненном зале). При этом время реверберации на низ- ких частотах должно быть равно или больше времени ревербера- ции на средних частотах (примерно на 20% в области ниже 125 Гц по отношению к времени реверберации в диапазоне 500-1000 Гц). «Теплота» субъективно определяется как «звучность» басов по сравнению со «звучностью» средних частот. Беранеком был предложен критерий KHT («коэффициент низкого тона»), равный отношению среднего значения времени реверберации на частотах 250 Гц и 500 Гц к среднему значению времени реверберации на частотах 500 Гц и 1000 Гц: T +T Арев125 Арев250 KTH = Трев500 + ТревЮОО Его измеренные значения для лучших концертных залов оказа- лись в пределах 1,08-1,10; — баланс — понятие, используемое для оценки громкости отдельных инструментов и групп инструментов по отношению к об- щей громкости оркестра. Баланс должен иметь место как между
Акустика помещений 503 разными группами инструментов, так и между оркестром и солис- тами. Он зависит от акустических особенностей сцены и околосце- нического пространства (подробнее об этом в разделах 5.2-5.5), размещения оркестрантов, способностей дирижера и звукорежис- сера и т. д. Один из вариантов количественной оценки баланса звучания инструментов в помещении предложен в работе [26]; — ансамбль — понятие, включающее в себя «стройность, сла- женность» совместного исполнения, а также ритмическую точность исполнения отдельных партий. Чувство ансамбля зависит от слы- шимости собственного исполнения и взаимной слышимости, что определяется в значительной степени конструкцией сцены и по- верхностей вблизи нее (см. разделы 5.2-5.5); — тембр — это понятие сложное и многогранное, как уже было отмечено в главе 3. Тембр зависит от структуры звука во все пе- риоды его звучания: в момент установления (атаки), в стационар- ный период и в момент спада. Акустические свойства помещения оказывают влияние на все этапы звучания и, соответственно, на воспринимаемый тембр. Как уже было отмечено выше, помещение является линейным фильтром, который производит обработку му- зыкального или речевого сигнала как во временной, так и в частот- ной области. Реверберационный процесс в помещении изменяет характер процессов спада звуков музыки и речи. Структура распределения резонансных частот в помещении также существенно влияет на спектральный состав музыкальных и речевых сигналов. Как было показано в разделе 5.1, плотность резонансных частот зависит от размеров помещения. Для поме- щения с малыми размерами дискретные резонансы попадают в область слышимых частот и значительно «окрашивают» звуча- ние. Плотность резонансных частот должна быть достаточно вели- ка, чтобы не было заметно изменение тембра за счет резонансов (например, в работе [26] предлагается считать необходимой плот- ность пиков 0,1 пик/Гц на низких частотах и 3 пик/Гц на средних). Исполнение музыки в помещениях с малым объемом неизбежно приводит к искажению тембра — за счет дискретных резонансов, малого времени реверберации, недостаточного временного интер- вала между прямым звуком и первыми отражениями и др. (музы- ка требует «пространства»: в частности, для музыкальных студий минимально допустимый объем должен быть не менее 200 м3). Таким образом, тембр существенно зависит от размеров и формы помещения, от распределения и величины коэффициента затухания в нем, от наличия рассеивающих элементов, обеспечивающих диффузное звуковое поле, и многих других факторов (из чего и складывается искусство создания залов с хорошей акустикой). Следует подчеркнуть, что влияние параметров помещения на тембр звучания очень существенно, о чем по собственному опыту хорошо знают музыканты-исполнители. Поэтому выбор
504 Глава 5 оптимального значения времени реверберации для каждого стиля музыки, а также оптимальных значений рассмотренных выше дру- гих параметров является обязательным условием обеспечения хо- рошего тембра звучания музыкальных и вокальных произведений в данном помещении. Среди других субъективных критериев, достаточно часто исполь- зуемых в различных исследованиях, можно выделить такой пара- метр как текстура. Он связан с субъективными ощущениями, кото- рые определяются структурой первых дискретных отражений, разницей во времени между приходом прямого звука и первого отражения (а также между приходом второго и третьего отражения и т. д.) и соотношением амплитуд между этими отражениями. До настоящего времени оценить все перечисленные субъектив- ные критерии можно было только в уже построенных помещениях. Только созданные за последние годы методы компьютерного мо- делирования звукового поля с возможностью предварительного прослушивания звучаний различных музыкальных и речевых источ- ников открывают принципиально новые возможности в проектиро- вании концертных залов, студий и др. (см. раздел 5.3). Наряду с акустическими параметрами помещений, которые оп- ределяют положительные впечатления от прослушивания в них му- зыки и речи, существует целый ряд параметров, которые являют- ся мешающими факторами. Ниже перечислены основные из них. Эхо — заметное на слух повторение прямого звука. Заметность эха зависит от времени запаздывания и интенсивности отражен- ных сигналов [22]. При времени запаздывания меньше 80 мс ощу- щение эха практически отсутствует, даже при достаточно больших уровнях сигнала. Порхающее эхо — многократная периодическая последователь- ность эха, что создает тональную окраску звука (эффект «гребенча- того фильтра»). Сильный эффект наблюдается при длинных парал- лельных стенах, что характерно для многих современных залов. Наличие эха может приводить к нарушению локализации звуковых источников, что совершенно недопустимо в помещениях для про- слушивания музыки. Мешающие шумы — общее впечатление от любого исполне- ния музыки или речи может быть в значительной степени испор- чено, если в зале имеется высокий уровень мешающих шумов. В таких залах (или студиях) оказывается трудно, иногда практиче- ски невозможно обеспечить звукозапись. Уровень шумов в зале определяет динамический диапазон воспринимаемого музыкально- го или речевого сигнала. Поскольку слабые уровни сигнала маски- руются шумом, это приводит к значительной потере качества зву- чания музыки и разборчивости речи. Уровень шумов в помещении зависит от нескольких причин: — проникновения внешних шумов от транспорта и др. Имен- но для борьбы с этими шумами применяются различные способы
Акустика помещений 505 звуко- и виброизоляции при строительстве концертных залов и студий; — возникновения внут- ренних шумов (от вентиля- ционных, осветительных и других систем), а также шумов от публики. При стро- ительстве студий значитель- ные средства затрачивают- ся на уменьшение уровней шумов от различных обеспе- чивающих систем. Общий уровень шумов в хороших залах (и студиях) должен соответствовать международным нормам, т. е. быть ниже кривой NC-20 (даже пред- почтительнее NC-15). Соответствующие кривые допустимых шумов показаны на рис. 5.1.19. Общее акустическое впечатление от помещения, в котором прослушиваются музыка и речь, складывается из всех вышепере- численных факторов. Значения основных вышеуказанных параметров для трех залов [6], отнесенных экспертами к лучшим залам мира по качеству зву- чания в них музыкальных программ, приведены в таблице 5.1.4: Таблица 5.1.4 Название зала, место- нахож- дения "^"рев время ревербе- рации, с Кол- во мест (1- KBCKK^ — коэф. кросс- корре- ляции С80* — ясность, ДБ СЗр3- гром- кость, ДБ СЗнч2 гром- кость, на н/ч, ДБ At — разность времени прихода, MC Гроссер- Мюзик- ферейн- саал, Вена 2,05 1680 0,71 -3,7 6,8 6,9 12 Симфо- нии, зал, Бостон 1,8 2631 0,65 -2,7 4,8 2,6 15 Консерт- гебау, Амстердам 2.0 2047 0,62 -3,3 5,8 5,1 21 * При расстояниях до источника больше г. NC-65 NC-60 NC-55 NC-50 NC-45 NC-40 NC-35 NC-30 NC-25 NC-20 NC-15 1000 2000 40008000 Центральная частота октавной полосы Рис. 5.1.19. Нормирующие кривые уровня шумов
506 Глава 5 Классификация концертных залов мира, выполненная в ра- ботах Л. Беранека [4, 5, 7], показала, что значения указанных выше объективных параметров существенно меняются при пере- ходе от залов, отнесенных по общему звуковому впечатлению к высшей категории (А), к залам третьей категории (С). Усреднен- ные значения параметров показаны в таблице 5.1.5: Таблица 5.1.5 Группы "^"рев' С (1 - квсккр3) С80, ДБ сзп., Л сзнч2, ДБ KHT Группа А 2 0,66 -2,5 6,2 6,0 1,08 Группа В 1,6 0,56 0,0 3,3 2,9 1,09 Группа С 1,4 0,41 0,1 1,7 0,4 1,10 Способы, которыми обеспечиваются оптимальные значения вы- шеуказанных параметров, различаются в зависимости от назначе- ния помещения: концертные залы, студии, звукозаписи, домашние помещения прослушивания и др. Некоторые из них будут рассмот- рены в разделах 5.2-5.5. 5.2. АКУСТИКА КОНЦЕРТНЫХ И ТЕАТРАЛЬНЫХ ЗАЛОВ Развитие музыкального и вокального искусства, особенно в по- следние десятилетия в связи с появлением техники звукозаписи, кино, телевидения, мультимедиа и пр., привело к большому разно- образию помещений, в которых исполняются музыкальные и во- кальные произведения с особыми требованиями к их акустическим характеристикам. Общая классификация современных помещений для прослуши- вания музыки и речи (пения) может быть предложена в следую- щем виде: — помещения с «естественной» акустикой, где качество звуча- ния оркестра, хора, солиста, оратора и др. определяется исключи- тельно акустическими параметрами помещения и передача звука происходит непосредственно от исполнителя к слушателю. Имен- но акустическое сооружение таких залов имеет самую длинную ис- торию (от нескольких столетий до нашей эры до настоящего вре- мени). Несмотря на их несомненные достоинства и высочайшее качество звука, достигнутое в лучших концертных залах мира, они все имеют сравнительно небольшой объем и ограниченную вмес- тимость. По акустическим параметрам такие помещения могут быть разделены на: лекционные залы и аудитории для передачи
Акустика помещений 507 речи; театральные залы (драматических, оперных театров); кон- цертные залы (филармонические, эстрадные и др.); — помещения для передачи звука только с помощью систе- мы озвучивания (такой тип помещения появился в начале XX века, примером может служить зал кинотеатра). В таких помещениях качество передаваемого звука в значительной сте- пени определяется параметрами системы озвучивания, хотя акустические характеристики самого зала оказывают также су- щественное влияние. В помещениях этого типа звук не поступа- ет непосредственно от исполнителя к слушателю, а предвари- тельно проходит сложную систему обработки при звукозаписи и звуковоспроизведении; — помещения, где передача звука происходит и непосредствен- но и через систему звукоусиления. Примером таких залов могут служить современные концертно-театральные комплексы. Поме- щения этого типа могут иметь значительные размеры и вмещать большое количество (до нескольких тысяч) слушателей, при этом качество звука, поступающего к слушателю, в значительной степе- ни определяется уровнем техники звукоусиления, хотя требования к акустической обработке и конструкции таких залов также чрезвы- чайно высоки; — помещения для записи и обработки звука (студии звукозапи- си, тонателье, радиовещательные и телевизионные студии и т. д.). Это особый вид помещений со специальными требованиями к аку- стическим характеристикам и, соответственно, к их конструкции. Они появились только в 30-е годы XX столетия и развиваются в настоящий период быстрыми темпами. Наконец, современные концерты проходят и в открытых поме- щениях — на стадионах, открытых эстрадах и т. д., что также вы- двигает специальные требования к их акустическим параметрам. В данной главе будут кратко рассмотрены требования к акусти- ческим параметрам помещений с «естественной» акустикой, с тем чтобы дать общие представления о влиянии помещения на каче- ство музыки и речи, исполняемых в них, а также требования к аку- стике студий и помещений с системами озвучивания. Подробные сведения об акустическом проектировании таких помещений можно найти в литературе по архитектурной акустике [4-7, 14, 17, 23, 26, 40, 46-51]. В разделе 5.2.1 будут рассмотрены акустические характеристи- ки помещений, предназначенных в основном для речевых про- грамм (лекционные залы, залы драматических театров), затем в разделе 5.2.2 — акустические свойства помещений для воспро- изведения музыки и пения (залы оперных театров, концертные залы и др.).
508 Глава 5 5.2.1. Акустика лекционных залов (аудиторий) и театральных залов драматических театров Акустическое проектирование помещений, предназначенных в основном для речевых программ, должно исходить из выполне- ния следующих задач: — обеспечение максимальной разборчивости речи, для того чтобы донести до слушателей семантическую (смысловую) ин- формацию; — сохранение естественного тембра голоса и его изменений для передачи эстетической информации; — обеспечение правильной локализации звукового образа, со- вмещение его со зрительным. Исследования зависимости разборчивости речи (методы ее оп- ределения даны в разделе 4.6.4) от акустических свойств помеще- ния, особенно выполненные за последние годы [44-46], позволи- ли установить, что основные факторы, определяющие высокий процент разборчивости, следующие: — высокий уровень прямого звука на всех слушательских мес- тах и максимальное отношение уровня прямого звука к ревербе- рирующему (т. е. к поздним отражениям, пришедшим к слушателям после 80 мс); — сравнительно небольшое время стандартной ревербера- ции (оптимальное время для речевых помещений показано на рис. 5.1.15 и составляет от 0,4 с до 1,2 с в зависимости от объе- ма помещения); — достаточно высокий уровень первых дискретных отражений, прибывающих к слушателям в течение первых 80 мс; — низкий уровень шумов (высокий уровень отношения «сигнал/ шум»); — отсутствие эха и других помех в помещении. Естественно, что уровень разборчивости зависит от содержа- ния, способа произношения и темпа речи, а также от состава, воз- раста слушателей, их внимания и степени заинтересованности. Сохранение тембральных характеристик речи определяется акустическими параметрами помещения, о которых уже было ска- зано в разделе 5.1, в первую очередь отсутствием дискретных ре- зонансов, что особенно актуально для помещений малых разме- ров, поскольку дискретные резонансы могут усиливать отдельные обертоны в спектре голоса и приводить к его «окрашиванию» (особенно это может проявляться для мужских голосов в диапа- зоне 80-300 Гц). Нарушение правильной локализации в помещениях с «есте- ственной акустикой» может быть вызвано наличием сильных позд- них отражений (эха или порхающего эха), для устранения которых необходимы специальные конструктивные меры. Кроме того,
Акустика помещений 509 явление «гребенчатой» фильтрации за счет порхающего эха с ред- кими пиками — провалами при малых временных задержках от- раженных сигналов (может возникать в помещениях небольших размеров) также способно привести к искажению тембральных характеристик речи. Таким образом, во всех помещениях, предназначенных для передачи речи, должна быть обеспечена специальная структура реверберационного процесса, в котором имеются: максимальный уровень прямого звука; интенсивные дискретные отражения (причем желательно, чтобы запаздывание первых из них не пре- вышало 20 мс, и число этих отражений было как можно большим на всех слушательских местах); сравнительно быстрое затухание поздних отражений; плавный характер спада уровня энергии (отсутствие эха). В зависимости от назначения помещения эти задачи решаются разными конструктивными методами — в первую очередь выбором размеров и формы зала, размещением в нем специальных отражающих конструкций, а также выбором и разме- щением звукопоглощающих материалов. Лекционные залы (аудитории): для обеспечения слушате- лей интенсивным прямым звуком в них необходимо учитывать, что уровень звукового давления, который может создать голос орато- ра, в среднем составляет 86 дБ/м, при этом он уменьшается об- ратно пропорционально расстоянию (эффект «скользящего погло- щения», см. гл. 2); диаграмма направленности голоса оратора существенно сужается с частотой (см. гл. 3); прямой звук при рас- пространении вдоль голов сидящих слушателей в значительной степени поглощается (см. гл. 2), а на высоких частотах начинает влиять также их экранирующее действие. В связи с этим размеры лекционных залов с «естественной» акустикой не должны превышать в длину 20 м (L < 20 м), а для ширины и высоты должны соблюдаться соотношения: 1 < {LiB) < 2 и 1 < {JJH) < 2, что дает значения для максимальной ширины и вы- соты зала: В < 15 м, H < 7,5 м [22, 23, 26]. При большей ширине и высоте зала к зрителям будет приходить мало первых отраже- ний, при этом они будут поступать со слишком большим интерва- лом запаздывания. Рекомендуемый объем зала для речевых ауди- торий должен задаваться из расчета V/N = 4-8 м3 (в среднем 5 м3) на одного зрителя; следовательно, максимальная вмести- мость не должна превышать 400 человек (при большей вместимо- сти требуется устанавливать систему звукоусиления) [40, 44-47]. Для уменьшения влияния скользящего поглощения использует- ся установка платформы для оратора (высотой не менее 1 м от пола), тогда источник звука будет находиться примерно на высоте 1,5 м над головами слушателей и влияние этого поглощения будет малым. Для небольших аудиторий могут использоваться плоский потолок и прямоугольная форма плана помещения. В больших
510 Глава 5 J JJJJJJJ кДд^д^д^ я!" лекционных залах обычно обеспечиваются подъем слушательских мест (рис. 5.2.1), особая форма потолка для усиления отражений, особенно для задних рядов (рис. 5.2.2), а также специальные от- ражатели над головой оратора (рис. 5.2.3). Следует только учесть, что для эффективного отражения звука размер отражающей пане- ли должен быть больше длины волны (для низшей частоты диа- пазона); в частности, для речи - "~ эта частота должна быть не выше 500 Гц и размеры панели не менее 1,35 м. Кроме того, в больших лекционных залах плоскопараллельная форма бо- ковых стен может не обеспечить попадания ранних отражений на всю площадь зрительного зала и быть причиной появления порха- ющего эха, поэтому часто при- меняются скошенные боковые стены. При выборе отражающих ма- териалов и их размещении учи- тывается, что поверхности, со- здающие первые отражения (потолок над оратором, нижняя часть боковых стен, передняя стена), должны быть отражающи- ми. Оптимальным материалом при этом является дерево, по- скольку материалы с большой добротностью, т. е. малым зату- ханием, например мрамор, ме- талл и др., могут создавать ок- рашивание речи. Остальные части поверхности должны быть поглощающими для уменьшения времени реверберации, поэтому Рис. 5.2.1. а — плоский пол в аудитории, - ступенчатый подъем слушатель- ских мест б Рис. 5.2.2. Особая форма потолка в аудитории И §§ II g§ IS Ig SS gg фанерный экран ^^¾, Рис. 5.2.3. Специальные отражатели над кафедрой в лекционном зале
Акустика помещений 511 используются ковры на полу, мягкие кресла и т. д. В акустически правильно спроектированном лекционном зале лектору и слушате- лям легко читать и воспринимать лекции и доклады, а при плохой акустике зала звукоусиление может понадобиться даже для ма- ленькой аудитории (до 50 человек). Акустика залов драматических театров: акустические тре- бования к залам драматических театров существенно отличаются от требований к лекционным залам и аудиториям. Это вызвано следующими основными причинами [22, 26, 40]: — в театральном действии важно донести не только семанти- ческую, но и эстетическую информацию, что требует точной пере- дачи тембральных характеристик голоса; — голос актера (профессионально поставленный) позволяет обеспечить больший динамический диапазон (соответственно большую громкость в зрительном зале); — источники звука (голоса актеров) находятся на сцене, обору- дованной декорациями, поэтому часть излучаемой энергии не по- падает в зал (поглощается на сцене); кроме того, актеры находят- ся в движении, поэтому часть энергии также не попадает в зал из-за направленности человеческого голоса (см. раздел 4.6); — драматическое действие часто сопровождается музыкой, что выдвигает дополнительные требования к акустике зала; — актер должен постоянно находиться в зрительном и слухо- вом контакте с аудиторией, что накладывает определенные огра- ничения на размер и акустические параметры зала. Все эти требования означают, что акустические характеристики зала должны обеспечивать не только достаточно высокий уровень прямого звука и первых дискретных отражений, что важно для хорошей разборчивости речи, но и определенные направления их прихода, от которых зависят такие субъективные критерии, как пространственность и интимность звучания. Кроме того, время реверберации в таких залах должно быть больше, чем в речевых аудиториях, чтобы обеспечить определенную полноту, жизненность и теплоту звучания. Экспериментальные исследования, выполнен- ные в работе [22], показали, что для того чтобы удовлетворить та- ким противоречивым требованиям, целесообразно сформировать особую структуру реверберационного процесса: уровень сплошных отражений, начинающихся после участка дискретных отражений, должен быть существенно ниже уровня прямого звука, тогда при сохранении достаточно высокой разборчивости речи время ревер- берации может быть увеличено. Это можно обеспечить за счет хо- рошего рассеяния звука на завершающем участке реверберацион- ного процесса. Исходя из этих требований зал драматического театра может быть разделен на две части с разными акустическими параметра- ми: околосценическую часть (с сильными ранними отражениями)
512 Глава 5 d J Рис. 5.2.4. Расположение балкона в зале театра и зрительскую часть, обеспечиваю- щую хорошее рассеяние и поглоще- ние звука. Выбор размеров и формы зала определяется вышеуказанными тре- бованиями [22, 23, 26,40]: длина зала должна находиться в пределах 26-30 м, для сокращения этого рас- стояния часто используются балконы и ярусы. При правильном проектиро- вании балконов на них приходит дос- таточное количество ранних отражен- ных сигналов, для этого глубина балкона D не должна превышать уд- военной высоты зала Н: D < 2Н (рис. 5.2.4). Ширина зала В должна удовлетворять условию 1< L/B < 2, т. е. В ~ 20-22 м. Высота зала обыч- но составляет 8-14 м: это связано, во-первых, с высотой портала сцены (и устройством осветительной систе- мы), а во-вторых, с обеспечением оптимального времени запаздыва- ния первых отражений от потолка, которое для драматических театров рекомендуется выбирать в пределах 15-20 мс (при этом длина пути отра- женного звука будет больше прямого на 5-7 м). Рекомендуется также раз- мещать несколько звукоотражающих панелей на участках потолка, примы- кающих к порталу сцены (рис.5.2.5). Используются панели выпуклой фор- мы, чтобы отражения попадали на все места зрительного зала; матери- ал для панелей также должен быть специально подобран, чтобы не вно- сить окрашивания в звучание (обыч- но применяется дерево). Размеры панелей должны быть больше длины волны отражаемого звука (для залов сравнительно больших объемов — не менее 5-6 м). Большое значение для получения сильных первых отражений имеет оборудование сцены [26, 40]. В частности, наличие только мягких декораций увеличивает поглощение звука. Использование твердых (фанерных) декораций, расположенных не слишком дале- Рис. 5.2.5. Различные варианты формы потолков и расположения отражающих панелей в зале театра
Акустика помещений 513 ко от источника звука (не более 7 м), может увеличить уровень по- лезного сигнала. Ширина зала и форма боковых стен у сцены имеют также очень большое значение в формировании структуры первых боко- вых отражений, максимальное время запаздывания от которых не должно превышать 35 мс. Поскольку площадки первых отражений располагаются в основном на 1/3 части боковых стен, форма пла- на зала может быть трапецеидальной с расширением до 24-26 м. Большое влияние на равномерность прихода первых отражений от боковых стен к зрительским местам оказывают размеры и форма простенков между порталом сцены и боковыми стенами. Если они слишком большие, на некоторых местах образуется «акустическая тень» [22]. Таким образом, околосценическая часть зала должна формировать сильные первые отражения, т. е. должна быть отра- жающей. Зрительная часть зала должна обеспечивать: требуемое время реверберации, которое для драматических театров составляет T= 1,35-1,6 мс в зависимости от объема помещения; создание диффузного звукового поля; обеспечение всех зрительских мест достаточным количеством прямой энергии и энергии ранних отра- жений, пришедших от передней части зала. Этим условиям удовлетворяют классические залы драматиче- ских театров, построенные по ярусной системе, — например зал Александрийского драматического театра в Санкт-Петербурге (рис. 5.2.6). Пересечение стен ярусами и балконами способствует рассеянию энергии и обеспечивает ее значительное поглощение за счет чередования отражающих (барьеры ярусов) и поглощающих (зрители) полос. При такой системе зрительные залы могут иметь объемы от 4000 до 10000 м3 (в среднем 6000 м3). Объем на од- ного зрителя составляет V/N ~ 4,5 м3. В залах, построенных по ярусной системе, обычно не требуется дополнительных погло- тителей. Общая форма зрительного зала при ярусной системе Рис. 5.2.6. Ярусная система классического драматического театра (продольный разрез зала Александрийского театра — XIX в.)
514 Глава 5 Рис. 5.2.7. Зрительный зал современного драматического театра может быть выбрана достаточно произвольно (прямоугольная, трапецеидальная, овальная), однако она должна способствовать рассеянию звука. В залах, созданных по другим системам (рис. 5.2.7), требуется размещение дополнительных звукопоглощающих материалов и введение звукорассеивающих элементов на стенах и на потол- ке. Методика расчета необходимого количества и способов разме- щения поглотителей приведена в работах [22, 28, 33]. 5.2.2. Акустика залов оперных театров Архитектура оперных театров по праву может быть названа классической: она восходит корнями к греческим и римским амфи- театрам, где зрители располагались полукругом на постепенно по- вышающихся уровнях. Форма зала в виде параболоидной чаши позволяла сократить его длину и обеспечить прямыми лучами все точки зала; отраженные звуки дополнительно создавались камен- ными зданиями за сценой (рис. 5.2.8). Переход от открытых амфи- театров к полностью закрытым театрам произошел в XVI веке Рис. 5.2.8. Греческий амфитеатр хорошую Структуру Отраженного в Италии, (таковы, например, театр Олимпико, театр Фарнезе в Парме и др.). Их форма пол- ностью повторяла римский ам- фитеатр, но зал был закрытым, сцена приобрела более вытяну- тую форму и появился просце- ниум. Последующие оперные театры, включая современные, повторяют эту форму зала с мно- гочисленными ярусами и балко- нами, что сохраняет все преиму- щества амфитеатров и создает
Акустика помещений 515 (диффузного) поля. Требования к акустике оперных театров прак- тически не изменялись на протяжении четырех веков, только ис- полнение опер Вагнера выдвинуло новые требования к увеличе- нию времени реверберации. В отличие от драматического театра в опере ведущую роль играет качество звучания музыки и пения, хотя при этом остается необходимость обеспечения хорошей разборчивости. Поэтому и требования к акустическим параметрам таких залов значитель- но усложняются. В зале оперного театра должны быть хорошие субъективные характеристики, важные для оценки музыкального со- провождения, такие как жизненность, полнота, ясность (разборчи- вость), интимность, баланс, тембр и др. Требования по обеспечению этих параметров противоречивы: улучшение одних, например пол- ноты, может ухудшить другие, например ясность. В работах Бера- нека [5, 6] были предложены следующие значения параметров для оперного зала: время реверберации на средних частотах для за- полненного зала — 1,5 с для классической оперы, 1,7 с для опер Вагнера; время прибытия первых отражений — 20-24 мс и т. д. Необходимо отметить, что в литературе имеются и несколько дру- гие данные по этим параметрам [44]. Современный классический оперный театр имеет три вида по- мещений: — зрительный зал — как и в случае драматического театра, его можно условно разделить на две части — околосценическую (переднюю) и тыловую (заднюю), которые должны выполнять раз- ные функции; — сцену, оборудованную декорациями и кулисами. Сцена пред- ставляет собой большой объем, внутри которого звуковая энергия практически полностью поглощается. Это значит, что в зрительный зал со сцены излучается только прямая энергия, а короткие отра- жения от поверхностей, окружающих певцов, в зал практически не приходят. Акустика сцены имеет огромное значение как для пев- цов, так и для зрителей; — оркестровую яму — объем ниже сцены по уровню, где раз- мещается оркестр; неправильно выбранные для него акустические параметры могут привести к тому, что оркестр будет заглушать певцов, музыканты не смогут играть в ансамбле и т. д. Поскольку опера является синтетическим видом искусства, требующим слухового и визуального восприятия действия, то, как и в драматическом театре, зрители должны быть в тесном кон- такте с актерами, что требует минимального удаления зритель- ных мест от сцены. Однако поскольку оперные певцы должны об- ладать более сильными голосами, то допускается большее удаление зрителей от сцены (до 35 м). Основное влияние на вос- принимаемое в оперном зале качество звучания музыки также определяется такими объективными параметрами как время
516 Глава 5 реверберации, время, направление прихода и структура ранних отражений, соотношение энергии ранних и поздних звуков и др. Время реверберации и максимальная вместимость классиче- ских оперных театров представлены в таблице 5.2.1. Таблица 5.2.1 Название, место- нахождение Год постройки Объем зала, M3 Кол-во мест Объем на одно место, M3 Время ре- верберации на средних частотах, с Театр Ла Скала, Милан 1778 11252 2289 4,9 1,24 Большой театр, Москва 1856 12000 2130 5,6 1,35 Театр Ковент-Гарден, Лондон 1858 12240 2209 5,54 1,1 Оперный театр, Одесса 1887 9000 1728 5,2 1,1 Национальная опера, Париж 1875 9960 2131 4,67 1,18 Оперный театр, Вена 1869/1959 (реконструкция) 10665 1709 6,2 1,36 Театр Колон, Буэнос-Айрес 1908 20570 2487 8,27 1,56 Метрополитен- Опера, Нью-Йорк 1883 24724 3816 6,47 1,47 Для оперных залов с хорошей акустикой было получено эмпи- рическое соотношение между объемом, временем реверберации и высотой зала [26]: (v/T500)1/3/hmax=i,i Для обеспечения теплоты звука рекомендуется подъем частот- ной характеристики времени реверберации примерно на 20% на частоте 125 Гц. Для того чтобы достичь значений времени оптимальной ре- верберации, соответствующих современным рекомендациям (рис. 5.1.15), объем зала, приходящийся на одно место, должен составлять V/N = 6-7 м3. Максимальной вместимостью зала со- временного оперного театра обычно считается 1500-1700 мест. Отсюда максимальный объем зала составляет 10 000-12 000 м3. В эту область практически попадают объемы залов наиболее из- вестных оперных театров, приведенные в табл. 5.2.1.
Акустика помещений 517 Рис. 5.2.9. Зал оперного театра JIa Скала в Милане В качестве примеров можно привести: Большой театр в Мос- кве, имеющий шесть ярусов и вмещающий 2100 человек (макси- мальное удаление зрительских мест в партере — 24 м); Оперный театр в Одессе (пять ярусов и 1700 человек при максимальном удалении зрителей в партере 23,5 м); театр Ла Скала в Милане (рис. 5.2.9) — шесть ярусов, 2300 человек при максимальном уда- лении зрителей от сцены 26 м; зал Национальной оперы в Пари- же — пять ярусов, 2100 человек, максимальное удаление зрителей от сцены 22 м. Обычно залы классических оперных театров имеют овальную форму, систему балконов и от трех до шести ярусов. Балконы дол- жны быть небольшой глубины (не превышающей 3 м), поскольку только при таком условии в подбалконное пространство свободно попадают и прямая звуковая энергия и все отражения, приходящие в течение реверберационного процесса. Интересно отметить, что в большинстве залов, построенных в XIX в эмпирически, были предусмотрены меры оптимизации акустических условий в соответ- ствии с требованиями, сформулированными только в настоящее время. Так, форма барьеров балконов и ярусов, как правило, спо- собствует хорошему рассеянию звука. При такой системе построе- ния зрительской части зала дополнительного звукопоглощения обычно не требуется. Современные залы оперных театров часто имеют прямоуголь- ную или веерную форму, без ярусов, поднимающиеся ряды зри- тельских мест и соответствующую систему размещения звукопог- лощающих и отражающих конструкций на потолке и стенах для создания равномерного диффузного поля с достаточно большим временем реверберации. Околосценическая (припортальная) часть зала требует реше- ния других задач, поскольку наряду с соответствующим време- нем реверберации в зале оперного театра требуется обеспечить
518 Глава 5 слушательские места интенсивными первыми отражениями с не- большим (20-35 мс) запаздыванием по отношению к прямому зву- ку. Эти задачи решаются таким же путем, как и в зале драматичес- кого театра (см. раздел 5.2.1): отражающие поверхности над сценой, отражающие плоскости на V3 длины боковых поверхнос- тей и т. д. Боковые стены вблизи портала сцены также должны обеспечивать формирование ранних интенсивных отражений (со временем прихода до 35 мс), структура которых должна быть близ- ка к оптимальной для звучания музыки. При акустическом проектировании зала оперного театра при- ходится решать и ряд специфических задач. Прежде всего это ка- сается правильного баланса звучания голоса певца со сцены и оркестра, расположенного в оркестровой яме [5, 26, 44]. Нару- шение баланса обычно проявляется в том, что оркестр, акустиче- ская мощность которого в сотни раз превосходит мощность человеческого голоса, «подавляет» певца. Для правильного балан- са необходимо создать условия хорошей взаимной слышимости музыкантов, а также музыкантов и певцов. Кроме того, как музы- канты, так и певцы должны слышать собственное исполнение. Успешное решение всех этих задач в первую очередь связано с правильным выбором параметров припортальной зоны зала, ко- торая включает поверхности потолка и стен, примыкающие к пор- талу, а также оркестровую яму. В современной практике примыка- ющие к порталу части потолка и стен часто делают в виде выпуклых звукоотражателей, формирующих направление отраже- ния к слушателям. Выбор формы таких отражателей — зна- чительная проблема: только при правильном ее решении (рис. 5.2.10а, б), звук певца, отраженный от козырька, направля- ется в переднюю зону мест, а отраженный звук оркестра возвра- щается к музыкантам, улучшая условия взаимной слышимости и слышимости собственного исполнения. При таком варианте отражателей улучшается также взаимная слышимость музыкантов а б Рис. 5.2.10. Формы козырька над порталом и оркестровой ямы: а — неблагоприятный выбор формы козырька; б — правильный выбор формы козырька
Акустика помещений 519 и певцов. По аналогичным соображениям боковые припортальные стенки не должны сильно раскрываться в сторону зала. Иногда ис- пользуется некоторое расчленение поверхностей козырька и боко- вых припортальных стенок с тем, чтобы часть отраженного звука возвращалась на сцену и улучшала слышимость собственного ис- полнения для певцов. Созданию оптимального баланса между певцами и оркестром способствует также частичное перекрытие оркестровой ямы (рис. 5.2.10). Над примыкающей к сцене частью ямы устраивает- ся навес, вынос которого не должен превосходить V3 ширины ямы. За счет уменьшения излучения звука непосредственно в зал и в сторону козырька над порталом навес позволяет «приглушить» расположенные под ним громкие инструменты оркестра (например, медные духовые). Такой навес способствует улучшению взаимной слышимости музыкантов. Часть ямы, примыкающая к сцене, неред- ко делается более глубокой, что также полезно для «приглушения» громких инструментов. Вблизи басовых инструментов в оркестровой яме рекомендуется размещать низкочастотный звукопоглотитель. Таким образом, обеспечение акустических параметров оперных залов требует решения целого ряда специальных задач, касаю- щихся конструкции как зрительной части зала, включая его припор- тальную часть, так и оркестровой ямы и сцены. 5.2.3. Акустика концертных залов Создание концертных залов с хорошей акустикой было и оста- ется сложнейшей задачей, которая до недавнего времени реша- лась исключительно опытом, интуицией и искусством архитекторов и акустиков. Только в последние годы с связи с развитием ком- пьютерных технологий появились возможности для точного мате- матического моделирования акустики залов, но эти методы только начинают развиваться (см. раздел 5.3). Некоторые общие идеи, ис- ходя из опыта строительства различных концертных залов в те- чение многих лет, были сформулированы следующим образом [40]: различные жанры музыки требуют разных акустических характери- стик в концертном зале; акустические характеристики, оптималь- ные для слушателей и для исполнителей, существенно различают- ся; только лучшие концертные залы мира обеспечивают акустические параметры, оптимальные как для слушателей так и для исполнителей; не существует единого архитектурного решения для концертных залов — большинство акустических требований может быть решено различными архитектурными приемами. Имен- но поэтому создание концертных залов пока остается еще «искус- ством на научной основе» [4]. В данном разделе будут кратко рассмотрены требования к акустическим параметрам «классических» концертных залов, где звучание музыки непосредственно передаются от исполнителю
520 Глава 5 к слушателю. Современные многоцелевые концертные залы с си- стемой звукоусиления требуют других акустических параметров, ко- торые будут рассмотрены в разделе 5.4. Хорошее качество звучания музыки в концертном зале требует обеспечения всех упомянутых в разделе 5.1 субъективных крите- риев: жизненности, полноты, пространственности, тембра, балан- са, интимности, громкости, отсутствия эха, низкого уровня шумов и т. д., — а следовательно, и соответствующей структуры и пара- метров реверберационного процесса, из которых основными явля- ются следующие: время реверберации, время и направление при- хода первых отражений, уровень боковых отражений, отношение энергии ранних отражений к энергии поздних отражений и др. Все эти параметры определяют требования прежде всего к форме и размерам концертных залов, а также к их системам звукопогло- щения, звукоотражения и звукоизоляции [4, 5, 7, 11, 13, 14, 17, 26, 40, 45, 47, 48]. В концертных залах также можно выделить две различные части: площадь для оркестра (эстраду) и площадь для зрителей, которая может быть разделена еще на две части — околоэстрад- ную и дальнюю зрительскую часть. Акустические требования к этим частям несколько различаются [26]: форма и размеры «классического зала» определяются прежде всего требованиями к достижению оптимальных времени реверберации и структуры ран- них отражений (время, уровень и направление прихода). Оптимальное время реверберации, как показано на рис. 5.1.15, зависит от вида музыкального исполнения: для органной музыки — 3-5 с, для симфонической 2-2,2 с и для камерной 1,3-1,6 с. При этом важную роль играет и стиль исполняемой музыки: в период барокко среднее время реверберации было 1,6 с, классической музыки —1,8 с, романтической — 2-2,2 с. Как уже было показано в разделе 5.1, для обеспечения теплоты звучания время ревербе- рации должно увеличиваться на низких частотах примерно на 20%. Это требует разных архитектурных параметров концертных за- лов: объем на одного слушателя должен составлять 10-12 м3для органной музыки, 8-10 м3для симфонической и 6-7 м3для камер- ной. Все это ограничивает общую вместимость залов с естествен- ной акустикой 1500-2000 человек (хотя современные залы уже имеют вместимость 2200-2500 человек). Объемы, соответствую- щие этим вместимостям, — 12000-20000 м3. Размеры и время ре- верберации наиболее известных концертных залов даны в табли- це 5.1.3. Анализ параметров для лучших залов позволил получить сле- дующее эмпирическое выражение [26], связывающее время ревер- берации, объем и высоту зала: (V/T500)m/hmax-\,2S.
Акустика помещений 521 Кроме оптимального времени реверберации в концертных залах важно обеспечить и другие параметры: ясность — С80, интимность, коэффициент внутрислуховой корреляции и др. (см. раздел 5.1), которые также определяются выбором соотноше- ния размеров и формы зрительного зала. В старых концертных залах ширина и высота обычно составляли 20 м и 17 м, это обес- печивало приход первых фронтальных отражений с интервалом 20-30 мс. При уменьшении этих интервалов эстетическое воспри- ятие музыки ухудшается. Если для речевых помещений размер зала определяется его вместимостью, но может быть уменьшен без потери разборчивости речи, то в концертных залах размер определяется требованиями к качеству звучания музыки и не может быть уменьшен ниже не- которого предела (независимо от количества зрителей). Как уже было отмечено в разделе 5.1, в залах малых размеров на местах слушателей образуется слишком плотная временная структура ранних отражений, из-за которой при малом времени ревербера- ции звучание оказывается «плоским» [40]; кроме того, резонансы воздушного объема попадают в слышимый диапазон и вносят до- полнительную «окраску» в тембр звучания. Длина зала, как и ранее рассмотренных помещений, ограничи- вается необходимостью доставки на самые удаленные места от эстрады прямой звуковой энергии достаточно высокого уровня. Од- нако здесь следует учесть, что голос певца или звук инструмента способен излучать большую мощность, чем речь актера. В связи с этим максимальное удаление слушателя от эстрады может быть увеличено по сравнению с залом драматического театра. Статистические данные, собранные в ходе анализа максималь- ного удаления мест слушателей от эстрады для музыкальных за- лов разной вместимости, построенных в разных городах мира и известных хорошими акустическими свойствами [48], показали, что максимальная удаленность слушателей от эстрады в партере не превышает 40 м, а на балконе — 45 м. Ограничения ширины и высоты зала распространяются прежде всего на припортальную часть для обеспечения необходимой структуры ранних отражений; в более удаленной от эстрады части ширина и высота зала может быть увеличена. Ширина зала у пор- тала рекомендуется не более 25 м, а на расстоянии одной трети длины зала — не более 30 м. Высота зала (если принять за уро- вень пол сцены) у портала не должна превышать 9 м, а на рассто- янии 7 м от портала — 10,5 м. Таким образом, при выборе основных размеров концертного зала, равно как и его формы, особое внимание должно быть уде- лено его припортальной части, занимающей около одной трети, а в больших залах — одной четверти его длины. Эта часть должна
522 Глава 5 быть так спроектирована, чтобы на местах слушателей была сформирована оптимальная структура ранних отражений. Исследования, выполненные на основе измерений, позволили собрать достаточно полный статистический материал по интерва- лу времени запаздывания первых отражений. Результаты анализа собранных материалов очень хорошо совпадают с результатами субъективных исследований и подтверждают ценность структуры ранних отражений в качестве одного из важнейших критериев ка- чества акустики концертного зала. Например, в залах, известных своими прекрасными акустическими свойствами, время запаздыва- ния первого отражения, приходящего в лучшие места, составляет: в Большом зале Московской консерватории — 21-26 мс, в Колон- ном зале Дома Союзов — 24-28 мс, в Санкт-Петербургской капел- ле — 25-30 мс, в Концертном зале в Зальцбурге — 23 мс и т. д. Наличие эстрады вместо сцены в значительной мере обуслав- ливает архитектуру концертного зала, отличающуюся от архитекту- ры театральных залов. Оказалось не обязательным строить залы по ярусной системе, так как оборудование эстрады жесткими зву- коотражающими конструкциями позволяет значительно увеличить уровень отраженной звуковой энергии, приходящей к слушателям в начальном периоде реверберационного процесса, и помогает обеспечить оптимальную структуру ранних отражений. Это в свою б Рис. 5.2.11. а — две части зала с плавным переходом (концертный зал в Бонне); б — сочетание двух разных форм сцены и зала (концертный зал в Детройте)
Акустика помещений 523 очередь позволяет удалить слушателя от эстрады и увеличить раз- меры зала. В современных залах используются разные формы зрительного зала для той части, которая примыкает к эстраде (примерно 1/3 общей длины), и остальной его части. Можно заметить два ти- пичных направления при решении их интерьера [40]: единую форму зала с плавным переходом эстрады в зрительный зал (рис. 5.2.11а) и композицию из двух разных форм для зала и сце- ны (рис. 5.2.116). Эстрада и ближайшая к ней часть зала: для музыкантов, находящихся на сцене, субъективные параметры, оказывающие наиболее существенное влияние на их качество исполнения, не- сколько отличаются от параметров, воспринимаемых слушателем. К числу основных из них можно отнести следующие [49]: время ре- верберации — процесс затухания в зале должен быть отчетливо слышен в паузах и давать музыкантам чувство опоры; поддерж- ка — этот параметр позволяет музыкантам слышать себя даже на тихих уровнях; тембр позволяет оценить влияние помещения на звучание инструментов и на восприятие музыкантами тонально- го баланса между инструментами в ансамбле; динамика характе- ризует динамический диапазон в данном помещении и определя- ет степень, с которой помещение влияет на динамику исполнения; слышание друг друга — необходимо для обеспечения ритмичес- кой точности, настройки и баланса по уровням; задержка сигналов во времени — если музыканты далеко друг от друга, то возника- ют слишком большие временные задержки, которые нарушают ритмическую точность и влияют на тембр. Исследования позволили установить, что ощущение поддержки возникает у музыкантов при высоком уровне ранних отражений на сцене (рис. 5.2.12). Измерения показывают, что в хороших залах их уровень значительно выше порогов слышимости. Для обеспечения слитности исполнения в ансамбле существен- ное значение имеет величина задержки прямого звука от соседних участников. Результаты исследований показали, что максимальное время задержки должно быть в пределах до 20 мс. Ширина и глубина эстрады (сцены) зависят от числа исполни- телей (на каждого должно прихо- диться примерно 2 м2) и от высо- ты потолка припортальной части зала. Если потолок сравнительно низкий (ниже 10 м), то могут быть выбраны большая ширина и глу- бина сцены, т. к. при такой высоте прямой звук и ранние отражения Рис 5 2.12. Структура отражений попадают к исполнителям (что на сцене
важно для их взаимной слышимости) и к зрителям. Если потолки высокие, то для обеспечения первыми отражениями исполнителей и зрителей необходимо ограничить площадь эстрады: ширина не более 15 м, высота не более 10 м. При низких потолках и широ- ких стенах возникают также проблемы с обеспечением необходи- мого времени реверберации в зрительном зале; кроме того, боко- вые отражения приходят на сцену слишком поздно и при этом нарушается ощущение ансамбля. При высоких потолках необхо- димое время реверберации обеспечивается, но общая площадь эстрады оказывается слишком мала. Поэтому в современных концертных залах часто используются навесные панели над площадью оркестра и передней частью зрительских мест (рис. 5.2.13а, б), форма, размер и степень наклона которых под- бираются исходя из требований обеспечения первыми отражени- ями оркестра и зрителей. Кроме того, в современных больших залах многоцелевого назначения, где оркестр размещается на просторной сцене, ис- пользуются акустические раковины, состоящие из системы звуко- отражающих поверхностей. Такая раковина может быть легко скомпонована в виде трансформируемой системы из отдельных щитов, которыми можно ограждать различные объемы на эстраде при выступлении ансамблей исполнителей. Размеры мобильных щитов должны быть достаточно велики во избежание потерь отра- женной звуковой энергии на дифракцию вокруг краев. Эти потери, особенно в области низких частот, становятся ощутимыми, если любой размер щита меньше 5-6 м.
Акустика помещений 525 В качестве интересного примера может служить зал в Зальц- бурге вместимостью более 2000 человек (рис. 5.2.14). При прове- дении концертов на эстраде в нем устанавливается трансфор- мируемая раковина, обеспечивающая запаздывание первого отражения на 23 мс. Классические концертные программы прохо- дят при естественных акустических условиях, т. е. без помощи си- стем усиления звука. Кроме того, в зале ставят оперные и дра- матические спектакли. Зрительская (дальняя) часть зала: основное требование к ее форме состоит в обеспечении высокой степени рассеяния звука для создания достаточного общего времени реверберации. Воз- можностей для реализации таких форм зала достаточно много, в настоящее время чаще всего для концертных залов используются следующие формы [40]: — высокая прямоугольная форма (Shoebox) — рис. 5.2.15а — старейшая форма, используемая как в музыкальных залах во дворцах XVII-XVIII веков, так и в крупнейших концертных залах XIX-XX веков, например Консертгебау (Амстердам, 1888), Мюзик- ферейнсаал (Вена, 1870). Из-за простой геометрии структура зву- ковых полей в таких залах лучше всего изучена и отмоделирова- на. Разновидностью являются залы с почти квадратной площадью (рис. 5.2.156); — веерообразная форма с расходящимися стенами и кривыми потолками (Fan), использовалась активно в период 1920- 1960-х годов, сейчас признана неудовлетворительной из-за бедных боковых отражений (рис. 5.2.15в); — форма с параллельными стенами, высокими потолками, кри- волинейной задней стеной (Horseshoe) — рис. 5.2.15г. Это типичная форма оперных залов, однако она часто использовалась и для кон- цертных залов (например, Концертный зал Макдермотт в Далласе); — террасообразная форма (Vineyard) зала, разделенного на уменьшающиеся асимметрично поднимающиеся блоки. Верти- кальные дополнительные поверхности на стенах создают ранние
526 Глава 5 а — высокая прямоугольная форма (Shoebox); б — залы с почти квадратной площадью; в — веерообразная форма с расходящимися стенами и кривыми потолками (Fan); г — форма с параллельными стенами, высокими потол- ками, криволинейной задней стеной (Horseshoe); д — специальная геометри- ческая форма (geometric) Рис. 5.2.15. Формы концертных залов боковые отражения для всех зон зала. Примером может служить зал Берлинской филармонии (1963); — специальная геометрическая форма (geometric), показанная на рис. 5.2.15д. Такой зал обладает большой гибкостью при на- стройке акустических параметров, но труден для проектирования. Залы небольшой ширины могут иметь простую форму паралле- лепипеда; из-за их небольшой ширины количество отражений, при- ходящих на зрительские места, быстро нарастает со временем и в завершающей части реверберационного процесса становится настолько велико, что образуется достаточная диффузность поля. В залах же со сравнительно большой шириной, как правило, тре- буется введение звукорассеивающих элементов. Примером могут служить Большой зал Санкт-Петербургской филармонии и Колон- ный зал Дома Союзов в Москве, где два ряда больших колонн со- здают высокую степень диффузности звукового поля. В современных залах, которые имеют большие объемы, рас- сеяние звука достигается членением стен и потолка под разными углами либо расположением на этих поверхностях специальных архитектурных элементов, способствующих рассеянию звука (на- пример, диффузоров Шредера). В качестве материалов для отдел- ки стен и потолка, в первую очередь акустической раковины и бли- жайших к сцене поверхностей, обычно используется дерево (это способствует созданию красивого тембра).
Акустика помещений 527 Обязательным требованиям к акустике концертных залов является низкий уровень внешних и внутренних шумов. Требова- ния для концертных залов составляют NC-20 (рис. 5.19), что за- ставляет применять специальные меры для повышения звукоизо- ляции в залах; подробнее эти вопросы освещены в специальной литературе [28]. 5.3. КОМПЬЮТЕРНОЕ МОДЕЛИРОВАНИЕ АКУСТИКИ ПОМЕЩЕНИЙ. АУРАЛИЗАЦИЯ Как уже было сказано выше, проектирование помещений (кон- цертных и театральных залов, кинозалов, аудиторий и др.) с хоро- шей акустикой остается в значительной степени искусством на на- учной основе. Необходимо отметить, что на протяжении столетий это было прежде всего искусством, и только в последние годы в связи с развитием компьютерных технологий появилась серьез- ная научная база для этого процесса. Для акустического проектирования в 60-е годы XX века был со- здан метод трехмерного масштабного моделирования [22], заклю- чающийся в том, что создавалась уменьшенная модель помеще- ния в масштабе 1 : т (например, 1 : 40) со всеми архитектурными деталями и размещением звукопоглощающих материалов на по- верхности, при этом выбирался источник звука с увеличенной в со- ответствующее число раз (т) частотой. Обычно использовался им- пульсный источник с последующей фильтрацией в заданной частотной области. Для записи применялся миниатюрный микро- фон. На таких уменьшенных моделях производились предвари- тельные измерения времени реверберации, структуры отражений и пр. и выбиралось оптимальное расположение архитектурных элементов и звукопоглощающих материалов. Такой метод исполь- зовался, в частности, при проектировании Кремлевского дворца съездов в Москве, Большого концертного зала «Октябрьский» в Санкт-Петербурге и др. Метод чрезвычайно трудоемкий и недо- статочно точный, поскольку возникают трудности при создании де- тальной модели помещения и, кроме того, анализ процессов в высокочастотной области трудно сделать адекватным процессу реверберации в полном частотном диапазоне. Развитие техники компьютерной обработки звука и накопление информации по связи субъективных оценок качества звука и объективных параметров звукового поля в помещении привело к принципиально новому этапу — созданию техники компьютерного моделирования акустики помещений, которая получила название «аурализация».
528 Глава 5 Термин «аурализация» (auralization) появился несколько лет тому назад и еще не определился окончательно. Определение его дал М. Кляйнер (М. Kleiner) (по аналогии с термином «визуализа- ция») на конгрессе AES в 1989 году: «Аурализация — процесс пре- вращения (путем физического или математического моделирова- ния) в «слышимый звук» звукового поля источника в помещении с учетом бинауральных свойств слуховой системы». Этой проблеме уделяется в настоящее время очень большое внимание: опубликовано много научных статей и докладов [36, 37, 52, 53, 54 ]; разработаны специальные пакеты программ для реали- зации этого метода; появились фирмы, которые специализируются на создании и внедрении таких программных продуктов, например фирма Odeon, которая предложила свое определение этой техноло- гии: «Аурализация — искусство создания цифровых моделей бина- уральных записей в помещениях, которые еще не построены». Нужно сказать, что трехмерное визуальное пространство уже удалось создать раньше (что нашло широкое применение в ком- пьютерных играх, видеоклипах, системах обнаружения и др.), мо- делирование трехмерного звукового пространства является следующим необходимым этапом для воссоздания «простран- ственного виртуального мира». Задача заключается в том, чтобы музыкальный сигнал после его компьютерной обработки слушатель воспринимал так же, как если бы он слушал музыку в реальном концертном зале (нахо- дясь при этом в любом другом помещении). По существу, пробле- ма состоит в формировании субъективного ощущения виртуаль- ного трехмерного звукового пространства (рис. 5.3.1). Как уже было рассмотрено в главе 3, только два физических параметра сигнала воспринимаются слуховой системой — интен- сивность (т. е. энергия или звуковое давление) и время — нача- ло и конец сигнала и его повторяемость во времени (периодич- ность или частота). Все остальное, что человек воспринимает звуковой источник микшер 3-D звуковой «образ» стереофоны Рис. 5.3.1. Создание «слухового ощущения» трехмерного пространства (HRTF —передаточная функция головы)
Акустика помещений 529 N 5000 10000 Число сэмплов 15000 Рис. 5.3.2. Осциллограмма слова «sound» (ощущает) в звуковом сигна- ле — громкость, высота, тембр, звуковое простран- ство, тонкие музыкальные нюансы и др., — это резуль- тат обработки его слухо- вым аппаратом и мозгом. Когда слушатель вос- принимает звук в помеще- нии, имеют место следую- щие процессы: музыкальный инструмент (или оркестр), голос или др. создают опре- деленный акустический сиг- нал, который представляет собой некоторую звуковую волну с оп- ределенной зависимостью звукового давления от времени P1 (t). Пример осциллограммы звучания мужского голоса при произнесе- нии слова «sound», записанной в заглушённой камере, показан на рис. 5.3.2. Затем этот сигнал определенным образом обрабатыва- ется помещением (например, концертным залом) за счет отраже- ний звуковых волн, процессов затухания, дифракции и т. д. Если рассматривать помещение как линейный фильтр, который имеет свои импульсные характеристики р(пом (t), то в каждой /-точке про- странства суммарный сигнал получается как «свертка» (convolution) сигнала источника и характеристики помещения. Этим термином называется результат обработки одного сигнала другим, например в данном случае: P1^) = P1® P1 п oo .■J Р1(0р1пом(г-0Л. Наконец, голова и слуховые раковины производят свою обра- ботку звукового сигнала (см. гл. 3). В результате, получив такую информацию от периферической слуховой системы, мозг опре- деляет параметры помещения, свойства и место расположения источника (музыка, речь, шум) и др., что и создаэт ощущение трех- мерного звукового пространства. Таким образом, чтобы вызвать у слушателя такие же ощуще- ния, как в естественном концертном зале, надо проделать сле- дующие операции: записать оригинальный звуковой источник, из- менить программно его импульсную характеристику (или спектр) так, как это делает заданное помещение (концертный зал, собор или аудитория), а затем произвести его фильтрацию аналогично тому, как это происходит на ушных раковинах и голове. После того как это сделано, можно воспроизвести зти сигналы через
530 Глава 5 стереотелефоны и получить ощущение нахождения в реальном трехмерном акустическом пространстве вместе с источником зву- ка (певцом, музыкантом, оркестром) (рис. 5.3.1). Следовательно, процесс формирования звуковых сигналов при аурализации проходит следующие последовательные стадии: — моноауральная запись источника звука: обычно начальные записи делают в заглушённой камере, но это допустимо и в полу- заглушенных помещениях, если запись делается там, где отраже- ния не являются определяющими. Расстояние при записи выбира- ется обычно 1 м на оси. Уровень записи должен соответствовать среднему уровню данного источника звука при естественном зву- чании: голос, отдельный инструмент, оркестр и т. д. Допускается использование синтезированных музыкальных записей, а также различных банков сэмплов. Это дает возможность прослушать, как в данном помещении (существующем или желаемом) будут звучать различные виды музыки; — создание компьютерных моделей звукового поля в помеще- нии: как было показано в разделах 5.1 и 5.2, при прослушивании любого звукового источника в помещении к слушателю поступает прямой звук и его многочисленные отражения от стен, потолка, пола и др. Для расчета структуры этих отражений в помещени- ях различной формы и размеров, с различными поглощающими или отражающими материалами и конструкциями, мебелью, эле- ментами декораций и др. используются пакеты программ, по- строенные как на приближенных методах геометрической акусти- ки (лучевой метод или метод мнимых источников), так и на более точных методах волновой акустики (МКЭ, МГЭ и др.) [37-39]. При- менение этих пакетов позволяет рассчитать импульсные характе- ристики помещения (т. е. реакцию помещения на воздействие ко- роткого импульсного сигнала) в любой точке помещения (рис. 5.3.3) или его спектральные характеристики, т. е. распреде- о 0,1 0,2 о,з 0,4 0,5 0,6 0,7 0,8с ДИтся исследование уже су- 1 0,8 0,6 0,4 0,2 Относительный уровень ление различных форм (мод) колебаний в пространстве (рис. 5.1.12).Через преобразо- вание Фурье они пересчиты- ваются друг в друга (см. гл. 2). -0,4 -0,6 -0,8 -1 Таким образом, для опре- деления импульсных характе- ристик помещения можно произвести их измерения микрофоном в разных точках пространства, если произво- Рис. 5.3.3. Импульсная характеристика помещения ществующего зала; а можно, задав геометрические разме-
Акустика помещений 531 ры помещения, поглощающие свойства его стен, потолков и др., рассчитать их для любой точки, в том числе для еще проектиру- емого помещения, т. е. построить его компьютерную модель (что и делается в программах САТТ, ODEON и др.); — определение бинауральных импульсных характеристик по- мещения (BRIR)'. после того как звуковой сигнал, созданный источ- ником звука, «обработан» помещением (т. е. к прямому сигналу до- бавлены его отражения), он обрабатывается двумя слуховыми приемниками (ушными раковинами). Затем он поступает на бара- банную перепонку и проходит дальнейшие стадии обработки в пе- риферической слуховой системе и в высших отделах мозга. Импульсные характеристики, которые получаются на входе ле- вого и правого слухового канала, называются бинауральными им- пульсными характеристиками помещения — BRIR (binaural room impulse response). Эти функции BRIR несут в себе всю необходи- мую информацию о положении и свойствах источника звука, свой- ствах помещения и свойствах приемника звука (т. е. о всех про- цессах обработки звука, которые происходят на голове, в ушных раковинах и др.). Для того чтобы описать свойства приемника, т. е. головы и уш- ных раковин, используются или импульсные характеристики слухо- вой системы, или ее передаточные функции — HRTF (т. е. ампли- тудно- и фазочастотные характеристики — АЧХ и ФЧХ), которые связаны друг с другом через преобразование Фурье. Для определения передаточных функций обычно используют библиотеки уже выполненных измерений АЧХ и ФЧХ внутри слухо- вого канала на моделях «искусственной головы» в заглушённой камере при разном расположении источника вокруг нее (рис. 5.3.4). Вид передаточных функций существенно меняется (особенно в области частот от 5 до 16 кГц) в зависимости от положения источника Сверху в вертикальной, горизонталь- ной плоскости и от перемеще- ния по глубине по отношению ко входу в левый и правый слуховой канал (т. е. ушные раковины, голова и торс дей- ствуют как частотно-зависи- мые дифракционные фильт- ры). Физические причины этого были рассмотрены в главе 3 в разделе по бинау- ральному слуху. В результате для воссо- здания «пространственного дБ 20 10 О С фронта т 0,1 1 10 Частота, кГц 0,1 1 10 Частота, кГц Рис. 5.3.4. Вид передаточных функций слуховой системы при различном угле падения звукового сигнала.
532 Глава 5 звукового образа» необходимо ввести в компьютер следующую ин- формацию: — выбор источника сигнала — музыка, речь, пение или др. (записанные в полузаглушенном или заглушённом помещении или синтезированные); — выбор помещения, в котором хотелось бы послушать этот источник звука; при этом могут быть заданы параметры известного помещения (концертного зала, собора, комнаты или др.) или поме- щения, которое еще предстоит построить; — положение источника звука в нем (на сцене, на полу, в лю- бой другой точке); — положение слушателя в определенном месте помещения (в партере, на балконе и т. д.). Для реализации «виртуального звукового образа» на компьюте- ре созданы специальные пакеты программ (наиболее известны программы ODEON, CATT и др.), которые последовательно выпол- няют следующие операции: — вводят свойства источника звука (из библиотеки записанных или синтезированных звуков в монозарианте); — производят расчет структуры звукового поля в заданном по- мещении и вычисляют его импульсную характеристику в заданных точках расположения правого и левого уха слушателя; — используют значения передаточных функций головы (HRTF) из заранее составленной библиотеки, соответствующие данному положению источника и слушателя, из них получают импульсные характеристики (BRIR); — производят последовательную «свертку» сигнала источника с импульсными характеристиками помещения и импульсными ха- рактеристиками головы. Полученные стереосигналы подают на телефоны, что дает воз- можность слушателю почувствовать, что он находится внутри зала на определенном месте и звук окружает его со всех сторон. При смене положения слушателя или источника происходит пересчет передаточных функций. Как уже было показано в разделе главы 3, посвященном бина- уральному слуху, для слуховой системы существует несколько наи- более важных признаков, по которым она определяет простран- ственное положение источника. Для локализации в горизонтальной плоскости основное значение имеет разница по времени прибытия сигнала на правое и левое ухо (ITD) и разница по интенсивности за счет дифракции на голове (HD)] для определения глубины — разница в уровнях звукового давления (изменение громкости), изме- нение отношения энергии прямых и отраженных сигналов в поме- щении и др.; для локализации в вертикальной плоскости — разли- чия в форме АЧХ и ФЧХ из-за дифракции на ушной раковине. Измеренные значения передаточных функций несут в себе всю
Акустика помещений 533 Моноауральный вход Модель ранних отражений Модель локализации в верти- кальной плоскости (дифракция и резонансы ушной раковины) Модель глубины (реверберация/громкость) Азимутальная модель ITD-левая Азимутальная модель ITD-правая необходимую для слуховой сис- темы информацию о локализа- ции источника. Разумеется, эти значения передаточных функ- ций выбираются для некоторых усредненных параметров голо- вы и ушных раковин, что вносит определенную погрешность, т. к. каждый человек имеет некото- рые индивидуальные особенно- сти, но, во-первых, экспертиза показала, что погрешности не слишком велики, а во-вторых, уже созданы компьютерные мо- дели ушной раковины, в кото- рых можно учесть индивидуаль- ные параметры слушателя. Таким образом, алгоритм обработки звука должен вклю- чать последовательный ряд следующих операций (рис. 5.3.5): моноауральная запись, расчет структуры ревербераци- онного процесса (в том числе структуры ранних отражений), расчет локализации в верти- кальной плоскости (с учетом дифракции на ушной ракови- не), расчет локализации по глу- бине (за счет изменения гром- кости и уровня реверберации), расчет азимутальной локализа- ции (временной и интенсивностной), выход на левый и правый каналы стереотелефонов. Техника аурализации стремительно развивается: уже созданы программы, учитывающие движения головы (система BRS), ко- торые позволяют при поворотах или подъеме головы пересчитать соответствующие параметры и дают возможность услышать в наушниках, как соответственно перемещается источник звука в пространстве. Для этого нужен постоянный мониторинг (система обратной связи), который отслеживает движение головы и пересчи- тывает соответствующие бинауральные импульсные характеристи- ки. Существуют разные системы обратной связи, с помощью кото- рых это можно делать, — от простейших инфракрасных датчиков, с использованием которых уже давно выпускаются стереотелефоны, до сложных и дорогостоящих систем обратного контроля. Азимутальная модель IID-левая Азимут мод 1Ш-П] альная ель эавая Рис. 5.3.5. Этапы последовательной обработки сигнала в системах аурализации
534 Глава 5 Для перехода от прослушивания через стереотелефоны к про- слушиванию через акустические системы необходимо решить еще несколько дополнительных проблем: во-первых, вторичное помещение накладывает свое реверберационное поле, что в дан- ном случае является помехой, т. к. вся необходимая информация о помещении уже закодирована в сигнале; во-вторых, сигналы от левого канала попадают не только на левое ухо, но и на правое, т. е. возникают перекрестные связи, которые разрушают звуковой образ. В настоящее время активно развивается техника би- науральной стереофонии, в которой необходимо решение таких же проблем. За последние годы разработаны различные методы проектирования бифонических процессоров, которые реализуют подавление перекрестных связей, и адаптивных процессоров, которые могут подавлять отражения во вторичном помещении. Проблема расширения зоны прослушивания остается пока не- решенной, удается получить пространственный эффект только для ограниченной позиции слушателей. Прогресс в решении этой проблемы позволит обеспечить в будущем возможность прослу- шивания бинауральных сигналов через акустические системы. При этом достаточно будет двух акустических систем на левый и правый канал для воссоздания трехмерного пространственно- го звукового образа. Новую технологию компьютерного моделирования простран- ственных звуковых полей — аурализацию — несомненно ожидает много применений: — в архитектурной акустике — для оценки акустических свойств различных существующих залов и моделирования еще не постро- енных помещений; для оценки влияния различных звукопоглоща- ющих конструкций на качество звучания, в том числе и в студи- ях звукозаписи; для проектирования систем звукоусиления и др.; — в технике звукозаписи — в создании новых пространствен- ных эффектов, совершенствовании систем пространственной зву- копередачи и др.; — в системах мультимедиа — для создания аудио-, видео-, виртуальных пространств; — в практике обучения исполнителей (музыкантов, певцов и др.), в том числе для получения возможности предварительного прослу- шивания различных видов исполнения в залах с разной акустикой; — в постановке научных экспериментов, в частности в пси- хоакустике, в системах обнаружения и распознавания различных источников сигнала в пространстве. По мере развития аурализа- ции, несомненно, появятся ее новые применения.
Акустика помещений 535 5.4. АКУСТИКА ЗАЛОВ МНОГОЦЕЛЕВОГО НАЗНАЧЕНИЯ. СИСТЕМЫ ОЗВУЧИВАНИЯ И ЗВУКОУСИЛЕНИЯ На протяжении столетий в концертных залах, театрах, лекцион- ных залах, церквах и др. звучали только естественные источники — голос оратора и певца, игра музыкантов и т. д. Определяющую роль для передачи звука при этом имела «естественная» акусти- ка зала, зависящая от его формы, размеров, размещения звукопо- глотителей и др. В XX веке, с одной стороны, появились новые технические воз- можности в связи с изобретением и развитием звукоусилительной аппаратуры, с другой стороны, стремление вместить как можно больше слушателей привело к строительству киноконцертных за- лов очень больших размеров; при этом урбанизм в архитектуре привел к изменению конфигурации залов — они приобрели более вытянутые формы с низкими потолками. Изменились вкусы и сти- ли музыки: слушатели, особенно молодые, привыкли слушать музыку на очень высоких уровнях громкости (дискотеки, клубы, концертные залы для шоу и др.). Расширилось строительство спортивных сооружений на сотни тысяч зрителей, где оказалась необходимой трансляция концертов при высоких уровнях шумов. Появилась необходимость проведения конгрессов, конференций и др. с переводом на различные языки. Все это вызвало существенные изменения в требованиях к акустическим параметрам современных больших залов многоце- левого назначения и привело к широкому использованию в них си- стем озвучивания и звукоусиления. Краткая информация о них бу- дет дана в настоящем разделе, более подробную информацию можно найти в работах [16, 21, 32, 33, 35, 40, 44, 45, 46, 50, 51]. Системой озвучивания называется комплекс электроакустиче- ских устройств, состоящий из излучателей, микрофонов, усилителей, различных корректоров и др., установленных специальным образом в залах, стадионах и др. и предназначенных для воспроизведения звуковых сигналов (музыки и речи) с достаточным уровнем громко- сти для всех слушателей, находящихся в данном помещении (от- крытом и закрытом) [21]. Необходимость в системах озвучивания возникает тогда, когда мощность естественных источников оказыва- ется недостаточной для обеспечения хорошей слышимости во всей зоне расположения слушателей. Слышимость может быть плохой из-за высокого уровня шумов, значительных расстояний до слуша- телей, неблагоприятных акустических условий в зале и т. д. Из используемых в настоящее время систем озвучивания мож- но выделить несколько основных типов: — системы озвучивания для помещений (открытых и закрытых), где звук воспринимается только через звуковоспроизводящий тракт. Звук, записанный ранее на магнитофонную ленту, компакт-диск
536 Глава 5 а б Рис. 5.4.1. Системы звукоусиления: а — сосредоточенная, б — распределенная или другой источник, воспроизводится только в данном помеще- нии, например, в кинозалах, помещениях вокзалов и др. В таких помещениях находится только аппаратура для воспроизведения (например, рупорные громкоговорители, звуковые колонки и др); — системы озвучивания для залов, где слушатель воспринима- ет «естественный» звук со сцены и звук через систему озвучива- ния (концертные залы, лекционные залы и др.). В этом случае в одном помещении находятся источники звука (певец, оратор, му- зыкант), а также микрофон, система усиления и коррекции звука и система воспроизведения. Такая система озвучивания называет- ся обычно системой звукоусиления (рис. 5.4.1). Отличительная особенность систем звукоусиления заключается в том, что в них микрофон находится в звуковом поле излучателей, а это может привести к появлению «обратной связи», т. е. неустойчивости (пе- реходу к режиму автогенерации) работы системы. Последнее на- кладывает особые требования на принципы ее проектирования (обратная связь характеризуется появлением «воющего» звука); — системы озвучивания или звукоусиления, которые дополни- тельно выполняют функции создания пространственного звуково- го образа или формирования реверберационного процесса (на- пример, амбиофонические системы и др.). Разумеется, существуют и другие разновидности, например системы озвучивания для конференц-систем с переводом речей и т. д., о них можно прочитать в специальной литературе [16, 46]. Как уже было отмечено, системы озвучивания и звукоусиления применяются в тех случаях, когда уровень громкости для обеспе- чения нормальной слышимости и разборчивости слишком мал из- за большого расстояния или большого уровня шумов. Например, оратор развивает на расстоянии 1 м уровень 80 дБ, на расстоянии 32 м этот уровень будет равен 50 дБ (поскольку при каждом удвоении расстояния уровень звукового давления умень- шается на 6 дБ); если уровень шумов в зале 40-45 дБ, то практи- чески речь будет слышна плохо и неразборчиво, поэтому и необ- ходима система звукоусиления.
Акустика помещений 537 Основные требования, которые предъявляются к системам оз- вучивания и звукоусиления, можно определить следующим обра- зом: однородное распределение звука при необходимой громкос- ти на всей площади зрительских мест; правильная локализация и совмещение зрительского и слухового образа; формирование не- обходимых ощущений пространственности; правильный баланс громкостей на всех слушательских местах; высокое качество зву- чания, т. е. сохранение тембральной окраски, разборчивости и др.; отсутствие возбуждения системы (устойчивость); отсутствие эха и других помех и т. д. В то же время применение систем озвучивания и звукоусиления открывает новые возможности для управления параметрами зву- кового поля в помещениях — в частности, позволяет обеспечить: управление динамическим диапазоном; изменение распределения уровней громкости источников на зрительских местах; формирова- ние различных звуковых эффектов; управление акустическими характеристиками помещения (например, адаптивное подавление отражений и др.); компьютерное управление параметрами системы звукоусиления в зависимости от характера звучания и условий в помещении (например, система Media-Matrix) и т. д. В настоящее время применяется огромное множество систем озвучивания и звукоусиления. Они отличаются способами постро- ения, функциональными возможностями, используемой аппарату- рой и др. Пример построения системы звукоусиления Большого Кремлевского дворца показан на рис. 5.4.2. Система включает в себя: первичный акустический тракт — от источника звука до мик- рофона; аппаратную часть — от выхода микрофона до излучателей (звуковых колонок, рупорных громкоговорителей и др.); вторичный акустический тракт — от выхода излучателей до слушателя. Основные параметры, определяющие качество систем звукоусиления, включают в себя: — динамический диапазон и неравномерность: под динамиче- ским диапазоном системы звукоусиления следует понимать раз- ность между максимально возможным для данного тракта уровнем сигнала в точке удаленного слушателя и уровнем шумов и помех в помещении. Если динамический диапазон источника звука (орке- стра, певца, оратора и др.) составляет D дБ (он равен разнице между максимальным и минимальным уровнями сигнала, созда- ваемого данным источником), то максимальный уровень сигнала, создаваемого системой звукоусиления в любой точке озвучиваемой поверхности, должен быть равен: ITP = N +N + D, мах шум прев. 9 где Ишум — уровень шумов; Nпрев — Уровень превышения (обычно 10-12 дБ).
Гардероб, фойе и т. п. !Микрофоны насце| |не и распределителя- ное устройство J устр< tm Периферийное уст- ройство записи и Распределительное устройство >^ Радиовещание [ , , 2 8 <LS> Магнитофоны Телевидение ft Кинопроектор! "Проигрыватель Проекция кинофильмов Амбиофони- ческие магнитофоны -:0 = © Эхо-камера > XX Распредели- : тель : выходов Усилители мощности > Громкоговорители зала Кино ТПППГ! Портал Стены Амбиофония Рис. 5.4.2. Структурная схема системы звукоусиления Большого Кремлевского дворца
Акустика помещений 539 Значение ^ртах зависит от вида передаваемого сигнала, при- меры показаны в таблице 5.4.1. Таблица 5.4.1 Вид музыки Максимальный уровень NTPmax, дБ Поп-музыка 120 Симфонический оркестр 100 Ансамбль 94-96 Речь 80-86 Суммарный уровень помех складывается из всех видов акус- тических шумов в точках, где находятся слушатели. Акустические шумы могут быть как внешние, проникающие от транспорта, так и внутренние (от шумов аппаратуры, слушателей, от запаздывающих сигналов и др). Может оказаться,что динамический диапазон источника звука слишком большой и тракт звукоусиления не может обеспечить требуемого значения NTpmax (например, из-за возникновения обратной связи или ограничений в каналах передачи), в этих случаях применяется компрессия (т. е. сжатие динамического диапазона). Под неравномерностью звукового поля, создаваемого система- ми озвучивания и звукоусиления в помещениях, понимается разни- ца в уровнях звукового давления в разных точках озвучиваемой по- верхности при подведении к системе постоянного уровня мощности. Одинаковый уровень звукового давления в различных точках помещения обеспечить практически невозможно, т. к. име- ет место неравномерная структура звукового поля из-за резонан- сов помещения, из-за взаимодействия излучателей друг с другом, из-за неравномерности АЧХ отдельных громкоговорителей и т. д. Общая неравномерность для всех точек в помещении не должна превышать 6-8 дБ. Средний уровень звукового давления во всех точках озвучиваемой поверхности должен быть такой же, как в оп- тимальной зоне прослушивания (для концертных залов это при- мерно в 10-12-м ряду), что необходимо для обеспечения «нату- ральности» звучания; — акустические характеристики излучателей (звуковых коло- нок, рупорных громкоговорителей, потолочных излучателей и пр.): эффективно воспроизводимый диапазон частот, неравномерность, чувствительность, характеристика направленности, коэфициент не- линейных искажений и др. Именно они в значительной степени определяют общие характеристики тракта звукоусиления. Подроб- нее с ними можно ознакомиться в работах [32, 33, 46, 55];
540 Глава 5 — слитность звучания, т. е. отсутствие заметного на слух эха. Под эхом понимается отраженный запаздывающий сигнал доста- точно большого уровня, который осознанно воспринимается как по- вторение сигнала (см. раздел 5.1). Заметность эха зависит от вре- мени запаздывания, от интенсивности отраженного сигнала,от спектральной структуры сигнала и т. д. В работе [30] был предло- жен количественный критерий заметности в зависимости от разни- цы по интенсивности с прямым сигналом и от времени задержки. Критическим интервалом заметности эха считается время запазды- вания более 80 мс, однако появление запаздывающих отражений больших уровней с меньшим временем запаздывания также может сказаться на разборчивости речи и тембральной окраске музыки. Особую опасность при построении систем озвучивания представля- ет возникновение порхающего эха (флаттер-эха), что вызывает сильное тональное окрашивание звука (при этом возникает эффект гребенчатого фильтра, приводящий к появлению пиков — провалов на АЧХ в различных точках помещения — см. раздел 5.1); — уровень акустических шумов в различных помещениях с си- стемами звукоусиления определяется по международным стандар- там в соотвествии с кривыми NC (рис. 5.19). Для концертно-теат- ральных помещений этот уровень не должен превышать NC 30- 35 дБ, что предъявляет достаточно жесткие требования к выбору аппаратуры и системам звукоизоляции зала; — разборчивость речи является одним из определяющих па- раметров в любой системе озвучивания и звукоусиления. Для ее определения существуют субъективные методы оценки и объектив- ные критерии, которые были рассмотрены в разделе 4.6. Для пра- вильно спроектированной системы звукоусиления слоговая разбор- чивость должна быть в пределах 90-97%; — локализация источников звука, совмещение зрительного и слухового образа, тембральное окрашивание звучания и пр. — это важнейшие характеристики систем озвучивания и звукоусиле- ния, которые обязательно должны контролироваться с помощью субьективных экспертиз. Подавляющее большинство систем озвучивания может быть разделено на три большие группы. 1. Сосредоточенные системы (рис. 5.4.1а), в которых звук к слушателю приходит почти из одной точки. Это могут быть близ- ко расположенные излучатели над сценой (например, одна или две звуковые колонки в аудитории) или несколько излучателей в центре зала (например, рупорные громкоговорители в виде люстры). Преиму- ществом сосредоточенных систем является возможность обеспечить совмещение «зрительного и слухового образа», недостатком — труд- ность обеспечения малой неравномерности звукового поля на озву- чиваемой проверхности.
Акустика помещений 541 2. Зональные системы состоят из ряда сосредоточенных излу- чателей, каждый из которых работает на свою зону. Такие систе- мы могут быть линейными, например для озвучивания узких и длинных площадей и улиц, и пространственными, в которых вся площадь разбита на зоны. Излучатели, обычно расположенные в центре зоны, обеспечивают заданный уровень звукового давления только на своей площади. Преимуществом таких систем является возможность озвучивания больших площадей, недостатком — большая неравномерность звукового поля, особенно в зонах пере- крытия, и опасность возникновения эха. 3. Распределенные системы, в которых громкоговорители рас- пределены таким образом,чтобы уровень поля в каждой точке опре- делялся суммарным действием всех или большинства излучателей. Распределенные системы делятся на линейные (например, распо- ложенные на боковой стенке) и поверхностные (на потолке, на стен- ках и др). Распределенные системы используются как в закрытых, так и в открытых помещениях, пример приведен на рис. 5.4.16. Методы расчета распределенных систем озвучивания приведе- ны в работах [21, 33, 40, 45, 46]. Для систем озвучивания используется обычно специальная аку- стическая аппаратура, имеющая характеристики, существенно отли- чающиеся от домашних систем. К числу основных отличий можно отнести регулируемые характеристики направленности специальной формы, высокую чувствительность, повышенную надежность и устойчивость к климатико-механическим воздействиям. Наиболее распространенными видами излучателей являются: звуковые ко- лонки, представляющие собой своего рода акустическую антенну из набора одинаковых громкоговорителей (рис. 5.4.3), что позволя- ет регулировать ширину характеристики направленности в верти- кальной плоскости; специальные актив- ные блоки (например, типа Acoustimass и др.); потолочные акустические систе- мы; кресельные громкоговорители; ру- порные громкоговорители различных конфигураций, имеющие более высокий КПД (до 10%) и возможность обеспече- ния заданной зависимости ширины ха- рактеристики направленности от частоты и др. Особую группу составляет концерт- но-театральная аппаратура, куда входят портальные системы, сценные монито- ры, комбинированные мониторы и т. д. Естественно, неотъемлемой частью СИСТеМ ОЗВуЧИВаНИЯ и ЗВуКОуСИЛеНИЯ Рис. 5.4.3. Вид звуковой является усилительная аппаратура, колонки
542 Глава 5 микшерские пульты, различные процессоры обработки звука и микрофоны [40, 44, 45, 46, 55]. Поскольку слушатель, находящийся в зале, видит источник зву- ка, то при любом построении системы должно иметь место совпа- дение зрительного и слухового образа. Таким образом, главными задачами при построении систем озвучивания являются обеспече- ние заданного уровня громкости во всех точках зрительного зала, обеспечение разборчивости речи и пения, правильная локализация слухового образа, сохранение тембра звучания и обеспечение от- сутствия «обратной связи». Акустическая обратная связь: как уже было отмечено выше, особую группу систем озвучивания составляют системы звукоуси- ления, которые имеют огромное распространение в настоящее время (киноконцертные комплексы, концертные залы, театры, лек- ционные залы и др.). Их отличительной особенностью является то, что к слушателю поступает звук от первичного источника (певца, оркестра, оратора и др.) и звук от размещенных в зале акустиче- ских систем, т. е. происходит наложение двух звуковых полей — «первичного» и «вторичного» источников, причем микрофон, нахо- дящийся в этом же помещении, также подвергается воздействию двух звуковых полей, что и может приводить к возникновению са- мовозбуждения системы обратной связи. Общая структура систе- мы показана на рис. 5.4.4. Одной из самых сложных проблем в них является борьба с возникновением акустической обратной связи: заданный уро- вень громкости достигается на всей озвучиваемой поверхности (при обеспечении требуемого уровня разборчивости, неравномер- ности и качества звучания) за счет: выбора определенных видов электроакустической аппаратуры с определенными техническими параметрами и способов ее размещения; соответствующей акусти- ческой обработки зала; выбора коэффициента усиления тракта. Электроакустический тракт можно рассматривать как систему, в ко- торой входной сигнал (звуковое давление — р ) поступает на мик- рофон, а выходной сигнал (звуковое давление — р ) в точку рас- Рис. 5.4.4. Структура системы который можно представить как обратной связи положения дальнего слушателя (рис. 5.4.4). Коэффициент переда- чи такого тракта определяется следующим образом: Индексом передачи тракта называется коэффициент Q= 20Ig к,
Акустика помещений 543 Q = 20lgpcJpM=LcrLM, где Lcjl — уровень звукового давления в месте расположения даль- него слушателя (дБ); LM — уровень звукового давления у микрофо- на (дБ). При отсутствии системы звукоусиления в зале индекс переда- чи можно приближенно определить исходя из следующих сообра- жений: давление в сферической волне падает обратно пропорци- онально расстоянию (р = 1/г)\ если принять расстояние до самого дальнего слушателя примерно равным 30-40 м, а расстояние до микрофона 2-3 м, то индекс передачи будет равен: Q = 20 Ig (р JpJ-20 Ig (гJr J Q = 20Ig (2+3)м/(30+40)м = -(25-30) дБ. При построении системы звукоусиления стараются выбрать ко- эффициент усиления таким образом, чтобы уровень звукового дав- ления у самого дальнего слушателя был таким же, как и у слуша- теля на 10-12 ряду, т. е. на расстоянии 10-12 м, в этом случае индекс передачи тракта будет равен: Q = -(12-16) дБ. Эта вели- чина считается оптимальным индексом передачи тракта, для му- зыки. Для речи она составляет -(10-14) дБ. Значение оптимального индекса передачи тракта оказывается не всегда достижимым из-за самовозбуждения системы при на- личии акустической обратной связи. Поскольку в системах звуко- усиления на микрофон, кроме звукового давления, создаваемого источником, действует звуковое давление, создаваемое излучате- лями (звуковыми колонками, рупорными, громкоговорителями и др.), то микрофон находится в тракте («в петле») акустической обратной связи. Коэффициент передачи такого тракта может быть представлен в виде: I=PsJPtX=PzM '(Ргм+Рл)' где рм — давление на микрофоне от источника звука, Ргм — давление на микрофоне от громкоговорителя. Коэффициент P называется также коэффициентом акустиче- ской обратной связи и представляет собой комплексную величину: P =■ |р| е1<р, где ф — фаза сигнала, которая складывается из фазо- вого сдвига в электрической части тракта и фазового набега при прохождении звуковой волной расстояния от громкоговорителя до микрофона. На определенных частотах, когда фаза принимает зна- чения ср = 2пя и lpl^l, уровень звукового давления от громкого- ворителя становится равным или большим уровня звукового дав- ления от источника звука на микрофоне ргм » рм\ возникает положительная обратная связь, которая приводит к самовозбужде- нию тракта звукоусиления.
544 Глава 5 Условием отсутствия обратной связи является: |(3| << 1 (ре- комендуемые значения |р| - 0,2-0,3) и ср*2пя. На тех частотах, где происходит самовозбуждение системы, из- меняется тембр звучания, появляются призвуки, дребезг, «завыва- ния»; резко увеличивается неравномерность АЧХ тракта (возникает эффект гребенчатой фильтрации); возрастают нелинейные и пе- реходные процессы; появляется эффект регенеративной ревер- берации, когда даже после выключения микрофона продолжают некоторое время поступать и усиливаться импульсы от громкогово- рителя, что создает эффект, похожий на процесс реверберации, но сильно отличающийся от него по тембру («позванивание») [21-24]. Для уменьшения эффекта акустической обратной связи в сис- темах звукоусиления целесообразно принимать следующие меры: — уменьшить коэффициент усиления, — но при этом индекс передачи тракта будет отличаться от оптимального и система мо- жет не обеспечить требуемого уровня звукового давления в опре- деленных зонах у слушателей, поэтому важно найти компромисс, чтобы сохранить достаточное усиление сигнала и устранить воз- можность появления самовозбуждения системы. Для обеспечения требования ||3| - 0,2-0,3 необходимо, чтобы давление от громкого- ворителя на микрофон составляло меньше 25% от давления пря- мого сигнала на него. Можно уменьшить расстояние между источником звука (на- пример, певцом, лектором и др.) и микрофоном, но при слишком близком расстоянии появляются дополнительные шумы и помехи, начинает существенно сказываться эффект подъема АЧХ у на- правленных микрофонов (эффект «близости») и т. д.; — увеличить расстояние между микрофоном и громкоговори- телем, но при смещении громкоговорителя первые ряды могут оказаться в зоне недостаточного уровня звукового давления, поэто- му необходимо пользоваться этим методом только при условии контроля распределения звукового давления в разных точках зала; — подобрать характеристики направленности громкоговорите- лей и микрофонов таким образом, чтобы звуковая волна от гром- коговорителя приходила в направлении минимальной чувствитель- ности микрофона; — внести дополнительное звукопоглощение, особенно в зоне вокруг микрофона: поскольку в закрытом помещении на микрофон действует не только прямой звук, но и отраженные звуки с различ- ных направлений, то в малозаглушенных залах самовозбуждение системы звукоусиления может наступать при более низком уровне усиления. В закрытых помещения опасность самовозбуждения системы звукоусиления наибольшая на резонансных частотах помещения, поскольку именно на них происходит максимальная передача энергии от громкоговорителя к микрофону, — поэтому и существу-
Акустика помещений 545 ют специальные методы и соответствующие приборы типа УПАОС для режекторной фильтрации наиболее опасных частот. В работах [16, 46] был предложен метод «транспонирования» частоты, т. е. небольшого сдвига опасных частот в системе звукоусиления, но поскольку при этом частоты звуковых сигналов, излученных громкоговорителем, будут несколько сдвинуты, то пользоваться им можно только при тщательном слуховом контроле. В целом создание систем звукоусиления, обеспечивающих до- статочный уровень громкости, хорошее качество звучания и отсут- ствие «возбуждения» за счет обратной связи, — процесс, требую- щий достаточного опыта, использования современных методов расчетов и измерений. Подробную информацию можно найти в ра- ботах [45, 46]. Структура систем звукоусиления существенно зависит от их на- значения: для систем перевода речи, конференц-систем, для озву- чивания аудиторий, концертно-театральных залов и т. д. Пример системы звукоусиления для Большого Кремлевского дворца в Москве (на 6000 зрителей) показан на рис. 5.4.2. В этом зале проблема с акустическими характеристиками была решена следу- ющим образом: было выбрано время реверберации, оптимальное для речи, и соответственно размещены звукопоглощающие мате- риалы, обеспечивающие высокий уровень поглощения. При испол- нении музыки включалась амбиофоническая система, обеспечива- ющая дополнительную реверберацию [22, 57]. В некоторых случаях используются такие дорогостоящие методы, как уменьше- ние объема зала за счет передвижных перекрытий при переходе от одного вида программ к другим [40]. Необходимо отметить, что в залах, где применяется система звукоусиления, требования к структуре реверберационного процес- са в помещении существенно видоизменяются. Поскольку любую точку зала можно обеспечить прямым звуком с высоким уровнем звукового давления за счет излучения от громкоговорителей, то нет необходимости добиваться высокого уровня первых отражений от фронтальной части зала (использовать навесные щиты, припор- тальные отражающие поверхности и т. д.), как в залах с естествен- ной акустикой, — скорее, наоборот, в зоне вокруг микрофона луч- ше обеспечить усиленное звукопоглощение. Однако акустические характеристики зала должны быть подобраны таким образом, чтобы обеспечить необходимое время реверберации для разных видов музыки, иначе его придется добавлять электронным путем (допускается оптимальное время реверберации на 15-20% ниже указанного для залов без звукоусиления). Например, для залов кинотеатров, где используются системы озвучивания, в работах [22, 25] был предложен такой способ обес- печения оптимальных акустических характеристик: высокий уровень прямого звука создается для всех слушательских мест,
546 Глава 5 L{ L0 Рис. 5.4.5. Структура реверберационного процесса в залах кинотеатра ранние отражения уменьша- ются по уровню за счет разме- щения поглотителей в приэк- ранной части зала, в то же время в зрительской части зала формируется достаточно высокий уровень отражений. Все это позволяет создать особую структуру ревербера- ционного процесса (рис. 5.4.5), которая обеспечивает хорошую разборчивость речи и достаточное время реверберации для музыки. В современных кинозалах, где используются системы пространственной звукопередачи, например Dolby Digital (рис. 5.4.6), требования к акустическим характеристи- кам помещения изменились. В соответствии со стандартом ITU-R BS.775-1 время реверберации в таких залах должно быть в пре- делах 0,2-0,4 с с допустимым разбросом ± 0,05 с (ниже 200 Гц до- 8 Правый канал окружения 1 — источник программ; 2 — декодер; 3 — левый громкоговоритель; 4 — цен- тральный громкоговоритель; 5 — левый громкоговоритель; 6 — низкочастотный блок; 7 — тыловые громкоговорители левого канала; 8 — тыловые громкогово- рители правого канала; 9 — усилители Рис. 5.4.6. Размещение громкоговорителей в кинозале по системе Dolby Digital
Акустика помещений 547 пускается подъем на 25%); уровень ранних отражений в пределах 0-15 мс должен быть на 10 дБ ниже прямого звука; рабочая кри- вая уровня звукового давления должна иметь неравномерность в пределах +/-3 дБ в диапазоне частот 50-16 кГц со спадом -6 дБ на границах; требуется также отсутствие флаттер-эха, низкий уро- вень шумов и др. 5.5. АКУСТИКА СТУДИЙ И КОНТРОЛЬНЫХ КОМНАТ Как уже было отмечено выше, в 30-е годы XX столетия появил- ся новый тип помещения для записи и обработки звука в связи с развитием звукозаписи, радиовещания, кино и телевидения. В настоящее время все эти направления техники интенсивно раз- виваются, появляются новые возможности для передачи простран- ственного звукового образа (системы Surround Sound, бинауральная стереофония и др.), активно внедряются цифровые компьютерные методы обработки звука; соответственно меняются и требования к помещениям для его записи, т. е. к студиям. Требования к акустическим характеристикам студий различного назначения подробно изложены в международных и отечественных стандартах, например EBUR22-1998, EBU R22-1994, RM-01-93, СНиП2.08.02-89, и многочисленных монографиях и учебниках [22, 23, 24, 40, 44, 47, 56, 58, 59, 62], среди которых можно выделить книги всемирно известного дизайнера студий звукозаписи Ф. Нью- элла (Ph. Newell) [60, 61]. В данном разделе будет приведена только краткая информация об основных акустических характеристиках студий и контрольных комнат. Современные студии, как правило, включают в себя (рис. 5.5.1): студийное помещение (зал для исполнения и записи музыки и речи, в котором размещаются микрофоны и исполни- тели); контрольную ком- нату, где установлены основные виды аппара- туры для записи и обра- ботки звука (микшерные пульты, контрольные агрегаты, компьютерные рабочие станции и др.) и где находится рабочее место звукорежиссера; техническую аппаратную, Рис. 5.5.1. Форма помещений В которую ВЫНОСЯТСЯ современной студии звукозаписи
548 Глава 5 некоторые виды аппаратуры, например стойки с усилителями и др. Все студии можно классифицировать: — по применению — на студии звукозаписи, радиовещательные и телевизионные звуковые студии, тонателье на киностудиях и т. д.; — по виду используемого для записи звукового материала — на большие музыкальные, камерные, литературно-драматические и речевые; — по количеству исполнителей, т. е. по объему, — на большие, средние, малые и др. Классификация студий может быть проведена и по другим кри- териям. Объективные акустические параметры студии для записи му- зыки должны быть выбраны исходя из тех же требований, что и для концертного зала. Первые студии звукозаписи, например в радиодомах и телецентрах Санкт-Петербурга, Москвы и др., строились как большие концертные залы, где была возможность записывать симфонические оркестры. Следовательно, и в студиях должны быть обеспечены все требования, которые были указаны выше для концертных залов, т. е. оптимальное время ревербера- ции в разных частотных диапазонах; однородная структура звуко- вого поля; определенные время, энергия и направление прихода ранних отражений, заданные уровни энергии поздних отражений; требуемый уровень шумов, а также другие объективные парамет- ры, которые важны для слухового восприятия музыкальных и ре- чевых программ (см. раздел 5.1). Очень часто одна и та же студия может использоваться для записи речи, музыки разных жанров и т. д., поэтому в ней должна быть предусмотрена возможность перестройки акустических условий. С другой стороны, студии часто строятся специально для записи определенного типа программ: для вокала, речи, камерных ансамблей, электронной музыки и т. д., — соответственно, требования к их акустическим характе- ристикам должны отличаться. Обеспечение необходимых параметров, прежде всего опти- мального времени реверберации, накладывает определенные ог- раничения на форму и размер студий. Требования к размерам и времени реверберации студийных помещений для записи (при- нятые в свое время как отечественные нормы для их технологи- ческого проектирования) даны в таблице 5.5.1 [21]. В настоящее время в связи с переходом на пространственные системы звукозаписи и широким использованием электронных ин- струментов требования к параметрам студий также меняются, раз- рабатываются новые стандарты и рекомендации, поэтому приве- денные соотношения следует рассматривать как ориентировочные и в каждом конкретном случае определять требования в процес- се акустической настройки студии.
Акустика помещений 549 Объем студии зависит от вида исполняемой музыки и должен выбираться в зависимости от заданного оптимального времени реверберации и от максимального числа размещаемых в ней ис- полнителей, удельный объем на одного исполнителя должен со- ставлять примерно 10-18 м3. Запись музыки в студиях малого объема неизбежно приводит к искажению тембра за счет резонансов помещения в слышимой области, нарушению пространственной панорамы и баланса гром- кости. Минимальный объем студии для записи музыкальных про- изведений должен быть не менее 200 м3. Таблица 5.5.1 Студия Площадь, M2 Высота, M Оптимальное время ревер- берации, с Кол-во исполни- телей Открытая для концертных программ в присутствии зрителей 1000 14 2-2,2 250-500 Большая музыкальная для симфонических оркестров и хоров с присутствием зрителей 1000 13 2 250 То же без зрителей 750 12 2 150 Средняя музыкальная для симфонических оркестров 350-450 8,5-10 1,5-1,7 40-65 Для эстрадной и джазовой музыки 350-450 9,5-10 0,9-1,1 35-60 Малая музыкальная для записи небольших оркестров и хоров 250-300 8-8,3 0,9-1,1 30-35 Камерная 150 6 1 10-15 Большая литера- турно-драматическая 150-200 6-6,4 0,8-1 20-30 Средняя литера- турно-драматическая 100 5 0,5-0,7 10-15 Речевая 26-30 3,2-3,5 0,4 2-4 Форма студии имеет существенное значение для обеспечения структуры ранних (в первую очередь боковых) отражений и одно- родности (диффузности) звукового поля, что очень важно для ка- чественной записи звука. Поэтому большие студии очень часто делаются непрямоугольной формы; примером может служить форма студийного помещения на рис. 5.5.1. Студии средних и малых размеров чаще имеют прямоугольную форму, при этом выбор их пропорций желательно делать соответственно правилу
550 Глава 5 H = 0,62 \Jv ; В = \Jv ; L = 1,62, что примерно соответствует дан- ным в таблице 5.5.1. Для любых, даже малых размеров студии вы- сота потолков должна быть не менее 3 м. Среди объективных параметров, определяющих звуковое поле в студии, важнейшим безусловно является оптимальное время реверберации {T). Как видно из таблицы 5.5.1, оптимальное вре- мя реверберации в студии зависит от вида исполняемых программ и от объема помещения: например, для симфонической музыки Tопт = 2~2'2 с; Для эстрадной и джазовой музыки Топт = 0,9-1,1 с и т. д. Для художественной передачи речи оптимальное время ре- верберации в студии с объемом 200 м3 находится в пределах 0,8- 0,1 с. В речевых студиях для передачи информационных программ время реверберации не должно быть более 0,4-0,5 с. На рис. 5.5.2 приведены оптимальные значения времени ревер- берации студий для частоты 500 Гц в зависимости от их объема. Приведенные на рис. 5.5.2 данные следует рассматривать как минимальные значения T . Экспериментальные зависимости опт • оптимального времени реверберации в различных студиях от их объема можно приближенно описать следующими соотношения- ми [21]: для концертных студий для малых музыкальных для речевых Топт = 0.5 Ig V -0,10; ^=0.45 Ig V -0,30; 7,-.= 0,4 Ig V- 0,40. Эти зависимости дают ошибку не более 10% (см. рис. 5.5.2). В основной части диапазона оптимальное время реверберации должно быть постоянным (допускается отклонение не более 10%), 2,5 2,0 1,5 1,0 0,5 4 2 1 0 JS Топт^/^от; 500Гц 1,5 0,1 0,2 0,5 1 2 5 10 20V,ivi 125 250 500 1000 2000 4000/Гц а б Ha рисунке а кривая J — речевые студии, 2 — студии для малых музыкальных форм, 3 — студии для концертных программ. Штриховой линией обозначена приближенная аналитическая зависимость. Рис. 5.5.2. Оптимальное время реверберации для студий различного объема (а) и допуски на T в зависимости от частоты (б).
Акустика помещений 551 на низких частотах возможно некоторое повышение Топт для музы- ки (примерно на 20%) (рис. 5.5.26). Для больших студий время ре- верберации с учетом затухания в воздухе на частоте 8000 Гц не должно быть менее 1с. Кривая (1) допустимой зависимости Топт от частоты показана на рис. 5.526. Для речевых студий Топт может иметь некоторый спад на низких частотах для увеличения разбор- чивости и спад на высоких (свыше 5000 Гц) до 30% (кривая 2, рис. 5.476). Методика расчета времени реверберации в студийных по- мещениях приведена в работе [62]. Поскольку, как уже было отмечено выше, в одних и тех же сту- дийных помещениях приходится записывать различные музыкаль- ные и речевые программы, проблема состоит в том, что в них дол- жна быть предусмотрена возможность перестройки акустических условий для обеспечения различных значений оптимального вре- мени реверберации. С этой целью в студиях используются звуко- поглощающие конструкции, которые могут сравнительно легко и быстро вводиться в действие или выводиться из него, например резонансные щиты (щиты Бекеши), рассеиватели (диффузоры Шредера, жалюзи), вращающиеся колонны с различным размеще- нием поглощающего материала и т. д. [22]. Широко применяются устройства искусственной реверберации, в том числе цифровые ревербераторы, реализуемые как программным путем, так и с по- мощью специальных приборов. Можно менять время эквивалент- ной реверберации, подбирая расстояние между источником звука и микрофонами [23]. Кроме обеспечения оптимального времени реверберации Топт, принципиально важным параметром для студий является «яс- ность» (или «четкость») С80 для музыки и разборчивость для речи. Пределы изменения С80 для студий предназначенных для записи классической музыки составляют (4±2) дБ, а для романтической - [46]. Разборчивость речи для театрально-драматических и речевых студий должна быть не менее 90% (слоговая), отличным считается значение 96%. Остальные параметры (интимность, пространствен- ность, полнота и др.) должны находиться в пределах, полученных Беранеком для хороших концертных залов (см. раздел 5.2). Уровень шумов (как внутренних, так и внешних) в студии в соответствии с международными рекомендациями должен быть равен NC-25 (форма кривых NC показана на рис. 5.1.19), что чрез- вычайно трудно реализовать. Это требует размещения студии в достаточно тихой части здания; применения специальных мер при строительстве для обеспечения звукоизоляции и виброизоля- ции помещения: двойных стен и дверей, «плавающих» конструкций пола, подвесных стен и потолков, специальных глушителей для вентиляционных систем и т. д. (рис. 5.5.3; подробнее об этом мож- но узнать в работах [28, 60, 61]).
552 Глава 5 Рис. 5.5.3. Способы защиты помещения студии от шумов Контрольная комната — это помещение, где находится ра- бочее место звукорежиссера и где размещается оборудование: микшерный пульт, контрольные агрегаты, цифровые звуковые стан- ции, процессоры обработки звука, магнитофоны и другая дополни- тельная аппаратура. Пример размещения оборудования показан на рис. 5.5.4. Требования к акустическим характеристикам конт- рольной комнаты вытекают из обеспечения условий для слухово- го контроля музыкальных и речевых записей. В настоящее время контрольные комнаты часто используются для непосредственного создания и записи электронной музыки. Контрольные комнаты должны удовлетворять следующим основ- ным требованиям [60, 61]: — позволять слышать сухой и чистый звук контрольных агрегатов; — не вносить существенных искажений в структуру ревербера- ционного процесса студии, где была произведена запись звука; Рис. 5.5.4. Размещение оборудования в контрольной комнате
Акустика помещений 553 — обеспечивать возможность звукорежиссеру услышать и сформировать пространственный звуковой образ, который он хо- чет передать слушателю; — быть звуконепроницаемыми (изнутри и снаружи) для обеспе- чения низкого уровня шумов; — позволять звукорежиссеру видеть музыкантов, т. е. иметь зву- конепроницаемое окно в студию. До недавнего времени в основе акустического проектирования контрольных комнат лежала концепция повторения параметров среднестатистического жилого помещения, т. е. считалось, что звукорежиссер должен находится в условиях, близких к условиям домашнего прослушивания. Среднее время реверберации выбира- лось 0,2-0,4 с. Объемы также были небольшими и составляли 30- 40 м3. Такие помещения удовлетворительно работали для записи музыки с небольшим динамическим диапазоном. Кроме того, усло- вия реального прослушивания музыкальных и речевых сигналов, переданных по каналам радиовещания, телевидения, звукозапи- си и пр., настолько разноообразны, что приведенные выше тре- бования нельзя считать типовыми для жилых помещений. Следующим этапом явилась концепция построения кон- трольных комнат, получившая название LEDE (live-dead end), в ко- торой звукорежиссер работал на границе двух сред — «живой» (//Ve) с большим количеством отражений и «мертвой» (dead), сво- бодной от отражений [40, 44, 60, 61]. В основе такого принципа по- строения контрольных комнат лежали следующие соображения: одним из важнейших критериев качества акустики в помещении является время прибытия ранних отражений, которое должно быть в пределах 20-30 мс после прямого звука. Если в студии при записи обеспечено это требование, то первые отражения в контрольной комнате не должны маскировать их, поэтому полез- но переднюю часть контрольной комнаты (стены за контрольными агрегатами, полы и потолки) сделать заглушёнными (dead end), а заднюю часть комнаты сделать отражающей (//Ve end). В этом слу- чае структура реверберационного процесса в контрольной комна- те должна иметь вид, показанный на рис. 5.5.5. Для того чтобы часть комнаты сделать отражающей, на задней стенке и потолке должны устанавливаться различные отражающие конструкции (на- пример, диффузоры Шредера) (рис. 5.5.6). Такая конструкция ком- наты позволяла звукорежиссеру ощущать живые отражения, но вместе с тем звук от студийных агрегатов воспринимался им без искажения, т. к. на прямой звук не накладывались отражения ком- наты. Однако такие контрольные комнаты было очень трудно на- страивать и, кроме того, возросшие требования к передаче стерео- панорамы и расширенного динамического диапазона для цифровых записей требовали снижения уровня реверберационных помех. Целый ряд известных студий (Master Sound Astoria в Нью-Йорке,
554 Глава 5 дБ ITD=10,6MceK 9,7дБ 24 дБ RFaJjJ 6 дБ О IO 20 мс Время Рис. 5.5.6. Общий план контрольной комнаты с зоной свободной от отражений (RFZ) и отражающей задней стеной Рис. 5.5.5. Структура реверберационного процесса в контрольной комнате Red Bus Studios в Лондоне, Winfeld Sound в Торонто и др.) продол- жают использовать контрольные комнаты, построенные в такой идеологии, в настоящее время. В конце 80-х годов была предложена конструкция «бессред- ных» контрольных комнат. Идея их проектирования была пред- ложена Т. Хидли (Т. Hidley), реализована на многих студиях мира Ф. Ньюэллом (Ph. Newell) и заключается в следующем [60, 61]: все поверхности, в направлении которых излучают студийные конт- рольные агрегаты, т. е. потолок, задняя стена и боковые стены, делаются звукопоглощающими, а поверхности перед звукорежис- сером, т. е. передняя стена и пол, делаются звукоотражающими. Это позволяет звукорежиссерам слышать прямой звук контрольных агрегатов, не окрашенный дополнительными отражениями, и в то же время получать отражения собственных голосов от передней фронтальной поверхности пола и находящегося в комнате обору- дования (пульта, компьютеров, стоек и др.). Для обеспечения по- глощения звуковой энергии во всем воспроизводимом диапазоне частот (особую проблему представляет обеспечение поглощения на низких частотах) используется новая технология так называе- мых «звуковых ловушек». Конструкция стены с боковыми ловушка- ми и общий вид «бессредной» контрольной комнаты показан на рис. 5.5.7. На определенном расстоянии от главной несущей сте- ны устанавливается дополнительная «диафрагменная» стена, со- стоящая из деревянной рамы с трехслойным покрытием (гипсовая штукатурка плюс древесно-волокнистая плита и снова гипсовая штукатурка), на котором закрепляется поглотитель из специальной минеральной ваты или синтепона. На некотором расстоянии от нее подвешиваются панели из фанеры, покрытые звукопоглоща- ющим материалом, под углом 45°, на расстоянии 30-46 см друг
Акустика помещений 555 звукопоглощающий материал, Рис. 5.5.7. «Бессредная» контрольная комната с ловушками от друга, общая глубина панелей 0,6-1,2 м. Установленные таким образом панели служат волноводами, поглотителями и рассеива- телями для низкочастотных звуковых волн. Поглощение средних и высоких частот обеспечивается традиционными методами и за- висит от свойств поглотителя на стене. Измерения процесса ре- верберации, выполненные в таких комнатах, показали, что в пер- вые моменты времени (до 50 мс) происходит очень быстрое поглощение отраженной энергии, что сохраняет ощущение мель- чайших нюансов в звучании контрольных агрегатов (в обычных комнатах они маскируются реверберационным процессом). Такого типа комнаты потребовали применения контрольных агрегатов с высоким уровнем звукового давления и малыми пере- ходными характеристиками, поэтому часто используются модели агрегатов с рупорными громкоговорителями (например, фирмы JBL) (см. гл. 6). Контрольные комнаты, построенные в такой идеологии знаме- нитыми дизайнерами Ф. Ньюэллом и Т. Хидли (более 100 студий в 32 странах мира), показали возможность получения в них запи- сей высочайшего качества с особой прозрачностью звучания, что особенно важно для цифрового звука. Поскольку контрольные комнаты используются теперь и как исполнительские студии для записи электронной музыки, такой принцип их построения лучше соответствут новым требованиям (искусственную реверберацию в них можно вносить электронными средствами). Уровень шумов в контрольных комнатах не должен превышать NC-25 для обеспечения большого динамического диапазона при
556 Глава 5 RS записи, что накладывает особые требования к их размещению. Так же как и для студий звукозаписи, проблемы снижения уровня шумов в контрольных ком- натах требуют решения сложнейших задач при их конструировании, в том чис- ле при выборе средств звукопоглощения и звуко- изоляции [28, 40]. Рис. 5.5.8. Расстановка контрольных агрегатов для пространственной звукозаписи по системе SS 5.1 Широкое внедрение со- временных пространствен- ных систем звукозаписи (см. гл. 6) изменило и требо- вания к параметрам конт- рольных комнат. В междуна- родных стандартах и реко- мендациях: ITU-R BS.775-1, SMPTE RP-173, EBU R22, EBU Tech3276, ITU-R BS.1116-1 и др. — оговариваются размеры и форма контрольных комнат, параметры звукового поля в них, способы расстановки контрольных агрегатов и др. Для контроля качества пространственных звукозаписей тре- буется установка контрольных агрегатов (например, для системы Surround Sound 5.1) по схеме, показанной на рис. 5.5.8. Эксперименты с выбором оптимальных условий для прослуши- вания пространственных звуковоспроизводящих систем показали, что общий объем студийных контрольных комнат должен быть не ниже 200 м3, а пропорции должны соответствовать данным в таблице 5.9 с целью обеспечения оптимального распределения резонансных мод в помещении. Форма комнаты должна быть в основном симметричной относительно зоны прослушивания. Рас- положение звукопоглощающего материала, особенно вокруг гром- коговорителей, дверей, окон и технического оборудования, должно быть подобрано так, чтобы избежать любых акустических неодно- родностей. Значение времени реверберации T рекомендуется выбирать в пределах 0,2-0,3 с (см. табл. 5.9). Частотная характе- ристики времени реверберации должна быть постоянной и не иметь резких скачков. Отклонения T в диапазоне 200 Гц-4 кГц не должны превышать +/-0,05 с, ниже 200 Гц допускаются откло- нения на 25% выше среднего значения. Общие требования к контрольным комнатам для простран- ственных систем звуковоспроизведения приведены в табли- це 5.5.2.
Акустика помещений 557 Таблица 5.5.2 Параметры помещения Малые контр, комнаты Средние контр, комнаты Комната Площадь пола, м2 50 (+/-20) 100 (+/-30) Объем комнаты, м3 >80 > 200 Форма комнаты Непрямоугольная (избегать параллельных поверхностей) Отношения размеров Желательно h : b : L = 1: 1,59 (+/-0,7) : 2,52 (+/-0,28) Высота комнаты, м 3,0-4,0 4,0-6,0 Однородное распределение отражающих/поглощающих поверхностей (необходимо избегать сильных отражений от каких-либо направлений) Акустические свойства Время реверберации, с 0,2 (±0,05) 0,3 (±0,1) Средний коэффициент поглощения 0,4-0,6 (на 500 Гц) Отклонения времени реверберации до 25% в частотной области ниже 250 Гц Ранние отражения (до 15 мс) на 10 дБ ниже прямого звука Распределение уровня звукового давл. — SPL Однородное распределение внутри слушательской зоны, включая место микширования Шум Шум от вентиляции Кривая NC15 Шум от оборудования Кривая NC20 В заключение необходимо подчеркнуть, что требования к аку- стическим характеристикам студий и контрольных комнат все вре- мя возрастают, поскольку они в значительной степени определяют качество музыкальных и речевых программ, поступающих к много- миллионной аудитории с помощью современных средств радиове- щания, звукозаписи, телевидения и мультимедиа. Отделка интерьера
558 Глава 5 Контрольные вопросы 1. Дать описание процесса распространения звуковых волн в помеще- нии и общей структуры реверберационного процесса. 2. Определить основные параметры реверберационного процесса (в со- ответствии со статистической теорией): средний коэффициент погло- щения, время реверберации, радиус гулкости, эквивалентное время реверберации, результирующее время реверберации. 3. Привести основные положения геометрической (лучевой) теории, а также описать структуру реверберационного процесса (роль и значе- ние первых дискретных отражений, структуру поздних отражений, эхо). 4. Какие виды волн возникают в помещении и как рассчитываются соб- ственные частоты для прямоугольного помещения в соответствии с волновой теорией? 5. Описать связь между параметрами реверберационного процесса и субъективными оценками качества звучания в нем (жизненность, полнота, ясность, интимность, пространственность, теплота и др.). 6. Определить основные требования к акустическим параметрам ауди- торий и залов драматических театров. 7. В чем состоят отличия требований к акустическим параметрам опер- ных театров от требований к речевым аудиториям? 8. Определить основные требования к акустическим параметрам концерт- ных залов. 9. Что такое аурализация? Дать определение и описание основных опе- раций по построению компьютерных моделей помещения. 10. Что называется системами звукоусиления и озвучивания? Привести требования к их параметрам и принципам построения. И. Описать причины возникновения обратной связи и методы борьбы с ней. 12. Привести классификацию современных студий звукозаписи и требо- вания к их акустическим параметрам. 13. Определить требования к акустическим параметрам контрольных комнат, тенденции их развития, особенности построения для совре- менных пространственных систем звукопередачи.
Акустика помещений 559 Список литературы 1. Sabine W. С. Collected Papers on Acoustics. Cambridge.: Harvard University Press, 1923. 2. Морз Ф. Колебания и звук. M.: Гостехтеориздат, 1949. 3. СтрэттД. (Рэлей). Теория звука. 2-е изд. M.: Гостехтеориздат, 1955. 4. Beranek L. Music, Acoustics and Architecture. 2 ed. N. Y.: John Wiley, 1996. 5. Beranek L. How They Sound: Concert and Opera Halls. N. Y.: Acoustical Society of America, 1996. 6. Beranek L., Hidaka T. Objective and subjective evaluations of twenty- three opera houses in Europe, Japan and the Americas. JASA. V. 107. № 1, 2000. 7. Beranek L. Concert Hall Acoustic. JASA. V. 92, 1992. 8. Olson K Music, Physics and Engineering. N. Y: Dover Publ. Inc., 1967. 9. Olson K Modern Sound Reproduction. N. Y.: McGraw-Hill, 1972. 10. Schroeder, M. R., Gottlieb D., Siebrasse K. E Comparative study of European concert halls: Correlation of subjective preference with geometric and acoustic parameters. JASA. V. 56, p. 1195-1201, 1974. 11. Kuttruff H. Sound in Enclosures. Encyclopedia of Acoustics I Ed. M. J. Crocker. N. Y, 1997. V. 3. 12. Kuttruff N. Room Acoustics I 3 ed. London.: Elsevier, 2000. 13. Barron M. Auditorium Acoustics and Architecturial Design. London.: Chapman & Hall, 1993. 14. Ando Y. Concert hall acoustics. Berlin.: Springer, 1985. 15. Кнудсен В. Архитектурная акустика. M.: Стройиздат, 1956. 16. Анерт В., Рейхардт В. Основы техники звукоусиления. M.: Радио и связь, 1984. 17. Иордан В. Л. Акустическое проектирование концертных залов и те- атров. M.: Стройиздат, 1986. 18. Рейхардт В. Акустика общественных зданий. M.: Стройиздат, 1984. 19. Egan М. D. Architectural Acoustics. N. Y.: McGraw Hill, 1988. 20. Rossing Т. D., Moore E R., Wheeler P. A. The Science of Sound. 3rd ed. San Francisco.: Addison — Wesley, 2002. 21. Акустика. Справочник I Под. ред. M. А. Сапожкова. M.: Радио и связь, 1989. 22. Качерович А. Н. Акустическое оборудование киностудий и театров. M.: Искусство, 1980. 23. Маньковский В. С. Акустика студий и залов для звуковоспроизведе- ния. M.: Искусство, 1966. 24. Маньковский В. С. Основы звукооператорской работы. M.: Искусство, 1984. 25. Павловская В. И., Качерович A. H., Лукьянов А. П. Акустика и элек- троакустические аппараты. M.: Искусство, 1986. 26. Макриненко Л. И. Акустика помещений общественных зданий. M.: Стройиздат, 1986.
560 Глава 5 27. Ковригин С. Д., Крытое С. И. Архитектурно-строительная акустика. M.: Высшая школа, 1986. 28. Щевьев Ю. П. Физические основы архитектурно-строительной аку- стики. СПб.: СПИКИТ, 2001. 29. Фурдуев В. В. Стереофония и многоканальные звуковые системы. M.: Связь, 1973. 30. Фурдуев В. В. Акустические основы вещания. M.: Связьиздат, 1960. 31. Сапожков М. А. Электроакустика. M.: Связь, 1978. 32. Сапожков М. А. Звукофикация открытых пространств. M.: Радио и связь, 1985. 33. Сапожков М. А. Звукофикация помещений. M.: Связь, 1979. 34. Давыдов В. В. Акустика помещений. M.: Радио и связь, 1995. 35. Дрейзен И. Т. Система электронного управления акустикой залов и радиовещательных студий. M.: Связь, 1967. 36. Kleiner М. Auralization-An Overview. JAES, V. 41, № 11. 1993. 37. Odeon (http://www.dat.dtu.dky~odeon/vocabula.htm) 38. CATT (http://www.netg.se/~catt/) 39. Orpheus (http://www.oфheus-acoustics.com) 40. Handbook for Sound Engineers. The New Audio Cyclopedia. 2 ed. I Ed. Glen Ballou. Carmd.: SAMS, 1991. 41. H. Lee, B. H. Lee. An Efficient Algorithm for The Image Model Technique. Appl. Acoustics. V. 24, 1988. 42. Ouis D. Study on the Relationship between Some Room Acoustical Descriptors. JAES. V. 51. № 6, 2003. 43. Ковалгин Ю. А. Стереофония. M.: Радио и связь, 1989. 44. Everest E A. The Master Handbook of Acoustics. Blue Ridge Summit, Penn.: TAB Books, 1989. 45. Eargle J., Foreman C Audio Engineering for Sound Reinforcement. N. Y.: Hal-Leonard Corporation, 2002. 46. Анерт В., Стеффен Ф. Техника звукоусиления. M.: Эра, 2003. 47. Hall D. Musical Acoustics: An Introduction. Belmont. California.: Wadsworth Publishing Company, 1980. 48. Talaske R., Wetherill E., Cavanaugh W. Halls for Music Performance: Two Decades of Experience 1962-1982. N. Y.: Acoustical Society of America, 1982. 49. Music, Room and Acoustics I Ed. Johan Sundberg. Stockholm.: Royal Institute of Technology, 1977. 50. The Psychology of Music I Ed. D. Deutch. N. Y: Academic Press, 1999. 51. Eagle J. Music, sound and technology. N. Y: Van Nostrand Reinhold, 1995. 52. http://www.audiolab.uwaterloo.ca/~bradg/auralisation.html 53. http://www.users.bigpond.com/simonpj/thesis/3daudio.htm 54. Edelbrock R Room Acoustics Modeling. http://www.ece.orst.edu/~edelbф/RoomSim/RoomSim.shtml. 55. Радиовещание и электроакустика. Учебник I Под. ред. Ю. А. Ковал- гина. M.: Радио и связь, 1998.
Акустика помещений 561 56. Ершов К. E Основы звукотехники. Л.: Искусство, 1989. 57. Schroeder М. R. Computer Speech. N. Y.: Springer, 2002. 58. Нисбетт А. Звуковая студия / Пер. с англ. M.: In-Out, 1996. Кн. 1. 59. Меерзон Б. Я. Акустические основы звукорежиссуры. M.: Аспект Пресс, 2004. 60. Нъюэлл Ф. Звукозапись. Акустика помещений. M.: Шоу Мастер, 2004. 61. Newell R Recording Studio Design. UK: Focal Press, 2003. 62. Еензель E С, Ковалгин Ю. А, Фадеев Ф. Ф. Расчет и проектирование элементов трактов звукового вещания. Пособие по кусовому проекти- рованию. СПб.: ГУТ им. Бонч-Бруевича, 2000.
Глава 6. ПРИНЦИПЫ ПОСТРОЕНИЯ СИСТЕМ ЗВУКОЗАПИСИ, ЗВУКОПЕРЕДАЧИ И ЗВУКОВОСПРОИЗВЕДЕНИЯ Как уже было отмечено в предыдущих главах, основные обла- сти исследований в музыкальной акустике включают в себя про- блемы создания, распространения и восприятия звука (см. гл. 1). На протяжении многих столетий вплоть до начала XX века это был «естественный» процесс: музыкальный звук создавался с помо- щью музыкальных инструментов и голоса, распространялся в кон- цертных и театральных залах и воспринимался слуховой системой слушателей. Начиная с 30-х годов XX века появилась новая система фор- мирования звукового образа, его передачи и воспроизведения с использованием электронных средств. Структура этой системы показана на рис. 6.1.1. Создание звукового образа происходит посредством записи как естественного звука (создаваемого го- лосом или традиционными музыкальными инструментами) в концертных залах и студиях, так и звука, получаемого с помо- щью электромузыкальных и электронных инструментов (в том чис- ле благодаря музыкальным компьютерным технологиям). Записан- ный звуковой сигнал в электрической форме обрабатывается в студиях звукозаписи и подготавливается к дальнейшей переда- че. Весь предназначенный для этого комплекс средств можно на- звать трактом формирования (первичной записи и обработки) звукового образа. Подготовленный звуковой сигнал передается широкой аудитории с помощью систем радиовещания, телевиде- ния, мультимедиа и звукозаписи. Этот комплекс средств можно назвать трактом звукопередачи. Наконец, имеется специальный набор технических средств (декодеров, усилителей, акустических Тракт первичной записи звука Тракт обработки звука Тракт звуко- передачи Тракт звуковос- произведения Рис. 6.1.1. Общая структура звукового тракта
Принципы построения систем звукозаписи 563 систем и др.) для воспроизведения (в настоящее время «простран- ственного») звукового образа — тракт звуковоспроизведения. Как показали исследования последних лет, все больший про- цент слушателей получает в настоящее время звуковую информа- цию с помощью электронных средств для ее записи, передачи и воспроизведения. Естественно, что современная музыкальная акустика изучает проблемы, связанные с этими вопросами. Поэто- му в международных учебниках по музыкальной акустике [1-8] уде- ляется внимание вопросам записи и воспроизведения звука и принципам работы электромузыкальных и электронных инстру- ментов. В отечественных образовательных стандартах для звукоре- жиссеров эти вопросы вынесены в отдельные дисциплины, од- нако, с учетом возможности использования данного учебника представителями других специальностей, а также общих тенден- ций в мировой музыкальной акустике, в главе 6 приведены крат- кие сведения о процессах записи и воспроизведения звука: раздел 6.1 — история звукозаписи, раздел 6.2 — принципы преобразова- ния аналогового сигнала в цифровой, раздел 6.3 — структура сту- дий звукозаписи и основные виды оборудования применяемого в них, раздел 6.4 — системы пространственной передачи и вос- произведения звука. Принципы построения электромузыкальных и электронных инструментов даны в главе 7. Более подробное освещение этих вопросов можно найти в литературе [9-15], а так- же в ряде существующих [16] и подготавливаемых в настоящее время учебников по этим дисциплинам. 6.1. ИСТОРИЯ ЗВУКОЗАПИСИ Поиски способов сохранения живых звуков музыки и речи и по- следующего их воспроизведения и передачи велись длительное время, однако только в конце XIX века удалось получить реальные результаты в этом направлении, которые привели к созданию раз- личных систем звукозаписи. Под процессом звукозаписи понимает- ся «перевод воздушных колебаний среды (воспринимаемых как звук) в изменение свойств какой-то другой среды (физического тела — носителя записи) с целью сохранения в ней информации для ее последующего извлечения» [14-23]. Основное промышлен- ное применение за прошедший период нашли три вида звукозапи- си: механическая, магнитная, оптическая [20, 22, 23]. Механическая звукозапись. 30 апреля 1877 года Шарль Кро (Charles Cros) послал во Французскую Академию наук документы на изобретение под названием «фонограф». Суть изобретения за- ключалась в том, что на поверхности вращающегося стеклянного диска, покрытого сажей, игла, прикрепленная к мембране, могла записывать звуковые колебания. С этого диска оптическим путем
564 Глава 6 можно было получить копию на свето- чувствительной хромовой пластинке. Вращая эту металлическую пластинку и прослеживая изображение звука иг- лой, соединенной с мембраной, можно было вновь получить звук. Пока эта заявка находилась на рассмотрении в Академии наук, в октябре 1877 года Т. Эдисон (Т. Edison) в США продемон- стрировал аппарат «фонограф» (заявка была зарегистрирована 19 февраля 1878 года), пригодный для записи и вос- произведения звука [20, 33, 34]. Прин- Рис. 6.1.2. Фонограф начала XX века цип действия первого фонографа заключался в следующем (рис. 6.1.2): металлический валик вращался вручную с помощью рукоятки, с каждым оборотом перемещаясь по продольной оси за счет винтовой нарезки на ведущем валу. На валик накладывалась оловянная фольга, к которой прикасалась игла, связанная с мем- браной, нагруженной на металлический рупор. Когда мембрана начинала колебаться под действием звуковой волны, игла вдавли- валась в олово, в соответствии с воспринимаемым звуком созда- вая канавку переменной глубины. Такой способ получил название «глубинной записи». Эдисон продолжал усовершенствовать свой аппарат и в дальнейшем выпустил модели, в которых носителями записи стали восковые валики, позволявшие использовать их многократно, если сошлифовывать каждую предыдущую запись. Привод из ручного стал механическим, а затем электрическим. Но Эдисону так и не удалось преодолеть главного недостатка фо- нографа, каковым являлось отсутствие способа тиражирования фонограмм. В практически неизменном виде фонограф просуще- ствовал несколько десятков лет. Как аппарат для записи музыкаль- ных произведений он перестал выпускаться в конце первого деся- тилетия XX века, но еще практически пятнадцать лет применялся в качестве диктофона, а валики к нему выпускались вплоть до 1929 года. Новый этап в развитии механической записи начался в 1887 году, когда Эмиль Берлинер (Е. Berliner) предложил использовать попе- речные колебания иглы для записи звука на плоский диск. Рабо- тая над своей идеей, Э. Берлинер сначала построил и опробовал прибор Шарля Кро, применив взамен хромовой пластинку из цин- ка. Опыт оказался удачным, на разработанное устройство, впос- ледствии названное «граммофоном», был получен патент 26 сен- тября 1887 года. Совершенствуя свое изобретение, Э. Берлинер разработал метод получения пластинок способом химического травления: на поверхности цинковой пластинки, покрытой тонким слоем воска, записывающая игла процарапывала канавку, которая
Принципы построения систем звукозаписи 565 затем протравливалась соляной кислотой. Полученная таким спо- собом пластинка позволяла получать звук большей громкости и лучшего качества. Такие пластинки Э. Берлинер продемонстри- ровал в 1888 году, и этот год можно считать началом эры грамза- писи. Через пять лет был разработан способ гальванического ти- ражирования с позитива цинкового диска, а также технология прессования грампластинок из эбонита при помощи стальной пе- чатной матрицы. В скором времени эбонит был заменен компози- ционной массой на основе шеллака, пластинки стали качественней и дешевле, хотя главным их недостатком была малая механиче- ская прочность. Шеллачные пластинки выпускались до середины XX века. Первоначально диск приходилось вращать вручную, и это было главным препятствием широкому распространению граммофонов. С изобретением специального двигателя начался массовый выпуск граммофонов по всему миру. Сразу две фирмы в США стали ра- ботать в области звукозаписи — это JVC и CBS. В первые годы XX века появились европейские фирмы грамзаписи: «Граммофон» в Германии, «Пате» во Франции и др., открывшие свои филиалы в других странах. Портативный граммофон стал называться в Рос- сии патефоном. Фирма «Пате» первой начала выпуск грампласти- нок в России в 1907 году с матриц, ввозимых из-за границы. Про- изводство собственных пластинок началось в России в 1910 году на Апрелевском заводе под Москвой. Шеллачные грампластинки непрерывно совершенствовались. Скорость вращения, вначале установленная между 68 и 88 об/мин, утвердилась на 78,26 об/мин. Диаметр пластинок со 175 мм уве- личился до 250 и 300 мм. С 1903 года начался выпуск двусторон- них грампластинок, разработанных фирмой «Одеон». Следующий этап в развитии механической записи связан с за- меной механоакустического способа записи с помощью рупора электроакустическим с использованием микрофона. Этот этап на- чался в конце двадцатых годов, в России — с 1929 года. Электри- ческая запись с использованием микрофонов, усилителей низкой частоты и специальных рекордеров, преобразующих электрический сигнал в механические колебания резца, резко улучшила качество грампластинок за счет уменьшения нелинейных искажений и рас- ширения частотного диапазона со 150-4000 Гц до 50-10000 Гц. Этот же период характеризовался появлением новых видов аппа- ратуры для воспроизведения (электродинамических громкоговори- телей, усилителей и др.). В 1948 году крупнейшая фирма грампластинок «Columbia Records» разработала новую систему записи «долгоиграющих» пластинок, для чего был создан специальный полимерный матери- ал винилит. Долгоиграющие виниловые пластинки за счет ис- пользования уплотненной записи с микроканавками и снижения
566 Глава 6 скорости проигрывания до 33 V3 об/мин позволяли записывать про- изведения, длительность которых достигала 30 минут для одной стороны пластинки при одновременном расширении частотного ди- апазона до 16000 Гц. Кроме того, пластинка стала небьющейся. Одновременно фирма RCA разработала грампластинки диаметром 175 мм с большим центральным отверстием и скоростью враще- ния 45 об/мин для проигрывания на автоматах. В России долгоиг- рающие пластинки стали выпускаться с 1950 года. В том же году в мире появились долгоиграющие пластинки с переменным шагом записи, позволившие увеличить длительность записи еще на 30%. Производство таких пластинок в России началось в 1956 году. Попытки создания стереофонической записи были сделаны еще в 1910 году, при этом пытались один сигнал записывать глубинным способом, другой — поперечным в двух параллельных канавках. В 1958 году был окончательно принят способ записи стереоплас- тинок, при котором сигналы обоих каналов записывались раздель- но на стенки канавки, ориентированные под углом 45° к поверхно- сти пластинки (впервые он был предложен А. Блюмлейном в 30-е годы). Такой способ оказался совместимым с монофоническим. Массовый выпуск стереофонических пластинок начался на рубеже шестидесятых годов. В последующие годы были разработаны еще более сложные системы записи, например четырехканальные (квадрофонические) и др. Общий принцип механической записи заключался в том, что на металлическом диске, покрытом слоем пластика, вырезалась спи- ральная канавка с помощью специального электромеханического преобразователя — рекордера с резцом из твердого материала (рис. 6.1.3). Рекордер (рис. 6.1.4) колебался в плоскости, парал- лельной диску (колебания его модулировались переменным элек- Рис. 6.1.3. Станок для записи 3 4 3 Рис. 6.1.4. Вид электромагнитного рекордера: виниловых пластинок: 1 — планшайба; 2 — двигатель; 3 — механизм управления 1 — магнит; 2 — якорь; 3 — резец; 4 — катушка; 5 — полюсные наконечники записывающим устройством; 4 — рекордер; 5 — диск
Принципы построения систем звукозаписи 567 Рис. 6.1.5. Вид канавки при записи стереосигнала трическим током, подводимым к его обмотке), и вырезал изви- листую спиральную канавку, фор- ма которой определялась пара- метрами подводимого звукового сигнала [14]. При записи моно- сигнала обе стороны дорожки были одинаковы, при записи сте- реосигнала резец совершал как боковые, так и глубинные колебания и на разные стороны дорожки записывалась разная информация для правого и левого сигнала (рис. 6.1.5). С этого диска затем тиражировались копии, с которых прессовались пластинки [9, 14, 22, 33, 34]. При воспроизведении игла звукоснимателя (адаптера) двигалась по канавке, повторяя смещение резца при записи. Механические смещения иглы трансформировались в звукоснимателе в электрический ток, ко- торый затем усиливался и воспроизводился. Качественное вос- произведение механических записей во многом зависело от мас- сы и упругости подвижной системы звукоснимателя, которая включала в себя иглу, элементы передачи механических колеба- ний и преобразующее устройство. В качестве звукоснимателей начиная с 1930-х годов применялись электромагнитные адаптеры, в них сначала использовались сапфировые иглы, затем для про- игрывания долгоиграющих пластинок начали выпускаться специ- альные корундовые иглы. Позднее получили распространение электродинамические и пьезоэлектрические звукосниматели; в по- следних в качестве материала для пьезокристалла использовалась сегнетова соль, потом на смену ей пришла пьезокерамика [22]. В 1970-е годы механическая запись постепенно уступила место оптической звукозаписи, хотя сохранился огромный парк винило- вых грампластинок и большое количество любителей старых ана- логовых записей на них [9, 23]. Магнитная звукозапись. В 1898 году Вальдемар Паульсен (V. Poulsen) получил первый патент на устройство магнитной запи- си звука, испопьзуя стальную проволоку как носитель. Лента появи- лась только в 1930-е годы, причем в качестве основы использова- лась бумага, только позднее она была заменена полимерной пленкой [18]. Больших успехов в совершенствовании технологии магнитной записи добились немецкие специалисты в 1940-е годы. Уже в 1935 году были организованы первые публичные демонст- рации фирмами BASF/AEG нового прибора «Magnetophone» на Берлинском радио. В 1936 году с его помощью были сделаны записи живого концерта. Качество магнитофонов улучшилось с изобретением фирмой AEG системы высокочастотного подмаг- ничивания. Разработанные в Германии магнитофоны были выве- зены в Америку и использовались в радиовещании до 1948 года.
568 Глава 6 В 1948-м году был продемонстрирован на выставке первый аме- риканский магнитофон Model 200, созданный фирмой Атрех, ис- пользующий ацетатную пленку, покрытую гамма-окисью железа. В этом же году появилась другая модель магнитофона «Long play record» (конструктор П. Гольдмарк). В период перехода с лампо- вой на транзисторную схемотехнику в конце 1950-х фирма Атрех создала первый магнитофон для записи стереозвука. В начале 1960-х появились магнитофоны для многодорожечной записи (4, 8, 16 треков), в них начала применяться система шумоподав- ления фирмы Dolby, SMPTE-time коды и др. В 70-е годы XX века техника создания многоканальных аналоговых магнитофонов до- стигла очень высокого уровня, они выпускались такими фирмами как Studer, Sony, Otary, Ampex, Mitsubishi и др. Большое количество радиодомов и телецентров в России были оснащены студийными многоканальными магнитофонами фирмы Studer и др., а также отечественными магнитофонами марки МЭЗ и др., обеспечиваю- щими высокое качество записи. Первые попытки записи цифрового звука были предприняты для магнитофонов в 70-е годы [18, 19]. В результате работ, вы- полненных в технической лаборатории японской радиовещатель- ной компании NHK, в 1967 году был создан первый цифровой магнитофон, в котором сигнал преобразовывался в цифровую форму с частотой дискретизации 31,5 кГц и 12-разрядным нели- нейным квантованием. Сигнал записывался на видеомагнитофон с двумя вращающимися головками на ленту шириной 2,54 мм. В нем удалось обеспечить очень высокие для того времени па- раметры — диапазон частот 10 Гц — 15 кГц и динамический ди- апазон 75 дБ. После этого работы по совершенствованию циф- ровых магнитофонов начались на многих фирмах, в основном на базе видеомагнитофонов как с неподвижными, так и с вращаю- щимися головками. В 1977 году фирма Sony выпустила ИКМ- адаптер, приставку к видеомагнитофону, которая позволяла запи- сывать на него цифровой звук. В 1983 году была стандартизована система цифровой магнитной записи для массового производ- ства, получившая название DAT (Digital Audio Таре — цифровая звуковая лента). В 1985 году был принят стандарт для записи по системе R-DAT с вращающимися головками, обеспечивающей па- раметры: 2-22000 Гц, «сигнал/шум» — 98 дБ, К. Н. И. — 0,005% и др. Кассета с размерами 75х54х 10,5 мм, записанная по та- кой системе, обеспечила звучание двух часов музыки с очень вы- соким качеством (см. раздел 6.3.4). Дальнейшее развитие этой техники происходит в настоящее время в связи с переходом на новые носители информации — например, развивается многодо- рожечная запись на жесткие магнитные диски с объемом допу- стимой информации десятки гигабайт (Гб).
Принципы построения систем звукозаписи 569 Оптическая звукозапись. Первые попытки использования для записи звука оптических (точнее, фотографических) методов были предприняты еще в 1930-е годы. Эти попытки положили на- чало развитию звукового кино. Принцип работы таких систем со- стоял в следующем: с помощью микрофона звуковые колебания преобразовывались в электрический сигнал, этот сигнал усили- вался до нужной величины и поступал на специальное устрой- ство — оптический модулятор, который модулировал полученным сигналом световой луч, падающий на светочувствительную плен- ку. Вначале модулируемым параметром светового луча была его яркость, впоследствии модуляция стала осуществляться путем перемещения луча перпендикулярно оси звуковой дорожки (попе- речная запись), которая размещалась у края кинопленки. После экспозиции пленка проявлялась и закреплялась обычным фото- химическим способом. С полученного оригинала, который пред- ставлял собой негатив, делались позитивные копии. Эти копии также проявлялись и закреплялись. Процесс воспроизведения звука с полученной таким путем до- рожки показан на рис. 6.1.6. С помощью оптической системы ОС свет лампы Л фокусируется на звуковую дорожку кинопленки КП. Пропорционально изменениям ширины звуковой дорожки меняет- ся и интенсивность проходящего через нее светового потока. Этот поток попадает на фотодиод, который преобразует его в электрический сигнал. Изменения величины сигнала фотодио- да соответствуют изменениям интенсивности светового потока. Полученный сигнал затем усиливается до нужной величины и воспроизводится акустическими системами. Такая технология за- писи звука нашла применение только в кинопроизводстве, посколь- ку возможности ее массового использования ограничиваются сложностью обработки пленки и невысокими качественными пока- зателями записанного звукового сигнала. Первые работы по оптической записи звуковой информации на дисковый носитель начались в 1961 году в Стэнфордском универси- тете Т. Стокманом (Т. Stockman). Здесь также запись звукового ос Q ф у гр сигнала осуществлялась вна- (STT П^^^^СГО^^^^" "4^ чале фотографическими мето- л дами (в виде светлых точек кп и черточек на темном фоне) И воспроизводилась путем про- Рис- 61-6- Система считывания СВеЧИВанИЯ ДИСКа ЛуЧОМ ртутной звуковой дорожки с кинопленки: лампы. В дальнейшем были опробованы и другие способы Л — лампа; ОС — оптическая система; КП — кинопленка; записи и считывания звуковой ф _ фотоПрИеМНик; информации на диск. Работы у _ усилитель; в этом направлении проводили Гр — громкоговоритель
570 Глава 6 многие фирмы, но наиболее удачную технологию оптической зву- козаписи разработали и в 1972 году продемонстрировали специ- алисты фирмы Philips. Звуковой сигнал здесь записывался в виде спиральной дорожки из последовательности углублений различ- ной длины, расположенной на отражающей поверхности диска, покрытой тонким слоем алюминия. Диск изготавливался из про- зрачной пластмассы, и считывание информации осуществлялось сфокусированным лучом полупроводникового лазера сквозь всю его толщину (подробнее об этом см. в разделе 6.3.4). Междуна- родный стандарт IEC (МЭК — Международный Электротехнический Комитет) на систему «компакт-диск» был принят 6 октября 1982 года, и с этого момента началось массовое производство как самих компакт-дисков, так и аппаратуры для их воспроизведения. В 1992 году на потребительском рынке появился новый носи- тель — магнитооптический мини-диск, который позволил не только воспроизводить звуковые программы той же продолжительности, что и программы на компакт-диске (74 минуты), но и записывать их. Диаметр мини-диска (64 мм) почти вдвое меньше диаметра компакт- диска (120 мм), и запись на него такого большого объема музыкаль- ного материала стала возможной только благодаря использованию алгоритма компрессии данных по стандарту ATRAC [19]. В конце 90-х годов XX века были разработаны две новые тех- нологии цифровой лазерной звукозаписи — DVD (Digital Versatile Disc — цифровой многопрофильный (легко изменяющийся) диск) в модификации DVD-Audio и SACD (Super Audio CD — звуковой компакт-диск со сверхвысоким качеством звучания) (см. раздел 6.3.4). В настоящее время происходит дальнейшее развитие техноло- гий записи звука, в том числе в направлении увеличения емкос- ти носителей информации. В 2000 году фирма Sony объявила о создании компакт-дисков повышенной плотности формата DDCD, позволяющего вдвое увеличить количество информации, записы- ваемой на диск (до 1,3 Гб). Фирма TDK предложила свой формат многоуровневой записи Multi-Level Recording, позволяющий увели- чить объем информации на диске в три раза (до 2 Гб). Огромным шагом вперед является разработанная фирмой C3D технология трехмерного флюоресцентного дискового носителя, в котором за- пись осуществляется не только по площади, но и по глубине на нескольких слоях. Фирма объявила о готовности продемонстриро- вать 100-слойный диск емкостью в 1 терабайт. Ведутся интенсив- ные научные работы по использованию твердотельных объемных накопителей, уже демонстрировались опыты по голографическим способам объемной записи информации в кристалл ниобата лития. Кристалл объемом 1 см3 может содержать до 1 терабайта инфор- мации [19]. Таким образом, возможности развития этого направле- ния техники представляются почти безграничными.
Принципы построения систем звукозаписи 571 6.2. АНАЛОГОВОЕ И ЦИФРОВОЕ ПРЕДСТАВЛЕНИЕ МУЗЫКАЛЬНЫХ И РЕЧЕВЫХ СИГНАЛОВ Как уже отмечено выше, в современной студийной звукозаписи за последние десятилетия произошел переход от аналоговой тех- ники к цифровой. Все современные музыкальные компьютерные технологии производят только цифровую обработку сигналов. Циф- ровая запись и обработка звука имеет ряд преимуществ: обеспе- чение большого динамического диапазона, низкого уровня шумов, малых нелинейных искажений и др.; гибкость, т. е. удобство про- граммирования и перепрограммирования; повторяемость, возмож- ность быстрого дублирования, стабильность при изменении вне- шних условий; легкость выполнения целого ряда функций, которые сводятся к некоторым стандартным операциям сложения, вычита- ния, умножения (сдвига) и деления двоичных чисел; долговечность при хранении информации; огромный объем обрабатываемой ин- формации и др. В данном разделе будут кратко приведены сведения по основ- ным операциям при переходе от аналогового к цифровому звуку (дискретизация, квантование и кодирование), необходимые для дальнейшего изложения. Подробнее с этими вопросами, а также другими видами цифровой обработки звуковых сигналов можно ознакомиться в литературе [16, 24-29]. Классификация сигналов. В технической литературе принято следующее определение сигнала: «процесс изменения во времени физического состояния какого-то объекта, в результате которого осуществляется передача энергии и информации» [16, 27]. В теории связи под сигналом понимается «варьируемая переменная, с помо- щью которой передается информация по электронным цепям» [24]. В практике работы звукорежиссера приходится иметь дело со звуковыми сигналами, которые могут быть классифицированы по различным признакам: — по способу их физического представления — на акустиче- ские сигналы (в виде вариаций звукового давления или плотности в воздушной среде) и электрические сигналы (переменное напря- жение (ток) в электрической цепи). На первом этапе звукозаписи от источника до микрофона сигнал имеет акустическое представле- ние, с выхода микрофона поступает уже электрический сигнал, с которым и производятся все виды обработок на микшерном пульте, в компьютере и т. д., затем сигнал сохраняется и переда- ется в электрической (проводные сети) или электромагнитной (сети радиовещания, телевидения и др.) форме; только на после- днем этапе сигнал с помощью громкоговорителя восстанавливает- ся в акустическом виде, в котором и поступает в слуховую систе- му (следует отметить, что внутри нее он опять конвертируется в электрическую форму — см. гл. 3);
572 Глава 6 — по степени их предсказуемости сигналы могут быть разде- лены на детерминированные, случайные, квазислучайные. Как уже было отмечено в главе 2, музыкальные и речевые сигналы отно- сятся к квазислучайным нестационарным сигналам, поэтому для их изучения используются методы статистической теории, а также методы спектрального и корреляционного анализа [15, 28]; — по характеру изменения значений функции, описывающей сигнал, и ее переменной (аргумента) можно выделить три клас- са сигналов: 1) непрерывные (аналоговые), в которых значения функции и ар- гумента изменяются непрерывно и могут быть измерены в любые моменты времени. Аудиотехника работала именно с этими вида- ми сигналов на протяжении всего периода ее развития с 30-х до 90-х годов XX века; 2) дискретные, в которых значения функции изменяются не- прерывно, а аргумент может принимать только строго фиксирован- ные значения. Дискретный звуковой сигнал можно представить в виде последовательности импульсов, амплитуда которых зави- сит от значения сигнала в данный момент времени (АИМ); можно также применять импульсы, ширина которых пропорциональна ам- плитуде сигнала (ШИМ) (рис. 6.2.1). Дискретные сигналы стали применяться в радиотехнике с 40-х годов [28]; 3) цифровые, в которых значения функции и аргумента могут быть только дискретными. Полученные значения сигналов пред- ставляются в виде определенной последовательности чисел (рис. 6.2.2). Операции преобразования аналогового сигнала в цифровой называются: дискретизацией (сэмплированием), квантованием и кодированием [15, 16, 24-28]. Необходимо отметить при этом, S(I) Рис. 6.2.1. АИМ- и ШИМ- Рис. 6.2.2. Основные операции перехода сигналы от аналогового сигнала к цифровому сигналу
Принципы построения систем звукозаписи 573 что аналоговый сигнал несет полную информацию о реальном звуковом мире в любые моменты времени с любой точностью (на- пример, звучание скрипки, пение, шум и др.); цифровые сигналы передают эту информацию всегда с определенной погрешностью, т. к. в промежутках между отсчетами (сэмплами) информация теря- ется; кроме того, она неточно передается и по уровню, т. к. исполь- зуются только квантованные значения. Эти неточности заложены в природу цифрового сигнала. По мере повышения быстродействия современной компьютерной техники эти погрешности становятся все меньше и приближаются к порогам чувствительности слуха. Следует отметить еще одно различие аналоговых и цифровых сигналов: когда в аналоговом сигнале изменяется частота, ам- плитуда или фаза в одной форме его представления, например в акустической, пропорционально изменяются эти же параметры в другой форме его представления, например электрической; при этом они в значительной степени взаимосвязаны. В цифровом сигнале изменение цифровых данных, описывающих, например, частоту, не приводит к изменению данных, описывающих ампли- туду и др., поэтому при обработке цифровых сигналов возмож- ны такие операции, как сдвиг высоты без растяжения (сжатия) сигнала по времени. Цифровая обработка сигналов — ЦОС (Digital Signal Proces- sing — DSP) включает в себя: анализ, синтез и изменение (обра- ботку) информации, передаваемой в виде дискретной последова- тельности чисел (т. е. в виде потока электрических импульсов, несущих закодированную в двоичном коде информацию) [26, 29]. В основе всех музыкальных компьютерных программ, исполь- зуемых в практике работы со звуком, лежит цифровая обработка сигналов, включающая некоторый стандартный набор операций: дискретизацию (сэмплирование), квантование, кодирование, пре- образование Фурье (FFT) и др. Ниже будут кратко рассмотрены основные из них. Дискретизация. Преобразование сигнала из непрерывной формы в дискретную можно представить как результат измерения мгновенных значений сигнала (например, напряжения) через по- стоянные (дискретные) промежутки времени. Полученная совокупность отсчетов затем преобразуется в чис- ловую последовательность и передается для последующей обра- ботки, например в компьютере. Этот процесс называется дискре- тизацией, или сэмплированием (слово «сэмпл» употребляется также и в другом значении — «образец записи звучания какого- либо отрезка музыки, речи, шума и др.»). Среди методов цифро- вого представления наиболее известна импульсно-кодовая моду- ляция (ИКМ), которая реализуется в специальном устройстве АЦП. Принципиальная схема его показана на рис. 6.2.3: входной сигнал U(t) ограничивается по полосе низкочастотным фильтром (ФНЧ)
574 Глава 6 Рис. 6.2.3. Схема устройства аналого-цифрового преобразователя (АЦП) и поступает в амплитудно-импульсный модулятор (АИМ), где проис- ходит его дискретизация, т. е. считывание значений с помощью гене- ратора тактовых импульсов (ГТИ). Выходной сигнал АИМ-модуля- тора представляет собой временную последовательность отсчетов (рис. 6.2.4), отстоящих один от другого на интервал времени T1 на- зываемый периодом дискретизации. Величина^, обратная пери- оду (интервалу) дискретизации {f = 1/Тд), называется частотой дискретизации. Частота дискретизации (sample rate) равна числу отсчетов сигнала в секунду Например, если указана частота дискретизации в компьютере 48 кГц, то это означает, что в АЦП, установленном на звуковой карте, выполнено 48000 отсчетов сигнала в секунду. Сигнал, показанный на рис. 6.2.4, называется дискретным. В кодере АЦП выходной сигнал затем квантуется по уровню и ко- дируется. Рассмотренная схема является простейшей. Реальные ИКМ-преобразователи содержат и некоторые другие функциональ- ные блоки, уменьшающие погрешности преобразования [15, 16]. Выбор частоты дискретизации является важнейшей операцией при обработке музыкальных и речевых сигналов в компьютерах и других цифровых устройствах. Для адекватного представления сиг- нала (особенно содержащего много высокочастотных составляю- щих в спектре) и его последующего восстановления в ЦАП необ- ходимо брать достаточно большое количество отсчетов (рис. 6.2.4). С другой стороны, когда выбрано слишком много отсчетов, появ- ляется много коррелированных значений сигнала, которые не оп- равдывают затрат времени на их сохранение; кроме того, большое ФНЧ АИМ Кодер ИКМ- сигнал ГТИ U, в Уровни ▲ кванто 61- вания 5 4 3 2 1 3 5 6 6 7 6 6 5 3 1 1 0 1 1 3 5 6 Рис. 6.2.4. Схема преобразования аналогового и дискретного сигналов
Принципы построения систем звукозаписи 575 количество отсчетов значительно увеличивает время на обработ- ку сигнала и определяется пропускными возможностями компьюте- ра и других цифровых приборов. В соответствии с теоремой Котельникова — Найквиста: «неис- каженная передача непрерывного (аналогового) сигнала с полосой частот 0...fmax дискретной последовательностью его отсчетов воз- можна только в том случае, если частота дискретизации^ связа- на с максимальной частотой fmax исходного сигнала следующим соотношением» [28]:^ > 2fmax. Например, если нужно передать музыкальный сигнал с полосой воспроизведения 30-20000 Гц, то частота дискретизации должна быть выбрана не ниже 40000 Гц. В настоящее время в лазерных проигрывателях и бытовых маг- нитофонах принята частота дискретизации 44,1 кГц, в профессио- нальных системах звукозаписи и радиовещания — 48 кГц, в совре- менных студийных устройствах уже используются частоты 96 кГц, 192 кГц (например, в DVD-Audio). При согласовании различной аппаратуры иногда возникает не- обходимость изменения частоты дискретизации: уменьшение час- тоты дискретизации называется децимацией, при этом задается ко- эффициент децимации (Decimation Ratio), который указывает, какое количество отсчетов сигнала должно быть взято для усред- нения и последующей замены на это усредненное значение. Уве- личение частоты дискретизации происходит с помощью процесса интерполяции, т. е. дополнения промежуточных значений сигнала; способы, которыми это может быть реализовано, приведены в ли- тературе [24-29]. Квантование. После дискретизации звуковой сигнал имеет дискретные значения аргумента (времени), но сохраняет непре- рывное изменение значений функции (напряжения). Однако из-за ограниченной разрядности элементов памяти и операционных сис- тем цифровых приборов сигналы в них могут передаваться только с ограниченной точностью. Поэтому производится операция квантова- ния. При этом непрерывное множество значений функции заменяется на некоторое конечное разрешенное число, которое определяется числом уровней квантования (рис. 6.2.2). Расстояние между со- седними разрешенными уровнями квантования называется шагом квантования. Каждое значение отсчета сигнала заменяется (округ- ляется или отбрасывается) ближайшим к нему разрешенным значе- нием. Квантование — операция нелинейная и неизбежно вызыва- ет ошибку квантования, при которой (в отличие от дискретизации) сигнал нельзя передать со сколь угодно малой ошибкой ни при ка- ком конечном шаге квантования. Разность между исходными и квантованными значениями отсче- тов изображена на рис. 6.2.5. Эта разность, т. е. сигнал ошибок,
576 Глава 6 называется шумом квантования. Чем меньше величина шага А при квантовании отсчетов дискретизиро- ванного сигнала, тем меньше по уровню этот шум квантования. Его мощность связана с величиной шага квантования следующим соотноше- нием: Рш кв = А2/12. Спектр шума квантования равномерный в полосе частот 0... /ц/2. Поскольку мощ- ность шума квантования зависит не от уровня входного сигнала, а толь- ко от выбранного шага квантования, то при слабых уровнях сигнала шум квантования вносит слыши- мые искажения. Для его уменьшения используются различные спо- собы неравномерного квантования [16, 24-28]. Кодирование — процесс представления квантованного отсче- та значений сигнала в двоичной системе счисления. Таким обра- зом, каждому квантованному уровню сигнала сопоставляется неко- торое число, содержащее определенное количество цифр, — так называемое кодовое слово. Двоичные кодовые слова состоят из двух цифр: 0 и 1. Любое число в двоичной системе может быть представлено в виде: Рис. 6.2.5. Шум квантования A = a ,2"1'1 +a ,2"1'2 + .... m-l т-2 a02°. Число А в системе с основанием 2 записывается только после- довательностью коэффициентов a т1, ат2 а0, которые могут принимать значения 0 или 1.Число т называется разрядом слова и определяет количество цифр, из которых оно состоит. При т = 4 число А содержит четыре цифры (например, 1011) и может быть представлено как: A = 1 • 23 + 0- 22+ 1- 21 + 1 • 2° (в десятич- ной системе это число равно 11). Приемы перевода чисел из де- сятичной системы в двоичную и наоборот даны в работах [16, 24-28]. Двоичные символы 0 и 1, входящие в состав кодовых слов, на- зывают битами. Это слово произошло от английского «bit», со- ставленного из начальных и конечной букв словосочетания «binary digit», что означает «двоичная цифра». Выбор определенного количества бит определяет длину слова, т. е. количество цифр, которое может использоваться для каждого уровня квантования. Число возможных уровней квантования, кото- рое может быть закодировано с помощью выбранного числа бит, определяется числом перестановок из заданного количества цифр. Например, выбрав число бит равным двум, т. е. задав длину сло- ва из двух цифр, можно получить только четыре, т. е. 22 разные
Принципы построения систем звукозаписи 577 перестановки, и соответственно закодировать только четыре уров- ня следующими комбинациями цифр: 00, 01, 10, 11. Соответствен- но, задав произвольное число m бит, можно закодировать N уров- ней, число которых N= 2т. Например, при m = 16 бит можно закодировать число уровней 216 = 65536. Если задано число уров- ней, например, N = 256, то число бит определится как т = In2(N)9 т. е. будет равно т = 8. Чем больше динамический диапазон звукового сигнала, тем больше уровней требуется для его квантования (при сохранении низкого уровня шума квантования) и тем больше требуется цифр в слове, т. е. числа бит, для их кодирования. Динамический диапазон сигнала D связан с числом бит т сле- дующим приближенным соотношением [16]: D= 6 т. Поэтому для увеличения ддинамического диапазона в современной звукотехни- ке происходит переход на число разрядов 24 бит при уровне кван- тования 96 кГц. Скорость передачи цифрового потока определяется как С = f х т, где f — частота дискретизации, т — число бит. Например, при частоте дискретизации 48 кГц и числе разрядов 16 бит скорость потока равна 768 кбит/с. Разумеется в реальных цифровых системах процессы кванто- вания и кодирования представляют собой достаточно сложные процессы преобразования сигналов, выше приведены только основные определения [16, 23-29]. После того как звуковой сигнал прошел в АЦП операции дис- кретизации, квантования и кодирования, он в виде последователь- ности цифр вводится в цифровое устройство (например, компью- тер), где и подвергается различным видам обработки (анализу, синтезу, фильтрации и др.). Спектральный анализ сигналов (см. гл. 2) в современных компьютерах производится обычно с помощью алгоритмов быстрого преобразования Фурье — БПФ (FFT). Для цифровой фильтрации и процессорной обработки используется большое количество различных алгоритмов. Представление о не- которых из них будет дано в разделе 6.3; более подробно с этой темой можно ознакомиться в литературе [24-29]. Затем цифровой сигнал после обработки подвергается обрат- ному преобразованию в цифро-аналоговом устройстве (ЦАП), на выходе которого получается аналоговый сигнал. Он может быть подведен к громкоговорителям или стереотелефонам для прослу- шивания. Принципы действия ЦАП можно найти в работах [15, 16, 23-29]. В настоящее время практически все системы звукозаписи, зву- копередачи и звуковоспроизведения используют цифровую обра- ботку сигналов, что открывает перед ними значительно большие возможности, чем при работе с аналоговыми сигналами.
578 Глава 6 6.3. СТРУКТУРА СТУДИИ ЗВУКОЗАПИСИ. ОСНОВНЫЕ ВИДЫ ОБОРУДОВАНИЯ Современные студии звукозаписи отличаются огромным мно- гообразием оборудования и структурой построения в зависимости от поставленных задач: студии звукозаписывающие, студии запи- си звука для кино (тонателье), студии радиовещательные, телеви- зионные и т. д. Акустические требования к помещениям студий звукозаписи и контрольных комнат приведены в главе 5. Примерная структу- ра студии звукозаписи (для радиовещания) и используемые в ней устройства показаны на рис. 6.3.1а, б. Основным и наиболее важным устройством в любой студии является микшерный пульт, в котором осуществляются обработка звуковых сигналов и дистанционное управление всеми звуковыми устройствами студии (подробнее см. раздел 6.3.2). В настоящее время широко используются цифровые микшерные пульты, в ко- торых имеются соответствующие интерфейсы управления как цифровыми (в том числе и по МИДИ-интерфейсу), так и аналого- выми устройствами для получения, записи и обработки музыкаль- ных и речевых сигналов. Источниками звуковой информации, обеспечивающими поступ- ление сигналов в микшерный пульт, являются прежде всего микро- фоны (см. раздел 6.3.1), магнитофоны, цифровые лазерные про- игрыватели и др. (см. раздел 6.3.3 ); могут использоваться также сигналы, поступившие по телефонным линиям и т. д. Дополнительными устройствами обработки сигналов, кроме операций, выполняемых в самом пульте, являются процессоры спецэффектов, например ревербераторы и др. (см. раздел 6.3.2). При подготовке фонограмм обычно используются компьютерные рабочие станции, CD-рекордеры, DAT-магнитофоны и др. Для кон- троля качества записи применяются контрольные агрегаты с встро- енными или выносными усилителями (см. раздел 6.3.3). Краткое описание основных видов оборудования и их параметры приведе- ны в следующих разделах. 6.3.1. Микрофоны. Стереомикрофоны Одним из важнейших элементов студийного оборудования явля- ется микрофон, первичное звено в тракте записи звука. Выбор его параметров в значительной степени определяет качество звучания музыки и речи, которая с помощью систем звукозаписи, радиове- щания, телевидения, мультимедиа передается многомиллионной аудитории. В соответствии с действующими международными рекомен- дациями IEC 268-4 и отечественным стандартом ГОСТ 16123-88
Принципы построения систем звукозаписи 579 Микрофоны ведущего и гостей KA-I КА-2 Микрофонный процессор Канал доставки программы к передатчику Усилитель звуковой частоты t ГТ 1 Процессор динамической обработки сигнала Выход на KA Выход наГТ Эфирный микшерный пульт Проигрыватель компакт-дисков Проигрыватель мини-дисков ^ Студийный ^ телефонный гибрид Спутниковый тюнер Магнитофоны: кассетный и профессиональный Компьютерная станция автоматизированного вещания IZZI L Сервер Устройство бесперебойного питания Сеть: 220 В, 50 Гц б Рис. 6.3.1: а — общий вид студии звукозаписи, б — оборудование радиовещательной студии звукозаписи
580 Глава 6 используется следующее определение микрофона: «Микрофон — устрой- ство, с помощью которого акустиче- ские колебания воздушной среды преобразуются в электрические коле- бания. Микрофон состоит из чувстви- тельного элемента — капсюля — и согласующего устройства. Блок пи- Рис. 6.3.2. Общая тания, предварительный усилитель конструкция конденсаторного и соединительные кабели входят микрофона С-зооов в комплект микрофона, если они фирмы AKG являются его неотъемлемой частью и указаны в технической документа- ции на микрофон конкретного типа». Современный микрофон имеет достаточно сложное конструк- тивное устройство. Конструкция микрофона С-ЗОООВ фирмы AKG показана на рис. 6.3.2: он включает в себя капсюль электростати- ческого типа, предусилитель, изолирующий экран, систему аморти- заторов для крепления капсюля, разъемы, корпус с защитной ре- шеткой и др. В цифровом микрофоне, например модели «Solution-D» фирмы Neumann, вместо предварительного усилителя в корпусе ус- тановлены АЦП и цифровой процессор для предварительной обра- ботки звука. Многообразие конструкций микрофонов, выпускаемых в настоящее время промышленностью, чрезвычайно велико и продол- жает постоянно увеличиваться. История создания микрофона начинается с 1876 года, когда А. Белл (A. BeII) продемонстрировал на выставке в Филадельфии жидкостный преобразователь. В это же время он запатентовал об- ратимый преобразователь с подвижной арматурой. Затем в пери- од с 1881 по 1888 год на фирме Bell Telephone System в резуль- тате работ Берлинера, Хьюза, Блейка (Berliner, Hughes, Blake) был создан угольный микрофон. Тогда же Хьюзом был предложен тер- мин «микрофон» для электроакустических приемников. В 20-е годы XX века на фирме Western Electric (США) были разработаны ди- намические и конденсаторные микрофоны (первый конденсатор- ный микрофон был создан Вентом (Wente) в 1917 г.). Серийный выпуск их начался в 1947 году, когда фирма AKG запустила в про- изводство свой первый конденсаторный микрофон. В 1942 году был выпущен ленточный микрофон фирмы RCA (изобретатель Г. Олсон), в 1962 году появился электретный микрофон фирмы Bell Lab (инженеры Сесслер, Вест (Sessler, West)) и, наконец, в 2000-м — цифровой микрофон (фирмы Neumann) [43]. В настоящее время микрофоны находят широкое применение в качестве входного элемента в системах звукозаписи, звукового
Принципы построения систем звукозаписи 581 вещания (радиовещания, телевидения), озвучивания и звукоусиле- ния, концертно-театральной аппаратуре, медицине, измерительной технике и др. К микрофонам предъявляются очень жесткие требования: — по техническим параметрам (большой динамический диапа- зон — до 100 дБ; широкий частотный диапазон — не менее 20- 20000 Гц; малые нелинейные искажения — меньше 1% и др.); — по эстетическим критериям (т. к. микрофон постоянно виден зрителям на сцене, на экране телевизора, и др.); — по надежности (поскольку микрофон подвергается различ- ным климатическим и механическим воздействиям: ветер, влаж- ность, температура, тряска, удары и др.); — по качеству звучания (для сохранения естественного темб- ра при передаче музыки различных жанров, пения, речи и др.). Мировая аудиопромышленность выпускает в настоящее время десятки миллионов микрофонов в год, ассортимент насчитывает сотни моделей. Выпуском микрофонов занимаются десятки фирм: среди них такие знаменитые как AKG, Sennheiser Electronics, В & К, Neumann, Beyerdynamic, DPA Microphone, Shure, Sony и др., а так- же отечественная фирма «Октава» (г. Тула) и др. Требования к параметрам микрофонов и методам их измерений изложены в международных и отечественных стандартах MOK(IEC)- 60268 ч. 4, МЭК-60268 ч. 15, МЭК-60581 ч. 5, МЭК 61094 ч. 1-4, ГОСТ 16123-88, ГОСТ 6495-88, DIN 45500 ч. 5, ANSI S1.12-97, AES-X85 и др. В международных стандартах нормируются только методы измерений, параметры устанавливает фирма-производи- тель. В условиях жесткой конкуренции эти параметры постоянно улучшаются, примером могут служить параметры одной из разра- боток фирмы AKG — С-3000В, приведенные в таблице 6.3.1. Таблица 6.3.1 Transducer type (тип преобразователя): pressure gradient (градиент давления) Sensitivity (чувствительность) 25 мВ/Па (-32 дБВ) Frequency response (частотная характеристика) 20 Гц — 20 кГц Polar pattern (полярная диаграмма): кардиоида Pre-attenuation (спад на н/ч): -10 дБ Impedance (импеданс): < 200 Ом Recommended loading (рекомендуемая нагрузка): > 1000 Ом Equivalent noise level (A-weighted) (эквивалентный уровень шумов) — IEC-651 14 дБ-А
582 Глава 6 Таблица 6.3.1 (продолжение) Transducer type (тип преобразователя): pressure gradient (градиент давления) Equivalent noise level (эквивалентный уровень шумов) — CCIR-468-2 25 дБ Sound pressure level for 0,5% THD (уровень звукового давления при КНИ 0,5%): 140 дБ (150 дБ с затуханием -10 дБ) S/N ratio (A-weighted) (сигнал/шум) 80 дБ-А Power requirement (фантомное питание): 9-52 В Environmental (температура окружающей среды): -10 0C ...+60 °С, влажность 90% (+20 0C) Output connector (внешний разъем): 3-pin XLR Size (размер): 53 х 162 мм Net weight (вес): 320 г Included accessories (аксессуары): Hl 00 elastic mounting suspension (упругая подвеска) Optional accessories (дополнительные аксессуары): B18 battery power supply (питание) PF100 pop filter (защита от взрывных звуков «п», «б») W414 windscreen (ветрозащита) Основные параметры микрофонов, обычно указываемые в со- временных каталогах и технической документации, следующие [43-45, 48, 49]: — номинальный диапазон частот (frequency range) — частот- ный диапазон, в котором определяются параметры микрофона (задается производителем). Для современных конденсаторных микрофонов он обычно равен 20-20000 Гц. Внутри этого диапа- зона определяется зависимость уровня чувствительности от ча- стоты и другие параметры; — чувствительность (sensitivity) — определяет способность мик- рофона преобразовывать акустическое давление в электрическое напряжение. Она определяется отношением сигнала на выходе микрофона (т. е. напряжения — U) к сигналу на входе микрофо- на (т. е. звуковому давлению р ): S = UJpn- В зависимости от способа измерения различаются следую- щие виды чувствительности: чувствительность по свободному полю, чувствительность по давлению, чувствительность по диф- фузному полю, чувствительность на холостом ходу, чувствитель- ность на номинальной нагрузке. Они все имеют несколько раз- ные значения [44].
Принципы построения систем звукозаписи 583 Чувствительность по свободному полю — «отношение напря- жения на выходе микрофона к звуковому давлению в свободном звуковом поле в рабочей точке, занимаемой микрофоном, на дан- ной частоте. Если угол приема не указан, то имеется в виду, что угол приема (между осью микрофона и направлением падения зву- ковой волны) 0°» (ГОСТ 16123-88). В международных каталогах на микрофоны (МЭК 60268-4) приводится такое определение чувствительности (sensitivity): «среднеквадратичное (RSM) значение напряжения на выходе микрофона на нагрузочном сопротивлении 1 кОм на частоте 1 кГц, когда на него действует давление 1 Па (94 дБ) в условиях свобод- ного поля (угол приема 0°)»; — уровень чувствительности (L ДБ) — двадцать логарифмов отношения чувствительности микрофона к значению 1 В/Па: 1дБ = 20IgSZS0, где S0 = 1 В/Па. Величина 1дБ при этом получается отрицательная. Обычно чувствительность современных конденсаторных микро- фонов находится в пределах от 8 до 40 мВ/Па. Например, микро- фон DPA Туре 3530 имеет чувствительность 10 мВ/Па и уровень чувствительности (- 40 дБ) (на холостом ходу), микрофон С-3000В фирмы AKG — 25 мВ/Па (-32 дБ); — частотная характеристика чувствительности микрофона (Frequency Response) — зависимость чувствительности или уров- ня чувствительности от частоты в номинальном диапазоне частот. Измерения проводятся по такой же методике на различных часто- тах внутри номинального диапазона на синусоидальных или шумо- вых сигналах. В настоящее время, так же как и для громкоговорителей, актив- но развиваются цифровые методы измерений микрофонов в неза- глушенных помещениях. Короткий импульс подается на измери- тельный громкоговоритель; сигнал, полученный с испытуемого микрофона, вводится в компьютерную измерительную станцию и с помощью преобразования Фурье вычисляются частотная характеристика чувствительности (ЧХЧ ), фазовая характеристика и трехмерный спектр (т. е. зависимость ЧХЧ от времени). Из записанной частотной характеристики чувствительности определяется: — неравномерность частотной характеристики — разность между максимальным и минимальным значением уровня чувстви- тельности в номинальном диапазоне частот. Обычно ЧХЧ высокока- чественных микрофонов обладает минимальной неравномерностью, это является одним из главных индикаторов качества микрофонов, поскольку определяет степень неискаженной передачи тембра источника; однако в некоторых случаях, например для записи речи и вокала, делается подъем на ЧХЧ в области 2-8 кГц с целью
584 Глава 6 ДБ +10 Рис. 6.3.3. Форма ЧХЧ увеличения разборчивости (presence peak) (рис. 6.3.3). Кроме того, в большинстве современных микрофонов предусмотрена возможность снижения уровня ЧХЧ на низких частотах для запи- си в условиях шумов, а также для коррекции эффекта «близости» (proximity effect), свойственного направленным микрофонам. Зависимость чувствительности микрофона от угла падения звуко- вой волны определяется с помощью следующих параметров: — характеристика направленности — зависимость чувстви- тельности микрофона на заданной частоте в свободном поле от угла падения звуковой волны. Частотные характеристики направ- ленности определяются как семейство частотных характеристик чувствительности измеренных при разных углах падения звуковой волны в свободном поле. Эти же характеристики могут быть за- писаны в полярных координатах (рис. 6.3.4), показывающих за- висимость уровня чувствительности (дБ) от угла падения волны (на рис. 6.3.4 окружности соответствуют различному уровню чувствительности в дБ — обычно выбирается шаг 5 дБ, — а диа- метры — углу падения звуковой волны по отношению к оси в гра- дусах). Полярные диаграммы (polar pattern) также записываются в заглушённой камере, микрофон при этом вращается вокруг оси относительно излучателя; — коэффициент направленности — отношение чувствительно- сти микрофона на данной частоте при падении звуковой волны под углом ot к оси к чувстви- о° тельности при угле падения,
Принципы построения систем звукозаписи 585 — индекс направленности равен двадцати десятичным лога- рифмам от коэффициента направленности: D = 20Ig Г(а°)\ — коэффициент осевой концентрации определяет отношение звуковой энергии, падающей на микрофон вдоль оси, к энергии со всех остальных направлений. Он рассчитывается по нижеприве- денной формуле, где К. — весовые коэффициенты для каждого шага по углу оГ (даны в ГОСТ 16123-88): Q = 100 /=1 S(a°) S(0°) Ki Коэффициент осевой концентрации может быть определен как отношение квадратов чувствительности, измеренной по свободному полю и по диффузному полю, при использовании тре- тьоктавного шумового сигнала с центральной частотой / Гц: — индекс осевой концентрации — десять логарифмов коэф- фициента осевой концентрации: Q= 101g Q. — перепад чувствительности, «фронт-тыл» — разность между уровнями чувствительности микрофонов, измеренными при углах приема 0° и 180° на данной частоте в свободном поле: Выбор микрофонов с различными характеристиками направлен- ности определяется условиями записи: расположением источников (например, инструментов в оркестре), шириной звуковой панора- мы, уровнем шумов в окружающем пространстве, стремлением по- лучить специальные звуковые эффекты и др. Именно поэтому в настоящее время промышленностью выпускается огромное мно- гообразие микрофонов с различными (часто переключаемыми на одном микрофоне) видами характеристик направленности; — уровень максимального звукового давления (max SPL) — уровень звукового давления, при котором коэффициент гармони- ческих искажений не превосходит заданного значения; — полный коэффициент гармонических искажений (THD) определяется по методике, используемой для определения чувствительности, но при этом с помощью анализатора спектра измеряется напряжение на выходе микрофона, соответствующее первой гармонике U1, второй U2 и т. д. Коэффициент рассчитыва- ется по формуле:
586 Глава 6 i=2 Обычно величина коэффициента гармонических искажений для современных микрофонов задается < 0,5% при максимально допустимых уровнях звукового давления (max SPL). Примером может служить значение max SPL для микрофона фирмы DPA Туре 4004 Hi-SPL: 142 дБ (< 0,5% THD), 148 дБ (< 1% THD); — уровень собственных шумов микрофонов: стандарт ГОСТ 16123-88 вводит параметр «уровень эквивалентного звуко- вого давления, обусловленного помехами», который определяется как «двадцать десятичных логарифмов отношения звукового давления, вызывающего на выходе микрофона напряжение, равное напряжению, обусловленному внешними и внутренними по- мехами при отсутствии звукового поля, к звуковому давлению, равному 2 х Ю-5 Па». Это означает, что измеряется напряжение на выходе микрофона в отсутствие звукового давления, обуслов- ленное только внутренними шумами, и затем определяется, како- му звуковому давлению оно могло бы соответствовать [44]. В международных каталогах на микрофоны обычно указывают- ся следующие величины: эквивалентный уровень шума (Equivalent Noise Level) и отношение «сигнал/шум» (Signal/Noise ratio). Спо- собы измерения несколько отличаются в разных стандартах, поэтому обычно в современных каталогах приводятся два значе- ния эквивалентного уровня шумов: по стандарту DIN 45412 (IEC 651) и по стандарту DIN 45405 (CCIR 468-2). Например, для конденса- торного микрофона С-3000В фирмы AKG эквивалентный уровень шумов по стандарту IEC-651(DIN45-412) составляет 14 дБ-А, а по стандарту CCIR468-2(DIN45-405) — 25 дБ. Для характеристики собственных шумов микрофонов использу- ется также отношение «сигнал/шум», которое тоже рассчитывает- ся двумя способами: 1) S/N ratio (DIN/IEC651) — отношение «сигнал/шум», рассчи- танное как разница между опорным уровнем звукового давления 94 дБ (1 Па) и эквивалентным уровнем шума, измеренным по IEC 651; 2) S/N ratio (CCIR 468-2) — отношение «сигнал/шум», рассчи- танное как разница между уровнем 94 дБ и эквивалентным уров- нем шума, измеренным по CCIR 468-2. Для студийных конденсаторных микрофонов эти величины находятся в пределах 74-84 дБ ( DIN/IEC 651) и 64-74 дБ
Принципы построения систем звукозаписи 587 (CCIR). Например, для того же микрофона С-3000В эти отношения составляют 80 дБ и 69 дБ; — динамический диапазон (dynamical range) — разность между максимальным уровнем звукового давления (max SPL), при кото- ром нелинейные искажения на выходе микрофона не превышают заданную величину, и эквивалентным уровнем шума. Например, для микрофона фирмы С-3000В он равен 120 дБ; — полное электрическое сопротивление микрофона определя- ется как отношение величины напряжения на выходе к результи- рующему току. Величина выходного электрического импеданса (output electrical impedance), т. е. модуля полного электрического сопротивления, в большинстве современных конденсаторных микро- фонов находится в диапазоне 50-200 Ом, у динамических микрофо- нов до 600 Ом. При этом входное сопротивл'ение предусилителей (input recommended load impedance) должно быть больше выход- ного сопротивления микрофона в 5-10 раз и составляет обычно 1000-2000 Ом. При таком соотношении сопротивлений обеспечи- ваются минимальные потери в кабеле. Кроме указанных выше электроакустических параметров, на микрофоны задается обычно рабочий диапазон изменения температуры и влажности окружающей среды, внутри которого чувствительность не должна изменяться более чем на ±2 дБ. Электродинамические микрофоны всех групп сложности имеют рабочий диапазон, как правило, - 40°... + 50° по температуре и 95% влажности при 20°, конденсаторные -10°... +35° и 85% влаж- ности при 20°. Все применяемые на практике микрофоны можно классифици- ровать по следующим категориям: — по принципам преобразования энергии; — по видам характеристики направленности; — по областям применения. По принципам преобразования акустической энергии в электри- ческую можно выделить следующие группы микрофонов: электро- динамические (катушечные, ленточные и др.), электростатические (конденсаторные), электретные, пьезоэлектрические и др. Наибольшее распространение в студийной практике имеют в настоящее время электродинамические (катушечные, ленточ- ные), электростатические и электретные микрофоны, поэтому ко- ротко остановимся только на их принципах преобразования; более подробную информацию о всех типах микрофонов можно получить в литературе [9, 10, 23, 38, 43, 45, 47]. Микрофоны электродинамические. Принцип действия ка- тушечных микрофонов основан на том, что при воздействии звуковой волны на легкую диафрагму она начинает колебаться и приводит в движение связанный с ней проводник (звуковую
588 Глава 6 Зажим Полюсные наконечники Ленточка Диафрагма а У Подвес Катушка f г у у<\* Поток 1 Смещение Напряжение Магнит Диафрагма Изолятогз IhL 1(1 1T f— Магнит Полюсный наконечник Рис. 6.3.5. Схематический вид: а — ленточного микрофона, б — катушечного микрофона, в — конденсаторного микрофона полюсный НаКОНеЧНИК ттиягЪпягъгя накладка \ щель Диафрагма катушку), который помещен в постоянное магнитное поле. При дви- жении проводника с током в магнитном поле в нем индуцируется электрический сигнал, который затем усиливается и передается для дальнейшей обработки. В ленточных микрофонах проводником является легкая гофрированная металлическая ленточка, которая сама колеблется под действием звуковой волны. Схематический поперечный разрез конструкции ленточного и катушечного элек- тродинамического микрофона представлен на рис. 6.3.5а, б. Естественно, конструкция капсюля промышленного электроди- намического микрофона намного сложнее [45]. Для обеспечения возможности регулировки формы АЧХ в конструкциях электро- динамических микрофонов обычно используются до- полнительные воздушные объемы сзади диафрагмы; сверху над диафрагмой на незначительном расстоя- нии от нее устанавливается накладка и т. д. (рис. 6.3.6). Электродинамические Рис. 6.3.6. Конструкция капсюля МИКрофОНЫ обладают рЯДОМ динамического микрофона преимуществ: устойчиво- флан© воздушный^ зазор стака] объемы гофрированный подвес звуковая катушка отверстия в дне стаканов
Принципы построения систем звукозаписи 589 стью к перегрузкам, стабильностью работы в различных климати- ческих условиях, прочностью конструкции и др. Конденсаторные и электретные микрофоны. Принцип дей- ствия конденсаторного микрофона достаточно прост (рис. 6.3.5b): он представляет собой плоский конденсатор, состоящий из двух обкладок. Из них внешняя, обращенная к источнику звука сторона выполнена в виде тонкой круглой металлизированной изнутри диа- фрагмы, скрепленной по окружности с кольцом из диэлектрика. Второй обкладкой конденсатора служит массивное металлическое основание. Обкладки располагаются на малом расстоянии друг от друга. Конденсатор соединяется через нагрузочное сопротивление с источником постоянного поляризующего напряжения U. Под воз- действием звукового давления диафрагма совершает колебания. При этом расстояние между обкладками конденсатора изменя- ется, соответственно изменяется и его емкость С, возрастая при их сближении и уменьшаясь при удалении. Заряд конденсатора равен: q ~ CU; при изменении расстояния величина заряда меня- ется и ток будет равен: / = £0SU {A(IZh)/At}, где е0 — диэлектри- ческая постоянная, S — площадь диафрагмы, U — поляризующее напряжение на конденсаторе, A(IZh) — изменение расстояния между обкладками, — изменение времни. В результате на со- противлении нагрузки R возникает сигнал, отображающий колеба- тельный процесс диафрагмы. Диафрагма диаметром 6-25 мм выполняется из полистирола, покрытого с внутренней стороны золотом или металлическим спла- вом. Расстояние между обкладками стремятся сделать как можно меньше, но оно ограничивается возможностью пробоя, опасность которого возникает из-за относительно большого поляризующего напряжения (U = 48 В); обычно оно равно 20-40 мкм. Постоянное напряжение подается по обкладкам сигнального кабеля (поэтому оно называется «фантомным»). Реальный капсюль конденса- торного микрофона имеет очень сложную конструкцию: с особой формой неподвижного электрода, с использованием дополнительных акустических полостей, иногда с применени- ем двух диафрагм и т. д. (рис. 6.3.7). Начиная с 1970-х годов, ши- рокое распространение получи- ли электретные микрофоны, в которых для диафрагмы применяется специальная изоляционное кольцо углубление вНЭ отверстия в дне НЭ ш кольцо щель втулка отверстия шайба мембрана неподвижный электрод Рис. 6.3.7. Конструкция конденсаторного микрофона
590 Глава 6 Вибрирующая — поверхность Источник света Световое 0S—>Г&Г) Светово_е_^Г\ пятно пятно Фотодетектор Нейтральная Позиция позиция (в покое) при изгибе Рис. 6.3.8. Принцип действия оптического микрофона металлизированная поляризованная пленка, способная удерживать длительное время заряд, что позволяет не использовать поляри- зующее напряжение [43, 45, 47]. Конденсаторные микрофоны имеют ряд преимуществ, которые позволяют их широко использовать в студийной практике. К числу основных из них можно отнести следующие: низкий уровень пере- ходных искажений (из-за малой массы диафрагмы), широкий час- тотный диапазон, малую чувствительность к магнитным помехам и т. д. Однако они обладают меньшей механической и клима- тической стойкостью, чем динамические микрофоны, требуют дополнительного напряжения поляризации и имеют более высо- кую стоимость. Вышеперечисленные принципы преобразования используются в подавляющем большинстве серийно выпускаемых микрофонов. Из новых направлений можно отметить активно проводимые в последние годы на фирме Sennheiser работы по созданию опти- ческих микрофонов, принцип действия которых показан на рис. 6.3.8: луч лазера падает на диафрагму, при колебаниях которой модулируется отраженный световой поток, затем с помощью фо- тодиода он преобразуется в переменный электрический сигнал. Первые образцы таких микрофонов уже были продемонстрирова- ны фирмой Sennheiser на конгрессах AES [43]. По видам характеристики направленности все микрофоны могут быть разделены на три группы: ненаправленные (omnidirectional) — приемники давления; двунаправленные (bidirectional) — приемни- ки градиента давления; однонаправленные (unidirectional) — ком- бинированные. Ненаправленные микрофоны — приемники давления (pressure microphone). Если условно изобразить микрофон (это от- носится к любому типу преобразования) в виде гибкой диафрагмы (мембраны) в корпусе с жесткими стенками, то переменное звуко- вое давление от источника звука будет воздействовать на диа- фрагму только с одной стороны (рис. 6.3.9а). На низких частотах, когда длина волны много больше размеров микрофона, звуковые волны со всех направлений приходят в одинаковой фазе на мем-
Принципы построения систем звукозаписи 591 Рис. 6.3.9. Принцип действия: а — ненаправленного микрофона; а б б — направленного микрофона брану в пределах ее площади, т. е. микрофон как бы «не чувству- ет» направление их прихода. Чувствительность такого микрофона одинакова для всех направлений прихода звуковой волны; следо- вательно, характеристика направленности представляет собой шар, в центре которого находится ненаправленный микрофон (рис. 6.3.10). Микрофоны — Приемники давления являются нена- правленными только в области низких частот, с увеличением час- тоты их направленность обостряется. Такие микрофоны находят широкое применение в технике звукозаписи, особенно для записи звуков окружающего (реверберационного) пространства и шумов. Двунаправленные микрофоны — приемники градиента давления (pressure gradient microphone). Схематически принцип работы микрофона — приемника градиента давления показан на рис. 6.3.96. В таком микрофоне независимо от принципа пре- образования должен быть обеспечен доступ звуковой волны как с лицевой, так и с тыльной стороны мембраны (в корпусе микро- фона делаются отверстия для доступа звуковых волн к задней части мембраны). При этом мембрана находится под действием разности (т. е. градиента) сил AF = F-F21 где F1 = рзв S sin cot — сила, действующая на переднюю сторону диафрагмы; F2 = p3eSsin (cot — Аср) — сила, действующая на заднюю сторону диафрагмы; она отстает по фазе на Aq)1 т. к. звуковые волны проходят более длинный путь до задней стороны диафрагмы. Ненаправленная («круг») Двунаправленная («восьмерка») Односторонне направленная Кардиоида Суперкардиоида Гиперкардиоида 30*/\ !1^120" 3OV^S»4 5S^Sl 50е 330^^7 (V^KT 30>^Г 240« 12Г 233* .110" ^ 240' Y\ ?*° * 250* Рис. 6.3.10. Различные виды характеристик направленности микрофонов
592 Глава 6 Эта разность фаз приближенно равна Аср = 2п (d cosa)/X, при этом градиент сил, действующих на диафрагму равен: AF = рзв S (d I С) со cos а, где d — толщина диафрагмы, а — угол падения звуковой волны, С — скорость звука. Как видно из это- го выражения, когда угол падения звуковой волны 0° или 180°, то разность (градиент) сил воздействия максимальна (т. к. cos а = 1), а когда угол падения 90°, то она равна нулю (cos а = 0); отсюда зависимость чувствительности от угла падения имеет вид, показан- ный на рис. 6.3.10. Характеристика направленности такого типа обычно называется «восьмерка» («figure eight»). Микрофоны с та- кой характеристикой направленности чувствительны к звуковым волнам, падающим вдоль оси, и практически нечувствительны к звуковым волнам, падающим под углом 90° к оси. Они находят достаточно широкое применение при стереозаписи, например по системе MS. Если синтезировать характеристику направленности микро- фона путем комбинирования ненаправленной и двунаправленной характеристики, то в осевом фронтальном направлении чув- ствительность увеличивается (поскольку сигналы приходят в оди- наковой фазе), а в тыловом направлении чувствительность уменьшается, поскольку сигналы взаимно вычитаются, т. к. их фазы противоположны. Пусть микрофон — приемник давления имеет чувствитель- ность Sn не зависящую от угла падения волны, а микрофон — приемник градиента давления имеет чувствительность S2cosa. Если чувствительности обоих микрофонов на оси выбрать равны- ми S1 = S21 то характеристика направленности такой комбинации микрофонов будет иметь вид: Г(а) = 1/2(1+ cosa). Такая форма диаграммы направленности называется кардиоидой (рис. 6.3.10). Подбирая разные соотношения чувствительностей S1 и S2, можно получать различные дру- гие формы характе- ре усилителю ристик направленности (рис. 6.3.10). Рис. 6.3.11. Контроль характеристики направленности Схема переключения характеристик направленности
Принципы построения систем звукозаписи 593 В современных микрофонах используется один преобразователь с двумя или более акустическими входами для доступа звуковой вол- ны к диафрагмам, при этом имеется возможность переключения различных форм характеристики направленности [48]; пример схе- мы переключения показан на рис. 6.3.11. В общем случае характеристика направленности микрофонов может быть записана в виде: Г(а) = {1/(1+А)}(1+ Acosa). При разных значениях коэффициента А получаются разные формы характеристики направленности (см. рис. 6.3.10): A = O, Г(а) = 1 — круг; А = 1, Г(а) = 1/2(1+ cosa) — кардиоида; A = 1,7 — суперкардиоида; A = Ъ — гиперкардиоида; А->оо , г(а) = cosa — восьмерка. Особую группу микрофонов составляют остронаправленные микрофоны (shotgun): такие конструкции состоят из микрофона — градиента давления, нагруженного на трубку с отверстиями (или прорезями), закрытыми тканью (рис. 6.3.12). Трубка представляет собой своего рода линию задержки, т. к. при падении звуковых волн под углом а к оси микрофона звуковые волны достигают мембрану с разными сдвигами фаз: Аф = со d.(l-cosa)/C, где d. — расстояние от начала трубки до i-отверстия, С — скорость звука, со — круговая частота. Этот дополнительный сдвиг фаз увеличивает градиент сил, воздействующих на диафрагму микро- фона, и «обостряет» характеристику направленности. Ткань на от- верстиях трубки является дополнительным акустическим сопротив- лением, которое возрастает по мере приближения к капсюлю микрофона. Еще одной разновидностью являются параболические микро- фоны, в которых кардиоидный микрофон располагается в фокусе параболического рефлектора (рис. 6.3.13), что обостряет его харак- теристику направленности. Следует отметить, что эффективность остронаправленных микрофонов обратно пропорциональна длине падающей звуковой волны: если она больше размеров трубы или Акустическое демпфирование Капсюль MK Рис. 6.3.12. Остронаправленный микрофон типа Shotgun Параболический микрофон Рис. 6.3.13.
594 Глава 6 рефлектора, то обострения характерис- тики направленности не происходит, т. е. на низких частотах они неэффек- тивны. Рис. 6.3.14. Принцип работы микрофона пограничного слоя — PZM Направленные микрофоны обладают еще одним свойством — зависимостью их уровня чувствительности от рассто- яния до источника. Это свойство назы- вается «эффектом близости» (proximity effect) и объясняется тем, что на близком расстоянии микрофон находится в «ближней зоне» действия источника, т. е. в зоне рас- пространения сферической волны. В сферической волне звуковое давление изменяется с расстоянием: р - 1/г, поэтому разность давления, которое действует на лицевую сторону мембраны, и давления, действующего на ее тыльную сторону, увеличивается за счет дополнительной разности (градиента) давлений, возника- ющих в сферической волне из-за разницы расстояний. За счет это- го чувствительность направленного микрофона на низких частотах возрастает; по мере повышения частоты эффект перестает сказы- ваться. Поэтому при использовании направленных микрофонов на близких расстояниях необходимо учитывать подъем частотной ха- рактеристики на низких частотах (вводя при записи необходимую коррекцию). К числу интересных конструкций, получивших широкое распро- странение в студийной практике, можно отнести микрофоны погра- ничного слоя (PZM). Конструкция микрофона (рис. 6.3.14) включает в себя экран с установленным параллельно ему на близком рас- стоянии капсюлем микрофона (обычно конденсаторного). Такая ус- тановка позволяет увеличить на 6 дБ уровень звукового давления, действующего на микрофон за счет отраженной волны, и сфор- мировать полусферическую диаграмму направленности, практически не зависящую от частоты (примером может служить модель Neumann GFM 132). По областям применения микрофоны разделяются на множе- ство групп, отличающихся конструктивными особенностями и пара- метрами, — например, студийные, репортажные, для служебной связи, для систем озвучивания и т. д. [43, 45, 48]. Широкое распространение в современной практике звукозапи- си получили радиомикрофоны, обеспечивающие передачу сигна- лов за счет частотной модуляции высокочастотных волн (обычно в диапазоне 450-950 МГц) звуковыми колебаниями. Это позволя- ет обеспечить беспроводную передачу сигналов на расстоянии до 100 м и более. Аналогично используется система беспроводной передачи в инфракрасном диапазоне. Микрофонная техника является одним из самых быстро разви- вающихся направлений в современной аудиотехнике.
Принципы построения систем звукозаписи 595 Технология использования микрофонов для записи музыкальных ин- струментов и голоса изучается звукорежиссерами в рамках специальных дисциплин. Стереомикрофоны. Для записи и передачи стереофонических и пространственных звуковых сигналов в настоящее время созда- ются специальные микрофонные системы (подробнее о простран- ственных системах звукопередачи в разделе 6.4). Большинство вы- пускаемых микрофонных стереосистем можно разделить на следующие группы [9, 10, 11, 38, 43, 47, 48]: — раздельные стереосистемы (AB, DIN stereo, NOS stereo, ORTF stereo, Baffled stereo); — совмещенные стереосистемы (XY stereo, MS stereo, Blumlein stereo); — «верхние» стереосистемы (Overhead microphones); — типа «искусственной головы» (Head related stereo, Sphere stereo, Stereo 180); — бинауральные стереосистемы (Binaural stereo); — системы для Surround Sound (Soundfield, SPL array и др.); — системы с адаптивным цифровым управлением (Audio- Technica AT 895, Microtech Gefell КЕМ 970 и др.). Раздельные микрофонные стереосистемы: — АВ-система: при записи по такой системе по фронту перед исполнителями устанавливается два или несколько включенных на один канал одинаковых по чувствительности и направленности микрофона на некотором расстоянии друг от друга, так, чтобы каж- дый канал мог работать на свою зону. Акустические оси микрофо- нов могут быть параллельными или развернутыми. Микрофоны могут быть как ненаправленными, так и направленными (напри- мер, две кардиоиды или две восьмерки). Общая схема записи и комплект микрофонов показаны на рис. 6.3.15а, б. Поскольку а б Рис. 6.3.15: а — общая схема записи по системе AB (M1 2 — микрофоны, H1 2 з — источники звука); б — комплект микрофонов для системы AB
596 Глава 6 основное влияние на локализацию источника при такой записи оказывает сдвиг по времени между различными источниками, то такую систему называют «временной стереофонией», хотя, если применять направленные микрофоны, то можно получить и раз- ность по интенсивности, что сделает локализацию более отчет- ливой (см. гл. 3). Как показали экспериментальные исследования системы AB [11,14, 46], она обладает определенным недостатком: при перемещении реального источника звука (например, солис^) соответствующее перемещение мнимого источника во вторичном помещении наблюдается в достаточно узкой зоне. Результаты измерений показывают, что для расширения этой зоны надо умень- шить отношение YZL1 где Y — расстояние от источника до ли- нии установки микрофонов, L — расстояние между микрофонами. Однако возможности таких изменений ограничены, т. к. микрофоны нельзя сдвигать слишком близко (для сохранения стереоэффекта), а приближение микрофонов к солистам увеличивает искажения по глубине и приводит к подъему низких частот у направленных мик- рофонов. Система AB используется в основном для передачи ощу- щения пространства, для точной локализации отдельных источников она менее полезна. Обычно система AB используется с дополнительными микрофонами; — DIN stereo (немецкое радиовещание) является разновидно- стью системы AB. Стереообраз создают два кардиоидных микро- фона, размещенных под углом 90° на расстоянии 20 см. Система создает временной и интенсивностно-разностный стереосигнал. Эта техника полезна на близких расстояниях, она обеспечивает угол охвата около 115°; — ORTF stereo technique (французское радиовещание) использует два кардиоидных микрофона, разнесенных на 17 см под углом 110° между капсюлями (рис. 6.3.16а). Размещение микрофонов соот- ветствует расстоянию между ушами, а угол моделирует теневой эффект чело- веческой головы. Эта техника создает до- статочно четкий стереообраз, обеспечивает угол охвата около 95° и широко использует- ся на практике; — NOS stereo (датское радиовеща- ние) — эта система записи использует два кардиоидных микрофона, размещен- ных под углом 90° на расстоянии 30 см друг от друга (рис. 6.3.166). Стереообраз также создается с помощью комбинации интенсивностной и временной стереофо- нии. Эта техника также полезна в основ- 110° б Рис. 6.3.16. Микрофонные системы: а — ORTF, б — NOS
Принципы построения систем звукозаписи 597 ном на близких расстояниях для малых ансамблей (угол охвата 80°). — Baffled Stereo — разне- сенная микрофонная стерео- техника, использующая акус- тический полупоглощающий экран. Экран размещается между двумя микрофонами в разнесенных СТереоСИСТе- Рис. 6.3.17. Микрофонная мах типа AB Stereo, ORTF стереосистема с экраном stereo, DIN stereo или NOS. Поглощающий эффект экрана оказывает положительное влияние на затухание звука от источников вне оси и улучшает раздели- мость между каналами. Одна из широко известных экранированных стереосистем Jecklin Disc (по имени ее изобретателя Ю. Джеклина) использует два ненаправленных микрофона, размещенных на расстоянии 17,5 см, и специальный диск диаметром 36 см, распо- ложенный между ними (рис. 6.3.17) [38]. Попытки найти оптимальные соотношения между расстояниями и углами установки микрофонов продолжаются все время; обоб- щая результаты таких работ, М. Уильяме (М. Williams) построил полезную номограмму (рис. 6.3.18), позволяющую установить зависимость эффективного угла охвата источников при записи (параметра кривых) от расстояния и угла между микрофонами. I i I Для кардиоидных" микрофонов 10 15 20 25 30 35 40 45 Расстояние между микрофонами Рис. 6.3.18. Номограмма для определения связи расстояния между микрофонами, угла между ними и полученного угла «охвата» для раздельных стереосистем
598 Глава 6 а б Рис. 6.3.19: а — позиции микрофонов в системе XY; б — комплект микрофонов XY Совмещенные микрофонные стереосистемы: эта техника стереозаписи предполагает использование двух направленных мик- рофонов, расположенных в одной точке. Ширина стереообраза зависит от формы характеристик направленности микрофонов и способа их установки. Наиболее известны системы XY-stereo, MS-stereo и Blumlein stereo: — XY-stereo — в этой системе используется два направлен- ных микрофона (две кардиоиды или две суперкардиоиды), уста- новленных на одной оси, у которых акустические оси развернуты и образуют некоторый угол (чаще всего 90°-120°, хотя он может меняться и в пределах 0°-180°). Пример такой конструкции пока- зан на рис. 6.3.19а, б. Поскольку оба микрофона находятся в одном месте, то различия во времени прихода сигналов практи- чески отсутствуют. Стереофонический эффект возникает здесь за счет разности интенсивностей сигналов от источника (так называ- емая «интенсивностная» стереофония). Система XY дает правиль- ное соответствие мнимого и реального источника, если последний находится в определенных угловых пределах. Благодаря отсут- ствию в сигналах левого и правого каналов временных сдвигов система XY обладает хорошей совместимостью с монофонической системой. Однако при использовании этой системы также возника- ют искажения пространственной панорамы (особенно в глубину). В этой системе должны выполняться жесткие требования к остро- те характеристики направленности микрофонов (иначе не удается получить разность по интенсивности); кроме того, у направленных микрофонов проявляется «эффект близости» при приближении к источнику; — MS-cmepeo: она также содержит два совмещенных микрофо- на с различающимися характеристиками направленности, сигна- лы которых подвергаются суммарно-разностному преобразованию. Обычно используются два совмещенных микрофона с диаграмма- ми направленности типа «круг — восьмерка» (рис. 6.3.20). Назва-
Принципы построения систем звукозаписи 599 Рис. 6.3.20. Система MS ние системы образовано первыми буквами немецких слов Mittel (середина) и Seite (сторрна). Напряжение UmB на выходе микрофона M будет неизмен- ным при любом положении источника, а напряжение с микрофона S определя- ется формой его характеристики на- правленности. При положении источника под углом 90° выходное напряжение бу- дет равно сумме напряжений с микрофо- нов MnS; при положении источника под углом 0° оно будет равно только напряжению с М-микрофона, а при положении -90° — разности напряжений с M и S микрофонов. С помощью суммарно-разностного преобразования можно сформи- ровать сигналы в двух каналах передачи. Система MS требует вве- дения в схему дополнительных узлов: суммарно-разностных преоб- разователей, стереорегуляторов направления и базы, — но она имеет и ряд преимуществ перед системой XY (дает возможность легко регулировать как общую ширину базы, так и ширину отдель- ных участков, занятых группами исполнителей) [11, 46]; — Blumlein stereo — совмещенная стереотехника, использую- щая два микрофона с характеристикой направленности типа «восьмерки», установленных в той же самой точке под углом 90°. Overhead stereo (микрофоны над головой): размещение микро- фонов выше звуковых источников. При этом часто оказывается возможным получить более натуральный тембр, т. к. звуки от ин- дивидуальных инструментов достигают микрофонов с более реаль- ным фазовым распределением. Кроме того, сохраняется возмож- ность записать несколько первых отражений в помещении, что больше соответствует естественному окружению инструментов: — Spaced<Cknni stereo — ненаправленные микрофоны устанав- ливаются на стойках перед исполнителями на высоте 1,2-2,4 м (для улучшения пространственности их иногда поднимают на 3 м или выше). Такая система дает глубину и хороший стереообраз, но может вносить фазовые искажения; — Decca Tree — эта техника была развита на студии English Decca Records в середине 1950-х и еще до сих пор используется при записи звука. Три микрофона размещаются на стойках на высоте 3-3,7 м слегка позади головы ди- рижера. Микрофоны наклонены приблизительно на 30° вниз по на- правлению к оркестру и установле- ны под определенным углом друг Decca tree 1,5 м е Ъ rof е 2 м Рис. 6.3.21. Стереосистема Decca tree
600 Глава 6 к другу: один направлен в центр, два других — под 45° от центра (рис. 6.3.21). Расстояние между стойками правого и левого микрофона приблизительно 2 м, центральный микрофон сдвинут на 1,5 м вперед. Кроме того, два дополнительных микрофона располагаются по краям оркестра, обычно немного сзади, чтобы записать реверберацию зала. Эта техника дает реалистический стереообраз, обеспечивает хороший баланс между инструментами оркестра, позволяет записывать отдельно центральный канал, что полезно при микшировании систем типа Surround Soun£l. Стереосистемы типа «искусственной головы»: два не- направленных микрофона размещаются на твердой сфере диамет- ром 20 см (Sphere Stereo). Диафрагмы микрофонов расположены на поверхности сферы. Геометрические размеры, используемые в этой технике, моделируют базовые междуушные пропорции чело- веческой головы и, соответственно, междуушное время задержки. Бинауральная стереосистема использует модель искусст- венной головы, внутри слуховых каналов которой расположены микрофоны (рис. 6.3.22 ). В такой модели достаточно точно копи- руется форма головы и ушных раковин, а также специально под- бираются физико-механические параметры материалов, чтобы от- моделировать костную проводимость. В этой системе звуковой сигнал поступает на мембрану микрофона уже после обработки в раковине и слуховом канале, т. е. он несет в себе закодированную информацию о пространственном положении источника, которую можно передать по двум каналам передачи и воспроизвести на приемном конце через стереотелефоны. При этом слушатель по- лучает достаточно точное пространственное ощущение первичного помещения. «Искусственная голова» — весьма сложное и дорогое устройство, которое производится только немногими фирмами: например, фирма Neumann выпускает модель KU-100, фирма В&К — модель 4128С, фирма Head Acoustics GmbH — модель Aachen Head, фирма IRP — модель KEMAR. Каждая из этих моделей отличается определенными конструктивными особенно- стями — например, модель 4128С дополнена моделью торса. Модель KU-100 обладает следующими параметрами: частот- ный диапазон 20-20000 Гц, чувствительность 20 мв/Па, эквива- источник кажущийся источник искусственная ^ голова Слушатель Бинауральная стереосистема — запись с помощью «искусственной Рис. 6.3.22. микрофоны стереотелефоны головы»
Принципы построения систем звукозаписи 601 лентный уровень звукового давления 16 дБ-А, максимальный уровень SPL при THD < 0,5% равен 135 дБ, динамический диапазон 119 дБ. Микрофонные системы для Surround Sound: в настоящее время происходит переход на пространственные системы звукоза- писи и соответственно идет процесс создания новых микрофонных стереосистем для них [43]: — Soundfield — система, использующая четыре кардиоидных капсюля, организованных в форме тетраэдра. Первичные сиг- налы, получаемые от этих капсюлей (Ц, RB, RF, LB), образуют А-формат. С помощью специального цифрового процессора из них формируются четыре новых сигнала W, X, Y, Z (В-формат), из которых W соответствует сигналу от ненаправленного микро- фона, X, Y, Z — сигналам от микрофонов с характеристикой на- правленности типа «восьмерка», ориентированным слева напра- во, вперед-назад, вверх-вниз. Сигналы В-формата с помощью специального декодера могут прямо конвертироваться в любые варианты сигналов для моно, стерео, surround system (вплоть до формата 10.1) — рис. 6.3.23. Для конвертирования в самый рас- пространенный формат 5.1 фирма Soundfield разработала специ- альный процессор SP-451. Благодаря компактности большим возможностям процессорной обработки и совместимости с боль- шинством известных стерео- и surround-форматов эта микрофон- ная система находит широкое применение в различных видах пространственной звукозаписи и звукопередачи (например, по си- стеме Ambisonics). Разновидностью этой системы можно считать предложенную фирмой Schoeps микрофонную систему, состоящую из одного А-формат В-формат ЬР(верхний фронтальный) \ ^(нижний !фронтальный) в(нижний задний) о 1-й PQ 4-канальный выход TTT Моно Стерео Рис. 6.3.23. Принцип работы микрофона Soundfield
602 Глава 6 17.5 см к> 17,5qCM Рис. 6.3.24. Принцип работы системы SPL ненаправленного микрофона и трех микрофонов с характеристикой на- правленности типа «восьмерка», закрепленных в одной точке компактно друг с другом, т. е. сразу записываю- щую сигналы В-формата. В этой систе- ме несколько проще процессорная об- работка. Область применения ее такая же, как и у предыдущей; — система SPL array представляет собой единый блок с пятью разнесенны- ми направленными микрофонами, рас- стояние между которыми и их ориента- цию можно гибко изменять в процессе записи (рис. 6.3.24). Системы с адаптивным цифровым управлением (Audio technica AT 895, Microtech Gefell КЕМ 970 и др.): возможности циф- ровой обработки сигналов позволили создать новые микрофонные системы, представляющие из себя своего рода микрофонные ан- тенны, в которых с помощью цифровых фильтров синтезируются диаграммы направленности управляемой формы, ширины и ориен- тации, адаптированные к разнообразным условиям окружающего пространства и задачам обработки. Такие системы находят себе все большее применение в системах звукозаписи и озвучивания. Пример системы Audio technica AT 895, состоящей из центрально- го остронаправленного микрофона и четырех кардиоидных микро- фонов, показан на рис. 6.3.25 [43]. Направленный MK © о-" -3 * ^ Предусилитель Фильтр Фильтр Н>-С1 Фильтр Фильтр — Фильтр C-K DSP Xc =Г _^ (и линии -|/ " I задержки) Рис. 6.3.25. Адаптивная микрофонная система Audio technica AT 895
Принципы построения систем звукозаписи 603 6.3.2. Студийные микшерные пульты. Процессоры спецэффектов Микшерный пульт в современных студиях звукозаписи пред- ставляет собой наиболее важное и сложное устройство, состоящее из конструктивно объединенных схем для усиления, регулировки, смешивания, обработки и контроля звуковых сигналов, поступаю- щих на него из разных источников: микрофонов, магнитофонов, проигрывателей, внешних линий и др. [9, 10, 15, 16, 21, 23, 35, 36, 38]. Микшерные пульты используются для подготовки, формирова- ния и выпуска фонограмм для звукозаписи, для радиовещания, для кино, для систем звукоусиления и др. [9, 15, 23]. Микширование (англ. mix — смешивать) есть процесс смеши- вания и обработки звуковых сигналов от нескольких источников, переданных по различным каналам. Современный микшерный пульт представляет собой сложней- шее устройство, позволяющее выполнять до 2500 операций в про- цессе обработки звука. В настоящее время микшерные пульты работают как с аналоговыми, так и с цифровыми сигналами. При- мером современных устройств могут служить пульты фирм Neve, Soundcraft, Mackie, Digidesign, Sony и др., которые позволяют производить обработку до 96 входных и 96 выходных каналов и работать с цифровыми сигналами с частотой дискретизации 96 кГц и выше и разрядностью 24 бита [40]. В качестве примера на рис. 6.3.26 показан современный многоканальный микшерный пульт Digidesign ICON для работы с аналоговыми и с цифровыми сигналами (частота дискретизации 192 кГц, разрядность 24 бита), обеспечивающий форматы от моно до Surround Sound 7.1. Рис. 6.3.26. Общий вид пульта Digidesign ICON
604 Глава 6 Среди основных операций, которые позволяют осуществлять микшерные пульты, можно выделить следующие [31]: — регулировка уровней и усиление звуковых сигналов от от- дельных источников; их смешивание (микширование) в определен- ных соотношениях (при этом современные пульты позволяют про- изводить несколько независимых смешиваний); регулировка уровней от сгруппированных определенным образом источников; общая регулировка уровней выходных сигналов; — динамическая обработка (компрессия, ограничение по пико- вым уровням, шумоподавление и др.), необходимая для согласо- вания выходных параметров сигналов с динамическим диапазоном последующих устройств в каналах записи и передачи (радиовеща- тельные, телевизионных и др.); — частотная коррекция звуковых сигналов (с помощью эквалай- зеров, различных фильтров и др.) и их пространственное панора- мирование; — процессорная обработка (реверберация, дилей, флэнжер, фейзинг, хорус и др.) как с помощью устройств внутри пульта, так и с помощью внешних подключаемых приборов; — визуальный и слуховой контроль с помощью различных измерительных приборов и устройств для прослушивания (кон- трольных агрегатов); — формирование фонограмм из отдельных фрагментов запи- сей и др. По назначению микшерные пульты можно разделить на: пульты записи; пульты перезаписи и монтажа; вещательные пульты; пуль- ты для звукоусиления и др. По количеству входных каналов пульты разделяют на малые, средние и большие. Малые звукорежиссерские пульты имеют до 6 входных каналов, средние — 16-20, большие — 24-40 и более. По числу последовательно включенных каналов пульты записи подразделяются на двухзвенные и трехзвенные. Трехзвенные пуль- ты содержат индивидуальные, групповые и общие каналы, двух- звенные пульты групповых каналов не имеют [23]. Микшерные пульты первого поколения были монофоническими аналоговыми, второго — стереофоническими аналоговыми и циф- ровыми, третьего — цифровыми многоканальными с возможно- стью обеспечения форматов пространственной записи Surround Sound и т. д. В состав микшерных пультов входят различные усилители (микрофонные, промежуточные, линейные и другие); частотные корректоры (фильтры плавного подъема и среза, фильтры присут- ствия, эквалайзеры); ручные регуляторы уровня (индивидуальные, групповые, общие); панорамные регуляторы (panpot), автомати- ческие регуляторы уровня (компрессоры, шумоподавители, огра- ничители и др.); сборные шины; измерители уровня; устройства
Принципы построения систем звукозаписи 605 Входные секции \ Группы Мастер- I секция •••••••• ей IVUl TTTTTTTT If Рис. 6.3.27. Упрощенная блок-схема трехзвенного пульта управления, коммутации и сигна- лизации и др. Все эти устройства объединены в определенные бло- ки, количество и состав которых существенно отличаются в пуль- тах различной конструкции и на- значения. Однако во всех пультах можно выделить некоторые общие принципы их построения. Упрощенная блок-схема трех- звенного пульта показана на рис. 6.3.27. В нем можно выделить три типа секций: входные (каналь- ные), групповые, мастер-секции (выходные). Число выходных ка- налов зависит от назначения пуль- та. Примерная структурная схема трехзвенного микшерного пуль- та показана рис. 6.3.28 [31]. Следует иметь в виду, что схемы современных пультов для пространственной звукозаписи намного сложнее и существенно отличаются у разных фирм [9,10]. Современная технология многоканальной звукозаписи (особенно для популярной музыки, рока и джаза) обычно использует предварительную запись отдельных источников на различные треки многодорожечных магнитофонов через микшерный пульт с предварительной обработкой сигналов, затем эти записанные сигналы снова подаются на пульт и из них вместе с записью «живых» сигналов от микрофонов и син- тезированных сигналов (например, с помощью МИДИ-интерфейса) производится окончательное микширование в выходной стереосигнал или другой многоканальный сигнал. Поэтому архитектура современных пультов строится по принципу использования или двух отдельных Входные каналы Групповые каналы МУЧККомИР ПУ Ш1 Щ ПУЧК ГР ПУ Вход 2 Вход 3 МУЧККомИР ПУ ПУЧК ГР ПУ МУЧККомИР ПУ Вход N ПУЧК ГР ПУ МУЧККомИР ПУ 1 1 Г 1 1——1 ' Г — -~ Д Общие каналы ПУ OP ПУОгрЛУ Ня*1 NId > ПУ QP ПУОгрЛУ Ня*1 HId > Выход 2 Рис. 6.3.28. Схема трезвенного микшерного пульта
606 Глава 6 секций для записи и обработки входных сигналов от микрофонов и для отдельной обработки и прослушивания сигналов с многодорожечных магнитофонов (split-конфигурация), или одной совмещенной секции для сигналов всех видов: от микрофонов, от многодорожечных магнито- фонов и от электронных МИДИ-синтезаторов (in-line-конфигурация). Последняя обеспечивает более экономную конструкцию пульта и чаще используется в современной звукозаписи [12]. В состав каждого индивидуального входного канала микшерного пульта обычно входят: универсальный усилитель (УУ), состоящий из аттенюатора (At) и микрофонного усилителя (МУ); частотный корректор (ЧК); компрессор (Ком); индивидуальный регулятор уров- ня (ИРУ); промежуточный усилитель (ПУ). Для смешивания сигна- лов со всех входных каналов в групповые каналы используются сборные шины (LU 1). В каждом групповом канале используются для обработки сигналов промежуточные усилители (ПУ), частотные корректоры (ЧК) и групповые регуляторы (ГР). Групповые каналы коммутируются на главных сборных шинах (Ш2) в выходные каналы. Каждый общий (выходной) канал содержит последова- тельно включенные промежуточные усилители (ПУ), общий регулятор уровня (ОРУ), инерционный ограничитель уровня (Огр) и линейный (выходной) усилитель (ЛУ). Кроме основных шин в пульте имеются дополнительные AUX-шины, позволяющие орга- низовывать мониторинг (контроль) звуковых сигналов и подключать приборы дополнительной процессорной обработки. В разрыв кана- лов (Insert) могут подключаться дополнительные внешние устройства обработки; кроме того, в пультах для стереозаписи используются панорамные регуляторы. Входной универсальный усилитель (УУ) [23, 35] предназначен для усиления звуковых сигналов, приходящих от разных источ- ников: микрофона, магнитофона, проигрывателя и др. Основное назначение микрофонного усилителя заключается в усилении по- ступающих с микрофонов слабых звуковых сигналов до значения, которое можно обрабатывать и регулировать. К микрофонному усилителю предъявляются также требования повышенной поме- хозащищенности. С выхода (УУ) сигналы поступают на частотный корректор (ЧК), представляющий собой набор фильтров (эквалай- зеры, полосовые фильтры и т. д.), предназначенных для частот- ной обработки звуковых сигналов (более подробно об этом будет сказано далее). После корректора в микшерных пультах обычно устанавливают компрессор (Ком) для сжатия динамического ди- апазона. Следующим устройством в микшерном пульте является индиви- дуальный регулятор уровня (ИРУ) — фейдер. С помощью таких ре- гуляторов осуществляются наиболее важные операции по созда- нию звукового образа (регулирование уровней, нахождение
Принципы построения систем звукозаписи 607 -5 оптимального баланса между отдельными источниками и др.). Индивидуальные (ИРУ) и общие (ОРУ) регуляторы уровня совместно со сборной шиной представляют собой собственно смесительное устройство. Пределы регулирования фейдера дол- жны быть не менее 80 дБ. Фейдеры бывают плавными и ступен- чатыми. Их выполняют в виде потенциометров, многоконтактных переключателей или усилителей с регулируемым напряжением VCA [9, 10, 15, 16, 31, 35, 38]. Промежуточные усилители (ПУ), кото- рые имеются как в индивидуальных, так и в общих каналах микшерных пультов, вы- полняют функции усиления сигналов на величину, определяемую затуханием в предшествующем блоке, а также служат для разделения отдельных блоков и ис- ключения их влияния друг на друга. Огра- ничитель уровня (ОРУ) предназначен для защиты следующих за ним устройств от перемодуляции (перегрузки). Ограни- читель уровня — это инерционный авто- матический регулятор, коэффициент пере- дачи которого остается постоянным до некоторого регулируемого порогового значе- ния входного сигнала, а затем начинает уменьшаться обратно пропорционально увеличению уровня. На выходе микшерного пульта стоит линейный усилитель (ЛУ), обычно он имеет симметричный выход и низкое выходное сопротивление. Для контроля звукового сигнала исполь- зуются встроенные в пульт измерители уровня, коррелометры и стереогониометры (для контроля стереоэффекта), а также акустические контрольные агрегаты для прослушивания. Пример реализации одного входного ка- нала для пульта SR 56-8 фирмы Mackie показан на рис. 6.3.29: 1 — источник фан- томного питания для конденсаторных мик- рофонов (см. раздел 6.3.1); 2 — селектор входа (Trim Control), с помощью которого выбирается уровень усиления в зависимо- сти от того, откуда поступает сигнал (с мик- рофона или других источников); 3 — пере- Рис 6 3 29 Входная ключатель полярности; 4, 6 — контроль секция пульта SR56.8 уровня сигналов, посылаемых на внешние фирмы Mackie -16 17
608 Глава 6 устройства (aux); 5, 7 — переключатели посылов как до фейдера, так и после него; 8-13 —секция частотной коррекции сигнала, использующая различные виды фильтров; 14 — регулятор панора- мирования (panpot); 15 — заглушение канала (mute); 16 — субмих, дополнительное микширование данного канала к любым группо- вым каналам; 17 — переключатели, позволяющие назначить дан- ный канал на левый, правый или центральный выходные каналы; 18 — канальный фейдер. Процессорная обработка звуковых сигналов, как уже было сказано выше, производится как в пультах (в основном динамическая и частотная коррекция), так и с помощью специальных процессоров спецэффектов. Динамическая коррекция сигналов выполняется с помощью индивидуальных ручных регуляторов уровня (ИРУ) — фейдеров — и с помощью автоматических регуляторов уровня (АРУ). Автома- тические регуляторы уровня применяются для изменения динами- ческого диапазона сигнала, для повышения его средней мощности, для уменьшения уровня шумов, повышения разборчивости и т. д. Они работают по принципу управления коэффициентом передачи усилителя в зависимости от уровня входного или выходного сигна- ла, подаваемого на его вход; блок-схема показана на рис. 6.3.30 [31]. Существует несколько видов АРУ, которые могут быть как встроены в пульт, так и выполнены в виде отдельных приборов: компрессоры, ограничители (лимитеры), экспандеры, гейты (шумо- подавители) и др. Компрессор — это усилитель, коэффициент передачи которого уменьшается с увеличением уровня входного сигнала, поэтому он предназначен для сжатия динамического диапазона сигнала (рис. 6.3.31а, кривая 2). Для характеристики работы компрессоров используются следующие параметры: VCA 1) порог срабатывания Вход х Выход (threshold) определяет уро- Прямой Рекурсивный —► контроль -►U- контроль вень, выше которого сигнал начинает компрессироваться; усиления усиления дБ, 2) коэффициент сжатия (compression ratio) определяет, насколько изменяется уровень выходного сигнала при изме- нении уровня входного сигна- ла (например, при его значе- нии 4 : 1 изменение входного сигнала на 4 дБ увеличивает выходной сигнал на 1 дБ); Рис. 6.3.30. Блок-схема АРУ Входной уровень 3) время срабатывания (attack time) и время вос- становления (release time)
Принципы построения систем звукозаписи 609 определяют, насколько быстро реагирует компрессор на пре- вышение сигналом порога сраба- тывания и насколько быстро он возвращается в исходное состо- яние после падения уровня сиг- нала ниже порогового. Обычно время атаки на- ходится в пределах от 10 мкс до 100 мс; время восстановления — от 0,5 с до 2 или 3 с [13]. Ограничитель (лимитер) представляет собой компрессор с большим коэффициентом сжа- тия (10 : 1 и выше) для сигна- лов, превышающих некоторый пороговый уровень (рис. 6.3.31а, кривая 3). Он служит для пре- дохранения каналов передачи от пиковых перегрузок. Де-эссер (de-esser) — специ- альный вид лимитера, который уменьшает уровень только высо- кочастотного сигнала в полосе от 6 до 8 кГц, когда тот превышает допустимое значение, что позво- ляет уменьшить громкость резких свистящих звуков, иногда появля- ющихся в речи и пении. Экспандер имеет характеристику, обратную компрессору, — его коэффициент передачи увеличивается по мере повышения уровня сигнала (рис. 6.3.31а, кривая 4). Он служит для расширения дина- мического диапазона сигналов и используется в компандерных си- стемах шумоподавления [15, 31]. Гэйт (шумоподавитель) имеет малый коэффициент передачи до определенного уровня входного сигнала и большой при уровнях выше порогового (рис. 6.3.31а, кривая 5), служит для подавления шума в паузах. Кроме того, имеются АРУ со сложной амплитудной характери- стикой, представляющей собой сочетание разных устройств, — пример показан на рис. 6.3.316. Частотная коррекция сигналов (эквализация) используется для уменьшения неравномерности амплитудно-частотных характе- ристик (АЧХ) аппаратуры, снижения уровня высокочастотных или низкочастотных шумов, создания специальных эффектов за счет подчеркивания или подавления сигналов в определенной области частот (например, выделения отдельных формантных областей Ьвых, дБ Lorp L > дБ Ьвых, дБ ограничение компрессирование LmLr L0IPLBX, дБ Рис. 6.3.31: а — динамические характеристики различных видов АРУ; б — комбинированный вид АРУ
610 Глава 6 дБ дБ дБ /Гц •/ Гц ВыС0&^?таЫЙ 1^3TSSS?™* Фильтры подъема и спада (РИЛЬТР фильтр высоких и низких частот а б ДБ дБ дБ Час. •/ Гц */ Гц В /Гц Эквалайзер (EQj) Графический EQ Параметрический EQ где ДБ Наклон АЧХ ж >/, Гц Рис. 6.3.32. Характеристики частотных корректоров в голосе), уменьшения «эффекта близости» у направленных мик- рофонов (см. раздел 6.3.1), создания общей тенденции подъема или спада АЧХ к высоким частотам и т. д. Некоторые виды частот- ных корректоров обычно включены в схемы микшерных пультов (например, эквалайзеры), другие реализуются в виде отдельных приборов или программно в составе различных музыкальных ре- дакторов по компьютерной обработке звука. Основные виды час- тотных корректоров показаны на рис. 6.3.32 [9, 10, 23], они вклю- чают в себя: фильтры высоких (а) и низких (б) частот; фильтры плавного подъема и завала низких и высоких частот (в); трехпо- лосные эквалайзеры (г); графические эквалайзеры (д) — набор по- лосовых фильтров с фиксированными центральными частотами, обычно выбираемыми в соответствии с рекомендациями между- народных стандартов (например, для третьоктавных фильтров 100 Гц, 125 Гц, 160 Гц, 200 Гц, 250 Гц, 315 Гц, 400 Гц, 500 Гц, 630 Гц, 800 Гц, 1000 Гц); параметрические эквалайзеры (е) с ре- гулируемыми частотой, уровнем и добротностью; корректоры плав- ного наклона АЧХ (ж). В настоящее время для коррекции приме- няются как пассивные, так и активные фильтры (с использованием усилителей). При коррекции амплитудно-частотных характеристик
Принципы построения систем звукозаписи 611 с помощью эквалайзеров происходит искажение фазовых характе- ристик, которые, как показали последние исследования, влияют на качество звучания (см. гл. 3). Кроме этих видов обработки звуковых сигналов, имеется большой класс операций, которые реализуются как в отдельных приборах (процессорах спецэффектов), выпускаемых, например, фирмами Lexicon, Apex, Solid State Logic, Yamaha и др., так и в большинстве современных компьютерных программ. Процессоры спецэффектов обеспечивают выполнение раз- личных видов обработки звуковых сигналов, среди которых можно выделить следующие [9, 10, 38, 39]: реверберация (reverberation), дилей (delay), хорус (chorus), флэнжинг (flanging), фейзинг (phasing), сдвиг высоты тона (pitch shift), изменение времени зву- чания (time modification), морфинг и вокодинг (morphing, vocoding) и многие другие, количество которых непрерывно увеличивается. Например, процессор спецэффектов SPX2000 — одна из новых моделей фирмы Yamaha — не только реализует алгоритмы ревер- берации с большим количеством заранее введенных образцов для различных залов (пресетов), но и обеспечивает сдвиг высоты тона, различные виды модуляции и др. (в нем также имеется возмож- ность моделировать программным путем старые модели процессо- ров этой фирмы). Особую группу составляют процессоры пространственной обра- ботки звука (о некоторых из них будет дана краткая информация в разделе 6.4). Следует отметить, что аналогичные операции вы- полняются программным путем практически во всех современных музыкальных редакторах и других программах (например, Sound Forge, Wave Lab, SpectroLab и др.). Большая группа спецэффектов основана на использовании вре- менной задержки сигналов. К ней относятся искусственная ревер- берация и связанные с ней виды обработки (дилей, эхо, хорус, фейзинг, флэнжинг и т. д.), подробную информацию можно найти в литературе [9, 10, 21, 23, 38, 39]. С момента появления звукозаписи предпринимались попыт- ки введения в записываемый звуковой сигнал добавочной реверберации. В аналоговой технике это делалось с помощью таких устройств, как пружинные, листовые, магнитные ревербе- раторы, а также специальные эхо-камеры [23]. В настоящее время в студийной практике используются в основном цифро- вые ревербераторы. Типичная схема цифрового устройства, реализующего алгорит- мы цифровой реверберации, показана на рис. 6.3.33а [39]. В нем обычно реализуются три блока, описывающие различные участ- ки реверберационного процесса (см. гл. 5), представленные на рис. 6.3.336:
612 Глава 6 Вход Линия задержки 1 Линия задержки с отводами 2 Прямой звук JyT Линия Г-*®+ задержки 1 3 —<]• Линия задержки 2 1Д Линия задержки N Ранние отражения Il 1111 !Реверберация Выходной сигнал Короткий импульс Время, с б Рис. 6.3.33: а — схема цифрового ревербератора; б — структура реверберационного процесса — начальное время задержки между прямым сигналом и пер- вым отражением в пределах 10-20 мс реализуется с помощью простой цифровой линии задержки (блок 1); — ранние отражения, поступающие в первые 80 мс после при- хода прямого сигнала, моделируются с помощью линий задержки с отводами, усилителей и сумматоров (блок 2). С их помощью можно создавать различное количество дополнительных задержан- ных сигналов, регулировать время их прихода и соотношение ам- плитуд; — поздние отражения, поступающие после 80 мс, моделируют- ся с помощью параллельного набора линий задержки с системами обратной связи — рециркулирующих линий (блок 3). В каждой цепи обратной связи находятся усилители, коэффициент усиления
Принципы построения систем звукозаписи 613 которых тем меньше, чем больше время задержки. Такая система позволяет смоделировать экспоненциальное уменьшение амплитуд и возрастание плотности поздних отражений (рис. 6.3.336). Каждая из таких линий моделирует только ограниченное число отраженных сигналов с определенной плотностью их распределения. Для того чтобы смоделировать полный реверберационный процесс в по- мещении, необходимо использовать большое число таких линий с варьируемым временем задержки. Кроме того, дополнительно используются перекрестные связи между отдельными линиями задержки, варьируются параметры обратной связи и др. [39]. Современные цифровые ревербераторы обеспечивают введение искусственной реверберации в стереосигналы и многоканальные сигналы для систем Surround Sound. Необходимо отметить, что наиболее прогрессивными являются алгоритмы воссоздания реверберационных процессов в помеще- нии с помощью «свертки» сигнала с импульсными характеристи- ками помещения, используемые в программах аурализации (см. гл. 5). Такие алгоритмы реализованы сейчас во многих компьютер- ных программах с помощью дополнительных модулей (plug-in), на- пример фирмы Waves, — они получили название Convolution Reverb (т. е. расчет реверберации с помощью свертки). Использование цифровых линий задержки позволяет обеспечить и другие виды процессорной обработки, например такие как [39]: дилей, эхо — добавление к исходному сигналу его задержанной копии (или нескольких копий), при этом время задержки должно быть больше 50-60 мс, поскольку только при этом слух начинает воспри- нимать эхо; хорус — эффект, имитирующий хоровое исполнение. Для него используется сложение сигнала с его копиями, задержанными на разное время в пределах 20-30 мс. Структурная схема устройства, реализующего этот эффект, показана на рис. 6.3.34: исходный сиг- нал расщепляется и подается на несколько линий задержки, вре- мя задержки в каждой из которых модулируется независимо друг от друга низкочастотным шумом или синусоидальным сигналом. При суммировании получаются небольшие сдвиги по времени, что создает ощущение звучания нескольких инструментов или хора; фейзинг — реализуется с помощью эффекта гребенчатой филь- трации, который получается, если сигнал с выхода линии задержки Вход Рис. 6.3.34. Блок-схема устройства для реализации хоруса Линия задержки 1 Линия задержки 2 Линия задержки N ,Выход
614 Глава 6 сложить с исходным сигна- лом при частотно-зависимой модуляции времени задерж- ки в пределах 1-5 мс (фазо- вая модуляция). Блок-схема и частотная характеристика устройства показаны на рис. 6.3.35. При модуляции времени задерж- ки положение резонансных нулей на частотной оси сдвигается и ощущается «плавающий» эффект в зву- чании; флэнжинг — похожий эффект, только для него используется линия задерж- ки с обратной связью (рис. 6.3.36). При модуляции вре- мени задержки в пределах 5-15 мс происходит сдвиг регулярно расположенных резонансных пиков, частоты которых находятся в гармо- ническом соотношении друг с другом, что создает иллю- зию вибрато в звуке, прида- вая ему определенную жи- вость [9, 10, 39, 41]. Особая группа процес- соров эффектов связана с изменением высоты тона и изменением времени звуча- ния без сдвига высоты (тон и таймкоррекция) [13, 39]. Большую группу процес- соров эффектов составляют так называемые «психо- акустические» процессоры, использующие частотную коррекцию сигнала [9, 10, 13, 42]. Энхансер (Enhancer): в нем используется усилитель с управля- ющим напряжением (VCA) — рис. 6.3.37. Напряжение для VCA (2) вырабатывается на основе анализа уровня высокочастотных со- ставляющих входного сигнала, которые выделяются с помощью
Принципы построения систем звукозаписи 615 блок управления фильтр высоких частот (ФВЧ) Рис. 6.3.37. Блок-схема энхансера управляющий элемент (УСА) сумматор фильтра (1). Блок управления (4) срабатывает в момент возрастания их уровня, что приводит к усилению на коротком отрезке времени высокочастотных составляющих, которые затем с помощью сумма- тора (3) в разных пропорциях подмешиваются к основному сигналу. Благодаря этому звучание становится более акцентированным и четким. Максимайзер (Sonic Maximizer): примерная упрощенная струк- турная схема этого устройства показана на рис. 6.3.38: 1 — регу- лятор тембра НЧ; 2 — регулятор тембра ВЧ; 3 — фильтр высоких частот (ФВЧ); 4 — полосовой фильтр (ПФ); 5 — блок управления. Сигнал со входа устройства поступает на регуляторы тембра и од- новременно на два фильтра: высоких частот — ФВЧ (3) и полосо- вой (4). При этом ФВЧ выделяет только высокочастотные состав- ляющие, а полосовой фильтр ПФ — среднечастотные, лежащие ниже полосы пропускания ФВЧ. Сигналы этих двух полос звуковых частот поступают в блок управления (5), который сравнивает их уровни и на основе этого производит регулировку коэффициента усиления высокочастотных составляющих (поднимая или опуская их) с помощью регулятора (2). Виталайзер (Vitalizer) использует «параллельный» принцип построения тракта обработки. При этом частотные составляю- щие сигнала сначала суммируются между собой в разных про- порциях, а затем добавляются к исходному сигналу. Регуляторы низких, средних и высоких частот позволяют подмешивать сиг- налы в отдельных частотных диапазонах с разными фазами и формой огибающей спектра. Вход Рис. 6.3.38. Блок-схема максимайзера регулятор тембра НЧ фильтр ВЧ 3 полосовой фильтр (ПФ) регулятор тембра ВЧ >-1 € 2 блок управления Выход ► V
616 Глава 6 Вход — Ж VOX/WIDE Выход ^ Рис. 6.3.39. Блок-схема эксайтера Эксайтер (Exciter) обогащает исходный сигнал дополнительны- ми гармониками. Один из возможных вариантов его реализации показан на рис. 6.3.39. Он содержит: 1 — входной регулируемый усилитель; 2 — специальный фильтр высоких частот; 3 — генера- тор гармоник; 4 — сумматор сигналов эффекта; 5 — выходной сумматор. В фильтре имеются регулятор частоты настройки, позво- ляющий выбрать для обработки желаемую часть спектра входного звукового сигнала, и регулятор для изменения добротности. Кроме этих регуляторов, в фильтре имеется специальный переключатель (Vox/Wide), изменяющий тембр звучания эксайтера. В большинстве моделей диапазон перестройки фильтра от 700 Гц до 7 кГц. Прошедший фильтрацию сигнал, в свою очередь, разветвляется на два. Один поступает прямо на сумматор (4), а второй — подается на управление генератором гармоник (3), в котором на основе информации, извлекаемой из входного сигнала, осуществляется генерация высших гармоник. При этом синтезируется, главным образом, вторая гармоника. Синтезированные гармоники подают- ся на сумматор (4) через регулятор, позволяющий установить их уровень в общем сигнале. Полностью сформированный сигнал с помощью регулятора подмешивается к исходному (входному) сигналу в выходном сумматоре (5). Применение эксайтера обога- щает сигнал дополнительными гармониками, придавая четкость звучанию. К числу новых видов процессорных эффектов можно отнести морфинг и вокодинг [9, 10, 13, 39]. Успехи, достигнутые в послед- ние годы в создании компьютерных физических моделей инстру- ментов, позволили разработать новые алгоритмы и программы для особой группы процессорных эффектов, обеспечивающих созда- ние новых тембров звучания. Принцип действия этих устройств или их программной реализации можно показать на примере об- работки речи (пения). Как показано в главе 4, речевой сигнал мож- но представить как свертку двух сигналов: сигнала источника, со- здаваемого за счет колебаний голосовых связок, и сигнала, формируемого в резонансных полостях голосового тракта. Если построить модель голосового тракта в виде набора фильтров, мо- делирующих свойства резонансных полостей, то, используя сигнал
Принципы построения систем звукозаписи 617 Рис. 6.3.40. Блок-схема вокодинга на вход Шум Bi на вход 2 Шепчущий ветер звукового источника от различных голосов или инструментов, мож- но получить: голос совершенно необычайного тембра; звуки ин- струментов, похожие на голос; совершенно необычный звук (шеп- чущий ветер) — рис. 6.3.40. Этот процесс называется вокодинг [9, 10, 13, 39]. Приборы, реализующие такие алгоритмы, выпускают- ся несколькими фирмами; в качестве примера можно привести ус- тановку Digitech Vocalist Workstation [10]. Процесс обработки при морфинге очень похож по структуре алгоритмов на вокодинг, но отличается от него необходимостью разделения входного сигнала источника на отдельные компоненты (например, с помощью линейки фильтров, шириной примерно рав- ной критической полосе слуха и обработкой отдельных компонент входного сигнала внутри каждой полосы, что усложняет процесс, но значительно расширяет его возможности в создании новых тем- бров звучания [39]. В более общем смысле под тембральным морфингом понимается процесс комбинирования (с использованием цифровой процессорной обработки) двух или более звуков различного тембра и длительности в некоторый новый звук с промежуточной длительностью и особым тем- бром, включающим в себя отдельные черты исходных звуков. В насто- ящее время проводится большой объем научных исследований по этому направлению, разрабатываются специальные алгоритмы и программы, а также новые виды синтезаторов и цифровых процессоров (например, Morphoder фирмы Waves). Разумеется, перечисленные выше процессоры эффектов не исчерпывают огромного разнообразия алгоритмов процессор- ной обработки звука, реализуемых как программным, так и ап- паратным путем. 6.3.3. Студийные контрольные агрегаты Одним из чрезвычайно важных в технике звукозаписи видов электроакустической аппаратуры является студийный контрольный агрегат [50, 51]. По определению стандарта, «студийный контрольный агрегат — это высококачественное акустическое устройство, предназначенное для контроля технического и художественного качества записей». Иногда его называют «студийный (акустический) монитор».
618 Глава 6 Студийный контрольный агрегат (KA) обычно представляет со- бой многополосную акустическую систему, состоящую из несколь- ких головок громкоговорителей, фильтрующе-корректирующих це- пей (пассивных или активных), корпуса и усилителей. В том случае, если используется один усилитель с последующей филь- трацией сигнала на каждую полосу частот, контрольный агрегат на- зывается пассивным. Если на каждую полосу воспроизведения ис- пользуется свой усилитель и фильтр, который включается до усилителя (в этом случае он называется кроссовером), то агрегат считается активным. Студийный контрольный агрегат является основным инструментом звукорежиссера, с помощью которого он решает следующие задачи: — контролирует степень соответствия записываемого им звука естественному звучанию, если идет запись солистов, ансамблей или оркестра в студии или концертном зале; — контролирует степень соответствия создаваемого им звуча- ния желаемому звуковому образу, если речь идет о создании элек- тронной музыки; — проверяет техническое качество записей (отсутствие искаже- ний, баланс, тембр, динамику и пр.). Студийный монитор — это своего рода «технический перевод- чик» электрических сигналов от микрофонов, микшерного пульта и других устройств в «слышимый звуковой образ». Принципиальное отличие студийного акустического агрегата от домашних акустиче- ских систем прежде всего в том, что он является контрольным, т. е. измерительным устройством. В связи с этим к нему предъявляются особые требования. Основные из них — следующие: — неокрашенность звучания, естественность, максимальная близость к живому источнику. Практически реализуемой задачей является обеспечение в контрольных агрегатах таких уровней ли- нейных и нелинейных искажений, чтобы они находились ниже по- рогов слышимости, что в ряде их лучших конструкций, например фирм Tannoy, KEF и др., уже удалось получить; — «верность» воспроизведения низких частот, которые должны быть чистыми, хорошо сбалансированными, «сухими», т. е. с ма- лым уровнем переходных искажений и т. д.; — чистота и неокрашенность звучания в области средних час- тот, что особенно важно при записи певческих голосов. Многие бытовые акустические системы не могут использоваться для кон- троля записи из-за наличия определенного окрашивания в этом ча- стотном диапазоне (именно в нем находятся высокие певческие форманты) (см. гл. 4); — воспроизведение реальных динамических диапазонов ин- струментов и оркестра, достигающих 90-100 дБ, поскольку звуко- вой сигнал поступает на контрольный агрегат до динамической
Принципы построения систем звукозаписи 619 компрессии. Это выдвигает особые требования к качеству воспро- изведения звука как с высокими, так и с низкими уровнями гром- кости, а соответственно, и к уровню собственных шумов; — правильность передачи точной формы импульсов, процессов атаки и спада звукового сигнала, что особенно важно для точного воспроизведения быстрых пассажей в музыке; — создание определенной тенденции АЧХ с плавным спадом к высоким частотам: поскольку работа с агрегатом происходит на близком расстоянии в зоне «прямого» звука, высокие частоты воспринимаются неослабленными за счет затухания и ревербера- ции, как это обычно имеет место в бытовых системах; — обеспечение достаточно широкой диаграммы направленно- сти во всем частотном диапазоне и отсутствие ее резких скачков при переходе от среднечастотного к высокочастотному громкогово- рителю, что эквивалентно требованию плавного спада частотной характеристики излучаемой акустической мощности. Несоблюдение этих требований чрезвычайно затрудняет работу звукорежиссера, так как при любом его перемещении от центральной оси исчеза- ет ощущение высоких частот; — обеспечение высокой надежности: во-первых, потому, что агрегаты эксплуатируются до 24 часов в сутки на высоких уровнях (на многих студиях звукозаписи работа часто идет круглосуточно), во-вторых, потому, что статистическое распределение спектраль- ного состава сигналов электронных музыкальных инструментов значительно отличается от классических за счет существенно бо- лее высокого уровня высокочастотных составляющих, что может приводить к выходу из строя высокочастотных громкоговорителей. Бытовые акустические системы не рассчитываются при проектиро- вании на такие условия эксплуатации. Поскольку контрольные студийные агрегаты, как и микрофоны, относятся к первичным звеньям тракта звукозаписи, то от их каче- ства в значительной степени зависит качество фонограмм и по- следующего воспроизведения звукового сигнала. В зависимости от вида записываемой музыки (классической, электронной и др.), от назначения и размеров студии (радиове- щания, телевидения, звукозаписи и т. д.), условий воспроизведе- ния и др. контрольные агрегаты проектируются по-разному, поэто- му в настоящее время выпускается множество разнообразных конструкций. Как правило, в современных студиях используются разные аку- стические мониторы для ближнего и для дальнего поля [50, 51]. Основные элементы конструкции студийного контрольного агрегата показаны на рис. 6.3.41. Он состоит из: излучателей (головок громкоговорителей), каждый из которых (или несколько одновременно) работает в своем частотном диапазоне; корпуса, который может как состоять из нескольких отдельных корпусов
620 Глава 6 (блоков), каждый для излучателей своего диапазона, так и представлять собой единую конструкцию; фильтрующе-коррек- тирующих цепей, а также других электрон- ных устройств (например, для защиты от перегрузок, индикации уровня и т. д.); звуковых кабелей и входных клемм] уси- лителей для активных агрегатов и крос- соверов (активных фильтров) в случае применения отдельных усилителей для каждой полосы частот. Этот набор элемен- тов (количество головок громкоговорите- лей, активных или пассивных фильтров, формы и конструкции корпуса и т. д.) мо- Рис. 6.3.41. Общий жет варьироваться у различных типов кон- вид контрольного трольных агрегатов. агрегата В качестве излучателей чаще всего ис- пользуются электродинамические громкого- ворители, хотя имеются контрольные агрегаты, использующие дру- гие типы излучателей. Например, фирма Quad использует электростатические излучатели, фирмы ESS, A.D.A.M и др. — излучатели Хейла и т. д., описание принципов устройства которых можно найти в литературе [52-58]. Устройство электродинамического громкоговорителя показано на рис. 6.3.42. Громкоговоритель состоит из трех частей: подвижной систе- мы, магнитной цепи и диффузородержателя [52, 58]. Подвижная система включает в себя подвес (2), диафрагму (коническую или купольную) (3), центрирующую шайбу (4), пылезащитный колпачок (5), звуковую катушку (6). Звуковая катушка представляет собой цилин- дрический каркас с намотанным в несколько слоев (обычно в два слоя) изолированным проводником. При пропускании переменно- го тока по звуковой катушке, помещенной в радиальный зазор магнитной цепи, на нее будет действовать механическая сила F = ВЫ, где В — индукция в рабочем зазоре, L — длина провод- ника, / — сила тока. Под действием этой силы возникают осевые колебания катушки и скрепленной с ней диафрагмы. Центрирующая 2 Рис. 6.3.42. Устройство динамического громкоговорителя
Принципы построения систем звукозаписи 621 шайба (4) представляет собой гофрированную мембрану, которая обеспечивает центровку звуковой катушки в зазоре, препятствует ее крутильным колебаниям, но позволяет ей совершать осевые коле- бания. Она должна обладать большой гибкостью в осевом направ- лении и малой в радиальном и кольцевом. Подвес (2) — кольцевая, обычно гофрированная оболочка, позволяющая диафрагме со- вершать осевые колебания и предохраняющая ее от крутильных колебаний, т. е. она также должна обладать большой гибкостью в осевом направлении и малой в кольцевом и радиальном. Диаф- рагма (3) представляет собой упругую оболочку, по форме она мо- жет быть конической, сферической, плоской и др. Под действием механической силы со стороны звуковой катушки диафрагма совер- шает колебания, которые создают звуковые волны в окружающей среде. Пылезащитный колпачок (5) — купольная или плоская пла- стинка, предохраняющая зазор магнитной цепи от попадания пыли и одновременно являющаяся ребром жесткости для диафрагмы. Гибкие выводы (7) — проводники, соединяющие выводы звуковой катушки с присоединительными клеммами громкоговорителя. Эле- ментами магнитной цепи (1) являются (рис. 6.3.43): магнит в виде кольца (1), верхний (2) и нижний (3) фланцы, керн (5), полюс- ный наконечник (6). Постоянный магнит создает магнитный поток, замкнутые силовые линии которого пересекают цилиндрический воздушный зазор между верхним фланцем и керном в радиальном направлении. Диффузородержа- тель (8) служит для объединения магнитной цепи и подвижной сис- темы и обеспечивает возмож- ность закрепления громкоговори- теля в корпусе АС, с которым он предназначен работать. Каждый 6—, г—2 Рис. 6.3.43. Магнитная цепь Рис. 6.3.44. Конструкция купольного среднечастотного громкоговорителя 1 —диффузор, 2 — сетка, 3 — медный колпачок, 4 — верхний фланец, 5 — кожух, 6 — звуковая катушка, 7 — вкладыш, 8 — шайба, 9 — подвес, 10 — нижний фланец, 11 — магнит, 12 — керн.
622 Глава 6 из элементов подвижной системы и магнитной цепи оказывает свое влияние на выходные характеристики громкоговорителя и его качество звучания. Средне- и высокочастотные громкоговорители чаще всего име- ют несколько другую конструкцию (рис. 6.3.44). В них использует- ся диафрагма купольной формы, применяется несколько отличная конструкция магнитной цепи и др. Корпус контрольного агрегата выполняет многообразные функции. В области низких частот он блокирует эффект «коротко- го замыкания», возникающий за счет сложения в противофазе из- лучаемого звука от передней и тыловой поверхности диафрагмы. Применение корпуса позволяет повысить интенсивность излучения на низких частотах, а также увеличить механическое демп- фирование громкоговорителей, в результате чего можно «сгладить» резонансы и уменьшить неравномерность амплитудно-частотной характеристики. Корпус оказывает существенное влияние в обла- сти не только низких, но и средних и высоких частот. Колебания стенок корпуса и дифракционные эффекты на его краях могут вно- сить существенный вклад в увеличение линейных и нелинейных искажений контрольного агрегата. Именно поэтому вопросам про- ектирования корпусов (выбору их конфигурации, материала сте- нок, вибродемпфирующих и виброизоляционных покрытий и т. д.) все фирмы-производители уделяют чрезвычайно большое внима- ние [59, 60]. Наиболее распространенными типами низкочастотных оформ- лений, используемыми в конструкциях современных контрольных агрегатов, являются: закрытый корпус (closed box, acoustical suspensions, sealed box); корпус с фазоинвертором (vented-box, ported-box, bass-reflection и др.) и его разновидности: лабиринт (labirinth), трансмиссионная линия (transmission-line), корпус с двойной камерой типа поло- »3 V демпфирующий материал п Рис. 6.3.45. Виды корпусов контрольных агрегатов: 1 — закрытый; 2 — с фазоинвертором; 3 — с пассивным излучателем; 4 — лабиринт; 5 — трансмиссионная линия; 6 — с двойной камерой; 7 — полосовой фильтр (band pass); 8 8 — изобарик
Принципы построения систем звукозаписи 623 сового фильтра (bandpass systems), с пассивным радиатором (passive radiator, drone cone) и др. (рис. 6.3.45). Закрытый корпус (closed box, acoustical suspensions, sealed box) — принцип работы такого типа оформления (называемого также компрессионным) состоит в том, что в нем используются громкоговорители с очень гибким подвесом и большой массой, т. е. низкой резонансной частотой. В этом случае упругость воз- духа в корпусе становится определяющим фактором. Именно она начинает вносить основной вклад в восстанавливающую силу, приложенную к диафрагме (при этом отношение гибкости подвеса к гибкости воздуха должно быть не меньше чем 3... 4). Поскольку воздух — среда линейная (при относительно малых уровнях зву- кового давления), то это не только дает возможность уменьшить объем корпуса, но и позволяет уменьшить нелинейные искажения. Низкочастотные громкоговорители для таких систем должны про- ектироваться особым образом (иметь большую гибкость подвеса, большую массу диафрагмы, особую конструкцию звуковой катуш- ки и магнитной цепи для обеспечения больших смещений и т. д.). При правильно подобранных электромеханических параметрах ГГ и корпуса такого типа можно получить максимально гладкую фор- му АЧХ на низких частотах, обеспечить чистое, сухое звучание басов. Именно поэтому многие ведущие фирмы при создании контрольных агрегатов применяют корпуса закрытого типа. Корпус с фазоинвертором (vented-box, ported-box, bass- reflection и др.) — корпус, в котором сделано отверстие, что позво- ляет использовать излучение тыльной поверхности диффузора. Максимальный эффект достигается в области частоты резонанса колебательной системы, образуемой массой воздуха в отверстии или трубе и гибкостью воздуха в корпусе. Наличие небольшого отверстия в корпусе не нарушает компрес- сионного принципа работы громкоговорителя, но дает дБа возможность увеличить уро- вень звукового давления на л/ ---.а частоте резонанса (сравни- Л ** 6 тельная форма АЧХ в облас- ти низких частот показана на рис. 6.3.46), уменьшить нели- нейные искажения, значи- тельно расширить возможно- Частота сти настройки параметров r. АГ _ , ДТТЛГ _ г Рис. 6.3.46. Сравнительная форма АЧХ KA. Следует отметить, что ЯТ¥в „_ттт_ пгжггпп "J ' для разных видов оформлении наличие фазоинвертора тре- а _ закрытый корпус; бует значительно большего б — с фазоинвертором; искусства при проектирова- в — с пассивным излучателем
624 Глава 6 нии, так как неточная его настройка приводит к появлению пере- ходных искажений («затянутых басов»). В современных моделях акустических контрольных агрегатов используется достаточно много разновидностей фазоинверсных корпусов (рис. 6.3.45): — корпус, использующий специальную трубу, нагруженную на отверстие (ducted port enclosures), — это позволяет уменьшить размеры корпуса и с помощью регулировки размеров трубы улуч- шить настройку фазоинвертора; — корпус с пассивным излучателем (passive radiator) — в отвер- стии корпуса устанавливается пассивный (т. е. без магнитной цепи) громкоговоритель, колебания которого возбуждаются за счет коле- баний объема воздуха, заключенного в корпус. Регулируя массу и гибкость такого громкоговорителя, можно получать такой же эф- фект, как и при настройке фазоинвертора; — лабиринт (labyrinth) или трансмиссионная линия (transmission line). Лабиринт представляет собой вариант низкочастотного корпуса с фазоинвертором, в котором устанавливаются специальные пе- регородки, создающие своего рода лабиринт для потока воздуха. Применение лабиринта расширяет возможности для настройки на более низкие частоты. Трансмиссионная линия отличается от лаби- ринта тем, что звукопоглощающим материалом забивается весь объем корпуса и поперечное сечение линии делается переменным — больше у громкоговорителя, меньше у отверстия; — фазоинверсное оформление с двойной камерой (double- chamber) или с несколькими камерами (multi-chamber port). Приме- нение двойных или нескольких одиночных камер позволяет обеспе- чить согласование параметров фазоинвертора с низкочастотным громкоговорителем в значительно более широком диапазоне частот; — оформления типа полосовых фильтров (band-pass systems) — это также разновидность фазоинверсных систем, в которых ГГ установлен внутри в закрытый корпус и излучает звук не прямо в окружающую среду, а через корпус с фазоинверсным отверсти- ем. Применение таких корпусов систем позволяет регулировать спад АЧХ не только в сторону низких, но и в сторону высоких ча- стот (т. е. он действует подобно полосовому фильтру). Такого типа оформления часто применяются для создания низкочастотных блоков (subwoofers) в современных комплектах контрольных агре- гатов для систем Surround Sound. Способы расчета основных видов низкочастотных оформлений (корпусов) достаточно подроб- но разработаны на основе теории Small-Thiele и практически пол- ностью переведены на компьютерные методы [53, 59, 60, 61]. Фильтрующе-корректирующие цепи. Все современные вы- сококачественные контрольные акустические агрегаты являются многополосными, поэтому приходится практически во всех них
Принципы построения систем звукозаписи 625 использовать электрические разделительные фильтры, основная задача которых — ослабление электрического сигнала за преде- лами рабочей полосы частот громкоговорителей. Развитие тех- ники конструирования и особенно возможности компьютерного моделирования изменили требования к проектированию фильтров и выдвинули новые задачи коррекции электроакустических харак- теристик контрольных агрегатов [59], такие как: симметризация характеристик направленности, обеспечение заданной неравно- мерности АЧХ, снижение уровня фазовых искажений и т. д. Начальным этапом в проектировании фильтров является выбор частот раздела между громкоговорителями. При выборе частот раздела обычно используются следующие соображения: — обеспечение возможно более равномерных характеристик направленности, т. е. отсутствие «скачков» ширины диаграммы на- правленности при переходе от низкочастотного к среднечастотно- му и от средне- к высокочастотному громкоговорителю. По этой же причине громкоговорители стараются размещать как можно бли- же друг к другу и располагать их в вертикальной плоскости; — обеспечение работы громкоговорителя в основном в облас- ти поршневых колебаний диафрагмы и значительного ослабления уровня амплитудно-частотной характеристики за ее пределами; — ограничение амплитуды смещения подвижных систем средне- и высокочастотных громкоговорителей в низкочастотной части излу- чаемого ими спектра до значений, определяемых их механической и тепловой прочностью, что повышает надежность их работы; — обеспечение требуемого уровня звукового давления, напри- мер за счет повышения частоты среза в области высоких частот, что позволяет увеличить уровень подаваемого напряжения на высокочастотный громкоговоритель и соответственно увеличить уровень звукового давления в высокочастотном диапазоне; — снижение уровня нелинейных искажений (в частности за счет эффекта Доплера), возникающих в многополосных KA за счет модуляции высокочастотных составляющих низкочастотными компонентами сигнала. Как правило, частоты среза в современных трехполосных KA находятся в пределах от 0,5 кГц до 1 кГц и от 2 до 5 кГц. В студийных акустических контрольных агрегатах используют- ся как «пассивные», так и «активные» фильтры. По сравнению с пассивными активные фильтры имеют ряд пре- имуществ: меньшие габариты, лучшую перестраиваемость частот раздела, большую стабильность характеристик и т. д. Однако пас- сивные фильтры обеспечивают больший динамический диапазон, меньший уровень шумов и нелинейных искажений. В последние годы фирмы-производители начали применять в контрольных агрегатах цифровые фильтры, обеспечивающие в реальном
626 Глава 6 Рис. 6.3.47. Схема фильтра для трехполосного KA времени функции фильтрации, коррекции и адаптации их харак- теристик к реальным условиям прослушивания. Из пассивных фильтров чаще всего используются фильтры «всепропускающего» типа (all-pass band), которые удовлетворяют одновременно нескольким требованиям: обеспечивают плоскую АЧХ по напряжению, симметричную характеристику направленно- сти, низкую чувствительность к изменению элементов; используют- ся также «минимально фазовые фильтры» и др. Методика расчета фильтрующе-корректирующих цепей для мно- гополосных KA приведена в работах [59, 60]. Программы для рас- чета фильтров различных порядков можно найти в Интернете [61]. Основные параметры фильтра: крутизна спада (порядок филь- тра), резонансная частота, добротность на резонансе. В зависи- мости от математической структуры их передаточной функции (которая обычно описывается в виде отношения полиномов) опреде- ляются фильтры: Баттерворта (Butterworth), добротность Q = 0,7071; Линквица — Рили (Linkwiz — Riley), Q = 0,49; Бесселя (Bessel), Q = 0,58, и др. В современных KA чаще всего применяются фильтры второго, третьего и четвертого порядков, обеспечивающие крутизну спада в полосах среза 12 дБ/окт, 18 дБ/окт., 24 дБ/окт. Пример полной схемы фильтра для трехполосного KA показан на рис. 6.3.47. Ведущие фирмы используют оптимизацию схем фильтров с помощью компьютерного моделирования, что позволяет добиться существенного снижения уровня фазовых искажений, симметризации характеристик направленности и умень- шения неравномерности суммарной АЧХ. Электроакустические параметры современных контрольных агрегатов ведущих фирм-производителей Tannoy, Genelec, JBL показаны в таблице 6.3.2.
Принципы построения систем звукозаписи 627 Таблица 6.3.2 Параметры Genelec 1036А Tannoy215DMTII JBL-4425 Амплитудно- 20 Гц — 20 кГц 35 Гц — ЗбкГц 40 Гц — 16 кГц частотная +/-2,5дБ +/-ЗдБ +/-ЗдБ характеристика (АЧХ) (frequency response) Чувствительность 104 дБ/Вт/м 91 дБ/Вт/м (sensitivity) Нел. искажения <0.5% <1% (distortion) Max SPL 136 дБ 114 дБ Паспортная мощность (power handling capacity) 200 Вт 200 Вт (2часа) Макс, кратко- временная (пиковая) мощность (short term input power) 500 Вт 1000 Вт Частоты среза 400 Гц, 3,5 кГц 250 Гц, 1,5 кГц 1,2 кГц Характеристики Угол излучения направленности 90°, 100°, спад — 6 дБ спад — 6 дБ Основные параметры, обычно указываемые в каталогах на кон- трольные агрегаты, следующие [51, 52, 55-57]. Амплитудно-частотная характеристика (АЧХ) — зависи- мость уровня звукового давления от частоты. Обычно измерения АЧХ производятся в специальных заглушённых камерах, обработка поверхностей которых позволяет значительно уменьшить влияние отражений [52]. В качестве измерительного используется синусо- идальный или шумовой сигнал. Однако в настоящее время широко используются цифровые методы измерения в незаглушенных по- мещениях на импульсных сигналах, позволяющих получить трех- мерный спектр; пример для контрольного агрегата фирмы Marantz показан на рис. 6.3.48а, б. Из АЧХ можно рассчитать целый ряд параметров, позволяю- щих количественно оценить амплитудно-частотные искажения: — эффективно воспроизводимый диапазон частот — диапа- зон, в пределах которого уровень звукового давления снижается на некоторую заданную величину по отношению к уровню среднего
628 Глава 6 звукового давления, опреде- ленному в диапазоне 100- 8000 Гц; — характеристическая чувствительность — уро- вень среднего звукового дав- ления, развиваемого KA в за- данном диапазоне частот (обычно 100-8000 Гц) на ра- бочей оси на расстоянии 1 м при подводимой элек- трической мощности 1 Вт; — неравномерность АЧХ— разница между макси- мальным значением уровня звукового давления и мини- мальным, или между макси- мальным и средним внутри эффективно воспроизводимо- го диапазона частот. Коэффициент нелиней- ных искажений (KHИ) — для оценки нелинейных ис- кажений используются раз- личные виды испытательных сигналов: тональные, шумо- вые, импульсные и др. Наибольшее распространение в междуна- родных и отечественных стандартах) получили методы измерения уровней первых (второй, третьей) гармонических составляющих в спектре излучаемого сигнала: при этом производится запись АЧХ второй и третьей гармоники в заглушённых камерах или из- меряется коэффициент гармонических искажений п-порядка: 1000 Рис. 6.3.48: а — импульсная характеристика контроль- ного агрегата фирмы Marantz; б — кумулятивный спектр для агрегата фирмы Marantz ср где pf — среднеквадратичное значение звукового давления, со- ответствующее п — гармонической составляющей, р — среднее звуковое давление. По нему рассчитывается общий коэффици- ент гармонических искажений: Kr = JZ К2г. 1 п=2 В современных контрольных агрегатах его величина не превы- шает 0,5-1%. В настоящее время широкое распространение
Принципы построения систем звукозаписи 629 300! 270е 240° получают методы измерений КНИ на «многотоновых» сигналах [62]. Характеристика направлен- ности — для оценки «простран- ственного» распределения звуковой энергии, излучаемой акустическими устройствами, в современной прак- тике проектирования используются такие параметры как характеристика направленности и частотная харак- теристика акустической мощности. В действующих стандартах пре- дусмотрено измерение характери- стики направленности в заглушён- ных камерах двумя методами. Первый — запись АЧХ при смещении микрофона под углами ± (20°... 30°) в горизонтальной плоскости и ± (5°... 10°) в вертикальной; при этом отклонение полученной АЧХ от измеренной на оси не должно превышать 4 дБ. Второй — запись диаграмм направленности в полярных коорди- натах при вращении KA на поворотном устройстве(рис. 6.3.49). Из этих данных определяются такие величины как: — коэффициент направленности — отношение звукового дав- ления, измеренного под заданным углом относительно рабочей оси к звуковому давлению на рабочей оси для одной и той же часто- ты (полосы частот) и при одном и том же расстоянии от рабочего центра громкоговорителя: Рис. 6.3.49. Полярная диаграмма направленности 1(0°) = Рзв (0°) ' — индекс направленности — 20 десятичных логарифмов ко- эффициента направленности; — угол излучения — угол, в пределах которого значение индек- са направленности спадает менее чем на 10 дБ. Электрические мощности — обычно в каталогах указывается несколько видов мощностей, что необходимо для правильной эксплу- атации KA и согласования их с выходной мощностью усилителей: — паспортная, при которой KA может работать на специаль- ном шумовом сигнале длительное время (обычно 100 часов) без механических и тепловых повреждений; — характеристическая, при которой KA обеспечивает задан- ный уровень звукового давления (в международных рекомендаци- ях он должен быть не менее 94 дБ на 1 м);
630 Глава 6 — максимальная синусоидальная, обеспечивающая возмож- ность проведения измерений на синусоидальном сигнале в тече- ние 1 часа. Специально для согласования с усилителями введено еще два вида мощностей: долговременная и кратковременная максималь- ная мощность (в немецком стандарте DIN 45500 введена близкая к последней по определению «музыкальная» мощность, иногда ее называют пиковой); для испытаний используется шумовой сигнал, но испытания продолжаются по 1 мин 10 раз с интервалом 2 мин и по 1 с 60 раз с интервалом 1 мин соответственно. В ряде ката- логов указывается не значение кратковременной мощности, а зна- чение пикового уровня звукового давления (SPL). Значения этих мощностей для одного и того же контрольного агрегата могут отличаться в несколько раз. Например, характери- стическая мощность — 35 Вт, максимальная синусоидальная — 50 Вт, паспортная — 90 Вт, долговременная — 100 Вт, кратковре- менная — 150 Вт. Наряду с этими часто указываются целый ряд других парамет- ров, подробнее с их спецификацией можно познакомиться в рабо- тах [52-57]. Особенности дизайна студийных контрольных агрегатов мож- но показать на примере моделей трех ведущих фирм, параметры которых приведены в таблице 6.3.2. — фирма Genelec, модель 1036А — мощный активный кон- трольный агрегат дальнего поля, предназначенный для больших контрольных комнат (рис. 6.3.50). Он состоит из корпуса объемом 430 л (дм3) с двумя низкочастотными громкоговорителями диа- метром 450 мм (18"), двумя среднечастотными 127-миллиметро- выми (5") и одним высокочастотным 25,4-миллиметровым (1") громкоговорителем и дополнительного блока, включающего трехка- нальный усилитель (2 х 1100 Вт; 600 Вт; 300 Вт), активные фильтры (кроссоверы) с частотами среза 400 Гц и 3500 Гц и цепи защиты. Рис. 6.3.50. Контрольный агрегат Рис. 6.3.51. Контрольный фирмы Genelec агрегат фирмы Tannoy
Принципы построения систем звукозаписи 631 1 — подвес, 2 — диффузор, 3 — рупор в керне, 4 — шайба, 5 — диффузородержатель, 6 — магнит, 7 — звуковая катушка, 8 — высокочастотная диафрагма, 9 — сборочное кольцо, 10 — концентратор Рис. 6.3.52. Коаксиальный громкоговоритель Он предназначен для установки в стену, но может устанавливаться и на полу. Фирменной особенностью конструкции практически всех агрегатов Genelec является использование корпуса особой формы с рупорным волноводом перед средне- и высокочастотными гром- коговорителями, что позволяет регулировать характеристику направленности в широком диапазоне частот и увеличивает их чувствительность (эта технология получила название Directivity Control Waveguide — DCWIM). — Фирма Tannoy, модель 215DMTII — большой контрольный агрегат дальнего поля. Он представляет собой трехполосную систе- му, состоящую из низкочастотного громкоговорителя диаметром 380 мм (15й) и коаксиального громкоговорителя диаметром также 15", совмещающего средне- и высокочастотный громкоговоритель (рис. 6.3.51). Корпус объемом 300 дм3 с оптимизированной фор- мой фазоинверторов. Фирменной особенностью большинства контрольных агрегатов фирмы Tannoy (она выпускает их более 22 типов, причем эти агрегаты считаются эталонными в професси- ональной студийной технике) является использование коаксиаль- ных громкоговорителей (рис. 6.3.52). Технология эта была запатен- тована фирмой еще в 60-е годы и заключается в совмещении двух излучателей в одной конструкции, в которой высокочастотный громкоговоритель установлен на магнитной цепи низкочастотного и излучает через отверстие в керне. Диффузор низкочастотного громкоговорителя служит для него рупором, такая установка позво- ляет обеспечить излучение громкоговорителей из одной точки и ус- транить фазовые сдвиги между ними, что улучшает чистоту и про- зрачность звучания. Одной из последних разработок фирмы является контрольный агрегат ближнего поля модель Ellipse 8 (рис. 6.3.53), представля- ющий собой активную трехполосную систему с корпусом для ко- аксиального громкоговорителя эллиптической формы (19,5 дм3). Монитор содержит коаксиальный низко-высокочастотный динамик
632 Глава 6 диаметром 204 мм ( 8") и сверхвы- сокочастотный динамик диаметром 25,4 мм (1"), расположенный наверху в специальном корпусе; частоты среза 1,7 кГц и 14 кГц. Корпус фазоинверторного типа с двумя круглыми выходами на передней панели. Частотный диа- пазон агрегата от 40 Гц до 50 кГц (+/-2 дБ), MaxSPL — 118 дБ. Рис. 6.3.53. Контрольный агрегат ТрвХПОЛОСНЫЙ уСИЛИТвЛЬ МОЩНО- фирмы Tannoy модель Ellipse 8 стью по 15Q Вт для н/ч и с/ч громкоговорителей и 30 Вт для в/ч громкоговорителя. Принципиальной особенностью этого конт- рольного агрегата является использование встроенного цифрово- го процессора с новой технологией интерактивного цифрового программирования — IDP ™, которая позволяет производить настройку его акустических параметров под конкретные условия прослушивания и осуществлять контроль и коррекцию параметров монитора в реальном времени. — Фирма JBL, модель 4425 — большой студийный контрольный агрегат, состоящий из низкочастотного громкоговорителя диамет- ром 300 мм и специального средне-высокочастотного громкогово- рителя с бирадиальным рупором (рис. 6.3.54). Применение рупо- ров такой сложной формы и титановых купольных диафрагм обеспечивает широкую и стабильную характеристику направленно- сти в диапазоне частот от 1,2 кГц до 16 кГц, высокий уровень чув- ствительности и четкое, чистое звучание. Низкочастотный громко- говоритель использует специальную конструкцию магнитной цепи, обеспечивающей низкие нелинейные искажения при больших сме- щениях звуковой катушки. Корпус объемом 53,8 дм3, с двумя фа- зоинверторами. Акустические параметры этого агрегата, способ- ность передавать сигналы с большим динамическим диапазоном без искажений и др. обусловили его широкое применение в совре- менных студиях цифровой звукоза- писи. Студийные контрольные агрега- ты производятся десятками других фирм, например Alesis, Infinity, Marantz, Yamaha и др.; в каждом из них имеются свои конструктив- ные особенности. Рис. 6.3.54. Контрольный агрегат фирмы JBL
Принципы построения систем звукозаписи 633 6.3.4. Устройства записи и воспроизведения звука (проигрыватели, магнитофоны) Неотъемлемыми элементами оборудования любой студии зву- козаписи являются устройства записи и воспроизведения звуковой информации (рис. 6.3.55). Современные студии оснащены цифро- выми проигрывателями и рекордерами, а также цифровыми и ана- логовыми студийными магнитофонами, которые используются и как источники звуковых сигналов, вводимых в микшерский пульт для последующей обработки, и как устройства для записи и прослуши- вания готовых фонограмм. В качестве проигрывателей и рекордеров в настоящее время используются в студийной практике в основном цифровые лазер- ные устройства, производящие оптическую запись и считывание звуковой информации с компакт-дисков с помощью луча полупро- водникового лазера. Устройства механической записи уже практи- чески не применяются. Структурная схема аппаратуры первичной записи информации на компакт-диск показана на рис. 6.3.56. Луч лазера (лазер — это оптический квантовый генератор, излу- чающий монохроматический свет, т. е. свет строго определенной длины волны) с помощью оптической системы фокусируется на по- верхности полированного стеклянного диска, покрытой слоем свето- чувствительного материала (фоторезиста) толщиной 0,1-0,13 мкм. Интенсивность луча модулируется специальным устройством — оптическим модулятором в соответствии с двоичным потоком ин- формации, поступающим с выхода кодера, который представляет Рис. 6.3.55. Вид аппаратуры звукозаписи в студии
634 Глава 6 Лазер (He-Cd или Ar) JI Источник записываемого сигнала (кодер) Оптический модулятор Детектор положения Процессор Сервопривод автоматической фокусировки Стеклянный диск, покрытый фоторезистом Механизм радиальной подачи (1,6 мкм за 1 об.) Поворотное зеркало Фокусирующий объектив Направление вращения Двигатель вращения Сигнал регулирования Рис. 6.3.56. Структурная схема установки для записи диска-оригинала записываемый музыкальный сигнал в виде последовательности «нулей» и «единиц». Оптический модулятор преобразует непре- рывное излучение лазера в последовательность световых импуль- сов. Для точной фокусировки луча на фоторезистивном слое и формирования спиральной дорожки записи с заданным шагом (1,6 мкм) используются соответствующие системы автоматического регулирования. Импульсы света оставляют на поверхности враща- ющегося диска зоны засветки, которые соответствуют двоичным «единицам» в модулирующем цифровом потоке. Зоны, где интен- сивность лазерного излучения мала и засветка поверхности диска не происходит, соответствуют «нулям». После окончания процес- са записи фоторезистивный слой проявляется в специальном ра- створе. Зоны засветки при этом растворяются и на их месте обра- зуются углубления, называемые питами (шириной 0,6-0,8 мкм, глубиной 0,1-0,13 мкм). Для тиражирования в процессе промыш- ленного производства диск-оригинал после окончания записи и проявления фоторезистивного слоя металлизируется тонким сло- ем серебра, после чего на его основе методом гальванопластики делается второй оригинал — цельнометаллический. Рельеф со вто- рого оригинала переносится на промежуточные копии, а с них — на матрицы. Полученные таким путем матрицы и используются в дальнейшем для массового тиражирования компакт-дисков. В ка- честве основного материала для компакт-дисков применяется про- зрачный поликарбонат. Со стороны пит на его поверхность нано- сится слой алюминия толщиной 0,01 мкм, который выполняет роль отражающего слоя. После этого алюминиевый слой покрывают
Принципы построения систем звукозаписи 635 Этикетка Защитный слой защитный слой отражающий слой CD-RW Питы питы ^ЧОтражающий ьй4 СЛОЙ отражающий слой CD-R основной слой питы 1,6+0,1 мкм дополнительный слой а б Рис. 6.3.57: а — структура компакт-диска, б — конструкция слоев компакт-диска (для CD и CD-R) еще и защитным слоем из прочной пластмассы, а на нем форми- руют этикетку. Защитный слой может быть как !розрачным, так и непрозрачным. Внутренняя структура компакт-диска показана на рис. 6.3.57а, б. Дорожка записи, состоящая из последовательности пит, имеет вид непрерывной спирали. Шаг спирали — 1,6 мкм. Об- щая длина дорожки — около 5 км. Начало записи — у внутреннего диаметра диска, окончание — у внешнего [9, 11), 14, 19]. Размеры компакт-дисков стандартизованы: внешний диаметр 120 мм, диаметр центрального отверстия 15 мм, толщина 1,2 мм. Компакт-диск содержит три основные зоны: зону ввода, программ- ную зону, зону выхода. Во вводной зоне (ограниченной диаметром 46 мм) содержится информация о количестве и наименовании фонограмм (произведений), записанных на диске, время от нача- ла диска до начала данной фонограммы в минутах и секундах, опознавательный номер диска и др. Наличие и нформации о вре- мени начала каждой фонограммы позволяет автоматизировать процедуру ее поиска и осуществлять многократное проигрывание. В программной зоне (от внутреннего диаметра ЕЮ мм до внешнего 116 мм) записываются музыкальные произведения, а также вспо- могательные коды. В зоне вывода (внешний диаметр 117 мм) содержится информация, необходимая для завершения работы с диском. Кроме того, на диске имеется еще зона! прижима (внешний диаметр — 33 мм). Для считывания информации в проигрывателях компакт-дисков также используется сфокусированный луч лазер а, который, следуя по дорожке, рассеивается на питах и отражается от плоской поверхности диска, после чего направляется к фотодиоду. Сигнал, формируемый фотодиодом, обрабатывается с целью выделения из него последовательностей прямоугольных импульсов, демоду- лируется, декодируется и преобразуется в аналоговый звуковой
636 Глава 6 ОЗУ (буферная память) Двигатель Опти- вращения ческая диска головка Блок выделения цифрового сигнала и тактовой синхропоследо- вательности Демодулятор, выделение кадровой и служебной группы Декодер CIRC А А Сервосистемы (автофокуси- автотрекинг) Блок управления двигателем вращения диска Блок обработки служебной информации Демульти- плексор Блок ЦАП Генератор хронирующих последова- тельностей Рис. 6.3.58. Общая схема проигрывателя компакт-дисков сигнал. Общая структура лазерного проигрывателя достаточно сложна (рис. 6.3.58) и содержит в себе прежде всего ряд сервоси- стем, обеспечивающих фокусировку луча на поверхности диска, слежение за дорожкой, быстрое перемещение луча в радиальном направлении в процессе поиска нужного фрагмента программы, управление двигателем вращения диска (поскольку для поддержа- ния постоянства линейной скорости перемещения светового пятна относительно дорожки необходимо изменять скорость вращения диска по мере смещения оптической головки от внутренних доро- жек к внешним) и выполнение множества других процедур, способ- ствующих безошибочному считыванию информации с диска и вы- полнению того или иного набора сервисных функций. Кроме того, проигрыватель содержит: демодулятор, преобразующий 14-разряд- ные канальные символы в 8-разрядные байты; устройства такто- вой, кадровой и блочной синхронизации; декодер, обнаруживаю- щий и исправляющий ошибки, возникающие в потоке данных, считанных с диска; цифро-аналоговые преобразователи, преобра- зующие кодированные отсчеты звукового сигнала в аналоговую форму; цифровые и аналоговые фильтры и другие функциональ- ные блоки. Следует отметить, что для записи звукового сигнала на компакт-диск стандартом предусмотрена частота дискретиза- ции 44,1 кГц. Первоначально были разработаны CD-диски, предназначенные только для считывания информации, но уже в 90-е годы появились диски CD-R, на которые можно производить однократную запись, и диски CD-RW, допускающие многократную перезапись материа- ла. Регистрирующим слоем дисков CD-R является слой специаль- ного органического красителя, который под воздействием сфокуси-
Принципы построения систем звукозаписи 637 рованного лазерного излучения разогревается, деформируется и образует питы. У дисков CD-RW вместо органического красите- ля роль регистрирующего слоя играет слой неорганического веще- ства, способного менять свое состояние из кристаллического в аморфное и обратно, что обеспечивает возможность многократ- ной перезаписи. Однако контраст записи (разница уровней отражен- ного света, соответствующих «нулям» и «единицам») у дисков CD-R и CD-RW ниже, поэтому качество записи на них получается хуже, чем на дисках, предназначенных только для считывания [9, 10, 18, 19]. Диски DVD-Audio и SACD, появившиеся в последние годы, име- ют размеры, одинаковые с CD: диаметр 12 см (или 8 см), толщи- на 1,2 мм (они склеены из двух половинок по 0,6 мм). Проигрыва- тели для обоих форматов совместимы с обычным компакт-диском. Принципиальным отличием этих двух форматов является то, что в DVD-Audio используется обычное кодирование цифрового звуково- го сигнала с частотой дискретизации 44,1; 88,2 и 176,4 или 48 кГц; 96 или 192 кГц; и с 16-, 20- и 24-разрядным разрешением. В SACD применяется цифровой сигнал с другим принципом кодирования, используется частота дискретизации 2,8 МГц и одноразрядное дельта-сигма-преобразование сигнала (DSD), что дает ряд преиму- ществ в относительной простоте реализации аппаратуры. Оба формата обеспечивают очень высокое качество звучания, каждый имеет свои преимущества. По какому пути пойдет их дальнейшее развитие — покажет будущее. В настоящее время распространено четыре типа дисков DVD- Audio, использующих от одного до четырех информационных сло- ев: однослойный односторонний SSSL — объем 4,7 Гб; однослой- ный двусторонний SSDL — 8,54 Гб; двухслойный односторонний DSSL — 9,4 Гб; двухслойный двусторонний DSDL — 17,08 Гб (структура его показана на рис. 6.3.59). Уже разработаны компакт- Считывание 0 & 0 & ^ Полупрозрачный ^^информационный слой —"~ 1 —r > t »- Фотополимер Г Непрозрачный информационный слой Поликарбонат Считывание Рис. 6.3.59. Структура диска DSDL
638 Глава 6 Рис. 6.3.60. Внешний вид рекордера фирмы Tascam диски такого формата для однократной и многократной перезапи- си DVD-R и DVD-RW. Предполагается что в дальнейшем, проигры- ватели будут воспроизводить как диски DVD-Audio, так и DVD- Video, а также SuperAudioCD [18, 19]. Перспективы дальнейшего развития этой аппаратуры обсуждены в разделе 6.1. Примеры технических параметров некоторых проигрывателей и рекордеров, используемых в современных студиях звукозаписи приведены в таблице 6.3.3 [19]. Внешний вид рекордера фирмы Tascam показан на рис. 6.3.60. Таблица 6.3.3 Параметры Про /!грыватели Рекордеры CDP-D11 PMD 330 CD-RW MDS-E15 (Sony) (Marantz) (Tascam) (Sony) Число каналов 2 2 2 2 Частотная харак- 20 Гц-20 кГц, 20 Гц-20 кГц, 20Гц-20 кГц 5Гц-20 кГц, теристика ±0,5 дБ ±0,3 дБ ±0,5 дБ ±0,3 дБ (неравномерность) Динамический диапазон, дБ > 96 > 90 > 94 > 98 Отношение с/ш, > 93 100 > 98 > 98 ДБ Коэфф. гармоник % 0,008 0,005 0,004 — Коррекция CIRC — ACIRC — ошибок помехо- устойчивый код Рида — Соломона с перекрест- ным пере- межением улучшенный помехоустой- чивый код Рида — Со- ломона с перекрестным перемежением. Лазер, длина вол- ны AIGaAs 780 нм 780 нм 780 нм 780 нм Частота дискрети- зации, кГц 44,1 44,1 44,1 44,1
Принципы построения систем звукозаписи 639 Вторая группа устройств, применяемых в современной студийной практике в качестве источников программ, включает аналоговые и цифровые магнитофоны, использующие принцип магнитной запи- си [9, 10, 12, 14, 16, 23]. Магнитная запись основана на использо- вании свойств некоторых ферромагнитных материалов сохранять свою намагниченность после прекращения воздействия на них внешнего магнитного поля (с физикой магнитной записи можно под- робнее ознакомиться в литературе [10-14, 31, 32]). Процесс запи- си состоит в воздействии локального переменного магнитного поля, создаваемого головкой записи в соответствии с подводимым зву- ковым сигналом, на участок магнитной ленты. Процесс воспро- изведения состоит в считывании остаточного магнитного потока с помощью головки воспроизведения и преобразовании его в электрический сигнал с целью его последующей подачи на усилители и громкоговорители. Структурная схема магнитофона показана на рис. 6.3.61. Маг- нитофон содержит лентопротяжный механизм (ЛПМ), предназна- ченный для перемотки магнитной ленты (1) с подающего узла (2) на приемный узел (3). Магнитная лента является основным но- сителем информации, она состоит из тонкой упругой подложки (в основном из поливинилхлорида, полиэфира и др.) с нанесен- ным на нее слоем ферролака (из связующего вещества с мельчай- шими частицами порошка гамма-окиси железа или железа-ко- бальта, двуокиси хрома и других добавок). Для контроля скорости и стабилизации натяжения ленты в профессиональных магнито- фонах применяются специальные электромеханические системы автоматического регулирования (САР). Перемещение ленты осуществляется за счет ее прижима к вращающемуся валику (4) Рис. 6.3.61. Схема аналогового магнитофона
640 Глава 6 с помощью ролика (5). В состав маг- нитофона входят головка записи (ГЗ), головка воспроизведения (ГВ) и головка стирания (ГС). Головка записи ГЗ (см. рис. 6.3.62) состоит из кольцевого (тороидального) ферритового сердечника (1) с намоткой из медного провода (2). В сердечнике имеется рабочий зазор шириной 10- Рис. 6.3.62. Конструкция 20 мкм (3) и дополнительный зазор магнитной головки 150-300 мкм (4). На обмотку подается звуковой сигнал в электрической фор- ме, например от микрофона. Сигнал проходит через цепь записи (рис. 6.3.61), включающую в себя автоматический регулятор уров- ня АРУ, измеритель уровня ИУ (7), частотный корректор (8), уси- литель звуковой частоты (УЗ). Переменный электрический ток в обмотке создает в катушке переменное магнитное поле, которое намагничивает сердечник; при этом магнитные силовые линии за- мыкаются через воздушный зазор (5) и за счет полей рассеивания намагничивают определенный участок ленты (рис. 6.3.62). Намаг- ниченность ленты меняется от участка к участку в зависимости от амплитуды и частоты переменного тока в обмотке, соответствую- щих изменению входного звукового сигнала. Для повышения каче- ства записи используется режим с высокочастотным под- магничиванием, для чего от генератора (Г) подается через усилитель (6) дополнительный ток высокой частоты (от этого же ге- нератора поступает сигнал на стирающую головку ГС). При стереофонической записи используются две самостоятельные кон- структивно объединенные головки, которые ведут запись на двух дорожках ленты, разделенных определенным промежутком. При многоканальной записи используется специальный блок головок и вдоль ширины ленты записывается сразу несколько дорожек (треков) [10]. Для воспроизведения используется другая головка (ГВ), аналогичная по конструкции (с более узким зазором), но работающая в обратном режиме: при движении ленты остаточ- ный магнитный поток в рабочем слое ленты создает в ее сердечни- ке переменный магнитный поток, который приводит к появлению электрического тока в обмотке, а он затем усиливается (УВ), корректируется (9) и подается на линейный выход магнитофона. Номинальный выход студийных магнитофонов по стандарту должен быть равен +6 дБи (1,55 В). В студийной практике используются в настоящее различные форматы записи. Примеры некоторых из них приведены в табли- це 6.3.4 [10]:
Принципы построения систем звукозаписи 641 Таблица 6.3.4 Количество Ширина ленты, Скорость движения треков формат записи ленты, см/с 2 1/4", стерео 19,05; 38,1; 76,2 4 1/2", четырехканальная 19,05; 38,1; 76,2 16 1", многоканальная 76,2 24 2", многоканальная 76,2 Несмотря на высочайший уровень качества записи, достигнутый в профес- сиональных студийных аналоговых маг- нитофонах, в них всегда присутствуют линейные и нелинейные искажения, шумы, эффекты детонации, копирэф- фект и др. ( за счет непостоянства ско- рости движения ленты, нелинейности кривых намагничивания и т. д.). Для борьбы с ними были разработаны раз- личные методы электронной коррекции [9, 10, 14, 15,]. В качестве примера в таблице 6.3.5 даны параметры анало- говых магнитофонов фирмы Tascam, внешний вид модели BR-20 показан на рис. 6.3.63. Таблица 6.3.5 Параметры Tascam 122 MKIII Tascam BR-20 Носитель компакт-кассета С-30 - С-90 Лента шириной 1/4" Формат дорожек 2 канала, 4 трека 2 канала, 2 трека Конфигурация Записывающая, Записывающая, головок воспроизводящая, воспроизводящая, стирающая стирающая Относительная нестабильность скорости движения + 0,5% ± 1,0% ленты в режимах запись/воспро- изведение Рис. 6.3.63. Аналоговый магнитофон фирмы Tascam
642 Глава 6 Табл. 6.3.5 (продолжение) Параметры Tascam 122 MKIII Tascam BR-20 Частотный диапазон Коэффициент нелинейных искажений на 1 кГц Отношение сигнал / шум (при THD = 3%) Переходные помехи в стереопаре на 1 Кгц Ослабление сигнала при стирании на 1 кГц Вес 25 Гц — 20 кГц 1,0% 35 Гц—22 кГц (38,1 см/с) 30 Гц—20 кГц (19,05 см/с) < 0,8% 45 дБ 65 дБ 8,4 кг >79 дБ 55 дБ 70 дБ 28 кг В последние годы в студийной практике происходит посте- пенный переход с аналоговых магнитофонов на цифровые (хотя, учитывая огромные архивы аналоговых записей, можно сказать, что потребность в аналоговых магнитофонах сохранится еще на многие годы). Переход на цифровые сигналы в магнитной запи- си обеспечил значительное улучшение параметров: расширение частотного и динамического диапазона, снижение нелинейных искажений, устранение детонации и шумов ленты и т. д. Кроме того, это обеспечило сохранность фонограммы при многократ- ных перезаписях. В цифровых магнитофонах используются те же физические прин- ципы записи информации на движущуюся магнитную ленту с по- мощью электромагнитных головок (хотя требования к параметрам ленты и конструкции головок существенно меняются) [8, 9, 10, 12, 19]. Существуют два принципиально разных способа записи, ис- пользуемых в цифровых магнитофонах: первый — это продольная многодорожечная запись с помощью неподвижных головок. Такой формат записи получил название DASH (digital audio stationary head format), структура дорожек на его магнитной ленте показана на рис. 6.3.64. В настоящее время такие магнитофоны (например, фирмы Sony PCM 3324S) используются в основном для професси- ональной многоканальной записи, из остальных областей примене- ния они вытесняются техникой с другими форматами записи (DAT, ADAT и др.)
Принципы построения систем звукозаписи 643 Рис. 6.3.64. Многодорожечная запись на магнитной ленте в формате DASH Второй способ использует вращающиеся головки, осуществля- ющие на ленте наклонно-строчную запись. Одним из первых был принят в 1985 году предложенный фирмой Sony формат R-DAT (Rotary Head Digital Audio Tape Recorder) — это система цифровой звукозаписи записи с высокой плотностью на магнитную ленту ши- риной 3,81мм (как в аналоговой компакт-кассете) с помощью вра- щающихся головок [9, 10, 14, 16, 19]. Структурная схема цифрового магнитофона с наклонно-строчной записью показана на рис. 6.3.65. В лентопротяжном механизме (ЛПМ) лента движется с небольшой скоростью (порядка 1 см/с) и охватывает барабан с вращающимися головками (БВГ), на кото- ром находится две или больше магнитных головок. В результате вращения барабана на движущейся ленте формируются дорожки записи, расположенные под определенным углом к краю магнитной ленты (рис. 6.3.66). Современные цифровые магнитофоны позво- ляют записывать как аналоговые, так и цифровые сигналы. Анало- Служебный трек ^ Служебный трек 2 Звуковые треки Пользовательские — данные ^Временный код ФНЧ - АЦП Аналог, вход >— ФНЧ - АЦП > Цифр, вход ФНЧ - ФНЧ Аналог, выход ФНЧ - ЦДЛ Цифр, выход МП дмп ОЗУ КПК СУ ОРГ. УПР. и ОЗУ дпк КЗ ЛПМ БВГ} - KB CAP Рис. 6.3.65. Структурная схема цифрового магнитофона
644 Глава 6 <- Формат Основная дорожка Направление вращения головки Ч 6°22'59,5! -20° азимут 20° азимут Угол наклона головки (не в масштабе) Рис. 6.3.67. Расположение строчек на фонограмме ДАТ говые сигналы поступают на фильтр низких частот (ФНЧ), затем в аналогово-цифровой преобразователь (АЦП). Полученный цифровой сигнал, так же как и цифровые сигналы, поступившие прямо на вход магнитофона, направляется на мультиплексор — МП, где не- сколько цифровых потоков объединяются в один общий поток. За- тем сформированный поток через оперативное запоминающее ус- тройство (ОЗУ) поступает на кодер помехоустойчивого кода (КПК), где выполняется операция разбиения цифрового потока на блоки оп- ределенной длины с добавлением к ним проверочных символов, не- обходимых для обнаружения и исправления ошибок. Эти символы заносятся в ОЗУ, где происходит также изменение временного масштаба и перемежение отсчетов в цифровом звуковом сигнале. Необходимость изменения временного масштаба вызвана добав- лением в цифровой поток различной служебной информации, а также специальной информации для исключения потери симво- лов цифрового сигнала при переключении головок записи и др. Перемежение выполняется для того, чтобы уменьшить влияние ошибок из-за выпадений отсчетов сигнала, например из-за дефек- тов на магнитной ленте и др. В результате соседние отсчеты ока- зываются записанными на разных участках ленты, при этом в по- ток данных в ОЗУ вводится необходимая служебная информация для последующего декодирования сигналов. Затем цифровой по- ток через канал записи (КЗ) поступает к блоку вращающихся голо- вок (БВГ) и записывается на магнитную ленту. При воспроизведении цифровой поток, сформированный на вы- ходе канала воспроизведения (KB), поступает на ОЗУ, с помощью которого восстанавливаются временной масштаб и исходный поря- док следования отсчетов ЗС (т. е. осуществляется операция депе- ремежения). При воспроизведении из потока символов выделяет- ся служебная информация, которая направляется в систему управления (СУ) для установки необходимых режимов работы
Принципы построения систем звукозаписи 645 цифро-аналогового преобразователя (ЦАП), обеспечения синхро- низации работы узлов магнитофона, например системы автомати- ческого регулирования (САР) двигателей и скорости вращения блока вращающихся головок, а также информация, которая требу- ется для реализации сервисных функций магнитофона (поиск и воспроизведение в запрограммированном порядке фрагментов за- писи, обзор записей, индикация времени и т. п.). Декодер помехо- устойчивого кода ДПК служит для обнаружения и исправления ошибок, которые могут возникать в процессе записи-воспроизведе- ния сигнала. Цифровой поток, получаемый на выходе декодера, подается на демультиплексор (ДМП), который разделяет общий цифровой поток на несколько цифровых потоков соответственно числу записываемых сигналов на входах магнитофона и числу его выходов. Для восстановления аналогового сигнала поток с выхо- да ДМП подается на ЦАП соответствующего канала. После про- хождения ФНЧ восстановленный сигнал поступает на аналоговый выход магнитофона для воспроизведения [16]. Благодаря помехоустойчивому кодированию удается существен- но уменьшить поток ошибок, которые могут возникать в канале за- писи-воспроизведения. Однако возможны ситуации, когда корректи- рующей способности помехоустойчивого кода при применяемом алгоритме его декодирования недостаточно. Для уменьшения вли- яния ошибок на качество воспроизведения в состав магнитофо- на вводят интерполятор (И), который используется для маскирова- ния ошибок. Простейшим «алгоритмом маскирования» является линейная интерполяция по двум соседним отсчетам ЗС, например вычисление среднего значения. Еще одним решением этой про- блемы для стереозаписей является замещение группы отсчетов сигнала в одном канале отсчетами из другого канала. В процессе работы магнитофона необходимо осуществлять множество вычислительных операций (например, при декодирова- нии помехоустойчивого кода), поддерживать требуемые режимы работы узлов и блоков магнитофона, реализовывать по определен- ным программам обмен данными между узлами и блоками. Для этого, а также для управления магнитофоном в состав последне- го вводится специальный компьютерный модуль, который выпол- няет функции по согласованию работы отдельных блоков магнито- фона. В студийных магнитофонах он применяется также для электронного редактирования и монтажа фонограмм [16]. Кроме формата R-DAT, в современной цифровой звукозаписи используются форматы ADAT-XT фирмы Alesis и DA-88 фирмы Tascam. В первом используется запись звука на видеокассеты S-VHS, во втором на Hi-Band (8-миллиметровые компакт-кассеты) [10]. Созданные на основе всех этих форматов цифровые много- дорожечные магнитофоны широко используются в студийной
646 Глава 6 Рис. 6.3.67. Внешний вид цифрового магнитофона фирмы Studer D-827 практике, обеспечивая высокий уровень параметров (частотный диапазон 20 Гц - 20 кГц, динами- ческий диапазон — больше 92 дБ, уровень нелинейных искажений — ниже 0,009% и т. д.), хорошее ка- чество звука и возможность ре- дактирования и контроля записей. На рис. 6.3.67 показан общий вид современного студийного цифро- вого магнитофона D-827 фирмы Studer (совместим с DASH-форма- том, 48 дорожек, AES/EBU и MIDI входы/выходы). Кроме вышеупомянутых носителей звуковой информации в на- стоящее время используются устройства записи на жесткие маг- нитные диски, позволяющие записывать огромные объемы ин- формации [10]. Уже выпускаются цифровые многодорожечные магнитофоны на жестких дисках, например D-90 и D-160 фирмы Fostex, обладающие возможностью редактирования, т. е. стирания, перемещения, копирования любого отрезка фонограммы, измене- ния скорости воспроизведения без изменения высоты тона, рабо- ты по MIDI с внешними устройствами, обеспечивающие запись зву- ка без компрессии на 32 трека с частотами дискретизации 44,1 и 48 кГц, или DR-100 фирмы Otari с возможностью записи на 48 треков с частотой 48 кГц и разрядностью 24 бита или на 24 трека с частотой 98 кГц. Наконец, в практике звукозаписи используется технология маг- нитооптической записи, которая объединяет в себе некоторые свойства как оптической, так и магнитной записи. Разработка этой технологии позволила начать производство нового вида цифровой аудиоаппаратуры — проигрывателей мини-дисков (MD). Мини- диск имеет диаметр 64 мм, однако длительность записанной на нем музыкальной программы может достигать 74 минут — как и у обычных компакт-дисков. Частота дискретизации (44,1 кГц) и разрядность квантования (16 разрядов) у мини-диска также совпадают с аналогичными параметрами компакт-диска. Если программа, которую нужно записать на мини-диск, представлена в цифровом виде с другой частотой дискретизации (48 или 32 кГц), то в процессе записи производится ее передискретиза- ция и приведение к частоте 44,1 кГц. Программы, записываемые на мини-диск, могут быть пред- ставлены как в цифровом виде, так и в аналоговом. Если сигнал представлен в аналоговом виде, то он предварительно преоб- разуется в цифровую форму с помощью внутреннего АЦП мини- дискового аппарата. Если программа в цифровом виде, то запись
Принципы построения систем звукозаписи 647 ее осуществляется непосредственно, минуя внутренний АЦП ре- кордера. Как упоминалось выше, вся записываемая на мини-диск звуковая информация подвергается сжатию в 5-6 раз по стандарту ATRAC, что и позволяет разместить на миниатюрном носителе до- статочно большой объем звуковых данных. В основе процесса записи информации на мини-диск лежит термомагнитный эффект, который состоит в том, что при нагрева- нии магнитооптического регистрирующего слоя, покрывающего по- верхность диска, с помощью лазера выше определенной темпера- туры (точки Кюри) он способен изменять свою намагниченность в соответствии с направлением внешнего магнитного поля. Поэто- му запись на мини-диск осуществляется с помощью магнитной головки, которая воздействует на разогретый лазером регистриру- ющий слой слабым магнитным полем, промодулированным цифро- вым звуковым сигналом. Магнитные домены, входящие в состав регистрирующего слоя, при этом меняют свою ориентацию, и маг- нитограмма дорожки приобретает характеристики, соответствую- щие модулирующему сигналу. После перемещения светового пят- на, формируемого лазером, дорожка остывает, и полученная магнитограмма фиксируется. В основе процесса считывания информации с поверхности мини-диска лежит магнитооптический эффект Керра, который в данном случае проявляется в том, что угол наклона плоскости по- ляризации луча, отраженного от поверхности диска, по отношению к плоскости поляризации падающего луча для участков дорожки с противоположной намагниченностью будет разным. Если пропус- тить отраженный луч через пластинку-анализатор, изготовленную из анизотропного материала, то интенсивность его будет зависеть от степени намагниченности того участка дорожки на диске, от которого луч отразился. Фотодиод, размещенный на пути про- шедшего анализатор луча, будет вырабатывать разный ток и, та- ким образом, выделять исходную информацию, содержащуюся в записанной на диск магнитограмме. В качестве магнитооптического материала чаще всего используют сплавы, содержащие кобальт. Как показали исследования фирм Philips и Du Pont наилучшими свойствами с точки зрения величины угла поворота плоскости по- ляризации (а значит, увеличения оптического контраста и уменьше- ния уровня шумов) обладает сплав кобальта и платины. Магнитооптические диски обеспечивают достаточно большое количество циклов перезаписи — не менее миллиона. Плотность записи на них может быть очень велика. Уже известны магнитооп- тические диски емкостью в десятки гигабайт и более. Развитие технологии магнитооптической записи активно продолжается [10, 14, 18, 19].
648 Глава 6 6.4. СИСТЕМЫ ПРОСТРАНСТВЕННОЙ ЗВУКОПЕРЕДАЧИ И ЗВУКОВОСПРОИЗВЕДЕНИЯ Важность восприятия пространственного звука была понятна задолго до появления средств его записи. На протяжении тысяче- летий предпринимались попытки создания помещений (храмов, те- атров, концертных залов и др.), где было бы обеспечено «погру- жение» слушателя в звуковое пространство. Цель современных средств записи и воспроизведения звука состо- ит в передаче некоторых признаков сигнала, позволяющих слушате- лю ощутить пространственное окружение (как в концертном зале, со- боре и др.). При этом можно выделить две тенденции: передачу некоторых физических параметров первичного звукового поля и пе- редачу некоторых психоакустических характеристик, вызывающих у слушателя ощущение нахождения в первичном пространстве. Для всех систем пространственной передачи звука характерны некоторые общие элементы, которые включают в себя средства: для записи звука (различные типы микрофонных систем); для ко- дирования исходных сигналов в некоторую новую систему комби- нированных сигналов; для декодирования на принимающей сторо- не; для воспроизведения звуковых сигналов (через акустические системы или стереотелефоны). Принципиальная трудность состоит в том, что при любой системе трехмерное звуковое поле необхо- димо записать и воспроизвести с помощью ограниченного числа точечных источников, таких как микрофоны и громкоговорители. Правда, слуховая система человека обладает способностью вос- произвести трехмерное звуковое пространство с помощью двух слуховых приемников, но за счет специальных методов фильтра- ции и последующей обработки, недоступной (пока) для техниче- ских средств. Кроме того, создаваемая техническая система пространствен- ной записи, передачи и воспроизведения звука должна быть эко- номически эффективной, практически реализуемой и устойчивой к изменению позиции слушателей. Попытки решить эти задачи продолжаются с начала XX века, полученные к настоящему мо- менту результаты кратко изложены в данной главе. 6.4.1. История создания систем «пространственного» звука На протяжении десятилетий усилия разработчиков были на- правлены на поиски средств записи и передачи максимально воз- можного числа каналов; на выбор оптимальной конфигурации громкоговорителей и микрофонов; на создание инфраструктуры, которая обеспечивает подготовку содержания звуковой информа- ции (музыкальной и речевой); на передачу ее средствами провод- ного и беспроводного вещания, звукозаписи, мультимедиа и др.;
Принципы построения систем звукозаписи 649 на отработку совместимых форматов записи и передачи для раз- личных систем кино, радио, телевидения, и т. д. Для того, чтобы понять определенные закономерности в разви- тии пространственных систем звукопередачи и способах их коди- рования, целесообразно кратко рассмотреть историю их развития [63, 64]. Первый период — начало развития: первые попыт- ки передачи пространственного звука можно отнести к 1881 году, когда Клеман Адер (Clement Ader) установил серию микрофонов на сцене Парижской оперы и сигналы от них подал по проводам к головным телефонам в некоторые комнаты ближайшего отеля. Слушатели впервые могли слышать пространственный звук, что и было первым шагом к бинауральной стереофонии. Эти эксперимен- ты не вызвали большого интереса, и только в 1915 году появился патент Е. Амета (Е. Amet), в котором описывалась система про- странственного звуковоспроизведения через несколько громкогово- рителей, расположенных на сцене и в зале. Запись была монофо- ническая, но предлагался некоторый способ панорамирования звука через эти громкоговорители. В 30-е годы, когда окончатель- но была сформирована техническая инфраструктура моносистем передачи звука, в лаборатории Bell Labs начались интенсивные работы по совершенствованию систем пространственной звукопе- редачи, материально и морально поддержанные знаменитым ди- рижером Леопольдом Стоковским. В этот период произошло важное событие: 14 декабря 1931 года английский изобретатель Алан Блюмлайн (Alan Blumlein) по- лучил патент № 394325, который содержал более 70 пунктов, прак- тически на все элементы стереофонической системы передачи звука. В нем было указано: — требуемая микрофонная техника, в частности, использование для записи двух микрофонов с характеристиками направленности в виде восьмерки, расположенных в одной точке (т. е. разновид- ность современной системы XY, которая сейчас называется систе- ма Блюмлайна) и суммарно-разностной системы MS; — система записи стереозвука на разные стороны одной дорож- ки на диске, расположенные под углами 45° (стереотехника 45/45). Этот способ записи еще несколько раз потом «изобретался», пока не стал широко применяться в промышленном производстве; — система стереорадиовещания, в частности использование AM и ЧМ с одной несущей для передачи двух звуковых каналов; — суммарно-разностное матрицирование для совместимости с моносистемой. Кроме этих, в патенте содержались и многие другие предложе- ния, которые примерно на двадцать лет опережали время и не были восприняты современниками. Работы Блюмлайна долгое
650 Глава 6 время оставались неизвестными, в то время как работы в BeII Labs активно развивались и широко демонстрировались. В 1933 году Г. Флетчер и другие сотрудники этой лаборатории, пытаясь расширить зону стереоэффекта, добавили третий громко- говоритель в центре. Они продемонстрировали запись и провод- ную передачу звука по такой системе из Национальной Академии наук в зал Конституции в Вашингтоне, и эта демонстрация произ- вела должное впечатление на слушателей. В том же году были вы- полнены первые бинауральные записи на «искусственной голове» (см. раздел 6.2) и продемонстрированы в Чикагском выставочном центре. В 1936 году была предложена Philips-Miller система для за- писи двухканального звука на специальной дорожке кинопленки, система была способна записывать стереозвук достаточно вы- сокого качества. Решающим для пространственного звука был 1940 год: в этом году Г. Флетчер и Л. Стоковский продемонстри- ровали в концертном зале Карнеги-Холл фильм с новой трехка- нальной системой записи звука. Звуковые дорожки записывались оптическим способом на три трека киноленты, четвертый трек ис- пользовался для записи контрольных сигналов. В системе был применен широкополосный шумоподавитель, что позволяло пере- давать широкий динамический диапазон. В результате их работы была создана первая система пространственного звучания для кино, получившая название «Fantasound». В 1942 году на герман- ском радио в Берлине впервые была продемонстрирована только что созданная система магнитной стереозаписи, которая послужи- ла основой дальнейшего развития стереофонии. Второй период — расцвет стереозвука: в 50-е годы стереозвук окончательно пришел в аудиотехнику. Передним краем использования пространственного звука по-прежнему было кино. В 1952 году была впервые продемонстрирована новая система «Синерама», использующая семь звуковых треков, из них один контрольный. В системе были применены пять экранных громко- говорителей и большая фуппа громкоговорителей, распределенных в зале, на которые могли подаваться комбинации сигналов из раз- ных каналов. Система создавала различные пространственные звуковые эффекты при демонстрации кинофильмов, но в силу своей дороговизны была вытеснена более дешевой системой Cinemascope, которая использовала четыре звуковых трека для левого, правого, центрального громкоговорителя плюс один моно- канал. Эта система использовалась в нескольких фильмах — в ос- новном, правда для создания отдельных эффектов, например про- лета самолетов и др. Понадобилось еще два десятилетия, чтобы в кино пришел полноценный пространственный звук. В этот же период стереозвук начал активно внедряться в быто- вую технику: в 1961 году началось стереорадиовещание, впервые продемонстрированное фирмой WEFM в Чикаго. В 1963 году фир-
Принципы построения систем звукозаписи 651 ма Philips выпустила компакт-кассету, что создало техническую возможность для разработки многодорожечного формата магнит- ной записи. Применение с 1969 года системы шумоподавления фирмы Dolby (В-тип) позволило значительно улучшить качество магнитной записи. Исследования слуховой локализации и механизмов панорами- рования стереообраза привели к ряду новых результатов: исполь- зованию отдельных низкочастотных блоков subwoofers (1959 г.), созданию бифонических процессоров для подавления перекрест- ных связей в бинауральной стереофонии (1963 г.) и др. В 1970-е годы началось внедрение квадрофонии, использующей передачу звуковой информации по четырем каналам. Одной из первых систем была матричная квадрофоническая система, пред- ложенная Р. Шайбером. На основе его идей были созданы такие матричные системы как SQ компании CBS и QS компании Sansui. Кроме того была предложена система фирмы Electro-Voice, в ко- торой использовались четыре громкоговорителя — два передних и два тыловых, а также система Окамото и Купера 1971 года, где ис- пользовалась другая конфигурация: центральный, левый, правый громкоговорители и один моноканал для заднего громкоговорите- ля. За этот период были созданы декодеры, отработана техноло- гия квадрозаписи на диски (система RCA/JVC CD-4), был предло- жен формат квадрозаписи на кассеты, появились в продаже коммерческие квадрофонические записи и т. д. Однако система квадрофонии оказалась экономически неэффективной для быто- вой техники и не нашла дальнейшего применения. Особое место в это время заняла система пространственного звука «Ambisonics», изобретенная М. Герценом и др. В 1976 году лаборатория Dolby разработала специальную ап- паратуру кодирования и декодирования для четырехканальной матричной системы Dolby Stereo для кино, при этом на тыловые громкоговорители подавался один моносигнал. Система была усовершенствована в 1978 году в этой же лаборатории за счет введения дополнительных фазовых сдвигов для тыловых кана- лов. В 1983 году фирма Dolby предложила новый алгоритм Pro- Logic, использующий динамическую систему матрицирования. Успешная демонстрация систем пространственного звука при создании кинофильмов подтолкнула развитие домашних систем. Уже с 1982 года системы Dolby Surround начали использовать- ся в домашних системах звуковоспроизведения, получивших на- звание «домашний кинотеатр». Третий период — цифровой звук и системы Surround Sound: внедрение цифрового звука, которое было, по существу, ре- волюцией в аудиотехнике, началось в 70-е годы. Впервые на кон- грессе AES в 1976 году в Нью-Йорке были продемонстрированы цифровые записи на рекордере фирмы Hewlett Packard. В 1970 году
652 Глава 6 была создана первая цифровая линия задержки Lexicon Delta — T 101. В 1975 году фирма EMT разработала первый цифровой ре- вербератор, а в 1981-м появился лазерный компакт-диск (см. раз- дел 6.3.4). Дальнейшим шагом вперед по отношению к используемой в то время четырехканальной матричной системе фирмы Dolby была предложенная фирмой Lucasfilm пространственная система с двумя дополнительными тыловыми громкоговорителями и одним низкочастотным блоком. Эта система в 1991 году была внесена в стандарт ITU-R Rec. BS 775-1. В 1993 году фирма Sony ввела новую 7.1-канальную систему SDDS, где два дополнительных канала использовались для пяти экранных громкоговорителей. В этом же году фирма DTS показа- ла свою систему пространственного звучания, которая к настояще- му времени может обеспечивать передачу до восьми звуковых ка- налов с диапазоном скоростей от 32 Кбит/с до 4,096 Мбит/с. В 1993 году цифровая система 5.1-канального пространственно- го звука была выбрана для телевидения высокой четкости (HDTV), в ней начал использоваться кодер ATSC Dolby Digital (АС-3). Этот же кодер был выбран в 1997 году для обеспечения звука на DVD-Video (с DTS-кодером как альтернативой), а в 1999-м для DVD-Audio с очень высоким качеством пространственного звука. В настоящее время формат 5.1 принят для пространственных зву- ковых систем в DVD, HDTV, кино и Интернете (хотя появляются предложения о введении SDDS 7.1-формата, различных систем с тремя или четырьмя тыловыми громкоговорителями, IMAX-ка- нальной конфигурации и новой системы с 10.2 каналами). Были сделаны попытки создания систем с использованием дополнитель- ных каналов для вертикальных потолочных громкоговорителей, с увеличенным числом боковых и экранных громкоговорителей и т. д. Однако обычный стереоформат продолжает еще активно использоваться в аудиокассетах и радиовещании. Попытки извлечь пространственную информацию из стереозвука с помощью специ- альных пространственных синтезаторов были предприняты в ряде систем: Dolby Pro-Logic II, DTS Neo 6, Lexicon Logic 7 и др. Факти- чески эти системы являются своего рода мостом между стереоси- стемами и 5.1 дискретными системами. К настоящему времени для передачи пространственного звука предлагается много различных способов: цифровые простран- ственные системы (Surround Sound), системы типа Ambiophonic Ambisonics, Wave Field Synthesis и др. Что касается будущего пространственных систем, то ближайшая задача, требующая своего решения, — это расширение зоны сте- реоэффекта: современные системы формата 5.1 обеспечивают до- статочно хороший пространственный эффект для центральной зоны расположения слушателей. Для боковых зон происходит
Принципы построения систем звукозаписи 653 расщепление восприятия на отдельные каналы. С увеличением числа каналов зона пространственного эффекта может быть расши- рена, но вопрос состоит в том, какое количество каналов является оптимальным. Современные средства передачи звуковой информа- ции могут поддерживать большое число каналов: например, для от- резка музыкального сигнала 60 мин и скорости 32 Кбит/канал стан- дарт DVD может обеспечить 400 каналов. Д. Блауерт показал [66], что для формирования пространственного впечатления примерно двух десятков каналов вполне достаточно. Однако работать в реальном времени с большим количеством каналов звукорежиссе- ру будет практически невозможно, поэтому вопрос должен стоять следующим образом: как из ограниченного числа передающих ка- налов автоматически восстановить оптимальное число воспроиз- водящих каналов. Это задача будущих систем пространственной звукопередачи. Проблема состоит также и в том, как воспроизве- сти большое число каналов с помощью громкоговорителей, разме- щенных в многочисленных точках пространства: на потолке, боко- вых стенах и т. д. Если общую проблему дальнейшего развития пространствен- ных систем ставить таким образом, чтобы с помощью дискретно- го числа каналов передать информацию о непрерывном распре- делении звукового поля в первичном трехмерном пространстве, то такую задачу практически решить невозможно. Возможно, техника пойдет по пути, указанному в докладе Д. Блауерта на 113-м кон- грессе AES: учитывая, что человек обладает всего двумя прием- никами информации и с их помощью воспринимает простран- ственный звуковой мир, надо передавать не информацию о звуковом поле в каждой точке трехмерного звукового простран- ства, а психоакустическую информацию, которая поступает по двум каналам в слуховую систему, извлекающую из этой информа- ции наиболее значимые признаки, определяющие пространствен- ное восприятие звука. Для этого необходимо построить компью- терную модель слуховой обработки сигналов, с помощью которой установить эти значимые признаки и организовать их передачу по каналам связи. Именно этими вопросами и занимается в настоя- щее время Институт коммуникационной акустики, возглавляемый профессором Д. Блауертом. 6.4.2. Общая структура систем пространственной звукопередачи и звуковоспроизведения Существующее многообразие пространственных систем звуко- передачи можно условно представить в виде следующей структур- ной схемы [65] (рис. 6.4.1): N1 — число входных каналов, по кото- рым звуковой сигнал поступает в микшерный пульт от внешних источников (от микрофонов, магнитофонов, проигрывателей и др.);
654 Глава 6 lo- 2о- Зо- 4о- I _r^rPl N1O Тракт звукозаписи Тракт передачи Тракт воспроизведения Рис. 6.4.1. Принцип построения систем пространственного звука N2 — число выходных каналов из микшерного пульта, по которым сигнал поступает в кодирующее устройство; N3 — число каналов передачи; N4 — число каналов звуковоспроизведения после деко- дирования. Системы пространственной звукопередачи могут быть класси- фицированы: по числу каналов звукопередачи; по выбору системы микрофонов; по способу кодирования многоканальных сигналов в заданное число каналов передачи; по способу декодирования и способу воспроизведения, а также и по другим критериям. Из пространственных систем, разработанных на разных этапах их развития, наибольшее распространение получили: — монофоническая система (N1,1,1,1,) (рис. 6.4.1), в которой все многообразие сигналов, записанных различными микрофона- ми, на микшерском пульте сводится в один канал, передается по одному каналу и воспроизводится через один громкоговоритель во вторичном помещении. При такой системе звукопередачи ощуще- ние пространственности первичного помещения теряется, звук исходит из одной точки. При этом полностью передать естествен- ность тембров инструментов и голоса также оказывается не- возможным. Были попытки улучшить эту систему введением дополнительных громкоговорителей при воспроизведении (ква- зистереофония), но принципиально это не улучшило ситуации. Однако в силу своей простоты для технической реализации этот способ звукопередачи широко использовался в течении нескольких десятилетий (и продолжает использоваться в отечественном теле- видении и радиовещании до сих пор); — стереофоническая система (N1,2,2,2) (рис. 6.4.2а) — ис- ходное множество первичных сигналов с (N1) группируется в два канала передачи — левый (Л) и правый (П). Для этого исполь- зуются различные системы микрофонов (см. разд. 6.3.1) и пано- рамно-кодирующие устройства на микшерном пульте. Сущность стереоэффекта заключается в том, что когда на левый и правый слуховые каналы слушателя поступают одинаковые сигналы от ле- вого и правого громкоговорителя, возникает ощущение «кажущего-
Принципы построения систем звукозаписи 655 Тракт _ звукозаписи передачи Тракт воспроизведения б Рис. 6.4.2. Стереофоническая передача и зона стереоэффекта ся (мнимого) звукового образа», расположенного в центре. Выбирая различные сочетания амплитуд и фаз при сложении первичных сигналов, можно управлять расположением звукового образа в плоскости расположения громкоговорителей при воспроизведе- нии. Совокупность всех кажущихся звуковых источников, разли- чающихся по месту в пространстве, образует стереопанораму. Зона расположения слушателей, ощущающих эту панораму («стереозона»), ограничена по размерам. Выход за пределы этой зоны ухудшает восприятие стереопанорамы (рис. 6.4.26). Переход на стереосистемы существенно улучшил качество воспро- изведения звука [14, 15, 16, 65], появилось ощущение простран- ственности, улучшилась правильность передачи тембров, прозрач- ность звучания инструментов и т. д. Дальнейшие шаги по улучшению пространственной звукопере- дачи привели к созданию квадрофонических систем с четырьмя каналами передачи (N1, 4, 4, 4), которые оказались экономически неэффективными. Были предложены различные варианты стерео- амбиофонических систем и др. [65]. Однако наиболее перспектив- ными представляются в настоящее время две системы — бинау- ральная и матричная: — бинауральная стереосистема (2,2,2,2) (рис. 6.4.3) — за- пись сигналов производится с помощью микрофонной системы «искусственная голова» (см. раздел 6.3.1), при этом сигналы, попадающие на микрофоны, уже полностью проходят обработку Рис. 6.4.3. Бинауральная стереосистема при воспроизведении через громкоговорители (H., к — передаточные функции, описывающие перекрестные связи) G' Г H' Tp2 L- H * Гр,
656 Глава 6 At At КФ, КФ, КФ, КФ, ДГр2 Рис. 6.4.4. Схема бифонического процессора для подавления перекрестных связей (КФп — корректирующие фильтры, At — линии задержки) на ушных раковинах и голове (см. гл. 3), после чего передаются по двум каналам передачи и воспроизводятся через стереотеле- фоны. Возникающие при этом у слушателя ощущения достаточ- но реалистично передают пространственность звучания. Начиная с первых попыток использования бинауральной стереофонии в 30-е годы предпринимались поиски способов передачи бинау- ральных сигналов через громкоговорители. Но при этом наличие перекрестных связей и дополнительных отражений во вторичном помещении разрушает бинауральный стереоэффект. За по- следние годы созданы цифровые бифонические процессоры (рис. 6.4.4), которые обеспечивают подавление перекрестных связей (для ограниченной зоны); достигнут прогресс в расшире- нии зоны прослушивания, отслеживании поворотов головы слуша- теля и т. д. Кроме того, на первичном конце начали применять- ся бинауральные процессоры, которые из множества сигналов, записанных обычными микрофонами, формируют два бинаураль- ных сигнала за счет «свертки» их с передаточными функциями правого и левого уха (см. гл. 5); Микшерный пульт I X1(OH^ X2(t)3-ll X3(I) x/t) xN(t> N1 Процессорная обработка ~~ AA А' N2 Тракт звукозаписи N3= 2 Тракт I передачи Л]'Ю 1' , 3 J Кодеры I 2I > Декоде ► п{ (t) \ 1 в -2] гр2 <|Грп N4 Тракт воспроизведения Рис. 6.4.5. Структура матричных систем звукопередачи
Принципы построения систем звукозаписи 657 Левый l+r! Центральный r Правый l + r фнч Низкочастотный блок l-r Левый тыловой Правый тыловой Рис. 6.4.6 Количество громкоговорителей по системе Dolby Surround — матричные стереофони- ческие системы — принцип ра- боты таких систем заключается в следующем (рис. 6.4.5 ): из мно- жества сигналов, записанных на первичном конце, формируется на выходе микшерного пульта опре- деленное количество каналов N2, которые далее кодируются по оп- ределенному закону с помощью специального кодера в два кана- ла, передаются по двум каналам и затем декодируются на при- емном конце по определенному алгоритму с помощью декодера в определенное количество каналов, например в шесть (систе- ма 5.1— рис. 6.4.6) или восемь (система 7.1), и т. д. Как уже было сказано выше, ведущую позицию в разработке таких систем заняла лаборатория Dolby (США). В России также были выполнены разработки звуковых систем такого типа «Супер- фон-35» и «АВС-стерео»; — система Dolby Surround использует матричный кодер, кото- рый по определенному алгоритму кодирует четырехканальный звук в два канала передачи. Кодированный программный материал полностью совместим с обычными стерео- и моносистемами зву- копередачи и звуковоспроизведения. Структура кодера этой систе- мы показана на рис. 6.4.7. На вход кодера поступают четыре сиг- нала, сформированные в микшерном пульте: левый (L), правый (R), центральный (С) и один сигнал окружения (S). Фронтальные каналы L, R, С содержат в основном информацию о прямом звуке (они формируются от микрофонов, находящихся вблизи исполнителей); тыловой сигнал S содержит, главным образом, информацию о реверберирующем поле в помещении (записан микрофонами, находящимися в дальнем поле). Левый (L) и пра- вый (R) сигналы поступают через сумматоры (S1, где i = 1, 2, 3, 4) прямо в левый и правый каналы системы передачи (звукоза- L- C- R- J-3 дБ -ЗдБ- ПФ Компандер Dolby-B ШФ . S3 +L' +90° -90° S4 R' Рис. 6.4.7. Структура кодера Dolby Surround
658 Глава 6 L'- R'- БКУ, —► R' —► БКУЛ M Ф ЛЗ D ПФ БКУ2 pys ► R' Экспандер системы Dolby-B Рис. 6.4.8. Структура декодера Dolby Surround писи, радиовещания, телевидения и др.). Центральный сигнал (С), ослабленный по уровню на 3 дБ, добавляется в правый и ле- вый канал. Сигнал окружения (S) также ослабляется по уровню на -3 дБ, обрабатывается фильтром с полосой частот 100-7000 Гц (ПФ), после чего поступает на компрессор системы шумоподавле- ния Dolby-B [65, 67] и фазовращатель ШФ, где он сдвигается по фазе, после чего добавляется в правый и левый канал. Сформи- рованный таким образом аналоговый стереофонический сигнал пе- редается с помощью различных систем звукопередачи и затем де- кодируется на приемном конце. Декодер на вторичном конце выполняет следующие функции (рис. 6.4.8): сигналы левого и правого каналов поступают через блоки контроля баланса уровней (БКУ) на левый и правый фрон- тальные громкоговорители. Сигнал окружения S выделяется на вы- читающем устройстве M и подается на фильтр Ф, линию задерж- ки ЛЗ и полосовой фильтр, который ограничивает сигнал по полосе 100-7000 Гц, затем на экспандер из системы шумоподавления Dolby-B и через блоки контроля и регуляторы уровня на передние и тыловой громкоговоритель (БКУ, РУ). В качестве тылового источ- ника может использоваться один громкоговоритель, а могут два и более, но в любом случае на них будет подаваться один монофо- нический сигнал с полосой 100-7000 Гц. Центральный канал С не восстанавливается, он воспринимается как «мнимый источник» между левым и правым громкоговорителем; — система Dolby Pro-Logic является следующим этапом раз- вития пространственных систем. В ней используется более усо- вершенствованная модель активного адаптивного декодера с дву- мя усилителями, в котором обеспечивается формирование реального сигнала для центрального канала, перераспределение мощности выходных сигналов с целью точной передачи домини- рующего направления и т. д. Все эти системы работают с анало- говыми сигналами; — Dolby Digital — цифровая система, использующая техноло- гию АС-3 для кодирования цифрового потока [15, 16, 67, 68, 69].
Принципы построения систем звукозаписи 659 1/2 В Система позволяет в едином циф- ровом потоке передавать инфор- мацию для шести каналов воспро- изведения: левого (L), правого (R), центрального (С), двух тыловых (стерео — LS, RS) и одного низко- частотного (LFE). Стандартизован- ный вариант расстановки громко- говорителей [70] показан на рис. 6.4.9. Система осуществляет пере- дачу сигналов с диапазоном частот 20-20000 Гц (для низкочастотного блока 20-120 Гц), со скоростью до 640 кбит/с, с использованием новых алгоритмов перцептуально- го кодирования для сжатия сигна- лов (без потери качества) и для более эффективного шумоподав- ления. Данный формат достаточно универсален и используется в теле- видении, кино, радиовещании, в домашних аудиовидеокомплексах и системах мультимедиа. В последние годы для профессионального применения была разработана расширенная система Dolby Digital EX1 где преду- смотрена раздельная передача информации для семи каналов (трех фронтальных и трех тыловых). Кроме этого, продолжают развиваться и другие форматы передачи пространственного звука для профессиональных и бытовых систем DTS, SDDS и др. [67- 69]. Рис. 6.4.9. Многоканальная конфигурация громкоговорителей по стандарту ITU-RB S. 1116
660 Глава 6 Контрольные вопросы 1. Что называется трактом формирования звуковых программ, звукопе- редачи и звуковоспроизведения? 2. Показать основные этапы развития систем звукозаписи. 3. В чем заключаются преимущества цифровой обработки звуковых сигналов? 4. Какие операции необходимо выполнить для перехода от аналогово- го к цифровому сигналу? 5. Что такое частота дискретизации, в чем заключается теорема Котель- никова — Найквиста? 6. Описать принцип работы АЦП. 7. В чем заключается операция квантования и кодирования? Чему рав- на мощность шума квантования? 8. Что такое число разрядов (бит)? Показать связь числа разрядов с числом уровней квантования. 9. Показать связь числа разрядов с величиной динамического диапазо- на сигнала. 10. Что такое БПФ (FFT)? 11. Объяснить состав и общую структуру микшерного пульта, основные виды операций в нем. 12. Показать основные виды процессорной обработки сигналов в про- цессе звукозаписи. 13. Сформулировать основные требования к контрольным агрегатам. 14. Описать основные элементы конструкции контрольных агрегатов и их назначение (излучатели, корпуса, фильтры и др.) 15. Привести методы измерений и требования к электроакустическим параметрам контрольных агрегатов. 16. Показать особенности конструкции контрольных агрегатов ведущих фирм (Tannoy, JBL, Genelec и др.). 17. Объяснить принципы работы лазерных проигрывателей. 18. Объяснить принципы устройства цифровых магнитофонов. 19. Описать общую структуру студии звукозаписи. 20. Привести методы измерений и требования к электроакустическим параметрам микрофонов. 21. Дать классификацию микрофонов по видам преобразования и харак- теристикам направленности. 22. Описать современные стереосистемы микрофонов. 23. Привести историю развития пространственных звуковых систем. 24. Дать классификацию современных пространственных звуковых си- стем и показать их отличия (стерео, бинауральные, матричные стерео и др.)
Принципы построения систем звукозаписи 661 Список литературы 1. Hall D. Musical Acoustics: An Introduction. Belmont, California: Wadsworth Publishing Company, 1980. 2. Rossing T., Moore B., Wheeler P. The Science of Sound. 3rd ed. San- Francisco: Addison-Wesley, 2002. 3. Musical Acoustics, part 1, 2 I Ed. by C. Hutchins. N. Y. : Wiley & Sons, 1975-1976. 4. Olson H. Music, Physics and Engineering. N. Y.: Dover Publ. Inc, 1967. 5. Benade A. Fundamentals of Musical Acoustics. London: Oxford University Press, 1995. 6. Backus J. The Acoustical Foundation of Music. N. Y.: W. W. Norton & Company, 1969. 7. Strong W., Plitnik G. Music, Speech, High-Fidelity. N. Y: Soundprint, 1983. 8. Eagle J. Music, sound and technology. N. Y.: Van Nostrand Reinhold, 1995. 9. Watkinson J. The Art of Sound Reproduction. Oxford: Focal Press, 1998. 10. Brice R. Music Engineering. Oxford: Newnes, 2001. 11. Streicher R. and Everest E The New Stereo Soundbook. Pasadena: Audio Engineering Associates, 1998. 12. Rumsey F. Sound and Recording. 4thed. Oxford: Focal Press, 2002. 13. Eagle J. Handbook of Recording Engineering. N. Y: VNR, 1992. 14. Меерзон Б. Я. Акустические основы звукорежиссуры. M.: Редакция 625, 1996. 15. Звуковое вещание. Справочник / Под ред. Ю. А. Ковалгина. M.: Ра- дио и связь, 1993. 16. Радиовещание и электроакустика. Учебник / Под ред. Ю. А. Ковалгина. M.: Радио и связь, 1998. 17. Encyclopedia Britannica Online, www.britannica.com 18. Никамин В. А. Цифровая звукозапись. СПб.: Наука и техника, 2002. 19. Никамин В. А. Форматы цифровой звукозаписи. СПб.: Эдби, 1998. 20. Очерки по истории развития звукозаписи. Шоу-мастер. 2001. № 3- 4; 2002. № 1-4. http://www.show-master.ru/articles/index.shtm 21. Handbook for Sound Engineers / Ed. G. Ballou. N. Y: SAMS, 1991. 22. Римский-Корсаков А. В. Электроакустика. M.: Связь, 1973. 23. Акустика. Справочник (Ефимов А. П., Никонов М. А., Сапожков М. А. и др.). M.: Радио и связь, 1986. 24. Гольденберг Л. М. и др. Цифровая обработка сигналов. M.: Радио и связь, 1985. 25. Применение цифровой обработки сигналов / Под ред. Э. Оппенгей- ма. M.: Мир, 1980. 26. Солонина А. И. и др. Основы цифровой обработки сигналов. Курс лекций. СПб.: БХВ-Петербург, 2003. 27. Физика. Большой энциклопедический словарь. M.: Научное издатель- ство «БРЭ», 1999.
662 Глава 6 28. Баскаков С И. Радиотехнические цепи и сигналы. M.: Высшая шко- ла, 1983. 29. Hearing / Ed. by В. Moore В. London: Academic Press, 1995. 30. Никамин В. А. Парадоксы цифрового звучания. СПб.: Лань, 1998. 31. Выходец А. В., Гитлиц М. В., Ковалгин Ю. А. и др. Радиовещание и электроакустика. Учебник. M.: Радио и связь, 1989. 32. Вроблевский А. А. и др. Физические основы магнитной звукозаписи. M.: Энергия, 1970. 33. http://www.recording-history.org/HTML/start.html 34. История механической записи. Музей Радио им. А. С. Попова, http:// radiomuseum.ur.ru/index9.htm 35. Мартинак Ф. Модули микшерного пульта. M.: ДМК, 2002. 36. Бьюик П. Живой звук. PA для концертирующих музыкантов / Пер. с англ. M.: Шоу-мастер, 1998. 37. Ньюэлл Ф. Project-студии. M.: Шоу-Мастер, 2002. 38. Birkner Ch. Practical Recording 5.1 London: SMT, 2004. 39. Howard D., Angus J. Acoustics and Psychoacoustics. Oxford: Focal- Press, 2001. 40. Алдошина И. А. 114-я конвенция AES в Амстердаме. Научные ре- зультаты / Звукорежиссер. 2003. № 5. С. 36-40. 41. Арзуманов С. Секреты гитарного звука. M.: изд.-во Смолина, 2003. 42. Чернецкий М. Психоакустические процессоры — что это такое? / Звукорежиссер. 1999. № 8. С. AA-Al. 43. Eagle J. The Microphone Book. Oxford: Focal Press, 2001. 44. Алдошина И. А. Акустическая метрология. Ч. 5 / Install-Pro. 2002. № 3. С. 82-89. 45. Бытовая электроакустическая аппаратура. Справочник / Под ред. И. А. Алдошиной. M.: КИБК, 1996. 46. Манъковский В. С. Основы звукооператорской работы. M.: Искусст- во, 1984. 47. Microphones Universities, http://www.dpamicrophones.com 48. http://www.neumann.com 49. Сидоров И. К, Димитров А. А. Микрофоны и телефоны. Справоч- ник. M.: Радио и связь, 1993. 50. Нисбетт А. Звуковая студия. Техника и методы использования. M.: IN/OUT, 1996. 51. Newell P. Studio Monitoring Design. UK.: Focal Press, 1995. 52. Алдошина И. А. Электроакустические измерения и оценка качества звучания. Учебное пособие. СПб.: ГУТ им. Бонч-Бруевича, 1998. 53. Алдошина И. А. Акустические системы и громкоговорители. Учебное пособие. СПб.: ГУТ, 2000. 54. Алдошина И. А. Нетрадиционные излучатели. Ч 1-8 / Аудиомагазин. 2000. № 5; 2001. № 1, 2, 3, 5; 2002. № 1, 3, 6. 55. Eargle J. Loudspeakers Handbook. N. Y.: Chapman & Hall, 1997. 56. Geddes E. Audio Transducers. N. Y.: Addison-Wesley, 2002.
Принципы построения систем звукозаписи 663 57. Colloms М. High Performance Loudspeakers. N. Y.: J. Wiley & Sons, 1997. 58. Алдошина И. А. Электродинамические громкоговорители. M.: Радио и связь, 1989. 59. Алдошина И. А., Войшвилло А. Г. Высококачественные акустические системы. M.: Радио и связь, 1985. 60. Dickanson V. The Loudspeaker Design Cookbook. Peterborough.: Audio Amateur Press, 1991. 61. http://users.pandora.be/educypedia/electronics/loudspeakers.htm 62. Voishvillo E. and others. Multitone Testing of Sound System Components I JAES, v. 50, n. 1/2, p. 66, 2002. 63. Davis M History of Spatial coding. JAES, v. 51, n. 6, 2003. June. 64. Алдошина И. А. История пространственного звука I Шоу-мастер. 2003. № 3. С. 74-82. 65. Ковалгин Ю. А. Стереофония. M.: Радио и связь, 1989. 66. Blauert J. Spatial Hearing. Cambridge, MA.: MIT Press, 1983. 67. Никамин В. А. Системы пространственного звучания. СПб.: Корона Принт, 2004. 68. Bosi М, Goldberg R. Introduction to Digital Audio Coding and Standarts. Boston.: Kluwer Academic Publishers, 2003. 69. http://www.dolby.com 70. Алдошина И. А. Многоканальные пространственные системы. Реко- мендации международных стандартов / Шоу-мастер. 2003. № 1. С. 86-89.
Глава 7. ЭЛЕКТРОМУЗЫКАЛЬНЫЕ ИНСТРУМЕНТЫ И КОМПЬЮТЕРНЫЕ МУЗЫКАЛЬНЫЕ ТЕХНОЛОГИИ Как уже было отмечено в главе 1, основные задачи музыкаль- ной акустики включают в себя изучение процессов создания, распространения и восприятия звуков, используемых в музыке [1]. До начала XX века основными источниками естественных музы- кальных звуков были музыкальные инструменты и голос. В начале XX века появились новые инструменты для создания звука, к числу которых относятся электромузыкальные инструмен- ты и звуковоспроизводящая электроакустическая аппаратура (аку- стические системы, усилители, проигрыватели и др.— см. гл. 6). К концу века к ним добавились новые технические средства на основе электронных и компьютерных музыкальных технологий. Таким образом, в настоящее время в качестве источников му- зыкальных звуков активно используются электромузыкальные и электронные инструменты, а также компьютеры, оснащенные со- ответствующими программами. Краткое рассмотрение принципов их работы является темой данной главы. (Подробное изучение этих вопросов для звукорежиссеров производит- ся в рамках специальных дисциплин в соответствии с образовательны- ми стандартами 051500, 053200, 053800 и предполагает создание отдель- ных учебников.) 7.1. ЭЛЕКТРОМУЗЫКАЛЬНЫЕ ИНСТРУМЕНТЫ. ПРИНЦИПЫ ЗВУКООБРАЗОВАНИЯ Как было показано в главе 4, классические музыкальные ин- струменты являются механоакустическими преобразователями, которые конвертируют энергию механических колебаний в акусти- ческое излучение. Основными элементами таких преобразовате- лей являются генераторы, вибраторы и резонаторы. Принципиальное отличие электромузыкальных инструментов заключается в том, что они представляют собой или механоэлек- троакустические преобразователи, или просто электроакустические
Электромузыкальные инструменты и компьютерные технологии 665 преобразователи. Первые преобразуют механическую энергию в электрическую, а затем в акустическую энергию излучения. Они также имеют генератор, устройство для передачи энергии колеблю- щемуся телу (вибратору), но при этом используют для усиления звука не упругие тела (резонаторы), а электрические устройства — усилители низкой частоты (УНЧ); кроме того, для излучения звука применяются громкоговорители (акустические системы). Вторые, электроакустические преобразователи непосредственно используют модуляцию электрических параметров сигналов для преобразования их в энергию акустических волн с помощью громкоговорителей. Электромузыкальные инструменты, созданные в основном в тече- ние XX века, можно классифицировать следующим образом [2-9]: — адаптеризованные инструменты, в которых механические колебания вибраторов (струн, тростей, брусков и др.), возбужда- емые обычным образом (ударом, щипком, смычком и т. д.), с помощью специальных звукоснимателей (адаптеров) преобра- зуются в электрические колебания, затем фильтруются, усилива- ются и воспроизводятся через громкоговорители. Это, например, электрогитары, электроскрипки, электропианино и др. Структурная схема такого типа инструмента показана на рис. 7.1.1.; — инструменты, которые воспроизводят звук электрическими или электронными средствами, но используют обычный интерфейс для исполнителя, например клавиатуру. Примером таких инстру- ментов может служить орган Хаммонда; — инструменты, которые применяют прямое преобразование электрической энергии в акустическую, но используют при этом не- обычный интерфейс для исполнителя, — например, терменвокс, волны Мартено и др.; — инструменты, которые генерируют звуки электронным спо- собом на основе различных алгоритмов (синтезаторы) или воспро- изводят заранее записанную в цифровом виде звуковую информа- цию (сэмплеры) совместно с управляющими устройствами (секвенсорами). Эти виды инструментов могут быть реализованы как аппаратным, так и программным способом; — инструменты, которые производят чтение закодированной информации о свойствах музыкальных звуков и воспроизводят их фильтр \ Л \ механический звуко- W усилитель громко- вибратор W сниматель W ► говоритель Рис. 7.1.1. Структурная схема электромеханического инструмента
666 Глава 7 через соответствующие электронные устройства, — например, со- временные MIDI-синтезаторы [9]. Ниже будет кратко рассмотрена история создания и конструкция электромузыкальных инструментов на примерах некоторых из них: электрогитары, Родес-пиано, органа Хаммонда, терменвокса, — а также дана краткая информация о принципах работы синтезато- ров, сэмплеров, секвенсоров и др. Более подробно с устройством как этих, так и других электромузыкальных инструментов можно оз- накомиться в литературе [1-21]. 7.1.1. История создания электромузыкальных инструментов Предшественниками электромузыкальных инструментов можно считать механические инструменты, история которых насчитывает не одно столетие. Очевидно, самые первые опыты применения электричества были реализованы еще в XVIII веке: в 1761 году француз Ж. Б. JIa Борд (La Borde) получил патент на электрический клавесин [4]. В 1837 го- ду К. Д. Пейдж (С. G. Page) из Массачусетса создал «электронный камертон». Важным событием было изобретение фонографа Т. Эдисоном (Т. Edison) и Э. Берлинером (Е. Berliner) в 1877-1894 годах, так как это показало принципиальную возможность сохранения и воспро- изведения музыкальных звуков и послужило базой для развития звукозаписи. Одной из самых первых попыток использования электрическо- го тока для создания музыкальных звуков была «поющая дуга» («Singing Агс»), изобретенная в 1899 году английским физиком У. Дудделом (W. Duddell). Устройство этого своеобразного «инстру- мента» показано на схеме (рис. 7.1.2) [5]. Как видно из этой схе- мы, прибор включал электрическую батарею (1), ток которой через контакты клавиатуры (2) заря- жал конденсатор (3). В опре- деленный момент времени на- пряжение на конденсаторе под действием заряда становилось достаточно высоким для того, чтобы образовать пробой (ис- кру) в разряднике (5), подклю- ченном параллельно конденса- тору. Это приводило к резкому импульсу разрядного тока в первичной обмотке (4) транс- форматора с малым числом витков. С первичной обмоткой была связана вторичная об-
Электромузыкальные инструменты и компьютерные технологии 667 мотка (6), имеющая очень большое число витков из тонкого про- вода в хорошей изоляции. При протекании в первичной обмотке трансформатора разрядного импульса во вторичной обмотке воз- никало высокое напряжение, которое вызывало коронный разряд («дугу») на острие электрода (7), соединенного с верхним концом вторичной обмотки. Этот разряд создавал ясно слышимый щел- чок, т. е. одиночный звуковой импульс. Если повторять этот им- пульс с определенной частотой (которая изменяется с помощью контактов клавиатуры), то можно получить тональный звук опре- деленной высоты. В таком инструменте было еще много недостат- ков: высота звука была неустойчива, громкость не поддавалась уп- равлению, тембр был слишком резким и т. д., но это был уже электромузыкальный инструмент. Следующим значительным этапом было создание в период с 1900 по 1906 год Тадеушем Кахиллом (Th. Cahill) электро- механического органа, получившего название «телармониум». Телармониум Тадеуша Кахилла представлял собой огромный комплекс (весом 200 тонн, длиной около 20 метров) и включал в себя множество генераторов электрического тока, роторы кото- рых вращались с разной скоростью (рис. 7.1.3а). Ротор каждой машины состоял из нескольких блоков в форме утолщенных дис- ков с разным количеством выступов (рис. 7.1.36). Частота гене- рируемого при этом тока была пропорциональна угловой скоро- сти вращения ротора и числу выступов на диске. Каждый из генераторов создавал звук определенной частоты. Шум, созда- ваемый множеством генераторов и приводящими их в действие электромоторами, был настолько сильным, что заставлял распо- лагать все это сооружение в специальном отдельном помещении. Переменные электрические сигналы разных частот пере- давались по проводам в дру- гое помещение, где распола- гался пульт с видоизмененной органной клавиатурой. Здесь сигналы перераспределялись через сложную систему пе- реключателей между клави- шами мануалов и педалями. Сила нажатия на клавишу преобразовывалась через сложную систему электро- механического преобразова- ния (с помощью двух катушек индуктивности) в пропор- циональное изменение на- пряжения выходного сигнала, а б Рис. 7.1.3. Орган Кахилла: а — общий вид генератора, диски ротора б
668 Глава 7 который затем через трансформатор подавался по телефонным линиям на телефоны. Инструмент работал по принципу аддитив- ного синтеза, когда для создания музыкального тона использо- валось сложение нескольких простых тонов с гармоническим отношением частот. Опытный образец «Телармониума» с 35 вра- щающимися цилиндрами был изготовлен в 1900 году. Публичные демонстрации инструмента в 1904 году позволили собрать день- ги, на которые Т. Кахиллу удалось построить еще один инструмент в 1906 году. Эта модель была технически более совершенной, в ней использовались динамомашины, механизм регулирования ско- рости которых обеспечивал более точное интонирование [4]. С точ- ки зрения исполнителя эта модель также была удобнее: интерфейс состоял из трех ручных клавиатур и одной ножной, набора педа- лей для изменения громкости, выключателей и регуляторов гром- кости для отдельных гармоник. Управлять инструментом должны были два человека — исполнитель и ассистент. Хотя в целом ин- струмент был слишком сложным, непрактичным, создавал много дополнительных призвуков и поэтому не получил дальнейшего раз- вития, его можно считать первым предшествеником современных синтезаторов. Идея использования вращающихся дисков для генерирования переменного электрического сигнала нашла свое применение во многих других работах, среди которых можно выделить два на- правления. Первое — использование фотоэлектрического способа возбуждения сигнала с помощью вращающихся дисков с нанесен- ными на их поверхности прорезями сложной формы. Принцип ра- боты этих устройств (фотоэлектрических звуковых генераторов) ос- нован на прерывании и модуляции светового потока с помощью таких вращающихся дисков. Проходящие через прорези световые потоки направлялись на фотоэлементы, в электрической цепи ко- торых и модулировался электрический ток. Высота звука изменя- лась в зависимости от скорости вращения, количества и формы прорезей на диске. Примером использования такой идеи может служить орган И. Еремеева, созданный в 1933-1935 годах в США, и его же инструмент «Синтроник» (1934), где изобретатель исполь- зовал закольцованные отрезки пленки с чередующимися засвечен- ными (светлыми) и незасвеченными (темными) полосами. Благода- ря перемещению этой фотопленки с определенной скоростью между источником света и фотоэлементом создавался электриче- ский сигнал определенной частоты [4, 5, 8]. В 1931-1936 годах был создан Radio Organ of a Trillion Tones, в котором также использо- валась техника вращения фотоэлектрических дисков и модуляция лучей света. В дальнейшем этот принцип получил название Polytone (А. Лести и Ф. Саммис, США) [6]. Второе направление, получившее развитие в инструментах, созданных последователями Т. Кахилла, использовало форми-
Электромузыкальные инструменты и компьютерные технологии 669 Рис. 7.1.4. Электромагнитный датчик и вращающийся металлический диск, используемые в органах Хаммонда рование электрического сигнала с помощью электромагнитных датчиков, состоящих из магнитного стержня и катушки индуктив- ности, в рабочем поле которых вращались стальные диски с равномерно распределенными по периметру зубцами (рис. 7.1.4). Создаваемые при этом флюктуации магнитного поля инду- цировали переменный электрический ток в катушке. Частота сиг- нала зависела от количества углублений и скорости вращения диска. Самым популярным электромузыкальным инструментом первой половины XX века, использующим этот принцип, стал электроорган, созданный инженером и изобретателем Лоуренсом Хаммондом (Lawrence Hammond), запатентованный в США в 1934 году. Орган Хаммонда имел большой коммерческий успех и производился в разных модификациях до 1974 года. Изобретение трехэлектродной электронной лампы ученым Ли де Форестом (Lee De Forest) в 1915 году послужило началом раз- вития ламповых усилителей и других видов звуковоспроизводящей аппаратуры. Это создало базу для разработки электрических органов, использующих ламповые генераторы и усилители, затем привело к появлению в 60-е годы электронных органов, исполь- зующих транзисторы и интегральные микросхемы, и, наконец, в 90-е годы — к созданию современных цифровых органов с MIDI- интерфейсом (подробнее об этом в разделе 7.1.4) [4-13, 19]. Следующее направление в создании электромузыкальных ин- струментов началось в 1915 году с создания инструмента Audion Piano, работающего на ламповых генераторах (Ли Де Форест, Франция, 1915). Идея использовать метод наложения высокоча- стотных колебаний, создаваемых гетеродинами (высокочастотны- ми генераторами), и последующего выделения разностного тона в звуковом диапазоне была применена в серии инструментов, созданных Л. Терменом в России (терменвокс, 1919; ритмикой, терпистон и др.), Й. Магером (J. Mager) в Германии (электрофон, 1921; сферафон, 1926), затем М. Мартено (М. Martenot) во Фран- ции, создавшим инструмент («волны Мартено», 1928), и Ф. Траут- вейном (R Trautwein ) в Германии («траутониум», 1929), а также ис- пользована в последующем развитии инструментов в России, работающих по этому и подобным принципам: неовиолены (1927), экводина (1931) В.А.Гурова, эмиритона (1935) А.А.Иванова, А. В. Римского-Корсакова и др. (см. раздел 7.1.5) [4-8, 13, 19].
670 Глава 7 Успехи в развитии техники звукозаписи, появление звукоснимате- лей и др. позволили приступить к развитию еще одного направле- ния — созданию адаптеризованных электромузыкальных инструмен- тов, в первую очередь электрогитар и электропианино. Серийное производство электрогитар началось на фирме Rickenbacker в 1932 году, в этот же период появилась гитары ES-150 фирмы Gibson. Первую цельнокорпусную (solid-body) гитару начала выпус- кать в 1938-м фирма Slingeriand. Подлинную революцию в произ- водстве таких инструментов произвел Лео Фендер (Leo Fender), разработав технологию их массового производства. В настоящее время электрогитары, в том числе оснащенные MIDI-звукоснима- телями, являются одними из самых распространенных инструмен- тов в массовой культуре (раздел 7.1.2). Кроме электрогитар, были созданы такие адаптеризованные струнные инструменты как скрип- ка, виолончель, контрабас и др. [7, 15, 16, 17, 19]. Большое распространение среди этой группы инструментов по- лучило электропианино. Первый инструмент под названием Rhodes Piano был изобретен в 1942 году американцем Гарольдом Родсом (Harold Rhodes). В 1959 году появилась первая серийная модель электромеханического фортепиано — Fender Rhodes Piano Bass. Затем были запущены в производство модели Suitcase и Stage Piano. В 1970 году появился новый инструмент The Stage Piano Mark I. C 1987 года производством Rhodes стала занимать- ся японская компания Roland; созданные ею модели, например Mark 60 и Mark 80, были исключительно электронными устройства- ми, имитирующими звук Rhodes. В настоящее время разработкой и выпуском цифровых роялей и пианино занимаются, кроме фир- мы Roland, такие фирмы как Yamaha, Casio, Kawai и др. (см. раз- дел 7.1.3) [7, 13, 19-23]. В 40-50-е годы была создана и усовершенствована техника магнитофонной записи (первоначально в Германии, затем в США), что послужило толчком для развития нового направления «конкрет- ной» музыки [26]. Это направление начало активно развиваться в 50-е годы П. Шеффером и др. в Париже на RTF Studio. Там про- бовали создавать с помощью магнитофонов музыкальные колла- жи, записывая реальные звуки, меняя скорость записи, направле- ние и т. д. К 1953 году была организована экспериментальная студия электронной музыки в Кельне (Г. Эймерт и К. Штокхаузен), где также проводились эксперименты по использованию различных электронных средств при создании музыки. В США в 1959 году О. Люнинг, В. Усачевский, М. Бабитт организовали в Принстонском университете Электронный музыкальный центр, объединивший большое количество композиторов, которые создавали новые му- зыкальные произведения, используя активное развитие электрон- ного оборудования, обеспечивающего создание и обработку звуков
Электромузыкальные инструменты и компьютерные технологии 671 (генераторы, фильтры, усилители, микрофоны, магнитофоны, микшерные пульты, громкоговорители и др.) [9, 10, 18-20]. В 70-е годы XX века началось развитие совершенно новых спо- собов создания музыки и речи на основе бурно развивающихся компьютерных технологий. Это привело к появлению новых элек- тронных музыкальных инструментов, основанных на цифровых компьютерных технологиях, к числу которых можно отнести синте- заторы, сэмплеры, секвенсоры и др. История их развития и прин- ципы устройства кратко рассмотрены в разделе 7.2. Кроме того, появилось огромное разнообразие программных продуктов, позво- ляющих реализовывать задачи синтеза музыкальных звуков, музы- кального редактирования, создания полифонических музыкальных композиций и т. д. (см. раздел 7.3.) [ 10, 13, 19-21, 39], что послу- жило базой для развития электронной музыки и значительно рас- ширило возможности обработки звука в процессе записи. 7.1.2, Электрогитара Среди адаптеризованных инструментов наибольшее распро- странение в XX веке получили электрогитары. Одним из первых изобретателей, который внес свой вклад в создание электрогита- ры, был Ллойд Лоар (Lloyd Loar), инженер фирмы Gibson Guitar Company, который в 1924 году разработал специальный электро- магнитный звукосниматель. Первая коммерческая модель электро- гитары, использовавшая такой звукосниматель, была выпущена фирмой Stromberg-Voisinet в 1928 году, причем в ней регистриро- вались вибрации деки, а не струн, — правда, полученный таким образом сигнал оказался слишком слабым. Поиски других путей усиления звука привели к созданию новой модели гитары, получив- шей название «Frying Рап», серийное производство которой на- чалось на фирме Rickenbacker под руководством Г. Бьючемпа (G. Beauchamp) и А. Рикенбакера (A. Rickenbacker) в 1932-м [3, 4, 17, 19, 20, 22]. В этот же период появились на рынке гитары ES-150 фирмы Gibson. Это были обычные акустические гитары, снабженные элек- тромагнитным звукоснимателем, который регистрировал колебания металлических струн. В этот же период несколько энтузиастов на- чали экспериментировать с новыми видами электрогитар, также используя звукосниматель под струнами, но изготавливая деку из цельного куска дерева. Одним из первых был известный гита- рист Лес Пол (Les Paul), получивший свой первый патент еще в 1928 году. Он создал такую гитару с названием «The Log». Пер- вая цельнокорпусная (solid-body) гитара (или «доска»), названная Songster, появилась на рынке в 1938 году. Ее выпустила фирма Slingeriand, специализировавшаяся на производстве обычных
672 Глава 7 гитар, банджо и др. В 1935-1936 годах цельнокорпусная гитара была создана русским изобретателем А. А. Ивановым [3, 4, 5], который показал ее возможности в ряде концертных программ. Принципиально новый этап в производстве таких инструментов открыл калифорнийский дизайнер и производитель музыкальных инструментов Лео Фендер (Leo Fender), разработав технологию их массового производства. В 1950 году он представил гитару Fender Broadcaster (переименованную в 1952-м в Telecaster ), которая была первой серийной моделью современной электрической гита- ры. Она имела исключительно простую конструкцию: только цели- ковый корпус и кленовый гриф, прикрепленный к нему четырьмя болтами. В течение 1950-х годов спектр моделей электрогитар не- уклонно расширялся. В 1954 году Фендер выпустил свою самую знаменитую модель — Stratocaster с тремя звукоснимателями. В 1958-м фирма Gibson выпустила первую полуакустическую мо- дель ES 335 и «цельнокорпусную» Les Paul Standard, а с 1963-го начала производство новых моделей Firebird. Твердотельные ги- тары не имели проблем с обратной связью, которая возникала в акустических гитарах при использовании микрофонов, и позво- ляли получить более громкий звук. Эти гитары прочно вошли в музыкальную культуру 50-60-х годов. Несколько выдающихся гитаристов того времени играли на гитарах такого типа (например, Чак Берри — на гитаре Gibson ES 350, Бадди Холли — на гитаре Fender Stratocaster); знаменитые ансамбли The Beatles, Rolling Stones и др. широко использовали электрогитары в своих компо- зициях. В конце XX века электрогитары начали использоваться в электронной и авангардной музыке, для них создавались специ- альные произведения, в частности такими известными композито- рами как П. Булез, R Герхард, К. Штокхаузен, П. Норгард, В. Лютославский, К. Пендерецкий, С. Слонимский и др. [4, 17, 22]. В настоящее время наиболее известными фирмами, выпускающи- ми электрогитары, являются Fender, Gibson, Ibanez, Jackson, В. Rich и др. Основные элементы конструкции электрогитары показаны на рис. 7.1.5. Кроме элементов, имеющихся у обычной гитары (корпус, гриф, ладовые пластины, струны, подставка, колковая механика), в ней используются установленные на корпусе звуко- сниматели, пассивные или активные (с усилителем), тембро- блоки; в некоторых типах сольных гитар на корпусе устанавлива- ются также специальные механические регуляторы (вибраторы) для изменения частоты колебаний струн и создания эффекта вибрато [15]. В зависимости от конструктивного исполнения корпуса совре- менные электрогитары разделяются на акустические (рис. 7.1.6а), полуакустические (рис. 7.1.66) и неакустические (рис. 7.1.6в) [15].
Электромузыкальные инструменты и компьютерные технологии 673 гриф- кнопка для крепления ремня металлический штырь, проходящий через гриф - фиксатор струн - порожек - лад звукосниматели корпус- регулятор громкости (темброблок) регулятор тона кнопка спецэффектов (вибрато) - рычажок переключения звукоснимателей кнопка для крепления ремня Рис. 7.1.5. Основные элементы конструкции электрогитары 8 — вибратор Рис. 7.1.6. Различные типы электрогитар: акустические (а), полуакустические (б), неакустические (в)
674 Глава 7 Акустическая электрогитара представляет собой обычную гитару с полым корпусом достаточно большого объема, на котором установлен звукосниматель (иногда используется микрофон). Звукосниматель закрепляется таким образом, чтобы он не влиял на работу резонансных дек инструмента. Полуакустическая электрогитара имеет полый корпус значи- тельно меньшего объема, чем у акустической гитары. Верхняя дека служит для установки звукоснимателей (адаптеров) и меха- низма вибратора. Уменьшение объема корпуса ухудшает акусти- ческие качества гитары и делает невозможным ее использование без усилителя. Неакустическая (цельнокорпусная) гитара имеет сплошной кор- пус, на котором жестко крепятся звукосниматели и вибратор. Гита- ра может быть использована только с адаптерами и усилителями. Развитие электроники и появление новых приемов игры приве- ло к появлению различных новых типов электрогитар, использую- щих эти виды корпусов: MIDI-гитар, стик-, стил-гитар, гитар с резо- натором, гитар ГРАН, двухгрифовых гитар и др. [17]. Для изготовления корпусов используются различные породы дерева в зависимости от назначения гитары: например, для гитар- соло применяются в основном легкие породы деревьев (ясень, липа и др.), которые создают яркий высокочастотный тембр; для гитар-ритм и гитар-соло — средние породы (ольха, тополь, пали- сандр и др.) с подчеркнутым среднечастотным диапазоном звуча- ния; и, наконец, в гитарах мощных ритм-партий корпуса изготавли- ваются из тяжелых пород деревьев (махагона, агатиса, ореха и др.). Существенное влияние оказывает также состав лака, кото- рым покрывается корпус. В зависимости от стиля исполнения выбирается тип гитары с тем или иным составом дерева для корпуса (например, модель гитары Fender Stratocaster использует корпус из ольхи, модель Ibanez JS1000 — из липы и т. д.). Гоиф электрогитар также делается из дерева (иногда вместе с головкой, на которой установлены колки). Колки (винты для за- крепления струн) могут иметь разное расположение: односторон- нее (шесть в линию), двустороннее симметричное (три плюс три), двустороннее несимметричное (два плюс четыре) (рис. 7.1.7). Между головкой и грифом иногда находится отверстие для регули- ровки анкерного металлического стержня, установленного внутри грифа. Это устройство необходимо для того, чтобы гриф из-за Рис. 7.1.7. Варианты расположения колков у электрогитар
Электромузыкальные инструменты и компьютерные технологии 675 сильного натяжения струн не деформировался. С помощью этого устройства можно также регулировать расстояние между струнами и грифом. Форма профиля грифа, его толщина, форма верхней накладки на гриф существенно влияют на удобство игры и значи- тельно различаются у разных типов гитар. Струны: в различных по назначению электрогитарах (сольных, ритмических, басовых или их комбинациях) используется разное количество струн (в основном металлических), обычно для бас-ги- тар — четыре или шесть, для сольных — шесть и др. [15-17]. Фи- зико-механические и акустические параметры металлических струн подбираются так же как и для обычных гитар, но в электрогитарах появляются дополнительные требования к струнам: малое магнит- ное сопротивление и гладкость поверхности. Первое требование обусловлено необходимостью получения максимальной чувстви- тельности в системе «струна — звукосниматель», второе — сниже- нием чувствительности этой системы к шорохам, возникающим при продольном скольжении руки исполнителя по струнам. Для лучше- го выполнения этих дополнительных требований на стальные стру- ны обычно делают навивку ленты (из стали, никеля, серебра, брон- зы с добавкой фосфора и др.) и затем подвергают полировке. Пример одного из видов конструкции струны для электрогитары показан на рис. 7.1.8: она состоит из керна (1), мягкой прокладки (2), круглой навивки из медной проволоки (3) и плоской ферромагнит- ной ленты (4) [15-17]. Подставка, с помощью которой струны крепятся к корпусу на электрогитарах, может быть фиксированной или подвижной (для создания вибрато, тремоло). Подставки могут располагаться на корпусе (накладные), быть встроенными в корпус или гибридными. Подвижная подставка имеет специальный пружинный механизм (рис. 7.1.9), который позволяет с помощью рычага поднимать и опускать строй за счет изменения натяжения струн. Звукосниматели: в качестве адаптеров (звукоснимателей) при- меняют электромагнитные (индукционные) преобразователи, пье- зоэлектрические датчики, иногда микрофоны. Основное распространение в электрогитарах получили электро- магнитные (индукционные) звукосниматели [16, 17]: они отличают- ся достаточно большой чувствительностью, помехоустойчивостью, низким выходным сопротивлением и надежны в работе. Кроме того, они относительно просты по конструкции и позволяют полу- 1 — керн, 2 — прокладка, 3 — медная проволока, 4 — ферромагнитная лента Рис. 7.1.8. Конструкция струны
676 Глава 7 б 6 4 •5 Рис. 7.1.9. Вибратор для струн с пружинным механизмом: а — общий вид, а 1— пружина, 2 — струны, 3 — рычаг, 4 — поворотный валик, 5 — упор для крепления струн, 6 — скоба для крепления пружин б — конструкция: чить широкий диапазон тембровых оттенков путем варьирования места расположения датчика на корпусе инструмента. К недостат- кам относится невозможность применения немагнитных (неметал- лических) струн. Для таких струн используются пьезокерамические звукосниматели, использующие свойства пьезокристалла преобра- зовывать механические деформации в электрический ток [16]. Принцип работы электромагнитных датчиков основан на появ- лении электрического тока в проводнике, находящемся в перемен- ном магнитном поле. Конструкция звукоснимателя показана на рис. 7.1.10а. Он состоит из постоянных магнитов, магнитопроводов и катушки. Движение металлических струн (рис. 7.1.106) приводит к изменению магнитного потока, проходящего через витки катуш- ки, что в свою очередь вызывает появление переменной ЭДС на ее выводах [16, 17]. Конструктивно могут использоваться магниты в виде бруска, в виде набора стержней, а также комплекта, состоящего из магнита и укрепленных на нем круглых или полосо- вых стержней из магнитопроводящего материала. Магнитные стержни -Катушка Основание Сигнал Начало обмотки Конец обмотки Проводная катушка V Вибрирующая струна а б Рис. 7.1.10. Конструкция электромагнитного звукоснимателя
Электромузыкальные инструменты и компьютерные технологии 677 Рис. 7.1.11. Конструкция однокатушечного звукоснимателя — сингла (single) Существует два основных вида звукоснимателей: — однокатушечные, или синглы (single), в которых использу- ется одна катушка, а магнит может представлять собой набор круглых стержней или полос (рис. 7.1.11). Сигналы от такого звукоснимателя достаточно яркие и чистые (не искаженные), но сильно подвержены электромагнитным помехам. Такого типа зву- косниматели появились первыми и использовались на гитарах Л. Фендера типа Stratocaster; — двухкатушечные, или хамбакеры (hum-bucker), представля- ют собой сдвоенные датчики, в которых используются две одина- ковые катушки, включенные последовательно в противофазе. Кроме того, магниты в обоих датчиках имеют разную полярность. Принцип работы и конструкция таких звукоснимателей показаны на рис. 7.1.12а, б. При таком включении полезные сигналы от обеих катушек складываются, а шумы и наводки вычитаются. Звук хам- бакеров более мощный и плотный, однако менее яркий (посколь- ку в нем меньше высоких частот). В современных электрогитарах используется большое количество вариантов конструкций хамба- керов [16, 17]. Поскольку датчик снимает сигналы с разных точек струны, то между ними имеется сдвиг по фазе, что может приводить к нерав- номерности огибающей спектра. Поэтому была создана разновид- ность этого типа звукоснимателя — вертикальный хамбакер (hum- canceller). В нем катушки находятся в одной точке струны одна над другой. Выходные сигналы с обеих катушек не имеют сдвигов по Рис. 7.1.12. Двухкатушечные звукосниматели — хамбакеры (hum-bucker): а — конструкция, б — принцип работы
678 Глава 7 фазе, но отличаются по амплитуде. Суммарный сигнал имеет бо- лее однородный спектр, но более низкий амплитудный уровень. Величина выходного сигнала зависит от конструкции звукосни- мателя, параметров используемого магнита, места установки зву- коснимателя и амплитуды колебания струны. Основные требова- ния к конструкции звукоснимателя состоят в обеспечении большого уровня выходного сигнала, малой неравномерности частотной ха- рактеристики, высокой помехоустойчивости, малых нелинейных искажений и др. Поскольку, как было показано в главе 4, струна гитары совер- шает колебания в постоянно меняющихся плоскостях, создавая вращающийся эллипс, то амплитуда сигнала на выходе звукосни- мателя имеет различную форму и величину в зависимости от из- менения плоскости колебания струны; при этом появляются допол- нительные гармоники и происходит частичное «замирание» звука, что придает звучанию электрогитар особый тембральный оттенок. Структура электрического выходного сигнала от звукоснимате- ля существенно зависит от места его установки. Как было пока- зано в главах 2 и 4, при возбуждении струны в ней возникают ко- лебания на всех ее собственных частотах, форма которых показана на рис. 7.1.13. При этом в случае установки звукоснима- теля в месте, соответствующем узлу данной гармоники, последняя будет отсутствовать в спектре выходного сигнала, поэтому можно подобрать места расположения звукоснимателей (обычно на элек- трогитарах под струнами устанавливаются несколько звукоснимате- лей — от 1 до 4 на различном расстоянии от подставки для струн), чтобы убрать отдельные гармоники в спектре. Места установки звукоснимателей стараются подобрать таким образом, чтобы из- 1 -я гармоника 2-я гармоника 3-я гармоника 4-я гармоника Рис. 7.1.13. Формы колебаний гитарных струн (три звукоснимателя передают колебания разных точек струны с разным качеством звучания)
Электромузыкальные инструменты и компьютерные технологии 679 бежать диссонансных интервалов между обертонами. Методика расчета мест установки с учетом прижатия струн к ладам дана в работе [15]. Например, при установке одного звукоснимателя в басовых гитарах стараются подавить восьмую и соседние гармо- ники, т. к. они дают диссонирующее звучание; этому удовлетворя- ет место установки AL/L = 0,125, где L — рабочая длина струны, AL — расстояние до звукоснимателя от подставки. При наличии двух звукоснимателей второй устанавливают из расчета обеспе- чения максимально большой амплитуды первой гармоники, это- му соответствует условие AL/L = 0,25. В сольных гитарах первый звукосниматель обычно размещают ближе к подставке. Таким об- разом, выбор количества звукоснимателей и мест их установки позволяет менять спектр, а следовательно, тембр получаемого звука. Электрическая цепь электрогитары: сигнал от звукосни- мателей поступает в темброблок, представляющий собой ком- мутационную или коммутационно-усилительную (для активных темброблоков) схему, расположенную внутри инструмента. Основ- ные задачи темброблоков: подключение звукоснимателей, их ком- мутация, коррекция тембра и громкости и предварительное уси- ление (в случае активных темброблоков). На передней панели темброблока расположены органы управления, состоящие из регу- ляторов громкости и тембра (рис. 7.1.4). Для регулировки громкости обычно используются переменный резистор и конденсатор (для компенсации потерь высоких частот) [16]. Электрическая схема звукоснимателя с учетом такой внешней нагрузки, показанная на рис. 7.1.14, представляет собой фильтр низких частот второго порядка со спадом частотной характерис- тики 12 дБ/окт. Меняя расположение и форму резонансного пика, который обычно находится в пределах 2-5 кГц (за счет сопро- тивления нагрузки), можно влиять на тембр выходного сигнала. Вы- ходное напряжение звукоснимателей обычно равно 100-300 мВ. Если сигнал больше не подвергается никакой обработке до поступления в усилитель, то такой звукосниматель считается Звукосниматель L R Внешняя нагрузка -х/ л V -с- Тон-генератор, источник напряжения ФНЧ 2-го порядка Рис. 7.1.14. Электрическая схема звукоснимателя с учетом внешней нагрузки
680 Глава 7 пассивным. Если он включен в электронную цепь операционного усилителя, встроенного в корпус самого датчика, и имеется воз- можность управления динамикой и спектральными характеристи- ками сигнала, создаваемого в катушке, то такой звукосниматель называется активным. При этом увеличивается выходное напряже- ние, улучшаются динамические и частотные характеристики сигна- ла. Однако для активного звукоснимателя необходим дополнитель- ный источник питания (потребляемый ток примерно 200 мкА ). Лидерами массового производства пассивных и активных звукоснимателей являются фирмы Di Marzio, Seymore Duncan, EMG, Bill Lawrence, Fender и др. [16 ]. Процессоры эффектов: для обработки гитарного звука исполь- зуются специальные устройства, реализующие один или несколько звуковых эффектов, без которых в настоящее время электрогитары практически не используются. К числу наиболее употребляемых гитарных методов обработки звука можно отнести как общие спосо- бы, используемые в студийной практике (компрессия, шумоподавле- ние, частотная коррекция, реверберация, дилей, хорус, фейзинг, флэнжинг и др. — см. гл. 6), так и специфические, например овер- драйв, дисторшн, вау-вау, тремоло, октавер, питч-шифтер, гармонай- зер, вокодер и др. Все эти эффекты реализуются с помощью от- дельных приборов, как аналоговых, так и цифровых (обычно в виде педалей — рис. 7.1.15), специальных блоков, например TCEIectronic G-Force, Lexicon MPX-G2), или программным путем. Принципы обработки звука для обеспечения компрессии (сжа- тия) сигнала, добавления реверберации и связанных с ней эффек- тов (дилей, фейзер, флэнжер, эхо и др.), а также частотной кор- рекции были рассмотрены в главе 6. Остановимся только на некоторых специфических процессах обработки, часто исполь- зуемых именно в гитарном звуке [17]. Овердрайв, дисторшн (overdrive, distortion) — группа эффек- тов, использующая искажения звука за счет его ограничения Рис. 7.1.15. Педаль эффект-процессора для электрогитары по амплитуде. Ограничение сигнала по амплитуде может реализовываться с по- мощью различных схемотехнических ре- шений; возникающее за счет этого боль- шое количество гармоник и придает звуку характерный оттенок. Звук стано- вится резким и неприятным. Поэтому, как правило, после ограничивающего каска- да устанавливаются фильтры, выполняю- щие частотную коррекцию полученного сигнала. Схемы дисторшн обеспечивают большой коэффициент усиления, из-за чего сигнал начинает искажаться сразу независимо от его уровня (рис. 7.1.16),
Электромузыкальные инструменты и компьютерные технологии 681 Рис. 7.1.16. Вид сигнала при ограничении уровня (эффект дисторшн) Амшштуда Уровень ограничения Уровень ограничения Время звук получается очень резким. При использовании овердрайва обеспечивается более мягкое ограничение, пропорциональное уровню входного сигнала, что создает более певучее звучание. Использование этих эффектов позволяет получить мощное звуча- ние гитары, выровнять динамику звука, замаскировать недостат- ки техники игры. Вау-вау (wah-wah), иногда его называют «тембровое вибрато» — еще один из распространенных гитарных эффектов. С помощью специальной педали регулируется частота пика на амплитудно-ча- стотной характеристике для подчеркивания определенного участ- ка спектра звукового сигнала; при нажимании и отпускании педа- ли «пик» перемещается на АЧХ в ту или иную сторону. Это достигается применением низкочастотного фильтра с высокой доб- ротностью, частота среза которого смещается по определенному закону. Устройство выпускается в виде как отдельной педали, так и совмещенной с каким-нибудь другим эффектом. Существуют так- же устройства Autowah, где управление осуществляется не педа- лью, а специальным встроенным генератором. Октавер (octaver) — данное устройство позволяет сдвигать спектр входного сигнала на октаву или две ниже или выше основ- ного тона, при этом продолжает звучать и сам основной тон, что создает впечатление игры в октаву сразу двух инструментов. В аналоговых педалях эффект реализован посредством простого умножения или деления частоты, но так как спектр гитары имеет довольно сложную форму, то сдвиг частоты сигнала носит услов- ный характер и изменение звучания достигается в основном за счет добавления определенных обертонов. В цифровых устрой- ствах короткие отрезки сигнала записываются в буфер и цикличе- ски считываются с разной скоростью. Величина сдвига высоты определяется синхронизацией входных и выходных таймеров [19]. В эту же группу входят приборы для сдвига высоты тона (pitch- shifting) и добавления дополнительных гармоник (гармонайзеры). Тремоло (tremolo) — это эффект амплитудной модуляции. Уст- ройство, реализующее этот эффект, представляет собой обычный
682 Глава 7 электронный регулятор громкости, управление которым осуществ- ляет генератор, вырабатывающий колебания низкой частоты; при этом форма импульсов, производимых генератором, может быть различной (треугольной, синусоидальной и т. п.). Соответственно различным будет закон модуляции сигнала, а значит, и восприни- маемый слуховой эффект. Аетопанер (autopanner) — устройство, обеспечивающее режим смещения сигнала от одного канала к другому. Основу устройства составляет низкочастотный генератор, который вырабатывает мо- дулирующий сигнал различной формы. Педаль громкости (volume pedal) встроена в отдельный корпус, где она с помощью зубчатой передачи связана с осью потенцио- метра. Такое устройство используется для оперативного контроля громкости звука, для формирования «мягкой» атаки, для обеспе- чения быстрого и в то же время плавного затухания звука и т. д. Существуют также модели, совмещающие в себе педаль громко- сти и еще какой-либо эффект (fuzz, wah-wah и т. д.). Конкретные схемы соединения между собой этих эффектов мо- гут быть различными в зависимости от стиля музыки и характера исполнения. Существует три основных способа соединения про- цессоров эффектов. Первый — последовательный (все необходи- мые эффекты включаются один за другим, пример для соло-гита- ры показан на рис. 7.1.17). Второй способ — параллельный (исходный сигнал разделяется на несколько идентичных копий, каждая из которых поступает на свой блок обработки, затем сигналы со всех блоков суммируются). Третий способ — последовательно-параллельный, когда последовательная группа блоков подсоединяется к параллельным. Существует огромное многообразие последовательностей включения различных эффектов, однако некоторые общие принципы заключаются в следующем: эффекты, использующие временную задержку (реверберация, дилей, хорус и др.), обычно находятся в конце Гитара- компрессор—* вау-вау дисторшн хорус октавер |._| флэнжер |—| гейт |— фейзер тремоло педаль громкости — дилеи ревербератор ♦Усилитель Рис. 7.1.17. Схема последовательного включения процессоров эффектов
Электромузыкальные инструменты и компьютерные технологии 683 ■ ■ Рис. 7.1.18. Комбинированный контрольный агрегат для электрогитары Roland Jazz Chorus линии; устройства, изменяющие динамиче- ский диапазон, находятся перед ними; час- тотная коррекция (эквалайзеры, фильтры и др.) может располагаться в любом месте цепи, где требуется коррекция тембра. Роль усилителя существенно отличается от его функций в системах звукоусиления, где он должен усиливать сигнал с мини- мальным уровнем искажений. В усилители для электрогитар иногда специально вво- дится определенный уровень нелинейных искажений (distortion) для придания специ- альных тембральных оттенков. Кроме того, в некоторых случаях используется эффект обратной связи (feedback loops), приводя- щий к возбуждению колебаний струн за счет обратного воздействия громких звуков от акустического агрегата. Среди усилителей в настоящее время широко используются также ламповые модели гитарных усилителей, например Marshall DSL-20, VOX-AC30 и др. Акустические системы обычно совмещаются в одном корпусе с усилителем и предусилителем (комбинированные активные си- стемы — комби), хотя встречается и их раздельное исполнение, например Roland Jazz (рис. 7.1.18). Основные фирмы-производи- тели таких систем — Roland, Marshall, Fender, Carlsboro, Dumble и др. Как правило, это однополосные или двухполосные акустические системы с одним широкополосным или двумя низко- и средне- частотными громкоговорителями. На каждый канал обычно исполь- зуется по две головки громкоговорителей (рис. 7.1.18). Чаще все- го применяются громкоговорители фирмы Celestion диаметром от 250 мм (10") до 380 мм (15"). Частотный диапазон обычно 8-8000 Гц, но для бас-гитар может ограничиваться пределами 30-6000 Гц. Паспортная мощность находится в пределах 50-120 Вт. Примером может служит модель JC120 фирмы Roland, которая является двухканальным акустическим агрегатом с тран- зисторным усилителем мощностью 120 Вт. Первый канал работа- ет в режиме чистого звука, имеет входы с высокой и низкой чув- ствительностью. В нем используются частотный корректор верхнего диапазона, трехполосный эквалайзер и регулятор гром- кости (внешняя педаль). Во втором канале обеспечивается режим перегрузок (distortion); в нем также имеются регулятор уровня, ча- стотный корректор, регуляторы эффектов «Вибрато», «Хорус», «Реверб», гнезда посыла-возврата сигнала и стереофонический линейный выход.
684 Глава 7 В 90-е годы появились новые устройства — моделлеры (modeller), моделирующие звук от акустического агрегата, записан- ный микрофоном в заглушённой камере. Примером может служить Sans Amp, который также позволяет моделировать звуки различ- ных усилителей. Одним из лучших приборов для цифрового моде- лирования является Roland VG-88, который обеспечивает модели- рование различных типов гитар, звукоснимателей и их комбинаций. Примером применения новых технологий может служить одна из последних моделей гитарного комби фирмы Roland Cube 30, в котором используется технология моделирования COSM, позво- ляющая моделировать звуки восьми наиболее известных гитарных усилителей (кроме того, в нем обеспечиваются эффекты хорус, тремоло, флэнжер, фейзер, ревербератор и задержка, которые можно выбирать с помощью педального переключателя). С появлением стандарта MIDI (Musical Instrument Digital Interface — см. раздел 7.2) много известных производителей музыкальной аппаратуры начали выпускать гитарные МЮ1-кон- троллеры (Roland, Ibanez, Digitech, Korg, Casio, Zeta Systems). Современная MIDI-гитара представляет собой обычную электро- гитару, на которой установлен специальный полифонический зву- косниматель, передающий отдельный сигнал (по стандарту MIDI) с каждой струны. Такая гитара, строго говоря, является контрол- лером, так как колебания ее струн используются только для управления звуками синтезатора. В случае необходимости ин- струмент может работать как обычная гитара (при использовании отдельных звукоснимателей), как MIDI-гитара или как обе одно- временно при смешивании двух сигналов. На гитару устанавли- вается небольшой блок управления, с которого можно управлять синтезатором; в этот же блок могут поступать сигналы и с обыч- ного выхода гитары, что позволяет регулировать баланс между гитарным и синтезаторным звуком. Оба сигнала (с обычных и с полифонических звукоснимателей) передаются с блока управ- ления по одному многожильному кабелю в MIDI-конвертер. Этот прибор непосредственно отвечает за распознавание нот и даль- нейшее преобразование их в MIDI-сигналы. Из-за чрезвычайной сложности аналогового гитарного сигнала возможно возникнове- ние различных ошибок — неправильное распознавание высоты тона, «зависание» ноты и пр. Из-за этого при исполнении про- изведения на MIDI-гитаре требуется применять определенную технику игры. Непосредственно с MIDI-конвертера сигнал посту- пает на источник звука — синтезатор или сэмплер. Конвертер и синтезатор могут быть как совмещенными в одном корпусе, так и выполненными в виде самостоятельных устройств. Вся вышеиз- ложенная схема изображена на рис. 7.1.19.
Электромузыкальные инструменты и компьютерные технологии 685 Рис. 7.1.19. Общая схема включения MIDI-гитары Наличие на конвертере входов и выходов MIDI дает огромное преимущество. Используя различные синтезаторы и сэмплеры, му- зыкант имеет доступ практически ко всем звукам, существующим в настоящее время. Это может использоваться для создания не- обычных звучаний электрогитары. При подмешивании синтетиче- ского сигнала к сигналу гитарному возникает ощущение одновре- менной игры сразу двух инструментов — гитары и синтезатора. Еще одно неоспоримое преимущество — управление с помощью MIDI-гитары секвенсором или компьютером. Это дает возмож- ность производить все виды обработки, доступные современным MIDI-технологиям. Одним из лучших приборов такого типа является прибор AXON АХ-100 фирмы Blue Chip, использующий современные алгоритмы нейронных сетей для распознавания звука. В числе других фирм, выпускающих подобную продукцию, можно указать Roland, Gibson, Steinberg, Hammer (использует электронику Roland) и др. При дальнейшем усовершенствовании стандарта MIDI-гитара вполне может стать конкурентоспособным инструментом в мире музыки и использоваться наравне с обычными электро- и акустическими гитарами [13, 14, 19, 22]. 7.1.3. Электропианино (Rhodes Piano) Инструмент под названием Rhodes Piano был изобретен в 1942 году американцем Гарольдом Родсом (Harold Rhodes). С конца 50-х годов Rhodes Piano становится излюбленным инструментом исполнителей джаза, рока и рок-н-ролла. Инстру- мент обладал удивительным тембром звучания, напоминающим звук челесты, поэтому иногда его называли «электромеханической челестой». Идея Г. Родса состояла в следующем: при нажатии клави- ши молоточек ударял по вибратору, в качестве которого
686 Глава 7 ■ Рис. 7.1.20. Общий вид первой модели Rhodes Piano (1946 г.) использовались металлические ба- лочки (типа камертона). Колебания вибратора возбуждали ток в электро- магнитном звукоснимателе (принцип работы которого аналогичен звукосни- мателю, расположенному под струна- ми электрогитары); ток усиливался и подавался на громкоговоритель. В 1946 году на выставке NAMM фирма, основанная Г. Родсом, пред- ставила модель под названием Pre Piano — первое электромехани- ческое фортепиано. Инструмент имел 38 клавиш, покрывающих средний ре- гистр, встроенный ламповый усилитель, громкоговоритель диамет- ром 150 мм и пьезоэлектрические звукосниматели. Все это было по- мещено в небольшой деревянный корпус на ножках. Общий вид такого пианино показан на рис. 7.1.20. В конце 50-х годов фирму Родса купил Лео Фендер — изобретатель бас-гитары, владелец известной компании по производству электрогитар (см. раздел 7.1.2). В 1959 году появилась первая серийная модель электроме- ханического фортепиано — Fender Rhodes Piano Bass. Инструмент имел 32 клавиши на тот же диапазон, что и у бас-гитары (нижней нотой была Е1). Опытный образец Piano Bass демонстрировался в 1960 году на выставке в Лас-Вегасе. Этот инструмент широко использовался музыкантами. В 1965 году Фендер продал свою фирму компании CBS. Новый производитель выпустил модель с 73 полноразмерными клавишами под названием Suitcase Piano. Инструмент Suitcase Piano был оборудован корпусом с динамика- ми и предварительным усилителем, который находился под клави- атурой; звук обладал теплым и густым тембром. Модель имела ре- гуляторы высоких и низких частот, а некоторые образцы — еще и регулятор тремоло. В ранних образцах Suitcase Piano использо- вались молоточки с фетровыми наконечниками, как и в рояле, затем стали применять молоточки с наконечниками из неопрена. В это же время фирмой CBS были выпущены две новые моде- ли — Celeste и Student Piano. Первая модель представляла собой вариант Suitcase Piano без верхней и нижней октавы (то есть име- ла 48 клавиш), а вторая, специально предназначенная для музы- кальных школ, имела встроенный метроном, но не имела вибрато и тремоло. В 1970 году наступил новый этап в развитии Rhodes Piano — появился новый инструмент The Stage Piano Mark I значительно меньшего веса (63 кг). Вскоре обе модели (Suitcase и Stage) ста- ли выпускаться в 88-клавишном исполнении, за счет чего еще больше расширился круг их пользователей. В течение десяти лет
Электромузыкальные инструменты и компьютерные технологии 687 Рис. 7.1.21. Модель Stage Piano Mark II в эту модель вносились усовер- шенствования, что позволило выпустить новую модель The Stage Piano Mark Il (рис. 7.1.21). В 80-е годы началось развитие цифрового звука, что сказалось на последующих модификациях инструмента. Новая модель The Stage Piano Mark III EK-10 совме- щала принципы электромехани- ческого преобразования и элек- тронного синтеза звуков; используемый в ней двухголосный синтезатор ЕК-10 работал по принципу аддитивного синтеза. Затем появляются модели Rhodes Chroma и Chroma Polaris, а в 1983 году — последняя (перед закрытием фирмы) модель The Stage Piano Mark V. Гарольд Роде считал эту модель воплощением всех технологических наработок за двадцать пять лет производства. Новый инструмент имел особую «колокольную» окраску звучания, полученную в результате серьезных изменений в его механической части. Наиболее существенное отличие Mark V от всех предыду- щих поколений Rhodes Piano заключалось в поддержке протокола MIDI (см. раздел 7.2.). С 1987 года производством этих инстру- ментов стала заниматься японская компания Roland [5, 7, 19, 23, 24, 25]. Принцип работы инструмента показан на примере модели Rhodes Stage Piano (рис. 7.1.21). Как уже было сказано выше, Rhodes Piano — электромеханический инструмент, в котором происходит преобразование механической энергии колебаний вибратора в электрическую энергию. Цепь звукообразования ин- струмента состоит из следующих звеньев: нажатие клавиши; удар молоточка по вибратору; преобразование звукоснимателем меха- нических колебаний в электрические; предварительное усиление; обработка электрического сигнала; оконечное усиление; воспроиз- ведение звука громкоговорителями [19, 23]. В отличие от рояля, где вибраторами являются струны, вибра- торы в Rhodes Piano напоминают двузубую вилку камертона. Вилки имеют разные размеры, форму и массу (рис. 7.1.22). Более тонкая и эластичная нижняя вилка называется иглой (Tine), по ней ударяет молото- чек при нажатии клавиши. При ударе игла вибрирует с достаточно большой амплитудой. Верхняя, жесткая вилка (Tone Ваг) является резонатором и вибрирует с той же частотой, что Камертон —~^о=ц Пружина для настройки Рис. 7.1.22. Верхняя и нижняя вилки камертона
688 Глава 7 и нижняя, хотя амплитуда вибраций у нее значительно меньше. На свободном конце нижней вилки прикреплен груз — так называемая настроечная пружина (Tuning Spring), с помощью которой можно быстро изменять высоту тона вибратора. Нажатие клавиши передается с помощью поворотного механиз- ма на молоточек, который разгоняется и ударяет по нижней вилке камертона (игле), что заставляет ее вибрировать, а это приводит к появлению на выходе звукоснимателя переменного электриче- ского тока. Схема клавишного механизма Rhodes Piano показа- на на рис. 7.1.23 (принцип его действия аналогичен клавишному механизму в фортепиано — см. раздел 4.3). В Rhodes Piano использовался электромагнитный звукосниматель, преобразующий смещение иглы в переменный электрический ток. Положение иглы камертона можно было настраивать, что позволяло молоточку уда- рять по игле в разных местах, создавая при этом разные по тем- бру звуки. Положение звукоснимателя по отношению к свободно- му концу иглы также поддавалось настройке. При этом можно было регулировать как громкость, так и тембр. Громкость изменя- лась при смещении иглы по горизонтальной оси звукоснимателя, тембр — по вертикальной. Для получения спектра излучаемого звука (связь состава спектра с тембром рассмотрена в главе 3), в котором максимально выражена основная частота, а количество обертонов мало, иглу необходимо было переместить в верхнее положение (рис. 7.1.24а). Оптимальное соотношение основной частоты и обертонов получалось при перемещении иглы ближе к продольной оси звукоснимателя. При расположении иглы строго на оси подавлялась основная частота и усиливались обертоны. Перемещение иглы вдоль горизонтальной оси (рис.7.1.246) вли- 1 — механизм тон-генератора, 2 — нижняя вилка (игла), 3 — настроечная пружина; 4, 5, 6 — винты; 7 — верхняя вилка, 8 — звукосниматель, 9 — винт; 10, 11, 12 — элементы демп- фера; 13-16 — элементы молоточка; 17 — прокладка из фильца, 18 — клавиша, 19 — прокладка из фильца; 20, 21 — рама Рис. 7.1.23. Схема клавишного механизма
Электромузыкальные инструменты и компьютерные технологии 689 — смещение в вертикальной плоскости, — смещение в горизонтальной плоскости Рис. 7.1.24. Положение иглы по отношению к звукоснимателю яло не только на общую громкость, но и на динамический отклик инструмента (даже при небольшом увеличении силы нажатия на клавишу громкость существенно возрастала). Конструкция иглы позволяла очень легко производить настройку высоты тона, т. к. при смещении настроечной пружины в сторону основания иглы высота тона увеличивается, при смещении к свободному концу — уменьшается (рис. 7.1.25). Настройке поддавались и другие параметры: глубина хода клавиши, жесткость молоточ- ков и др. Особый тип вибратора-камертона создавал совершен- но другой спектральный состав звука, чем натянутая струна обыч- ного фортепиано, что позволяло получать особый тембр звучания пианино Rhodes, состоящий как бы из трех частей: колокольной, ксилофонной и фортепианной. Тембр Rhodes Piano сильно зави- сел от нюансировки исполнения, в частности от динамики (скоро- сти нажатия на клавишу). Инструмент обладал большим динами- ческим диапазоном — 40-50 дБ. После того как механическое колебание в звукоснимателе было преобразовано в переменный электрический ток, сигнал поступал в предварительный усилитель и подвергался разнообразной элек- троакустической обработке. Звук Rhodes Piano редко использо- вался в творчестве музыкантов без дополнительной обработки. Обычно применялись процессоры, создающие такие эффекты, как амплитудная модуляция, автопанорамирование, хорус, вау-вау, дисторшн, всевозможные задержки и др. Нередко несколько процессоров подключались последовательно и эффекты комбини- ровались. Некоторые производители выпускали устройства, кото- рые стали практически стандартом при использовании с Rhodes высоты Рис. 7.1.25. Смещение настроечной пружины
690 Глава 7 Piano. Так, почти сразу после выхода модели Stage Piano Mark I фирма Fender выпустила усилитель Fender Twin Reverb, который, к тому же, мог производить довольно специфичный эффект тре- моло. Активно использовалась с Rhodes и другая модель усили- теля — Roland JC-120 Jazz Chorus, которая кроме усиления, по- зволяла обработать сигнал Rhodes эффектом хоруса. Дальнейшее развитие техники создания электропианино поста- вило своей целью решить несколько задач: полностью воссоздать в электронных инструментах тембр акустических фортепиано; со- вместить в одном инструменте несколько тембров; воспроизвести особенности реальной игры музыканта, для чего нужна была кла- виатура, правдиво имитирующая действие реального молоточково- го механизма и дающая исполнителю полное ощущение игры на настоящем инструменте. Поставленные задачи могли быть ре- шены только с помощью быстро развивающихся компьютерных технологий. В конце 80-х годов фирма Roland представила полностью циф- ровое фортепиано RD-1000. В нем использовалась особая разра- ботанная фирмой технология адаптивного синтеза Structure Adaptive (SA) Synthesis. С тех пор компания Roland занимает ве- дущие позиции в исследованиях, разработках и производстве циф- ровых фортепиано. Со второй половины 1980-х годов и до нынеш- него времени сменилось примерно четыре поколения цифровых фортепиано как фирмы Roland, так и других фирм. С каждым новым поколением происходило усовершенствование параметров и расширение возможностей этих инструментов, в результате чего они все больше приближались к настоящим акустическим форте- пиано — как по звучанию, так и в смысле выразительных возмож- ностей клавиатуры и реальности ощущений при игре [23-25]. Во втором поколении цифровых фортепиано Roland (период с 1990 по 1995 год) была использована та же технология синте- за звука, но усовершенствованная на основе прогрессивных на тот момент времени компьютерных музыкальных технологий. Главной особенностью этого синтеза (Advanced SA Synthesis) стало исполь- зование сэмплов (образцов звучания реальных инструментов, сохраняемых в цифровой памяти) и возможностей цифровых про- цессоров по обработке звука, с помощью чего оказалось возмож- ным моделировать характерные особенности фортепианного зву- чания и различные нюансы исполнительской техники, например имитацию эффекта резонанса струн и деки, технику полуснятия пе- дали и др. Технология Advanced SA Synthesis, впервые реализо- ванная в модели Roland НР-3700, значительно улучшила качество звучания инструментов, сделав его более реалистичным. Другая задача, решавшаяся в этом поколении инструментов, состояла в создании клавиатуры, близкой к настоящей по выразительным возможностям и по ощущениям при игре на ней. В 1991 году
Электромузыкальные инструменты и компьютерные технологии 691 появилось сценическое фортепиано Roland FP-8, в котором была установлена клавиатура с фирменным механизмом Roland Hammer Action («молоточковый механизм Roland»). Этот механизм имитировал действие клавишного механизма в реальном фортепи- ано, где молоточки поднимаются при нажатии клавиш и опускаются под действием собственной тяжести (см. гл. 4). Цифровые фортепиано Roland третьего поколения (период с 1996 по 1999 год) использовали новые возможности, которые появились благодаря значительному увеличению мощности цен- тральных процессоров и удешевлению оперативной памяти. Для них были разработаны новые алгоритмы и технологии стереосэм- плирования, специальные формантные фильтры, особые схемы подавления нежелательных резонансов корпуса инструмента (технология CREC) и др. Принципиальным нововведением явилось использование наряду с техникой сэмплирования новых элемен- тов синтеза, основанных на «физическом моделировании» (см. раздел 7.2), т. е. моделировании процессов, происходящих в ре- альных, акустических инструментах (нажатие на клавиши, срабаты- вание рычагов и шарниров молоточкового механизма, удары моло- точков, колебания струн, резонансы деки и корпуса и т. д.). Это позволило значительно продвинуться в решении проблемы повышения выразительности звучания, передачи многочисленных нюансов исполнения, присущих настоящему акустическому форте- пиано. Наиболее совершенной моделью фортепиано второй поло- вины 90-х годов считалась KR-575P. Существенное изменение конструкции клавиатуры произошло в цифровых фортепиано четвертого поколения. Большая часть этих инструментов оборудована клавиатурами с так называемым «прогрессивным» молоточковым механизмом (Progressive Hammer Action) и градиентом жесткости, имитирующим разную степень тя- жести клавиш в нижнем и верхнем регистре (при этом ощущения исполнителя при игре будут такими же, как и на реальном инстру- менте). Примером одной из последних разработок фирмы Roland может служить цифровое пианино KR-17M, которое имеет 88-нот- ную клавиатуру с прогрессивным молоточковым механизмом и градиентом жесткости; 128-голосную полифонию; огромный вы- бор стереосэмплов (рояля, клавесина, струнных и др.); сотни встроенных музыкальных стилей; разделение клавиатуры (split keyboard) и наложение тембров (layer keyboard) что позволяет на разных участках клавиатуры использовать тембры различных ин- струментов параллельно или последовательно и изменять типы тембров, например за счет разной силы нажатия клавиш [27]; восемь уровней реверберации; эффект хорус; эффект имитации резонансов деки и струн; эффект вращающихся громкоговорите- лей (громкоговорители Лесли); физическое моделирование рабо- ты педалей; еще 45 других дополнительных эффектов; встроен-
692 Глава 7 ный CD-проигрыватель; 16-дорожечный секвенсор; программу DigiScore (отображающую ноты, тексты песен и др. на экране); микрофонный вход с эффектами пребразования голоса (гармо- найзер, вокодер и др.); метроном; три педали; выход MIDI in/out; выход на стереотелефоны; встроенные акустические стереосис- темы с усилителями и т. д. В настоящее время кроме фирмы Roland разработкой и выпус- ком электророялей и пианино занимаются такие фирмы как Yamaha, Casio, Kurzweil, Technics, Kawai и др. Фирма Yamaha выпускает, кроме чисто цифровых инструмен- тов — клавинов (clavinova), также цифровые акустические рояли (пианино) — дисклавиры (disklavier), которые представляют собой комбинацию акустического рояля (или пианино) и цифровой элек- троники. Звукоизвлечение при игре происходит одним из двух методов: стандартным и сайлент-способом. Стандартный способ означает, что работает традиционная механика фортепиано — кла- виши, молоточки, демпферы и т. п., звук создается за счет колеба- ний струн. Функция сайлент (silent) позволяет отключить молоточ- ки от струн, превращая инструмент в клавишный контроллер (MIDI-клавиатуру). Каждая клавиша снабжена высокочувствительным электромеха- ническим датчиком (соленоидом), на который поступает управля- ющий сигнал, записанный ранее. В результате происходит автома- тическое нажатие клавиш и педалей, т. е. как бы воссоздаются действия исполнителя (т. е. инструмент может играть заданное произведение самостоятельно без участия пианиста). Данные для записи звука снимаются специально разработанными, попарно сгруппированными оптическими сенсорами, фиксирующими после- довательность, скорость и продолжительность нажатия каждой клавиши и соответствующие параметры движения молоточков. Данные, снимаемые сенсорами, записываются в обычный MIDI-файл или файл расширенного формата Pro MIDI (дисклави- ры оснащаются дисководами и картами флэш-памяти). Устройство дисклавира показано на рис. 7.1.26: 1 —соленоиды, приводящие к нажатию клавиш; 2 — блок управления педалями, оснащенный собственным микропроцессором; 3 — оптические сенсоры клавиш (регистрируют скорость нажатия, глубину и скорость снятия пальца); 4 — оптические сенсоры молоточков; 5 — стопор гаммерштиля (см. гл. 4), приводимый в действие электродвигателем, который отклю- чает молоточки от струн. Дисклавир можно использовать как традиционное пианино, дви- жения клавиш благодаря оптическим сенсорам передаются звуко- вой карте и воспроизводятся через акустические системы или сте- реотелефоны. В режиме silent используется огромный банк стереосэмплов концертного рояля Yamaha CFIII S, записанных при разной силе нажатия клавиш. Кроме того, предусмотрено исполь-
Электромузыкальные инструменты и компьютерные технологии 693 зование различных процессоров цифровой обработки звука (эф- фекты реверберации, фильтрации и др.). Примером такого дисклави- ра может служить модель DGH- 1BA (рис. 7.1.27), обеспечивающая функции проигрывания, записи и перезаписи (шестнадцать треков, одиннадцать уровней громкости, транспозиция в пределах двух ок- тав с шагом один полутон, 64-нот- ная полифония, баланс уровней в ансамбле и т. д.), микширования, Рис 1Л26. Устройство процессорной Обработки, MIDI-ИН- дисклавира фирмы Yamaha терфейс, метроном, таймер и др. Одним из примеров современных возможностей по созданию и обработке звуков может служить модель цифрового пианино фирмы Casio «Celviano AL-IOOOR» (рис. 7.1.28), которая имеет: 88-клавишную клавиатуру с молоточковым механизмом, градиентом жесткости и чувствительностью к силе нажатия (три уровня чув- ствительности); 64-голосную полифонию; 271 тембр; разделение клавиатуры и наложение тембров; автогармонизацию; 100 стилей аккомпанемента; 17-трековый секвенсор на 10 песен (15500 нот); музыкальную библиотеку на 80 произведений; 32 цифровых эффекта; метроном; функции микширования (31 канал); совмести- мость с General MIDI; три педали; линейный выход; MIDI-интер- фейс; выход на стереотелефоны, двухполосную акустическую си- стему и др. Рис. 7.1.27. Дисклавир DGC-I Рис. 7.1.28. Цифровое пианино фирмы Yamaha Celviano AL-1000R фирмы Casio
694 Глава 7 7.1.4. Орган Хаммонда. Электрические и цифровые органы Как уже было отмечено в разделе 7.1.1, самым популярным ин- струментом среди электрических органов был орган Хаммонда, представляющий собой электромеханический музыкальный инстру- мент, патентное свидетельство на изобретение которого было выдано Лоуренсу Хаммонду в 1934 году в США. Впервые он был показан на Выставке индустриального искусства в Нью-Йорке в 1935-м и высоко оценен музыкантами. Лоуренс Хаммонд (1895- 1973) после окончания университета работал на автозаводе в Дет- ройте, где сделал ряд изобретений. Это позволило ему открыть собственную фирму, производящую электронные часы с использо- ванием созданного им синхронного электромотора, который он применил позднее в музыкальных инструментах. Работу над орга- ном он начал в 1933-м. Экспериментируя с различными способа- ми генерации звука, Хаммонд применил (с учетом опыта Кахилла по созданию телармониума) колесный тон-генератор, приводимый в действие синхронным часовым мотором [5, 6]. Принцип работы органа заключался в следующем: синхронный электродвигатель приводил во вращение валы с закрепленными на них зубчатыми колесами. Каждое колесо вращалось в поле посто- янного стержневого магнита с намотанной проводной катушкой (рис. 7.1.29). Флюктуации магнитного поля, возникающие при этом, приводили к появлению в катушке переменного электрического тока, частота которого зависела от скорости вращения колеса и количества зубцов на нем. В первых моделях органа использо- валось 96 таких колес диаметром примерно 30 мм. Полученный электрический сигнал подавался на ламповый усилитель и затем на громкоговоритель. Музыкальные тоны различного тембра про- изводились с помощью «аддитивного» синтеза, для чего к каждой клавише с помощью специальной системы переключений на меха- нических тягах подключалось несколько генераторных колес (рис. 7.1.30). Это позволяло, смешивая синусоидальные звуки в разных комбинациях, получать различные тембры звучания, ими- тирующие звуки духового органа. В первых инструментах исполь- зовались два мануала (две ручные клавиатуры) и педали, конт- вал магнит электродвигателя магнит Рис. 7.1.29. Принцип работы электромеханического тон-генератора зубчатые колеса
Электромузыкальные инструменты и компьютерные технологии 695 выход к УСИЛИТЕЛЮ Рис. 7.1.30. Функциональная схема органа Хаммонда ролирующие громкость звучания. Чтобы колеса вращались с различной скоростью, было разрабо- тано специальное устрой- ство, трансформирующее скорость вращения для каждого колеса. В резуль- тате в первых электро- органах было по 1500 переключателей и почти девять километров про- водов различной тол- щины. Каждая клавиша приводила в действие 9 переключателей, соеди- ненных с различными регистровыми движками. Регистровые движки, рас- полагаясь в порядке, со- ответствующем принятой для органных труб системе от 16" слева до 1" справа, позволя- ли исполнителю смешивать основной тон с обертонами; при этом контролировалась громкость каждой составляющей звука. Кроме того, в инструментах использовались специальные регуляторы для создания таких эффектов как вибрато, тремоло, хорус и др., а также применялся пружинный ревербератор (позднее широ- ко используемый в гитарных усилителях). Выпуск новой модели начался в 1935 году, уже в 1936-м было произведено 250 электроорганов, что позволило реорганизо- вать компанию, которая стала называться Hammond Instruments. В 1936 году была разработана модель ВС, в которой дополнитель- но к обычному звукоколесному генератору использовался хорус-ге- нератор, состоявший из дополнительного набора звуковых колес, немного отличающихся по настройке от основного набора. Лоуренс Хаммонд занимался разработкой и других инструментов: в 1939 году он создал «Новахорд», один из предшественников современных синтезаторов, имитирующий при помощи звуковых генераторов оркестровые инструменты. Однако эта имитация была еще да- лека от совершенства, что не позволило «Новахорду» получить широкое распространение. В 1940 году был создан «Соловокс», трехоктавный компактный одноголосный электронный инструмент, который производил широкий спектр звуковых эффектов. В пери- од с 1940 по 1948 год были разработаны три модели «Соловокса», после чего производство их было прекращено.
696 Глава 7 В послевоенное время началась разработка новых моделей хаммонд-органа, предназначенных не только для пианистов, но и для начинающих исполнителей. Был разработан «хаммонд-спи- нет» (модель M) со встроенным усилителем и громкоговорителями, имевший по 44 клавиши на каждом мануале вместо обычных 61. Этот инструмент получил широкое распространение в домашнем музицировании и в небольших церквах и выдержал конкуренцию с многочисленными маленькими органами, появившимися на рын- ке в то время. В результате в США сформировались многочислен- ные (более 500) общества любителей игры на хаммонд-органе. В 1950 году появился струнный орган (модель S) с одним трех- октавным мануалом и двумя ножными педалями, обладающий регистрами, имитирующими звучание струнных инструментов. В середине 1960-х годов усилился интерес джазовых музыкантов к хаммонд-органу. Модель ВЗ, выпущенная в январе 1955 года, как раз обладала подходящим звучанием, поэтому и осталась, несмот- ря на прекращение выпуска в 1976-м, самой популярной за всю историю инструмента (что вынудило фирму Suzuki уже в 2002 году разработать современную версию модели ХВЗ с цифровой эму- ляцией звукоколесных генераторов). За двадцать лет (с 1955 по 1975 год) было выпущено более 100 000 органов модели ВЗ. В 1966 году была выпущена модель Х77, первый хаммонд-орган со встроенными акустическими системами Лесли. Принцип действия громкоговорителей Лесли (первоначальное название — «вибратон») основан на использовании эффекта Доплера (см. гл. 2). Возникаю- щая в них комбинация модуляций частоты (вибрато) и амплитуды (тремоло) приводила к особому, характерному только для них тем- бру. Акустическая система Лесли представляла собой большой де- ревянный корпус с отверстиями вверху и внизу. Небольшой высоко- частотный громкоговоритель с прикрепленной к нему вращающейся трубой был расположен в верхней части системы; низкочастотный громкоговоритель, также вращающийся, но направленный вниз, на- ходился в нижней ее части (рис. 7.1.31). Труба и низкочастотный громкоговоритель вращались в противоположных направлениях. Таким образом, при вращении труба и громкоговоритель то удалялись, то приближались к слушателю, создавая эффект Доплера. Вращение могло быть усилитель кроссовер I | медленным (1-5 оборотов в секунду, при этом возникал эффект типа фэй- зер — см. гл. 6) или быстрым (7-8 обо- ротов в секунду, при этом возникал эф- фект типа вибрато и тремоло). Громко- говорители Лесли сделали звучание Рис. 7.1.31. хаммонд-органа более близким к звуча- Громкоговорители Лесли НИЮ ДУХОВОГО органа.
Электромузыкальные инструменты и компьютерные технологии 697 Рис. 7.1.32. Система регистровых движков для аддитивного ЦТ|| 2 J[T]I 2 ||1 синтеза сложных , , \\ \ \ звуков в органах I I Хаммонда I J I J Первая электронная (не звукоколесная) модель хаммонд-орга- на серии J была разработана в 1967 году. В этом же году была со- здана первая модель со встроенной шестиголосной ритмической секцией. Это нововведение получило свое развитие в инструменте под названием автохорд, созданном компанией Хаммонда в середи- не 1970-х годов и обладающем автоаккомпанементом с программи- руемым ритмом. Для создания сложных звуков использовался в ос- новном аддитивный синтез, т. е. каждый генератор вырабатывал синусоидальный сигнал определенной частоты, и эти сигналы с помощью специальной системы рычажных движков складывались в определенной пропорции, формируя сложный звук (рис. 7.1.32). В 1973 году (год смерти изобретателя) насчитывалось свыше тридцати производителей электронных хаммонд-органов; к концу 1970-х это число увеличилось из-за значительно возросшей по- требности в домашних органах. Это был период перехода от лам- повой техники к транзисторной. В большинстве электронных орга- нов для формирования музыкальных тонов применялся не только аддитивный, но также субтрактивный синтез [6, 7, 19]. В этом случае с помощью электронного генератора создавался сигнал какой-либо сложной формы, а затем с помощью частот- ной фильтрации из него вы- делялись необходимые обер- тоны. Большие электронные органы такого типа выпуска- лись фирмами Rodgers, Baldwin, Conn (США), Yamaha, Roland (Япония) и др. Пример LC-генератора, используемого в органах Conn, показан на рис. 7.1.33. В большинстве Рис. 7.1.33. Схема LC-генератора квадратичные тоны ^.флейтовые тоны импульсные тоны
698 Глава 7 органов уже не применялось по одному генератору на каждую ноту, а использовались специаль- ные электронные делители [6]. Примером наиболее известных моделей органов этого периода могут служить Roland VK-9, Korg СХЗ и др. (рис. 7.1.34). Большая работа по созданию инструментов подобного типа проводилась в это Рис. 7.1.34. Электронный орган время в России: были созданы В эпоху цифрового звука стали выпускаться инструменты, соче- тающие преимущества новых технологий с моделированием (эму- ляцией) традиционных возможностей хаммонд-органов. В 1984 году была выпущена модель В-400, первый электроорган массово- го производства, поддерживающий систему MIDI (см. раздел 7.2.). В 1986 году была разработана модель Super В, полностью по- строенная на технологии цифрового сэмплирования с пресетами, имитирующими звучание трубы, маримбы, саксофона и других инструментов. Новые инструменты обладали также и встроенны- ми секвенсорами. В том же 1986-м фирма Hammond закрылась. Торговую марку Hammond приобрела корпорация Suzuki и нача- ла выпуск цифровых органов типа ХВ1, ХВ2 и ХВЗ. В последней модели воспроизводилось звучание знаменитого органа Хаммонда В-3; в ней использовались две пятиоктавных клавиатуры, 25-кла- вишная педальная клавиатура, два набора регистровых движков для верхних и нижних клавиш и два движка для педали. Инстру- мент имел большую библиотеку органных сэмплов, качественный процессор спецэффектов и наряду с эмуляторами звучания гром- коговорителей Лесли использовал обычные звукоусилительные акустические системы с вращающимися громкоговорителями. В настоящее время многие компании, выпускающие цифровые эмуляторы для хаммонд-органов, обратились к технологии физи- ческого моделирования, где, в отличие от технологии сэмплирова- ния, используются алгоритмы, моделирующие физические процес- сы звукообразования в реальных органных трубах [28, 29, 34]. К числу таких моделей относятся виртуальный орган VK-7 фирмы Roland и его расширенная версия VK-77 с двумя рядами клавиш и дополнительно поставляемой педальной клавиатурой. В их осно- ве лежит технология физического моделирования тональных колес органов Хаммонда «Virtual Tone Wheels» («воображаемые тональ- ные колеса»). Эта технология позволяет достаточно точно смо- делировать всю цепочку, формирующую звук: колесный механизм, катушки звукоснимателей и «тяговые стержни» (drawbars). Для того Roland VK-9 такие инструменты, как «Юность», «Лель», «Эстрадин» и др. [5].
Электромузыкальные инструменты и компьютерные технологии 699 чтобы имитировать звучание роторных акустических систем Лесли с различными усилителями и корпусами, использовалась еще одна технология моделирования, COSM — Composite Object Sound Modeling (звуковое моделирование сложных объектов), широко применяемая фирмой Roland в гитарных процессорах, студийных рабочих станциях и т. д. С помощью этой же технологии обеспе- чивалась передача различных нюансов звучания реального орга- на Хаммонда, таких как перкуссионные призвуки, плавающая вы- сота тона, стук клавиш, взаимовлияние соседних тональных колес. Встроенный процессор эффектов VK позволял (также с помощью моделирования COSM) имитировать работу акустических систем Лесли, при этом сохранялась возможность подключать и реальные громкоговорители Лесли. Кроме этих моделей выпускаются также электронные органы Nord Electro фирмы Clavia, СХЗ фирмы Korg и др., в которых с помощью технологий физического моделирова- ния удается получить выразительное и динамичное звучание, очень похожее на голос классических органов Хаммонда. 7.1.5. Терменвокс. Волны Мартено Как уже было отмечено в начале данной главы, среди элек- тромузыкальных инструментов можно выделить группу, где при- меняется прямое преобразование электрической энергии в акус- тическую и используется при этом необычный интерфейс для исполнителя, например терменвокс, волны Мартено и др. Особое место среди них занимает терменвокс, один из первых электро- музыкальных инструментов, созданных в начале XX века, отли- чающийся очень своеобразным тембром звучания, не похожим на обычные инструменты. Терменвокс — название электронного инструмента русского изобретателя, ученого и музыканта Льва Сергеевича Термена (1896-1993) (см. гл. 1). Его музыкальные инструменты ритмикой, терпистон, теремин-виолончель получили широкое признание во всем мире. Терменвокс, изобретенный в 1919 году, представ- лял собой один из первых электромузыкальных инструментов на вакуумных лампах, работающий по принципу выделения биений звуковой частоты, возникающих при сложении высокочастотных ко- лебаний [5, 6, 8, 30, 31]. Главной частью терменвокса являлись два высокочастотных генератора (гетеродина), настроенных на одинаковую частоту. Частота одного генератора оставалась постоянной, частота другого могла варьироваться за счет изменения емкости конденсатора, со- единенного с вертикальной металлической антенной (рис. 7.1.35). Приближение руки к этой антенне изменяло емкость входящего в LC-контур конденсатора за счет изменения параметров электро-
700 Глава 7 Антенна, высоты звучания^4 Антенна громкости \, звучания Vb1 (С ,+C11.,) частотный амплитудный генератор * фильтр детектор переменной частоты генератор постоянной частоты —^\лл-|-— 1 Усилитель частот (сэгсо0) Громкоговоритель Рис. 7.1.35. Принципиальная схема терменвокса магнитного поля вокруг нее и, соответственно, меняло частоту пе- ременного магнитного поля. Затем сигналы от обоих генераторов суммировались, возникающие при этом разностные тоны, попада- ющие в слышимый диапазон частот, фильтровались, усиливались и подавались на громкоговоритель. Перемещение руки вблизи вер- тикальной антенны в пределах 40-50 см позволяло менять высо- ту звука в диапазоне 3-4 октавы [2-12, 19, 30, 31]. Вторая горизонтальная антенна, выполненная в виде петли, так- же была включена в схему дополнительного высокочастотного ге- нератора. При движении руки исполнителя вблизи нее происходи- ла амплитудная модуляция сигнала, который затем проходил фильтр, амплитудный детектор и подавался на усилитель и гром- коговоритель. Эта цепь использовалась для регулирования гром- кости звучания. Таким образом, когда исполнитель менял положение рук во вре- мя исполнения вблизи вертикальной и горизонтальной антенны (рис. 7.1.36), то он мог менять высоту тона и его громкость. Игра на таком инструменте требовала очень точной координации движе- ния рук, поскольку даже малые перемещения могли привести к большим сдвигам по высоте тона. Одним из первых музыкантов, виртуозно владевших техникой игры на этом инструменте, был К. И. Ковальский (1890-1976) [5]. Работы по усовершенствованию конструкции инструмента про- должались весь XX век, как самим создателем, так и его последо- вателями. В настоящее время существует несколько разновидно- стей терменвокса, отличающихся по конструкции. Если в первых моделях, созданных Л. Терменом, использовались две антенны (рис. 7.1.36) — левая управляла динамическими параметра-
Электромузыкальные инструменты и компьютерные технологии 701 Рис. 7.1.36. Л. С. Термен — игра на терменвоксе ми звука (громкостью), а правая час- тотными характеристиками звука (звуковысотностью), — то в модернизи- рованной конструкции высота звука по- прежнему регулируется правой рукой, а левая рука управляет общими характери- стиками звука при помощи кнопочного манипулятора. Громкость звука регулиру- ется ножной педалью. Большой вклад в усовершенство- вание инструмента внес Л. Д. Королев, который ввел в конструкцию: визуали- затор пространственного грифа (шкалу, на которой отображается высота звука, соответствующая положению руки); воз- можность расширения набора тембров и стабилизации музыкального строя (независимо от влажности окружающего воздуха) и др. Все это в целом значи- тельно облегчило технику игры на инстру- менте [4, 30, 31]. В современных терменвоксах, которые стали значительно меньше и компактнее (рис. 7.1.37), удалось получить широкий частотный диапазон (основные тоны 130,8 Гц(сз>-1976 Гц(В6)); большой дина- мический диапазон (больше 40 дБ), широ- кий выбор тембров (четыре голосовых и шесть инструментальных) и т. д. Кроме того, были созданы модели с М1Д1-интер- фейсом, большим банком сэмплов, с устройством формирования атаки и за- тухания звука, с возможностью работать в режимах пиццикато, стаккато, легато рИс. и т. д. Благодаря своеобразному звучанию инструмент широко использовался в концертной практике (много сделали для его популяризации такие исполнители как русская ви- олончелистка К. Рокмор, французский исполнитель Ж. М. Жарр, внучатая племянница Термена Л. Кавина и др.), а также в музыке для кино, радио,телевидения и т. д. К инструментам этой же группы относится созданный во Фран- ции Морисом Мартено (Maurice Martenot) в 1928 году инструмент «Ondes Musicales» («волны Мартено»), в котором также исполь- зовался принцип выделения огибающей биений двух высокочас- тотных составляющих, возникающих из-за изменения емкости 7.1.37. Современный терменвокс
702 Глава 7 конденсатора. Инструмент имел клавиатуру, отдельную клавишу для плавного изменения громкости и несколько ключей для изме- нения тембра (рис. 7.1.38). Некоторые модификации инструмента «волны Мартено» имели пяти- и семиоктавные клавиатуры, конст- рукция которых позволяла создавать эффекты вибрато и др. Со- здание эффекта глиссандо осуществлялось за счет передвижения вдоль клавиатуры специальной ленты за укрепленный на ней по- водок — в этом случае управление высотой звука переключалось с клавиатуры на ленту. Для этого инструмента было написано бо- лее 500 произведений, включая трио и квартеты для нескольких инструментов, а также программные произведения для игры с оркестром. Их авторами были такие известные композиторы, как Д. Левидис, О. Мессиан, А. Онеггер, Э. Варез и др. В 30-е годы появилась группа инструментов, использующая пря- мую генерацию сигналов звуковой частоты. Среди них можно выде- лить «Виолену» (В. А. Гуров, Россия) и «Траутониум» (Ф. Траутвейн, Германия). Инструменты «траутониум» в нескольких модификациях (одно- и двухголосных) были освоены в 1935-1940 годах такой крупной радиоэлектронной фирмой как «Телефункен». Система звукоизвлечения в них заключалась в следующем: при надавлива- нии пальцем стальная струна смыкалась с металлическим грифом, включенным в схему генератора электрических колебаний звуковой частоты. При этом в зависимости от силы нажатия металлическая пластинка грифа, закрепленная на упругих петлях, передавала давление пальцев подгрифовому регулятору громкости звука. Опи- санная система давала возможность не только для создания плав- ного нарастания и спада громкости, но и для гибкой динамической трактовки музыкального исполнения. В 30-е годы группой ученых: А. В. Римским-Корсаковым, А. А. Ива- новым и др. — был создан мелодический инструмент, работающий по этим же принципам, «Эмиритон», который получил широкое
Электромузыкальные инструменты и компьютерные технологии 703 распространение в концертной практике. К этой же группе относятся электромузыкальные инструменты «Ондиолин» (Ж. Жени, Франция) и «Экводин» (А. А. Володин, Россия), созданные в 40-50-е годы [4, 5]. В 50-е годы были разработаны магнитофоны, которые стали широко использоваться как средства записи и воспроизведения звука, затем появились синтезаторы, секвенсоры, компьютерные звуковые станции и другие средства для создания и воспроизве- дения музыки, на разработке которых и начали концентрировать- ся основные научные силы (см. раздел 7.2.). 7.2. ЭЛЕКТРОННЫЕ МУЗЫКАЛЬНЫЕ ИНСТРУМЕНТЫ. СИНТЕЗАТОРЫ Одними из первых представителей нового поколения электрон- ных инструментов, появившихся в конце 50-х годов, были синте- заторы. Синтезатор — это электронный музыкальный инструмент, спо- собный генерировать, комбинировать и обрабатывать широкий спектр звуков [2, 5-7, 9, 10, 13, 14, 19, 20, 32]. Первые синтезаторы были аналоговыми приборами, как, напри- мер, созданный в 1955 году знаменитым акустиком Г. Олсоном и инженером Г. Беларом в Принстоне (США) синтезатор RCA Music Synthesizer [6]. Этот прибор состоял из семи больших стоек, запол- ненных генераторами, усилителями, модуляторами и др. Закодиро- ванные значения высоты тона, его интенсивности, формы огиба- ющей и др. наносились в двоичном коде на перфорированную бумажную ленту и считывались специальным устройством (меха- ническим сканером). Синтезатор мог воспроизводить четыре музы- кальных тона различной частоты, длительности и тембра. Одним из первых синтезаторов стал АНС, сконструированный в России инженером Евгением Мурзиным (он был назван в честь знаменитого русского композитора А. Н. Скрябина). Роль фотоопти- ческого генератора в нем выполнял стеклянный диск, покрытый фотоэмульсией, на котором были отпечатаны 144 звуковые дорож- ки «чистых тонов». Звук задавался с помощью рисунков на специ- альной маске, располагавшейся между диском и фотоэлементом. AHC содержал 720 генераторов синусоидальных тонов. Он был запатентован в 1958 году, и вскоре при музее А. Н.Скрябина в Москве была создана Студия электронной музыки, в которой с АНС'ом экспериментировали такие композиторы, как Эдуард Артемьев, София Губайдуллина, Эдисон Денисов, Альфред Шнит- ке и др. [5]. В 1960 году появилась модель синтезатора «Model -Т Ford», созданная Р. Мугом (R. Moog). В ней автор впервые применил мо-
704 Глава 7 дули контроля напряжения, которые являются неотъемлемыми ус- тройствами всех последующих моделей этих инструментов. При- мерно в это же время появилась модель синтезатора «Model-200» Д. Бухла (D. Buchla) в США; и, наконец, в Лондонской студии элек- тронной музыки композитором П. Зиновьевым и инженером Д. Кор- кереллом в 70-е годы был создан портативный модульный синте- затор — Synthi AKS. Он имел две клавиатуры, секвенсор, два генератора шумов, два ревербератора, трехголосную память, во- семь фильтров и восемь мелодических генераторов. Если первые синтезаторы были монофоническими, то в 1975-м был создан пер- вый полифонический синтезатор на интегральных микросхемах PolyMoog. Большое семейство появившихся позже портативных синтеза- торов, например Minimoog, Sonic Six, Electrocomp 101 и др., обес- печило возможность широко использовать их в электронной музы- ке [6, 9, 19, 20]. Принцип работы любого аналогового синтезатора состоял в использовании различных модулей, каждый из которых мог кон- тролировать напряжение (а, следовательно, и выходные характе- ристики) другого. В основополагающей работе Р. Муга (R. Moog) в 1965 году было описано три основных типа модулей с контроли- руемым напряжением: генератор (VCO), усилитель (VCA) и фильтр На рис. 7.2.1 показан пример такого соединения модулей (patch), где используется два генератора, из которых один (VCO-1) служит для создания сигналов различной формы (синусоидальной, пилообразной и т. д.) и частоты (высоты тона), второй (VCO-2) — для контроля напряжения в выходном усилителе (VCA), что позво- ляет получить на выходе амплитудно-модулируемый сигнал. В качестве устройств, модулирующих напряжение основного ге- нератора или усилителя, могли использоваться низкочастотные фильтры (VCF) с изменяющимся значением добротности и частоты среза, что позволяло получить, например, сигнал с амплитудной и частотной модуляцией одновременно (сигналы такого типа час- то создаются в реальных музыкальных инструментах). Для этой же цели могли использоваться генераторы контроля огибающей (VCF). Рис. 7.2.1. Схема соединения модулей (patch) с использованием двух генераторов (VCO) и усилителя с управляемым коэффициентом усиления (VCA).
Электромузыкальные инструменты и компьютерные технологии 705 ; ADSR • I I JAR- - Сигнал Контроль напряжения Рис. 7.2.2. Схема соединения модулей (patch) с использованием фильтров (VCF) и генераторов огибающей (ADSR, AR) (envelope generator), позволяющие изменять временную структуру сигнала. Самые распространенные генераторы — типа ADSR (А — атака звука, D — спад, S — стационарная часть, R — спад) и AR. Схема контроля напряжения усилителя с помощью такого типа ге- нераторов и фильтров показана на рис. 7.2.2. Для контроля частоты, напряжения или частот среза в боль- шинстве синтезаторов применялся клавиатурный контроллер, как наиболее удобный для музыкантов (хотя использовались также джойстики и ленточные контроллеры). В аналоговых синтезаторах уже начали применяться секвенсоры, т. е. устройства, которые за- поминали последовательность нажатия клавиш, а затем позволя- ли эту последовательность воспроизводить. Первоначально они использовались только для подачи повторяющихся последователь- ностей контрольного напряжения — например, применялась за- кольцованная магнитная лента, на которую можно было записать любую последовательность сигналов. Достаточно часто в синтезаторах использовались генераторы белого шума, изменение амплитуды и частоты которых с помощью соответствующих контролирующих низкочастотных генераторов, позволяло получить AM- и ЧМ-модулированный сигнал с богатым спектром (см. гл. 2). Меняя индекс модуляции, можно было полу- чать динамически изменяющийся спектр воспроизводимого сигна- ла [6, 19]. В синтезаторах использовались и другие виды модулей, например кольцевые (ring) модуляторы, ревербераторы и т. д. Кро- ме того, большинство синтезаторов имело микрофонный вход, что позволяло обрабатывать сигнал с выхода микрофона и комбини- ровать его с искусственно синтезированными звуками, — это да- вало необычные эффекты. В аналоговых синтезаторах использо- вались гибкие и перестраиваемые схемы соединений (patch), которые давали возможность получать интересные музыкальные созвучия, примером может служить популярная модель аналогово- го синтезатора Minimoog. Один из видов аналоговых синтезаторов группы Moog показан на рис. 7.2.3. Следующим этапом развития синтезаторов стало появление гибридных систем, в которых применялась аналоговая схемотех- ника, но роль контроллеров напряжения выполнял компьютер или
706 Глава 7 Рис. 7.2.3. Аналоговый синтезатор Moog микропроцессор. В таких син- тезаторах использовалась до- статочно сложная схе- мотехника [6, 7, 13, 19, 32], позволяющая получать сигна- лы разнообразных волновых форм, смешивание которых в различных соотношениях позволяло создавать музы- кальные тоны с достаточно разнообразным тембром. Та- кая техника получила назва- ние аддитивный синтез. В синтезаторах использовалась и обратная операция, основанная на извлечении звуков путем их фильтрации из изначально бога- той гармонической формы, получившая название субтрактивный синтез. В 1967 году Дж. Чоунингом (J. Chowning) был предложен чрез- вычайно эффективный метод синтеза сигналов с помощью час- тотной модуляции — FM-синтез (см. гл. 2). Если один синусои- дальный сигнал (несущий) с частотой со 0 модулируется другим синусоидальным сигналом с частотой Q, то получается сложный сигнал: X(t) = A Qsin(co()t + т sin(Q t), в спектре которого наряду с сигналом с частотой CO0 появляются боковые составляющие с частотами (CO0 + £1). Амплитуды этих боковых составляющих изменяются (пропорционально функции Бесселя) в зависимости от величины индекса модуляции m = Aco/Q, где Асо — девиация (изменение) частоты исходного сигнала. Варьируя индекс модуля- ции и используя различные формы сигналов в качестве модулиру- ющих функций, можно получить сложный звуковой сигнал с ди- намически меняющимся спектром. Наиболее известным инструментом (с компьютером в качестве контроллера), работающим по принципу FM-синтеза, был синтеза- тор DX-7 фирмы Yamaha, появившийся в 1983 году и широко ис- пользовавшийся в популярной музыке. Следующим шагом в развитии синтезаторов было создание инструментов, работающих по принципу сохранения сэмплов (образцов) звучания различных музыкальных инструментов и го- лоса (sample playback). В их постоянной памяти записывалось большое количество образцов звучания различных музыкальных инструментов и синтезированных звуков, которые могли воспро- изводиться с различной звуковысотностью, громкостью и дли- тельностью под управлением клавиатуры. Такая техника синтеза требует больших объемов памяти, поскольку для реалистично- го звучания необходимо записывать образцы звучания инстру-
Электромузыкальные инструменты и компьютерные технологии 707 ментов не только с различной высотой тона, но и на различных динамических уровнях. Все это привело к широкому использованию Wave-Table(WT)- синтеза, когда звук создается с помощью наложения большого ко- личества очень коротких отрезков сэмплов. Обычно записывается один период формы волны в специальные таблицы волновых форм EPROM [13, 19]. Для создания сложного звука выбирается из таблиц определенное количество волновых отрезков, которые цик- лически повторяются (looping) на определенной скорости в зависи- мости от заданной частоты; подвергаются цифровой фильтрации (на них накладывается определенная форма огибающей из отдель- ных таблиц (envelope table); кроме того, используются другие виды цифровой обработки: интерполяция, сдвиг высоты и т. д. В этом случае цифровые синтезаторы работают по принципу сложения различных форм сигналов (синусоидальных, прямоугольных, пило- образных и др.), как это происходило в аналоговых синтезаторах, использующих большое количество генераторов [19]. Такой принцип работы позволяет обеспечить значительную экономию объемов памяти и создает достаточно широкие возможности формирования различных звучаний. Одним из первых примеров использования этой техники может служить модель синтезатора Roland МТ-100, в котором предусматривалась также возможность использования различных цифровых эффектов для обработки зву- ков (реверберация, эквализация и пр.). Дальнейшее развитие этой идеи привело к технике гранули- рованного (granular) синтеза [18, 19], в которой используются крошечные отрезки сэмплов (10-15 мкс) и стохастические вероят- ностные методы для предсказания их распределения в музыкаль- ных отрезках. Для этого была создана специальная программа GranuLab, доступная для загрузки из Интернета [33]. Эту технику широко использовал в своем творчестве греческий композитор Ксенакис. Существует смешанная техника «линейно-арифметический синтез», когда атака звука берется из сэмплов, а стационарная часть создается с помощью цифровых синтезаторов [18]. В последнее время все большую популярность завоевывают синтезаторы, которые работают по принципу физического модели- рования (PM) звука [18, 19]. Физическое моделирование предусмат- ривает использование математических моделей звукообразования реальных музыкальных инструментов для генерации в цифровом виде соответствующих волновых форм. Например, для духовых тростевых инструментов решается система нелинейных диффе- ренциальных уравнений, описывающих совместные колебания трости и столба воздуха в трубе, и рассчитывается форма выход- ного звукового сигнала (обычно цифровыми методами) при пода- че на вход такой системы различных видов сигналов. Полученный
708 Глава 7 сигнал затем с помощью ЦАП на звуковой карте конвертируется в аналоговый звуковой сигнал и воспроизводится через акустиче- скую систему. Такой способ синтеза создает модель поведения ре- ального музыкального инструмента, позволяет получить гораздо более реалистическое звучание, открывает новые возможности для изменения тембра, для создания новых видов инструментов; кроме того, он дает возможность в реальном времени управлять параметрами синтеза. Пионерами в области производства синте- заторов, работающих по принципу физического моделирования, были фирмы Korg и Yamaha — они первыми выпустили в сере- дине 90-х годов такие устройства (например, Yamaha VL-1). По- скольку создание детальных физических моделей музыкальных инструментов (рояля, например) представляет значительные математические трудности, то часто под методом физического моделирования понимается функциональное физическое модели- рование (Functional PM). В нем используются макромодель ин- струмента, который рассматривается как источник, генерирующий широкополосный сигнал, и набор фильтров, описывающих пове- дение резонаторов с учетом их обратного влияния на источник (техника морфинга, вокодинга — см. гл. 6) [19]. Значительным событием было появление синтезатора Kurzweil 250, использующего новые алгоритмы «искусственного интеллек- та» — Al, которые продолжают сейчас активно развиваться (ней- ронные сети, генетические алгоритмы и др.). С их помощью уда- лось создать звуки, очень близкие по тембру к звукам реальных музыкальных инструментов (например, концертного рояля и др.). Интенсивно проводимые в настоящее время работы по распозна- ванию тембров музыкальных инструментов с помощью компьюте- ров несомненно приведут к созданию принципиально новых синте- заторов, использующих особенности формирования пространного звукового образа в слуховой системе [34]. Полный переход на цифровые технологии привел к появлению новых устройств, реализуемых аппаратно или программно, — циф- ровых сэмплеров и секвенсоров. Сэмплеры (sampler) — это выполненные программно или аппа- ратно устройства, которые способны записывать в оперативную память образцы звуков (сэмплы) с любого внешнего источника, а затем воспроизводить эти звуки под управлением клавиатуры. У них установлена оперативная память большого объема, куда можно записать любые звуки, а потом воспроизвести их с разной высотой, громкостью и длительностью с помощью клавиатуры. С записанным материалом легко можно производить любые операции редактирования. Еще одно достоинство сэмплеров — это большие возможности по расширению. Для сэмплеров можно использовать большое количество библиотек звуков на компакт- дисках. В любом синтезаторе типа «sample playback» количество
Электромузыкальные инструменты и компьютерные технологии 709 звуков ограничено объемом постоянной записи, куда они предва- рительно должны быть записаны. В последнее время происходит сближение сэмплеров и синтезаторов типа «sample playback»: пер- вые приобретают специальную перезаписываемую постоянную па- мять, в которую можно загружать данные как и в оперативную, а последние дополняются оперативной памятью. Примером тако- го объединения этих устройств может служить Kurzweil K2000S. Секвенсор (sequencer) — программное или аппаратное устрой- ство, способное записывать, редактировать, сохранять и воспро- изводить музыкальные события [27]. Эти устройства запоминают последовательность нажатия клавиш на синтезаторе и любые дру- гие действия с органами управления, то есть они запоминают всю управляющую информацию. Преимущество записи управляющей информации в секвенсор перед записью звука того же синтезато- ра на цифровой магнитофон заключается в том, что в любой мо- мент времени можно отредактировать выбранный музыкальный отрывок. Кроме того, управляющий код занимает несравнимо меньше места, чем оцифрованный звук, поэтому секвенсорам не требуется для работы больших объемов памяти. Секвенсоры мо- гут выпускаться в отдельном корпусе для работы с любыми типа- ми синтезаторов. Также имеется целый класс объединенных уст- ройств, которые называются «рабочими станциями» и включают синтезатор типа «sample playback» или сэмплер и секвенсор, раз- мещенные в одном корпусе. Принципиально новым этапом в развитии электронных музы- кальных инструментов явилось создание цифровых синтезаторов (сэмплеров и секвенсоров), использующих связь друг с другом и с компьютером по стандарту MIDI. MIDI (Musical Instalments Digital Interface) — цифровой интерфейс музыкальных инструментов, который был разработан и стандарти- зован в 1983 году для обеспечения совместимости и стандартиза- ции принципов управления синтезаторами (и другими электронными музыкальными инструментами) разных моделей. Основное преиму- щество такого интерфейса заключается в том, что по нему пере- дается не информация о самом звуковом сигнале, а только управ- ляющая информация о действиях, которые выполняются на данном устройстве, что позволяет значительно сократить объем информации и обеспечить управление комплексом устройств (синтезаторов, секвенсоров, компьютеров и др.) в реальном вре- мени. Информация передается по 16 каналам и содержит три вида MIDI-сообщений: информацию об исполнении данной ноты (вклю- чает высоту тона, его длительность, силу нажатия клавиши); о смене значений контроллеров (с помощью которых можно управ- лять такими параметрами, как громкость, панорама, вибрато и др.); об исключительных системных сообщениях (SysEx), предна- значенных для какого-либо конкретного устройства. Кроме того,
710 Глава 7 СЕКВЕНСОР MIDI-выход (out) • • • • |о о •••I Аудиовыход MIDI-вход (in) Канал 1 Канал 2 Канал 3 Канал 2 Канал 3 !ВОСПРОИЗВЕДЕНИЕ Дорожка 1 Дорожка 2 Дорожка 3 к остальным дорожкам MIDI-выход (out) СИНТЕЗАТОР Рис. 7.2.4. Схема соединения синтезатора и секвенсора по MIDI-каналам с помощью этого интерфейса осуществляется временная синхро- низация все работающих устройств (MIDI-Time). Протокол MIDI дает возможность управлять с одной клавиатуры несколькими синтезаторами одновременно, записывать партии в секвенсор по очереди, а затем воспроизводить их на разных инструментах, соединенных с секвенсором с помощью MIDI-кабелей. Стандарт MIDI позволил не только совмещать синтезаторы и секвенсоры разных производителей, но и стандартизовать принципы управления синтезаторами разных моделей. Практи- чески все современные синтезаторы (секвенсоры, сэмплеры) оснащены MIDI-интерфейсом (рис. 7.2.4). Подробное описание принципов его работы можно найти в специальной литературе [13, 14, 19, 32, 35]. Таким образом, широкое распространение, начиная с 80-х го- дов, технологий цифрового синтеза привело в настоящее время к созданию нового поколения цифровых синтезаторов, выполня- емых аппаратно или программно («виртуальных» синтезаторов), которые обеспечивают огромные возможности воспроизведения естественных и синтезированных звуков с мультитембральной по- лифонией, со средствами разнообразного контроля параметров звуковых сигналов в реальном времени, с огромным количеством алгоритмов для процессорной обработки звуков (реверберация, хорус, флэнжинг, морфинг, вокодинг и др. — см. гл. 6), с возмож- ностью четкой реакции на индивидуальную манеру исполнителя и т. д. В последние годы используются методы создания «вирту- альных» аналоговых синтезаторов, для чего в компьютере созда- ется математическая модель работы усилителей, генераторов, фильтров и т. д. и с ее помощью моделируется их звучание.
Электромузыкальные инструменты и компьютерные технологии 711 Рис. 7.2.5. Компьютерная рабочая станция Fantom-X8 фирмы Roland Современные музыкальные рабочие станции (workstation), объединяющие компьютер, цифровой синтезатор, секвенсор, сэм- плер и другие устройства, с огромным банков звуков, многообра- зием алгоритмов и программ для их процессорной обработки, представляют собой новый класс музыкальных инструментов. Пер- вым в этой серии был разработан Synclavier фирмы New Eng. Digital Corp (Англия). В качестве примера современных музыкаль- ных рабочих станций можно указать модели К-2500 фирмы Kurzweil и Fantom-X8 фирмы Roland (рис. 7.2.5). Последняя отно- сится к новому поколению рабочих станций типа «Giga- Workstation» с объемом волновой памяти, расширяемым до 1 Гб. В синтезаторе (совместимом с General MIDI-2) имеется 88-клавиш- ная клавиатура с прогрессивным молоточковым механизмом, с возможностью разделения (split) и наложения (layer) темб- ров, 128-голосная полифония, 256 пэтчей (совокупность сэмплов и управляющей информации), 32 ударных установки, 64 набора инструментов (performances); 78 типов эффектов: хорус (3 типа), реверберации (5 типов); трехполосный компрессор и др. В состав станции входит сэмплер с объемом оперативной памяти 544 МБ, 16-дорожечный секвенсор (400000 нот), имеется линейный вход с шестью входными эффектами, четыре линейных выхода (2 — стерео или 4 — моно) и т. д. Появление такого типа музыкальных инструментов с огромны- ми возможностями для исполнителей открывает принципиально новые перспективы для развития электронной музыки и других на- правлений мультимедиа-искусства [39]. 7.3. КОМПЬЮТЕРНЫЕ МУЗЫКАЛЬНЫЕ ПРОГРАММЫ В настоящее время количество программ для работы с музы- кальными и речевыми сигналами растет в геометрической прогрес- сии вместе с увеличением мощности компьютеров. Программы постоянно усложняются и возможности их все время расширяют-
712 Глава 7 ся. В данном разделе приведена приближенная классификация основных видов этих программ. Разумеется, предложенная ниже классификация не исчерпывает всех видов музыкальных про- грамм, однако она позволяет дать некоторое общее представление о современных компьютерных музыкальных технологиях. Подроб- нее с ними можно ознакомиться в литературе [7, 9, 13, 19, 20, 32, 34-39]. Программы для редактирования и цифровой обработки звука (музыкальные редакторы) — основные возможности этих про- грамм предусматривают следующий набор функций: операции с файлами (запись, воспроизведение, импорт, сохранение и др.); редактирование (копирование, вырезание, увеличение или умень- шение громкости, микширование, инвертирование, реверс и др.); процессорная обработка (реверберация, эхо, хорус, дилей, флэн- жер, вибрато, эквалайзер, компрессия, сдвиг высоты тона и др.); работа с MIDI-интерфейсом (синхронизация по коду с MIDI-сек- венсором, ввод информации с MIDI-клавиатуры, наличие вирту- альной MIDI-клавиатуры и др.); синтез звука; синхронизация SMPTE; работа с видеофайлами и др. К перечисленным выше собственным возможностям этих программ следует отнести воз- можность подключения дополнительных модулей (plug-in) — на- пример, фирм Steinberg, Sonic Foundry.Waves и др., которые позво- ляют реставрировать записи, создавать виртуальные трехмерные звуковые поля и т. д. Все эти программы соответствуют единому стандарту Direct X, что позволяет работать с ними всем музыкаль- ным редакторам. Наиболее известные программы этой группы, используемые в настоящее время, — Sound Forge, WaveLab, Cool Edit Pro и др. Программы многоканальной записи и монтажа звука являют- ся аналогами ленточных многодорожечных магнитофонов: они по- зволяют записывать, микшировать и обрабатывать процессорами эффектов несколько независимых звуковых дорожек. Запись на жесткий диск имеет ряд преимуществ: мгновенный доступ к любо- му фрагменту, произвольный выбор последовательности фрагмен- тов для воспроизведения, возможность не разрушающего монтажа, широкий выбор редакторских возможностей. Примером таких про- грамм могут служить Samplitude Studio, Cool Edit Pro, Software Audio Workshop и др. Виртуальные студии включают в себя программы, которые по- зволяют работать как с аудио- (цифровым звуком), так и с MIDI- дорожками (синтезированным звуком) в одном окне. Каждая из них имеет большой выбор эффект-процессоров, цифровых микшеров, синтезаторов, позволяет применять специальные MIDI-приемы редактирования (квантизацию, транспонирование, изменение темб- ров и выбор инструментов и т. д.) и может работать с любыми
Электромузыкальные инструменты и компьютерные технологии 713 MIDI-устройствами. Примером таких программ могут служить Cubase VST SX, Cakewalk Sonar, Nuendo, Logic Audio Platinum, Reason и др. Виртуальные синтезаторы: осуществляют программным пу- тем имитацию различных типов синтезаторов (например, анало- говых). В них используются специальные постоянно совершен- ствующиеся математические алгоритмы, которые позволяют синтезировать сложные звуки различного тембра и мелодиче- ские последовательности, экспортировать синтезированный звук в стандартный звуковой файл, записывать и воспроизводить его. Кроме синтеза такие программы обычно используют банки запи- санных сэмплов (выступают в роли сэмплеров). Примером таких программ могут служить Reality, Audio Architect, Mellosoftron, Seq-303, MouSing, Gigasampler и др. Программы для создания MIDI-композиций: к их числу относят- ся прежде всего MIDI-секвенсоры — программы, позволяющие записывать, редактировать MIDI-сообщения и представлять их в виде треков. Как и в аппаратных секвенсорах, в них запомина- ется вся управляющая информация. Такие секвенсоры позволяют редактировать MIDI-сообщения (редактор списка, нотный редактор, редактор управления темпом, микшерный пульт и др.), обеспечи- вают возможность импорта/экспорта MIDI-файлов, работу с внешни- ми MIDI-устройствами, содержат аранжировщик, логический редак- тор, обеспечивают возможность цифровой записи, редактирования звуковых файлов, вызова внешних редакторов и т. д. Примерами таких программ могут служить Cubase Audio VST, Cakewalk Pro Audio, Logic Audio, Music Time 3.0, Digital Orchestrator Plus, Concertware, Power Chords Pro, Recording Session, Studio 4 и др. К этой же группе программ относятся автоаранжировщики, спо- собные создавать музыкальные партии на основе заданной аккор- довой схемы в разных музыкальных стилях и жанрах (Visual Arranger, Band and Box, Jammer Pro, Easy Keys и др.), музыкаль- ные конструкторы, обеспечивающие создание музыкального фай- ла на основе шаблонов или специальных алгоритмов (DoReMix, Koan X Platinum, Dance Machine и др.) Нотные редакторы выполняют: представление звуковой ин- формации в нотном виде с учетом общепринятых музыкальных символов; открытие одновременно нескольких нотных станов; под- держку различных музыкальных ключей; экспорт отдельной партии из партитуры; экспорт нотного текста в графический файл; печать со всеми символами; проигрывание нотного текста с помощью MIDI, конвертирование MIDI-файла в нотный текст и др. К числу таких программ можно отнести Encore, Finale, Sibelius, Score и др. Имеются также программы, обеспечивающие перевод нот в MIDI-сообщение (Midiscan), конвертирование звукового фай- ла в MIDI и нотный текст (Autoscore, Sound2Midi, AKoff Composer,
714 Глава 7 Gama с использованием одного из перечисленных выше МЮ1-сек- венсоров). Мультимедиа-плееры (аудиорекордеры, MIDI-плееры) предназ- начены для воспроизведения различных звуковых и MIDI-файлов, аудиокомпакт-дисков и др., при этом они обеспечивают управление процессом воспроизведения, изменение параметров исполнения, поиск нужных файлов, составление альбомов и др. (Winamp, Midi Master, Music Genie, Media и др.) Обучающие музыкальные программы, которые сейчас активно развиваются, предназначены для решения различных задач: обу- чения теории музыки, развития слуха (Piano Professor, Music Lessons, Music Tutorial и др.), изучения музыкальной литературы (Midisoft Sound Explorer, Music mentor, Music Magic и др.), обучения игре на каком-либо инструменте (Midisoft Play Piano, The Jazz Guitarist, Chord Wizard) и обучения вокалу (Singing Tutor) и др. Кроме этих программ, имеется большое разнообразие других программных продуктов, обеспечивающих работу с музыкальными файлами [35-39]. Таким образом, современные компьютеры, оснащенные набо- ром специальных программ, обеспечивают технические средства для создания, записи и редактирования музыкальных произве- дений, т. е. являются по существу новым видом музыкальных инструментов. Появление таких возможностей является базой для развития существующих и создания новых направлений в музыкальном искус- стве (в т. ч. электронной или компьютерной музыки), а также осно- вой для развития научных и технических исследований в области музыкальной акустики. Начало XXI века отмечено формированием синтеза музыкаль- ного искусства, музыкальной акустики (как его естественнонаучной основы) и компьютерных технологий, что позволяет ожидать прин- ципиально новых открытий во всех этих направлениях.
Электромузыкальные инструменты и компьютерные технологии 715 Контрольные вопросы к главе 7 1. В чем состоят особенности принципов звукообразования в электро- музыкальных инструментах? 2. Изложить основные этапы истории создания электромузыкальных инструментов. 3. Показать основные элементы конструкции электрогитары и их роль в звукообразовании. 4. Какие типы звукоснимателей используются в современных электро- гитарах? 5. Какие устройства используются в современных электрических цепях электрогитар? Их роль и назначение (процессоры спецэффектов, усилители, акустические агрегаты). 6. Показать основы устройства и принципы звукоизвлечения в Rhodes Piano. 7. Показать основы устройства органов Хаммонда и принципы звуко- извлечения в современных цифровых органах. 8. Объяснить принцип работы терменвокса. 9. Показать историю развития и принципы работы синтезаторов. 10. Перечислить основные виды компьютерных музыкальных программ и их назначение.
716 Глава 7 Список литературы 1. Порвенков В. Г. Акустика и настройка музыкальных инструментов: Методическое пособие по настройке. M.: Музыка, 1990. 2. Hall D. Musical Acoustics. An Introduction. N. Y.: Wadsworth Publ., 1980. 3. Музыкальные инструменты мира I Пер. с англ. Минск.: Энц., 2001. 4. Орлов Л. Основы синтеза звука / Звукорежиссер. 1998. № 10; 1999. № 1-6. 5. Володин А. А. Электромузыкальные инструменты. M.: Музыка, 1979. 6. Rossing Т. D. The Science of Sound. N. Y: Addison-Wesley Publ., 1982. 7. Alan Douglas. The Electronic Musical Instrument Manual: A Guide to Theory and Design. London: Focal Press, 1976. 8. Корсунский С Г., Симонов И. Д. Электромузыкальные инструменты. M.: Госэнергоиздат, 1957. 9. The New Grove dictionary of music and musicians I Ed. S. Sadie. London: Macmillan Press, 1994. V. 1-20. 10. Encyclopedia Britannica Online, www.britannica.com 11. Термен Л. С Физика и музыкальное искусство. M.: Знание, 1966. 12. Меерзон Б. Я. Электромузыкальные инструменты. M.: Знание, 1977. 13. Williams D. В., Webster P. R. Experiencing Music Technology. N. Y.: Schirmer Books, 1996. 14. Lehrman P, Tully Т. MIDI for the Professional. N. Y: Amsco Publication, 1993. 15. Кузнецов Л. А. Акустика музыкальных инструментов. Справочник. M.: Легпромбытиздат, 1989. 16. Смолин К. О Звукосниматели. Справочник. M.: Изд. Смолина, 2003. 17. Арзуманов С Секреты гитарного звука. M.: Изд. Смолина, 2003. 18. Encyclopedia of Acoustics I Ed. by M. Crocker. N. Y: Jonh Wiley & Sons. 1997. V. l-A 19. Brice R. Music Engineering. Oxford.: Newnes, 2001. 20. Chadabe J. Electric Sound: The Past and Promise of Electronic Music. Upper Saddle River. N. Y: Prentice Hall, 1997. 21. Welch W L. and L. B. S. Burt. From Tinfoil to Stereo: The Acoustic Year soft the Recording Industry, 1877-1929. Gainesville: University Press of Florida, 1994. 22. http://dynotone.ru/index.html; http://www.guitarT^astere.narod.ni/mdex_Ust.hmi 23. http://www.badrat.com/rhodes/supersite 24. http://www.wikipedia.org/wiki/Rhodes_piano 25. http://www.foi.hr/~rlogozar/rnbsnl/AnalogSynthsRhodesPianos.html 26. Schaeffer R. A la Recherche d'une Musique Concrete. Paris: Editions du Seuil, 1952. 27. Королев A. H. Музыкально-компьютерный словарь. СПб.: Компози- тор, 2000. 28. http://www.rolandmusic.ru/st/key/hammond.htm 29.http://theatreorgans.com/hammond/fag/all_hammonds.html 30. http://eidos.kiam.ru/group/theremin.html
Электромузыкальные инструменты и компьютерные технологии 717 31. http://www.oddmusic.corrVtheremin/index.html. 32. Nyquist К R Music & Technology. N. Y.: Billboard Book, 1989. 33. http://hem.passagen.se/rasmuse/Granny.htm 34. Kostec В. Soft Computing in Acoustics. Heidelberg: Physica-Verlag, 1999. 35. Белунцов В. Музыкальные возможности компьютера. СПб.: Питер, 2000. 37. Живайкин 77. 77. 600 звуковых и музыкальных программ. СПб.: BHV-Ю, 1999. 38. Дубровский Д. Ю. Компьютер для музыкантов, любителей и профес- сионалов. M.: ТРИУМФ, 1999. 39. Dodge С, Jerse J. A Computer Music: Synthesis, Composition & Performance. N. Y.: Schimmer Books, 1985.
Приложение Современная система обозначения нот в равномерно-темперированной шкале частот Значение частоты /„ Гц Обозначение ноты ~~1 CH 277,2 DH 311,1 FH 370,0 GH 415,3 АН 466,2 OJ5 554,4 DK5 622,3 FK5 740,0 GK5 830,6 Att5 932,3 С«6 1109 DI6 1245 FK6 1480 GK6 1661 А|6 1865 С«7 2217 DK7 2489 FJ7 2960 GtI 3322 А«7 3729 Значение частоты —— L Гц Обозначение Г ноты П 16,35 СО 18,35 DO 20,60 Е0 21,83 FO 24,50 GO 27,50 А0 30,87 во 32.70 Cl 36.71 Dl 41,20 El 43,65 Fl 48,00 Gl 5,00 Al 61,74 Bl 65,41 С2 73,43 D2 82,41 Е2 87,31 F2 98,00 G2 110,0 А2 123.5 В2 130,8 СЗ 146,8 D3 164,8 ЕЗ 174.6 F3 196,0 G3 220,0 A3 247,0 ВЗ CItO 17,32 DItO 19,45 F80 23,13 G»0 25,96 А«0 29,14 си DJtI FIl Gttl АН 34,64 38,89 46,25 51,91 58,27 С#2 69,30 DS2 77,78 Ш 92,50 GK2 103,8 А»2 116,5 ОЗ 138,6 DtB 155,6 Ftt3 185,0 GI3 207,7 AB 233,1
Приложение 719
И. Алдошина, Р. Приттс А 45 Музыкальная акустика. Учебник. — СПб.: Композитор Санкт-Петербург, 2006. — 720 с, ил. ISBN 5-7379-0298-6 Настоящий учебник предназначен для студентов высших учебных за- ведений, специализирующихся в области подготовки звукорежиссеров, аудиоинженеров, композиторов, музыковедов и др., а также может быть рекомендован аспирантам, научным работникам и другим специалистам в области аудиотехники и компьютерного музыкального творчества Учебник содержит информацию по следующим основным направле- ниям предмет и история музыкальной акустики; физика звука; основы психоакустики; акустика музыкальных инструментов и голоса; акустика концертных залов и студий; системы звукозаписи и звуковоспроизведе- ния, принципы построения электромузыкальных инструментов. Учебник снабжен большим количеством таблиц, схем, графиков и оснащен обшир- ной библиографией ко всем рассмотренным темам. ББК 85.315.3 Ирина Аркадьевна АЛДОШИНА Рой ПРИТТС МУЗЫКАЛЬНАЯ АКУСТИКА Учебник Художественно-технический редактор Т. И Кий Корректор А Е. Моносов Макет и компьютерная верстка Т. Ю Фадеевой Отрисовка рисунков В. А. Ревской Подписано в печать 22 11.2006. Гарнитура Arial, Times Формат 60 xilOO/16. Бумага офс. Печать офс. Печ л. 46 Уч -изд л. 52. Тираж 1000 экз. Заказ № 2987. Издательство «Композитор • Санкт-Петербург» 190000, Санкт-Петербург, Большая Морская ул., 45. Тел (812) 314-50-54, 312-04-97 Факс: (812) 314-50-54 E-mail, sales@compozitorspb.ru Internet: 11ItPZZwWw1COmPOzUOr-SPb1I-U Отпечатано с готовых диапозитивов в ООО «Типография Правда 1906». 195299, Санкт-Петербург, Киришская ул., 2 Тел - (812) 531-20-00, (812) 531-25-55