Аннотация: В этой статье показан способ определения информативности музыкальных произведений.
Опыт применения теории информации при оценке музыкальных произведений
Введение
В 1947-1948г.г. американский математик Клод Шеннон указал на область математики, которую назвал 'теорией информации'.
На практике очень часто приходится сталкиваться с опытами, могущими давать различные результаты в зависимости от обстоятельств, которые мы не умеем учесть. Например, при бросании игральной кости мы не можем знать заранее, какая из граней окажется сверху, так как это зависит от очень многих неизвестных нам обстоятельств (деталей движения руки, бросающей кость, положение игральной кости в момент броска, особенностей поверхности, на которую падает кость и.т.д.).
Применение математики к изучению явлений такого рода опирается на то, что во многих случаях при многократном повторении одного и того же опыта в одних и тех же условиях частота появления рассматриваемого результата остаётся всё время примерно одинаковой, близкой к некоторому числу 'Р'. Это постоянное число называется вероятностью рассматриваемого события. Другими словами, вероятность некоторого события равна отношению числа равновероятных исходов, благоприятных для данного события, к общему числу равновероятных исходов.
Для практики важно уметь численно оценивать степень неопределённости самых разнообразных опытов, чтобы иметь возможность сравнить их с этой стороны. Последнее условие наталкивает на мысль принять за меру неопределённости опыта, имеющего 'К' равновероятных исходов число 'log K'. Такое определение меры неопределённости согласуется с условиями, что при К=1 она равна нулю и что при возрастании 'К' она возрастает.
Выбор основания логарифмов здесь несуществен .
Переход от одной системы логарифмов к другой сводится лишь к умножению функции f(x)=log K на постоянный множитель, то есть равна простому изменению единицы измерения степени неопределённости. В конкретных применениях 'меры неопределённости' обычно используют логарифмы по основанию 'два'. Это означает, что за единицу измерения
степени неопределённости здесь принимается неопределённость, содержащаяся в опыте, имеющем 'два' равновероятных исхода. Такая
единица измерения неопределённости называется БИТОМ. Если используется логарифмы по основанию '10', то такая единица называется ДИТОМ.
В качестве меры неопределённости используется величина Н(а)=pi log pi, где pi - вероятность i - го события и принято её называть ЭНТРОПИЕЙ.
Так как - 'pi log pi' равно нулю лишь при pi =0 или pi=1, то ясно, что энтропия Н(а) опыта (а) равна нулю лишь в том случае, когда одна из вероятностей Р1,Р2...Рi равна единице, а все остальные равны нулю. Это обстоятельство хорошо согласуется со смыслом величины Н(а) как меры неопределённости: действительно, только в этом случае опыт вообще не содержит никакой неопределённости.
Приведём пример. Русский текст содержит 'N' признаков - это буквы от А до Я, а так же: '.', ',', ':', ';', '-', '!', '?', пробел, всего 42 признака .Энтропия опыта при условии, что все признаки считаются одинаково вероятными равна Но На самом деле в русском языке разных признаков не одинаково вероятно. Строго говоря, эти частоты зависят от характера текста. Например, в учебнике по высшей математике частоты обычно очень редкой буквы 'Ф' заметно выше средней из-за частого повторения слов 'функция', 'дифференциал', 'коэффициент'. Большие отклонения от нормы в частоте употребления отдельных признаков можно наблюдать в некоторых художественных произведениях, особенно в стихах. Например, в стихотворении К.Д. Бальмонта 'Камыши' (Полночной порою в болотной глуши чуть слышно, бесшумно шуршат камыши...) всё построено на обыгрывании шипящих звуков 'Ч' и 'Ш'. Суммарная энтропия появления соответствующих признаков в выбранном тексте определяется выражением: Н(а)= РаlogPa+PбlogРб+т.д. Неравномерность появления признаков содержащихся в выбранном тексте осуществляется сравнением значения Н(а) с величиной Но=log N по формуле: К =Н(а)/Н(о) (1).
Величина Н(а) индивидуальна для каждого автора, написавшего стихи или прозу, о чём было сказано выше.
В мире звуков, который окружает нас существенное место занимает музыка. 'Хорошая' или 'плохая' музыка? На этот вопрос может ответить теория информации.
1. Методика оценки качества музыкального произведения
Конкретное музыкальное произведение можно анализировать:
1) По длительности и высоте звуков;
2) По приёмам извлечения звука;
3) По силе звука;
4) По темпу;
5) По характеру музыкального произведения.
Вычисления проводились с использованием формулы(1), которая в развернутом виде имеет следующую конфигурацию:
К = 1/logN*(Nа/n/logNа/n+Nб/nlogNб/n +Nв/n+Nг/n +...+Nпробел/n) (2),
где К - коэффициент значимости музыкального произведения
N - число признаков. В нашем случае N = 42, а log 42 = 5.343;
N i - число опытов, в котором наблюдается признак;
n - общее число производимых опытов.
В число признаков входит русский буквенный алфавит от буквы 'А' до буквы 'Я' включительно, а так же 'точка', 'запятая', 'двоеточие', 'точка с запятой', 'тире', 'кавычки', 'восклицательный знак', 'вопросительный знак', 'пробел'. Всего 42 признака.
Ноты, их длительность и высота, приёмы, извлечения звука, сила звука, темп, характер музыкального произведения зашифрованы под буквы русского алфавита и показаны в таблицах 1,2,3,4,5.
Вычисления реализованы в программе ВИХРЬ ФОНЕТИКА ,которая составлена автором этих строк и её алгоритм использования приведён ниже .
Для анализа сложных музыкальных произведений, по- видимому, следует использовать весь диапазон фортепиано, где реализовано звучание в пределах контроктавы, большой октавы, малой октавы, а так же 1, 2 и 3 октавы и один признак следует отнести на паузы.
Выполнены расчёты информативности следующих простых музыкальных произведений : 'Комар', 'Весёлые гуси', 'Я на горку шла', 'Во саду ли в огороде'.
Параметр 'К' означает отношение информации, заключённой в высоте и длительности нот данного музыкального произведения к максимально возможной. Чем больше 'К', тем информативнее, интереснее музыкальное сочинение.
Для песенок 'Весёлые гуси', 'Я на горку шла', 'Во саду ли в огороде' 'К 'соответственно равен 44,52%, 51,47%. При п=31,37,123.
Обращает на себя внимание, что чем больше нот и чем шире их диапазон в данном сочинении, тем больше коэффициент 'К'.
Иллюстрацией этого, может служить следующий факт: песня 'Комар' написана 4 нотами, а песня 'Во саду ли в огороде' -12 нотами. Коэффициент 'К' при этом, соответственно равен 35,68% и 56,55%. На слух второе произведение более благозвучно, а следовательно более информативно, что и доказывается математическими расчётами.
В подтверждении указанного факта говорит и ещё одно обстоятельство. В приведённой нотной записи песня 'Во саду ли в огороде' состоит из 2 -х частей: 1 часть (16 тактов) написана 6 нотами; здесь К = 46,70%, 2 часть (16тактов) написана вариациями 12 нотами и в этом случае К = 62,06%. В сумме обе части (32 такта) составляют единое сочинение и при этом К = 56,55%, то есть внесение в структуру музыкального произведения вариаций с расширенным диапазоном звуков приводит к увеличению информативности, а следовательно повышенной значимости сочинения.
Следует сказать, что увеличение длительности пауз, уменьшает информативность музыкального произведения, а следовательно его ценность. Например, если вместо музыки 'звучит' пауза, то информация в этом случае равна 'нулю', что и подтверждается математическими расчётами.
Аналогичные результаты получаем, если в течение всех тактов звучит лишь одна нота.
Исполнение мелодии аккордами несёт в себе большую информацию, чем исполнение одной нотой.
Проиллюстрируем это утверждение на примере песенки 'Комар'.
Песенка представлена нотами соль, до, си, ля или соответственно в зашифрованном виде через буквы русского алфавита Г, Й, Н,Л. Причём нота соль =Г - 8шт., до = Й - 6шт., си =Н - 4шт., ля = Л - 3шт. Здесь n = 21шт. Песня заканчивается нотой 'до', длительностью '1'.
Эта же песенка имеет заключительным аккордом ноты 'до', 'соль', 'ми', 'до' длительностью так же '1'. В итоге имеем соль = Г = 12, до = Й = 10шт., си = Н =4 шт., ля = Л = 3шт, ми = Ж = 4шт. Всего нотных знаков 33шт.
В этом случае, когда песня заканчивается аккордом до - соль - ми - до длительностью так же как и в первом случае, равной '1', коэффициент информативности равен 39,04%, что в 1,106 раз превышает игру без аккордов.
Расчёты коэффициента информативности проводились компьютерной программой 'ВИХРЬ', составленной автором этих строк.
Алгоритм вычислений был следующим: ПК → рабочий стол → Диск Д → программы → программа 'Вихрь' → фонетика. В рабочее поле программы вводим ноты, закодированные под буквы русского алфавита: а, б, в,... пробел (см. таблицу ?1 ) сумма n → сумма Ni/n → cумма Ni/n log Ni/n → расчёт коэффициента информативности. В окошке видим его значение в процентах. Например, для сочинения 'Комар' он равен 35,68%.
Ниже приводятся ноты к песням 'Комар', 'Весёлые гуси', 'Я на горку шла', 'Во саду ли в огороде', таблицы кодирования музыкальных произведений: по высоте звуков, по приёмам извлечения звуков, по силе звука, по темпу, по характеру сочинения смотри в таблицах 1,2,3,4,5.
Таблица 1. Кодирования музыкального произведения по высоте звуков
Буква А: ля
Буква Б: ля# (сиb)
Буква В: си
Буква Г: до
Буква Д: до #(реb)
Буква Е: ре
Буква Ё: ре#( миb)
Буква Ж: ми
Буква З: фа
Буква И: фа#(сольb)
Буква Й: соль
Буква К: соль #(ляb)
Буква Л: ля
Буква М: ля# (сиb)
Буква Н: си
Буква О: до
Буква П: до#(реb)
Буква Р: ре
Буква С: ре#(миb)
Буква Т: ми
Буква У: фа
Буква Ф: фа #(сольb)
Буква Х: соль
Буква Ц: соль#(ляb)
Буква Ч: ля
Буква Ш: ля#(сиb)
Буква Щ: си
Буква Ъ: до
Буква Ы: до# (реb)
Буква Ь: ре
Буква Э: ре#(миb)
Буква Ю: ми
Буква Я: пауза
Таблица 2. Кодирование музыкального произведения по приёмам извлечения звука
Буква А: Legato (легато)
Буква Б: поп Legato (неполное легато)
Буква В: Staccato (стаккато)
Буква Г: Репетиция
Буква Д: Portamento (портаменто)
Буква Е: Glissando (глиссандо)
Буква Ж: Tremolo (тремоло)
Таблица 3. Кодирования музыкального произведения по силе звука
Буква А: р - piano (пиано) - тихо
Буква Б: mр - mezzo piano (меццо пиано) - не очень тихо
Буква В: pр - pianissimo (пианиссимо) - очень тихо
Расчёты коэффициента значимости реализованы в программе 'ВИХРЬ'. С этой целью закодированы через буквы русского алфавита нотные записи:
1) По высоте и длительности звуков (таблица ?1)
2) По приёмам извлечения звуков (таблица ?2)
3) По силе звука (таблица ?3)
4) По темпу (таблица ?4)
5) По характеру сочинения (таблица ?5)
Например, вот как выглядят кодированные записи высоты и длительности звуков для музыкальных произведений.
'Комар' (К = 35,68%) п = 14
О Й О Н Л Н Й Й Л Н Й Й Л Н
'Весёлые гуси' (К=47,58%)п = 31
Ж Е Г Й Й Й Й З Ж Е Г Й Й Й Й З З Л З Ж Ж Й Ж Е З Ж Е Г Г Г Г
'Я на горку шла' (51,47%) п = 37
У Т Т Р Р О О Х У Т О Р Н О О Р Р Л Л Н Н О О Н Н Л Л Й Й Й Й Н Н Л Л Н Н
'Во сади ли, в огороде' (56,55%) п = 123
У У У У Т Т Т Т Р Р Р Р Р Р Т Т У У У У Р Р Р Р Р Р Р Р О О О О Н Н Н Н Л Л Л Л Л Л Н Н О О О О Н Н Н Н Л Л Л Л Л Л Л Л Т Р У Т Р П Т Р Л Р П Р Т У Х У Т Р У Т Р П Т Р Т Ц Т Х У Т Р О Н Л О Н Л К Н Л Ж И К Л Н О Р О Н Л О Н Л К Н Л Н О Т Ч Ч Ч Ч Я.
Каждой букве соответствует высота звука, их повторение - длительности.
Упомянутые записи вводятся на рабочее поле программы 'ВИХРЬ'. Компьютер сам считает количество букв в данной последовательности ( Ni), общее количество букв (п), далее (Ni/п, logNi/п, Ni/пlogNi/n и наконец К = количество информации, содержащейся в данном музыкальном произведении для соответствующего признака.
Основное время в вычислениях занимает кодирование. Величина количества информации :
1) По высоте и длительности К равен соответственно для произведений:
К 1 'Комар - 35,68%'К2 'Весёлые гуси - 47,58%',К3 'Я на горку шла - 51,47%'К4 'Во саду ли ,в огороде - 56,55%'.
Совершенно очевидно, что чем сложнее и длиннее музыкальное произведение, тем больше информации оно содержит.
Аналогично, можно произвести расчёты 'К' для остальных признаков.
2) По приёмам извлечения звука
2.1 'Комар'
А А А А А (легато)
К 2.1 = 0
2.2 'Весёлые гуси'
Б Б Б Б Б Б Б Б (неполное легато)
К 2.2 = 0
2.3 'Я на горку шла'
Б Б Б Б Б Б Б Б Б Б Б Б Б (неполное легато)
К 2.3 = 0
2.4 'Во саду ли, в огороде'
А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А А (легато)
К 2.4 = 0
3) По силе звука
3.1 'Комар'
Ж Ж Ж Ж Ж (умеренно громко)
К 3.1 = 0
3.2 'Весёлые гуси'
Ж Ж Ж Ж Ж Ж Ж Ж (умеренно громко)
К 3.2 = 0
3.3 'Я на горку шла'
Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж (умеренно громко)
К 3.3 = 0
3.4 'Во саду ли, в огороде'
Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж (умеренно громко)
К 3.4 = 0
4) По темпу
4.1 'Комар'
Ж Ж Ж Ж Ж (умеренно)
К 4.1 = 0
4.2 'Весёлые гуси'
Ж Ж Ж Ж Ж Ж Ж Ж (умеренно)
К 4.2 = 0
4.3 'Я на горку шла'
Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж (умеренно)
К 4.3 = 0
4.4 'Во сади ли, в огороде'
Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж (умеренно)
З З З З З З З З З З З З З З З З (оживлённо)
К 4.4 = 1 = 18,54%
5) По характеру сочинения
5.1 'Комар'
Ж Ж Ж Ж Ж (певуче)
К 5.1 = 0
5.2 'Весёлые гуси'
И И И И И И И И И (спокойно)
К 5.2 = 0
5.3 'Я на горку шла'
Д Д Д Д Д Д Д Д Д Д Д Д Д (воодушевлённо)
К 5.3 =0
5.4 'Во саду ли, в огороде'
Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж Ж (певуче)
А А А А А А А А А А А А А А А А (возбуждённо)
К 5.4 = 18,54%
В итоге имеем К для:
1) 'Комар' К 1 = (35,68%+0+0+0+0) х 1/5 =7,14%
2) 'Весёлые гуси' К 2 = (44,52%+0+0+0+0)х 1/5= 8,90%
3) 'Я на горку шла' К 3 = (51,47%+0+0+0+0)х1/5 = 10,29%
4) 'Во саду ли, в огороде' К 4 =(56,55%+0+0+18,54%+0)х 1/5 = 15,02%
В обобщённом виде коэффициент информативности (К) равен для произведений: