Uma modelagem Categorial para a Teoria Musical

Uma modelagem Categorial para a Teoria Musical
:)1
1
Instituto de Informática – Universidade Federal do Rio Grande do Sul (UFRGS)
Caixa Postal 15.064 – 91.501-970 – Porto Alegre – RS – Brazil
Abstract. This paper describes a simple aproach at modeling some musical
structures common to western music in a precise and mathematic manner by
using Category Theory. In the course of the work we’ll introduct models for musical notes, scales and melodies together with tempo restrictions to be applied
to the melodies. Finally, a method of musical scale and melody transposition
using categorial properties will be shown.
Resumo. Este artigo descreve uma abordagem simples para modelar algumas
construções comuns à música ocidental de maneira matemática e precisa se
utilizando de Teoria das Categorias. Durante o trabalho serão introduzidos
modelos para notas musicais, escalas e melodias bem como restições de tempo
associadas às notas. Posteriormente será apresentado um método para realizar
transposições de melodias entre escalas se utilizando de propriedades categoriais.
1. Introdução: Sobre músicos e matemáticos
A música é uma das maiores áreas de experimentação para o intelecto humano, unindo um
estudo de estruturas extremamente abstratas com uma aplicação totalmente pragmática.
Ao longo dos anos, diversas teorias tentaram dar um embasamento teórico preciso para
a música buscando inspiração na matemática, principalmente na teoria dos conjuntos
[Forte 1979]. Este trabalho busca usar Teoria das Categorias para expressar de forma
genérica, concisa e não ambígua várias construções comuns à teoria musical.
1.1. Motivação
Um aspecto muito interessante da música é que o seu estudo envolve diversas áreas e,
por consequência, também diversas teorias. [Mazzola et al. 2002] argumenta que existem quatro diferentes atividades no processo que é denominado música, sendo elas: percepção, comunicação, produção e documentação.
Cada uma dessas áreas possui diferentes construções e notações usadas para os
seus fins específicos. Neste artigo em especial, serão abordados os temas de produção e
documentação da música. Estamos interessados em investigar as seguintes questões:
• Quais são as construções mais básicas possíveis na teoria musical?
• Como essas construções podem ser denotadas de forma concisa e não ambígua?
• É possível facilitar o processo de composição de uma peça por meio das construções notacionais usadas?
• Dada uma construção musical (uma melodia por exemplo) é possível a derivação
de novas construções a partir dela?
• Como se daria essa derivação?
Desde o início do trabalho se deseja apresentar como motivação maior uma integração das respostas a estas perguntas com uma abordagem algorítmica para a produção e
documentação de música, de forma que estas possam ser aplicadas proceduralmente por
um computador.
2. Um modelo matemático
Para começar bem vamos tomar uma simples melodia, como o Hino à Alegria (Ode to
Joy) da 9a sinfonia de Bethoven, por exemplo. Seria interessante econtrar algum padrão
comum nela que nos permitisse uma discretização, uma divisão em pedaços menores e
correlacionados que podem ser expressos de maneira mais enxuta e formal e, se desejado,
compostos novamente para se obter a melodia original.
Uma peça musical é composta por uma infinitude de fatores, como por exemplo
melodia, timbre, instrumento, interpretação do artista, etc... No entanto existem alguns aspectos invariantes nessa mistura e segundo [Nattiez 1990] podemos considerar o conceito
de nota musical como um dos átomos de uma melodia.
A expressão nota musical, entretanto, é usada informalmente com dois significados distintos:
• Fisicamente: Um som com uma frequência específica (traduzido livremente do
inglês ‘pitch’).
• Simbolicamente: Um símbolo que representa um som com uma frequência específica associado a um intervalo de tempo.
Apropriando-se da segunda definição, é possível expressar uma melodia como
uma cadeia de notas simbólicas e portanto denotar o Hino à Alegria como a "string"Mi,
Mi, Fá, Sol, Sol, Fá, Mi, Ré... e assim por diante. Esta representação indutiva de melodia é
exatamente um dos aspectos da música que a tornam um perfeito exercício da matemática
e da cognição humana [Zatorre et al. 2002] e terá um papel muito importante no desenvolvimento deste artigo.
2.1. Uma rápida fundamentação
Na música ocidental moderna 1 podemos mapear, a partir da frequência padrão de 440Hz
para o Lá (A4), as frequências em notas simbólicas usando (1):
n
f (n) = 2 12 × 440Hz
(1)
Desta forma as frequências que representam notas "válidas"são dadas pela imagem dessa função, que tem como domínio os números inteiros. Usando a notação científica musical [Young 1939] obtemos que valores de n positivos são mais agudos que o
Lá e os negativos mais graves. A variável n pode ser considerada como o índice da nota,
indicando a sua posição relativamente ao padrão.
1
Esta consideração é necessária, pois o temperamento das notas, ou seja, as divisões de frequências
utilizadas para representar as notas musicais, varia bastante durante a história da música, bem como nas
diferentes culturas.
Como símbolos tradicionalmente se estabelece a letra A para denotar o Lá, B para
o Si e assim por diante até o Sol que é denotado por G. Entre cada dois tons, com exceção
das transições E,F e B,C, existe o que é chamado de um acidente, que geralmente é denotado pelo nome da nota anterior seguido de um #. Temos então 12 símbolos distintos: A,
A#, B, C, C#, D, D#, E, F, F#, G e G#.
Note que ao se tomar um n qualquer, a razão f (n + 12)/f (n) será igual a 2, ou
seja, a cada doze "passos"teremos o dobro da frequência original e esta, por convenção, é
denotada com a mesma letra. Por exemplo, a frequência para o A padrão é f(0) = 440Hz e
portanto f(12) = 880Hz também é a nota A. Cada nova repetição dos símbolos é chamada
oitava e duas notas com o mesmo símbolo mas de oitavas distintas são diferenciadas por
um número indicando a qual oitava a nota pertence. 440Hz é definido como A4 e portanto
880Hz é o A5 e consequentemente 220Hz é A3, mais exemplos podem ser encontrados
na tabela 1.
A última consideração importante é que em teoria musical geralmente se falam
de intervalos usando os termos tom e semitom (ou meio tom) onde o primeiro se refere
a uma diferença de 2 intervalos de n e o segundo apenas 1. Durante o artigo serão usados estes termos bastante informalmente para se referir a incrementos e decrementos nos
"índices"das notas.
Índice Frequência
-1
415.30469
2
493.88330
1
466.16376
15
1046.50226
Símbolo
G3
B4
A#4
C5
Tabela 1. Notas e suas frequências
3. O conjunto das notas musicais
Após a leitura da sessão anterior podemos intuitivamente imaginar que existem infinitas
notas musicas. Segue uma definição mais formal deste conjunto:
Seja o monóide definido por:
hZ, +, 0i
(2)
e mais conhecido como Zad. O conjunto suporte de (2) representa todos os índices
possíveis para a geração de notas a partir de (1) 2 .
De fato, existe um morfismo em Set que leva Z num conjunto com todas as frequências de notas e visto que ele é definido por (1), que é injetora e sobrejetora, sabemos
que ele é mono e epi (para prova ver [Menezes and Haeusler 2001]) e portanto o conjunto
das notas é isomorfo aos números inteiros. Este conjunto será chamado de M n para fins
de referência.
2
Pode ser interessante observar um subconjunto finito das notas que represente apenas as notas
“acessíveis” aos ouvidos humanos. Um esquema parecido com este é utilizado para representar sons MIDI,
onde a indexação começa do 0 e é apenas incrementada até um valor máximo de 127
4. Melodias
Partindo de M n podemos facilmente derivar um conjunto que contemple também todas
as melodias possíveis seguindo uma simples sequência de passos. Primeiro aplicamos o
funtor esquecimento sobre (2) visto como uma categoria para extrair apenas conjunto suporte que engloba todas as notas musicais. Em seguida este conjunto pode ser novamente
transformado em um monóide se for enriquecido com a operação concatenação de notas
e o elemento neutro palavra vazia (equivalente à não tocar nenhuma nota). Deste forma
definimos:
M l = hM n, ⊕, i
(3)
Onde:
• M n: é o conjunto obtido com a aplicação do funtor esquecimento em (2) após o
morfismo (1)
• ⊕: Operação de concatenação de notas
• : Não tocar nenhuma nota
O conjunto livremente gerado por este monóide representará todas as melodias
passíveis de serem construídas3 . Este conjunto será chamado de M l para fins de referência.
4.1. Observações
Da mesma maneira que a definição do conjunto dos números naturais usando a categoria
NAd é em si deliciosamente engenhosa e inútil os conjuntos M n e M l por si só não
são muito interessantes. Entretanto, M n resolve o problema da definição das notas de
uma maneira muito simples, todas podem ser obtidas por meio de (1). M l por sua vez
mostrará sua utilidade mais adiante.
Adicionalmente existem algumas pequenas considerações a serem feitas sobre
estes resultados. Em primeiro lugar, M n trata de uma simplificação do modelo simbólico de notas, pois não leva consigo nenhuma informação temporal e consequetemente
M l também não. Relacionar cada nota a um tempo e criar continuidade e rítmo será
abordado mais tarde neste artigo.
Outra consideração, que não constitui empecilho para os argumentos apresentados aqui, é que se supõe que o semitom usado para construir M n é o mesmo usado na
música ocidental. Esta suposição, porém não é necessária, pois poderíamos trabalhar
com pedaços arbitrariamente menores de frequências (seria necessário apenas modificar
a função geradora) e de fato isto é interessante para modelar notações musicais que ostentem frequências intermediáras das notas “normais”, como por exemplo o “bend” de uma
guitarra que pode acrescer àlguma nota por 41 de tom. Porém estas questões não serão
discutidas aqui.
3
Na realidade, em consonância com o que foi dito anteriormente, definimos aqui o conjunto de todas as
melodias com esta divisão de frequencias
4.2. Transposição de melodias
No caso de tomarmos o conjunto M l podemos definir morfismos entre ele e outros conjuntos. O importante é notar que estes conjuntos podem possuir “valores“ diferentes de
notas e assim o que acontece é, de certa forma, uma modificação da melodia original.
Exemplos de morfismos (em Set) e suas respectivas semânticas estão ilustrados na tabela
2, lembrando que existe um morfismo f : Z → M l e portanto a podemos trabalhar
com funções de números inteiros e contar com a composição de setas para que eles se
manifestem em M l.
Tendo definido esta renomeação, podemos aplicá-la numa ”string“ melodia prédefinida para derivar uma nova melodia modificada condizente com os novos nomes das
notas.
4.3. Além das transposições isomorfas
Como pode ser visto na tabela 2, g(n) continua sendo um isomorfismo entre conjuntos
com a exceção do último caso em que temos apenas um epimorfismo (facilmente verificado ao perceber que a função resto da divisão reduz a cardinalidade da imagem da
função para apenas 12). Este exemplo demonstra que podemos usar dos epimorfismos
para transpor melodias e obter efeitos interessantes, como por exemplo remover certas
notas.
g(n)
Significado
n+2
Aumenta em dois semitons
n − 12
Diminui em uma oitava
n + 12
Aumenta em uma oitava
n mod 12 Coloca todas notas na mesma oitava
Tabela 2. Morfismos entre conjuntos de notas
Com relação à melodia da tabela 3, a figura 1 demonstra um morfismo definido
em termos dos números inteiros que ”retira” (na realidade elas estão sendo mapeadas para
uma nota um semitom mais alta) todas as notas tal que n mod 6 o que transcorre numa
modificação da sonoridade relativa da melodia original.
Figura 1. Exemplo de epimorfismo entre notas
Melodia
Notas
Indices
A
0
Nova melodia
Notas
A
Indices
0
D#
6
C
3
A
0
G A
-2 0
E
7
C
3
G
0
G A
-2 0
Tabela 3. Exemplo de melodia simples e transposição
5. Uma modelagem para os tempos
Como dito na introdução deste trabalho, existe mais numa nota musical do que a sua
frequência. Para que a notação esteja completa precisamos incorporar o conceito de tempo
a cada uma das notas da melodia. O tempo de cada nota numa peça musical é expresso
por frações de uma duração temporal medida em batidas por segundo (do inglês beats
per second). Esta duração é chamada tempo da música e geralmente é aplicada a todas
as notas da peça.
Tendo ciência de que o tempo “global” da melodia não é o importante e sim
os tempos relativos nos voltamos para ao conjunto Q dos números racionais. Usando
uma técnica semelhante à derivação de M n e nos aproveitando do fato de Q e Z serem
conjuntos contáveis (para prova ver [Lang 1993] ) construímos T n, isomorfo ao conjunto
suporte do monóide Zad, porém sendo mapeado por (4):
t(n) = T empo × h(n)
(4)
Onde:
• T empo é o tempo global sendo aplicado às notas
• h(n) é a n-ésima fração do conjunto Q
Analogamente à criação do conjunto M l podemos enriquecer o conjunto T n para
formar T l como segue:
T l = hT n, ⊕, i
(5)
• T n: é o conjunto suporte de (2) com a aplicação de (4)
• ⊕: Operação de concatenação de tempos
• : Não espera nenhum tempo
5.1. Tempos como restrições: uma soma ordenada
A definição de T l, o conjunto de todos os “strings“ de tempo, abre caminho para a união
do conceito de tempo, com o conceito de melodia. Em suma o que queremos é dizer
para cada nota de uma melodia qual é o tempo que deve ser aplicado a ela. Esta união
pode ser facilmente alcançada como uma operação de Soma Amalgada entre uma melodia
m ∈ M l e tempos t ∈ T l definida como segue:
hSo, p : M l → So, q : T l → Soi
(6)
Onde:
• So: M l +N T l objeto resultante da soma amalgamada
• p e q: Imersões de M l e T l em So
• N : é o conjunto restrição que representa a ordem implícita (estabelecida pela
concatenação) a cada elemento de M l e T l
Esta operação é basicamente uma soma ordenada pelas posições de cada elemento
dos dois conjuntos. Um exemplo da restrição de tempo sobre uma melodia pode ser
encontrado na figura 2.
Figura 2. Aplicando restrições de tempo sobre as notas
6. Escalas Musicais
Outro conceito vital na teoria musical é o de escala musical. Esta pode ser definida como
um conjunto de notas simbólicas, geralmente expresso de maneira ordenada crescente de
frequência e gerado a partir de uma nota inicial e um “passo”.4 [Benward 2003]. Uma
escala possui tantas notas quanto forem necessários passos para que se chegue na primeira
oitava da nota inicial, depois desse ponto as notas se repetem ciclicamente.
A mais famosa escala é com certeza a de Dó maior, a qual o leitor deve saber
recitar decor. Uma escala maior é gerada a partir de uma nota inicial e do passo: “Tom
Tom SemiTom Tom Tom Tom SemiTom”. Detalhes podem ser vistos na tabela 4. O
conjunto de notas gerado (incluíndo as suas respectivas oitavas) é a escala maior da nota
tomada como início (chamada tônica). Existem diversos tipos de escalas: pentatônica,
maior, menor, menor harmônica, entre muitas outras.
4
Geralmente e em especial nessa publicação especificado em número de semitons
Símbolo
C D
Passo
- 2
Passo Absoluto 0 2
Índice
0 1
E
2
4
2
F G
1 2
5 7
3 4
A B
2 2
9 11
5 6
C
1
12
7
Tabela 4. Escala de Dó Maior
Interessantemente podemos notar que o conjunto de notas M n pode ser considerado como uma escala iniciada de um nota qualquer e com um intervalo de um semitom
entre cada uma das notas. Esta escala, que engloba todas as notas é conhecida na teoria
musical como a escala cromática.
A criação da escala cromática na forma do conjunto M n começa a sugerir que
talvez seja possível fazer o mesmo com as diversas escalas. Em suma, gerar o conjunto de
todas as notas de uma escala e em consequência também o de todas as melodias associadas
a ela.
Construindo a partir da seção 4.3 podemos imaginar que a definição de uma escala se dá por um morfismo de M n para um novo conjunto, de forma que as notas não
presentes na escala sejam deixadas de fora. Por exemplo, para a obtenção da escala de C
maior observamos que será necessário retirar as notas A# ,C# ,D# ,F# ,G# e consequentemente todos os elementos n tal que n mod 12 ∈ {1, 4, 6, 8, 11}. Para fazer essa exclusão
existem algumas opções:
• Definição de uma função parcial: Elementos não desejados não são mapeados
para o novo conjunto (pode ser usado com Set⊥)
• Definição de função não injetora: Semelhante ao desenvolvido em 4.3, podemos
ter dois elementos do domínio mapeados para apenas um na imagem.
Os dois meios podem ser utilizados e diferem na semântica que se quer dar ao
morfismo, sendo o primeiro um mapeamento que identifica todas as notas “inválidas” em
um ponto específico e o segundo mais semelhante a uma tradução “com perda” para a
nova escala.
6.1. Modelando as diferentes escalas musicais
Como é possível deduzir, existem tantas escalas quantas permutações de intervalos diferentes possam ser encontradas entre a ocorrência de uma nota inicial e sua oitava. Visto
que este é um número limitado é possível gerar proceduralmente todas as escalas possíveis ao se definirem estas limitações com morfismos de M n → M n. Sendo assim cada
escala musical nada mais é do que um morfismo sobre M n (a escala cromática) e todas
elas podem ser denominadas pelo tipo de morfismo aplicado (pode ser usado o próprio
nome da escala) e a nota inicial.
6.2. Escalas como templates
Tendo um conjunto de notas resultante da aplicação de um morfismo escala sobre M n
podemos esquecer os índices absolutos destas notas ( que são vestígio da escala cromática)
e normalizá-los de acordo com as posições relativas das notas dentro da escala. Na tabela
4 a última linha exibe estes índices na escala de C maior. Esta renomeação permite abstrair as escalas em que estão as melodias, de forma que a escala musical age como um
“template” de como a música deve ser tocada, porém a sonoridade pode ser modificada
por um morfismo para uma escala diferente como pode ser visto na tabela 5.
Símbolo
C D
Passo
- 2
Passo Absoluto 0 2
Símbolo
E F#
Passo
- 2
Passo Absoluto 0 2
Índice
0 1
E F
2 1
4 5
G A
1 2
3 5
2 3
G
2
7
B
2
7
4
A
2
9
C
1
8
5
B C
2
1
11 12
D# E
3
1
11 12
6
7
Tabela 5. Escala de Dó Maior x Escala Menor Harmônica de Mi
Sendo assim um conjunto livremente gerado pode definir todas as melodias tocadas dentro de uma escala e o mapeamento entre escalas disponibiliza um método de
“transposição” automático.
7. Conclusão
Neste trabalho foi apresentada uma maneira para modelar construções musicais e suas
relações baseada em teoria das categorias. A teoria das categorias permite uma abstração
poderosa, pois é possível esquecer os valores absolutos de frequência das notas e se preocupar apenas com as relações que estas tem entre si, podendo alternar entre diferentes
sonoridades de maneira transparente. Além disso esta abstração pode ser muito proveitosa
na implementação computacional de um sistema musical, visto que é uma representação
muito enxuta. Este esquema permite um acesso algorítmico às diferentes sonoridades por
meio de manipulações matemáticas simples das de notas, tempos e suas assossiações.
Algumas questões deixadas em aberto neste trabalho são a modelagem de acordes
e “busca”, por assim dizer, no espaço infinito de possibilidades gerado pelas notas. Este
último aspecto poderia ser aproveitado para criar um sistema que gere música com diferentes estilos e sonoridades sem interação humana, ou ainda que possa se adaptar e tocar
juntamente com um músico.
Referências
Benward, B. (2003). Music: in Theory and Practice : Spiral. McGraw-Hill College,
Boston.
Forte, A. (1979). The structure of atonal music. Yale Univ. Press, New Haven [u.a.], 3.
pr. edition.
Lang, S. (1993). Real and functional analysis. Springer.
Mazzola, G., Göller, S., and Müller, S. (2002). The topos of music : geometric logic of
concepts, theory, and performance. Birkhauser Verlag, Basel; Boston.
Menezes, P. B. and Haeusler, E. H. (2001). Teoria das Categoarias. Livros Didáticos.
Editora Sagra Luzzatto.
Nattiez, J.-J. (1990). Music and Discourse: Toward a Semiology of Music. Princeton
University Press.
Young, R. W. (1939). Terminology for logarithmic frequency units. The Journal of the
Acoustical Society of America, 11(1):134–139.
Zatorre, R., Belin, P., and Penhune, V. (2002). Structure and function of auditory cortex:
music and speech. Trends in Cognitive Sciences, 6(1):37–46.