Uma modelagem Categorial para a Teoria Musical :)1 1 Instituto de Informática – Universidade Federal do Rio Grande do Sul (UFRGS) Caixa Postal 15.064 – 91.501-970 – Porto Alegre – RS – Brazil Abstract. This paper describes a simple aproach at modeling some musical structures common to western music in a precise and mathematic manner by using Category Theory. In the course of the work we’ll introduct models for musical notes, scales and melodies together with tempo restrictions to be applied to the melodies. Finally, a method of musical scale and melody transposition using categorial properties will be shown. Resumo. Este artigo descreve uma abordagem simples para modelar algumas construções comuns à música ocidental de maneira matemática e precisa se utilizando de Teoria das Categorias. Durante o trabalho serão introduzidos modelos para notas musicais, escalas e melodias bem como restições de tempo associadas às notas. Posteriormente será apresentado um método para realizar transposições de melodias entre escalas se utilizando de propriedades categoriais. 1. Introdução: Sobre músicos e matemáticos A música é uma das maiores áreas de experimentação para o intelecto humano, unindo um estudo de estruturas extremamente abstratas com uma aplicação totalmente pragmática. Ao longo dos anos, diversas teorias tentaram dar um embasamento teórico preciso para a música buscando inspiração na matemática, principalmente na teoria dos conjuntos [Forte 1979]. Este trabalho busca usar Teoria das Categorias para expressar de forma genérica, concisa e não ambígua várias construções comuns à teoria musical. 1.1. Motivação Um aspecto muito interessante da música é que o seu estudo envolve diversas áreas e, por consequência, também diversas teorias. [Mazzola et al. 2002] argumenta que existem quatro diferentes atividades no processo que é denominado música, sendo elas: percepção, comunicação, produção e documentação. Cada uma dessas áreas possui diferentes construções e notações usadas para os seus fins específicos. Neste artigo em especial, serão abordados os temas de produção e documentação da música. Estamos interessados em investigar as seguintes questões: • Quais são as construções mais básicas possíveis na teoria musical? • Como essas construções podem ser denotadas de forma concisa e não ambígua? • É possível facilitar o processo de composição de uma peça por meio das construções notacionais usadas? • Dada uma construção musical (uma melodia por exemplo) é possível a derivação de novas construções a partir dela? • Como se daria essa derivação? Desde o início do trabalho se deseja apresentar como motivação maior uma integração das respostas a estas perguntas com uma abordagem algorítmica para a produção e documentação de música, de forma que estas possam ser aplicadas proceduralmente por um computador. 2. Um modelo matemático Para começar bem vamos tomar uma simples melodia, como o Hino à Alegria (Ode to Joy) da 9a sinfonia de Bethoven, por exemplo. Seria interessante econtrar algum padrão comum nela que nos permitisse uma discretização, uma divisão em pedaços menores e correlacionados que podem ser expressos de maneira mais enxuta e formal e, se desejado, compostos novamente para se obter a melodia original. Uma peça musical é composta por uma infinitude de fatores, como por exemplo melodia, timbre, instrumento, interpretação do artista, etc... No entanto existem alguns aspectos invariantes nessa mistura e segundo [Nattiez 1990] podemos considerar o conceito de nota musical como um dos átomos de uma melodia. A expressão nota musical, entretanto, é usada informalmente com dois significados distintos: • Fisicamente: Um som com uma frequência específica (traduzido livremente do inglês ‘pitch’). • Simbolicamente: Um símbolo que representa um som com uma frequência específica associado a um intervalo de tempo. Apropriando-se da segunda definição, é possível expressar uma melodia como uma cadeia de notas simbólicas e portanto denotar o Hino à Alegria como a "string"Mi, Mi, Fá, Sol, Sol, Fá, Mi, Ré... e assim por diante. Esta representação indutiva de melodia é exatamente um dos aspectos da música que a tornam um perfeito exercício da matemática e da cognição humana [Zatorre et al. 2002] e terá um papel muito importante no desenvolvimento deste artigo. 2.1. Uma rápida fundamentação Na música ocidental moderna 1 podemos mapear, a partir da frequência padrão de 440Hz para o Lá (A4), as frequências em notas simbólicas usando (1): n f (n) = 2 12 × 440Hz (1) Desta forma as frequências que representam notas "válidas"são dadas pela imagem dessa função, que tem como domínio os números inteiros. Usando a notação científica musical [Young 1939] obtemos que valores de n positivos são mais agudos que o Lá e os negativos mais graves. A variável n pode ser considerada como o índice da nota, indicando a sua posição relativamente ao padrão. 1 Esta consideração é necessária, pois o temperamento das notas, ou seja, as divisões de frequências utilizadas para representar as notas musicais, varia bastante durante a história da música, bem como nas diferentes culturas. Como símbolos tradicionalmente se estabelece a letra A para denotar o Lá, B para o Si e assim por diante até o Sol que é denotado por G. Entre cada dois tons, com exceção das transições E,F e B,C, existe o que é chamado de um acidente, que geralmente é denotado pelo nome da nota anterior seguido de um #. Temos então 12 símbolos distintos: A, A#, B, C, C#, D, D#, E, F, F#, G e G#. Note que ao se tomar um n qualquer, a razão f (n + 12)/f (n) será igual a 2, ou seja, a cada doze "passos"teremos o dobro da frequência original e esta, por convenção, é denotada com a mesma letra. Por exemplo, a frequência para o A padrão é f(0) = 440Hz e portanto f(12) = 880Hz também é a nota A. Cada nova repetição dos símbolos é chamada oitava e duas notas com o mesmo símbolo mas de oitavas distintas são diferenciadas por um número indicando a qual oitava a nota pertence. 440Hz é definido como A4 e portanto 880Hz é o A5 e consequentemente 220Hz é A3, mais exemplos podem ser encontrados na tabela 1. A última consideração importante é que em teoria musical geralmente se falam de intervalos usando os termos tom e semitom (ou meio tom) onde o primeiro se refere a uma diferença de 2 intervalos de n e o segundo apenas 1. Durante o artigo serão usados estes termos bastante informalmente para se referir a incrementos e decrementos nos "índices"das notas. Índice Frequência -1 415.30469 2 493.88330 1 466.16376 15 1046.50226 Símbolo G3 B4 A#4 C5 Tabela 1. Notas e suas frequências 3. O conjunto das notas musicais Após a leitura da sessão anterior podemos intuitivamente imaginar que existem infinitas notas musicas. Segue uma definição mais formal deste conjunto: Seja o monóide definido por: hZ, +, 0i (2) e mais conhecido como Zad. O conjunto suporte de (2) representa todos os índices possíveis para a geração de notas a partir de (1) 2 . De fato, existe um morfismo em Set que leva Z num conjunto com todas as frequências de notas e visto que ele é definido por (1), que é injetora e sobrejetora, sabemos que ele é mono e epi (para prova ver [Menezes and Haeusler 2001]) e portanto o conjunto das notas é isomorfo aos números inteiros. Este conjunto será chamado de M n para fins de referência. 2 Pode ser interessante observar um subconjunto finito das notas que represente apenas as notas “acessíveis” aos ouvidos humanos. Um esquema parecido com este é utilizado para representar sons MIDI, onde a indexação começa do 0 e é apenas incrementada até um valor máximo de 127 4. Melodias Partindo de M n podemos facilmente derivar um conjunto que contemple também todas as melodias possíveis seguindo uma simples sequência de passos. Primeiro aplicamos o funtor esquecimento sobre (2) visto como uma categoria para extrair apenas conjunto suporte que engloba todas as notas musicais. Em seguida este conjunto pode ser novamente transformado em um monóide se for enriquecido com a operação concatenação de notas e o elemento neutro palavra vazia (equivalente à não tocar nenhuma nota). Deste forma definimos: M l = hM n, ⊕, i (3) Onde: • M n: é o conjunto obtido com a aplicação do funtor esquecimento em (2) após o morfismo (1) • ⊕: Operação de concatenação de notas • : Não tocar nenhuma nota O conjunto livremente gerado por este monóide representará todas as melodias passíveis de serem construídas3 . Este conjunto será chamado de M l para fins de referência. 4.1. Observações Da mesma maneira que a definição do conjunto dos números naturais usando a categoria NAd é em si deliciosamente engenhosa e inútil os conjuntos M n e M l por si só não são muito interessantes. Entretanto, M n resolve o problema da definição das notas de uma maneira muito simples, todas podem ser obtidas por meio de (1). M l por sua vez mostrará sua utilidade mais adiante. Adicionalmente existem algumas pequenas considerações a serem feitas sobre estes resultados. Em primeiro lugar, M n trata de uma simplificação do modelo simbólico de notas, pois não leva consigo nenhuma informação temporal e consequetemente M l também não. Relacionar cada nota a um tempo e criar continuidade e rítmo será abordado mais tarde neste artigo. Outra consideração, que não constitui empecilho para os argumentos apresentados aqui, é que se supõe que o semitom usado para construir M n é o mesmo usado na música ocidental. Esta suposição, porém não é necessária, pois poderíamos trabalhar com pedaços arbitrariamente menores de frequências (seria necessário apenas modificar a função geradora) e de fato isto é interessante para modelar notações musicais que ostentem frequências intermediáras das notas “normais”, como por exemplo o “bend” de uma guitarra que pode acrescer àlguma nota por 41 de tom. Porém estas questões não serão discutidas aqui. 3 Na realidade, em consonância com o que foi dito anteriormente, definimos aqui o conjunto de todas as melodias com esta divisão de frequencias 4.2. Transposição de melodias No caso de tomarmos o conjunto M l podemos definir morfismos entre ele e outros conjuntos. O importante é notar que estes conjuntos podem possuir “valores“ diferentes de notas e assim o que acontece é, de certa forma, uma modificação da melodia original. Exemplos de morfismos (em Set) e suas respectivas semânticas estão ilustrados na tabela 2, lembrando que existe um morfismo f : Z → M l e portanto a podemos trabalhar com funções de números inteiros e contar com a composição de setas para que eles se manifestem em M l. Tendo definido esta renomeação, podemos aplicá-la numa ”string“ melodia prédefinida para derivar uma nova melodia modificada condizente com os novos nomes das notas. 4.3. Além das transposições isomorfas Como pode ser visto na tabela 2, g(n) continua sendo um isomorfismo entre conjuntos com a exceção do último caso em que temos apenas um epimorfismo (facilmente verificado ao perceber que a função resto da divisão reduz a cardinalidade da imagem da função para apenas 12). Este exemplo demonstra que podemos usar dos epimorfismos para transpor melodias e obter efeitos interessantes, como por exemplo remover certas notas. g(n) Significado n+2 Aumenta em dois semitons n − 12 Diminui em uma oitava n + 12 Aumenta em uma oitava n mod 12 Coloca todas notas na mesma oitava Tabela 2. Morfismos entre conjuntos de notas Com relação à melodia da tabela 3, a figura 1 demonstra um morfismo definido em termos dos números inteiros que ”retira” (na realidade elas estão sendo mapeadas para uma nota um semitom mais alta) todas as notas tal que n mod 6 o que transcorre numa modificação da sonoridade relativa da melodia original. Figura 1. Exemplo de epimorfismo entre notas Melodia Notas Indices A 0 Nova melodia Notas A Indices 0 D# 6 C 3 A 0 G A -2 0 E 7 C 3 G 0 G A -2 0 Tabela 3. Exemplo de melodia simples e transposição 5. Uma modelagem para os tempos Como dito na introdução deste trabalho, existe mais numa nota musical do que a sua frequência. Para que a notação esteja completa precisamos incorporar o conceito de tempo a cada uma das notas da melodia. O tempo de cada nota numa peça musical é expresso por frações de uma duração temporal medida em batidas por segundo (do inglês beats per second). Esta duração é chamada tempo da música e geralmente é aplicada a todas as notas da peça. Tendo ciência de que o tempo “global” da melodia não é o importante e sim os tempos relativos nos voltamos para ao conjunto Q dos números racionais. Usando uma técnica semelhante à derivação de M n e nos aproveitando do fato de Q e Z serem conjuntos contáveis (para prova ver [Lang 1993] ) construímos T n, isomorfo ao conjunto suporte do monóide Zad, porém sendo mapeado por (4): t(n) = T empo × h(n) (4) Onde: • T empo é o tempo global sendo aplicado às notas • h(n) é a n-ésima fração do conjunto Q Analogamente à criação do conjunto M l podemos enriquecer o conjunto T n para formar T l como segue: T l = hT n, ⊕, i (5) • T n: é o conjunto suporte de (2) com a aplicação de (4) • ⊕: Operação de concatenação de tempos • : Não espera nenhum tempo 5.1. Tempos como restrições: uma soma ordenada A definição de T l, o conjunto de todos os “strings“ de tempo, abre caminho para a união do conceito de tempo, com o conceito de melodia. Em suma o que queremos é dizer para cada nota de uma melodia qual é o tempo que deve ser aplicado a ela. Esta união pode ser facilmente alcançada como uma operação de Soma Amalgada entre uma melodia m ∈ M l e tempos t ∈ T l definida como segue: hSo, p : M l → So, q : T l → Soi (6) Onde: • So: M l +N T l objeto resultante da soma amalgamada • p e q: Imersões de M l e T l em So • N : é o conjunto restrição que representa a ordem implícita (estabelecida pela concatenação) a cada elemento de M l e T l Esta operação é basicamente uma soma ordenada pelas posições de cada elemento dos dois conjuntos. Um exemplo da restrição de tempo sobre uma melodia pode ser encontrado na figura 2. Figura 2. Aplicando restrições de tempo sobre as notas 6. Escalas Musicais Outro conceito vital na teoria musical é o de escala musical. Esta pode ser definida como um conjunto de notas simbólicas, geralmente expresso de maneira ordenada crescente de frequência e gerado a partir de uma nota inicial e um “passo”.4 [Benward 2003]. Uma escala possui tantas notas quanto forem necessários passos para que se chegue na primeira oitava da nota inicial, depois desse ponto as notas se repetem ciclicamente. A mais famosa escala é com certeza a de Dó maior, a qual o leitor deve saber recitar decor. Uma escala maior é gerada a partir de uma nota inicial e do passo: “Tom Tom SemiTom Tom Tom Tom SemiTom”. Detalhes podem ser vistos na tabela 4. O conjunto de notas gerado (incluíndo as suas respectivas oitavas) é a escala maior da nota tomada como início (chamada tônica). Existem diversos tipos de escalas: pentatônica, maior, menor, menor harmônica, entre muitas outras. 4 Geralmente e em especial nessa publicação especificado em número de semitons Símbolo C D Passo - 2 Passo Absoluto 0 2 Índice 0 1 E 2 4 2 F G 1 2 5 7 3 4 A B 2 2 9 11 5 6 C 1 12 7 Tabela 4. Escala de Dó Maior Interessantemente podemos notar que o conjunto de notas M n pode ser considerado como uma escala iniciada de um nota qualquer e com um intervalo de um semitom entre cada uma das notas. Esta escala, que engloba todas as notas é conhecida na teoria musical como a escala cromática. A criação da escala cromática na forma do conjunto M n começa a sugerir que talvez seja possível fazer o mesmo com as diversas escalas. Em suma, gerar o conjunto de todas as notas de uma escala e em consequência também o de todas as melodias associadas a ela. Construindo a partir da seção 4.3 podemos imaginar que a definição de uma escala se dá por um morfismo de M n para um novo conjunto, de forma que as notas não presentes na escala sejam deixadas de fora. Por exemplo, para a obtenção da escala de C maior observamos que será necessário retirar as notas A# ,C# ,D# ,F# ,G# e consequentemente todos os elementos n tal que n mod 12 ∈ {1, 4, 6, 8, 11}. Para fazer essa exclusão existem algumas opções: • Definição de uma função parcial: Elementos não desejados não são mapeados para o novo conjunto (pode ser usado com Set⊥) • Definição de função não injetora: Semelhante ao desenvolvido em 4.3, podemos ter dois elementos do domínio mapeados para apenas um na imagem. Os dois meios podem ser utilizados e diferem na semântica que se quer dar ao morfismo, sendo o primeiro um mapeamento que identifica todas as notas “inválidas” em um ponto específico e o segundo mais semelhante a uma tradução “com perda” para a nova escala. 6.1. Modelando as diferentes escalas musicais Como é possível deduzir, existem tantas escalas quantas permutações de intervalos diferentes possam ser encontradas entre a ocorrência de uma nota inicial e sua oitava. Visto que este é um número limitado é possível gerar proceduralmente todas as escalas possíveis ao se definirem estas limitações com morfismos de M n → M n. Sendo assim cada escala musical nada mais é do que um morfismo sobre M n (a escala cromática) e todas elas podem ser denominadas pelo tipo de morfismo aplicado (pode ser usado o próprio nome da escala) e a nota inicial. 6.2. Escalas como templates Tendo um conjunto de notas resultante da aplicação de um morfismo escala sobre M n podemos esquecer os índices absolutos destas notas ( que são vestígio da escala cromática) e normalizá-los de acordo com as posições relativas das notas dentro da escala. Na tabela 4 a última linha exibe estes índices na escala de C maior. Esta renomeação permite abstrair as escalas em que estão as melodias, de forma que a escala musical age como um “template” de como a música deve ser tocada, porém a sonoridade pode ser modificada por um morfismo para uma escala diferente como pode ser visto na tabela 5. Símbolo C D Passo - 2 Passo Absoluto 0 2 Símbolo E F# Passo - 2 Passo Absoluto 0 2 Índice 0 1 E F 2 1 4 5 G A 1 2 3 5 2 3 G 2 7 B 2 7 4 A 2 9 C 1 8 5 B C 2 1 11 12 D# E 3 1 11 12 6 7 Tabela 5. Escala de Dó Maior x Escala Menor Harmônica de Mi Sendo assim um conjunto livremente gerado pode definir todas as melodias tocadas dentro de uma escala e o mapeamento entre escalas disponibiliza um método de “transposição” automático. 7. Conclusão Neste trabalho foi apresentada uma maneira para modelar construções musicais e suas relações baseada em teoria das categorias. A teoria das categorias permite uma abstração poderosa, pois é possível esquecer os valores absolutos de frequência das notas e se preocupar apenas com as relações que estas tem entre si, podendo alternar entre diferentes sonoridades de maneira transparente. Além disso esta abstração pode ser muito proveitosa na implementação computacional de um sistema musical, visto que é uma representação muito enxuta. Este esquema permite um acesso algorítmico às diferentes sonoridades por meio de manipulações matemáticas simples das de notas, tempos e suas assossiações. Algumas questões deixadas em aberto neste trabalho são a modelagem de acordes e “busca”, por assim dizer, no espaço infinito de possibilidades gerado pelas notas. Este último aspecto poderia ser aproveitado para criar um sistema que gere música com diferentes estilos e sonoridades sem interação humana, ou ainda que possa se adaptar e tocar juntamente com um músico. Referências Benward, B. (2003). Music: in Theory and Practice : Spiral. McGraw-Hill College, Boston. Forte, A. (1979). The structure of atonal music. Yale Univ. Press, New Haven [u.a.], 3. pr. edition. Lang, S. (1993). Real and functional analysis. Springer. Mazzola, G., Göller, S., and Müller, S. (2002). The topos of music : geometric logic of concepts, theory, and performance. Birkhauser Verlag, Basel; Boston. Menezes, P. B. and Haeusler, E. H. (2001). Teoria das Categoarias. Livros Didáticos. Editora Sagra Luzzatto. Nattiez, J.-J. (1990). Music and Discourse: Toward a Semiology of Music. Princeton University Press. Young, R. W. (1939). Terminology for logarithmic frequency units. The Journal of the Acoustical Society of America, 11(1):134–139. Zatorre, R., Belin, P., and Penhune, V. (2002). Structure and function of auditory cortex: music and speech. Trends in Cognitive Sciences, 6(1):37–46.