Música Adaptativa

Transcrição

Música Adaptativa
Áudio Adaptativo ao Contexto para Jogos:
Música Adaptativa
Tiago Roberto Conceição da Silva
Instituto de Informática – Universidade Federal do Rio Grande do Sul (UFRGS)
Caixa Postal 15.064 – 91.501-970 – Porto Alegre – RS – Brazil
[email protected]
Abstract. This paper presents an overview of the state of the art in the
context-adaptive audio for games, focusing in the sub-area of adaptive
music, trying to describe the theme evolution since its first try until the
recent developed researches in the area, always providing real examples
of its use when available.
Resumo. Este artigo apresenta uma visão geral do estado da arte na
área de áudio adaptativo ao contexto para jogos, focando-se na área de
música adaptativa, tentando descrever a evolução do tema desde sua
primeira tentativa até as pesquisas desenvolvidas na área atualmente,
sempre providenciando exemplos reais de seu uso quando possível.
1. Considerações iniciais
O som é produzido por vibrações que perturbam o ar, causando ondas de pressão
que viajam em todas as direções a partir da fonte emissora. Quando essas ondas
atingem a orelha, elas causam vibrações que geram sinais elétricos, enviados para
o cérebro. Esses sinais elétricos são percebidos como áudio [Prince 1997].
Áudio na mídia interativa de entretenimento atual progrediu muito além dos
beeps dos primeiros videogames, já que com a tecnologia conhecida é possível
fazer com que um objeto ou um ambiente dentro do jogo exiba um grande
número de relações complexas com outros objetos e com o ambiente em si: uma
criatura pode ficar surpresa ao ver o jogador; um inimigo pode emitir um som
gutural para criar um ambiente ameaçador para o usuário; um inimigo diabólico
tem medo do escuro... Quando esses elementos são encontrados em um ambiente
de jogo, é esperado que eles se comuniquem com o jogador através do áudio em
maneiras sutis e diferentes. Aspectos de emoção como surpresa, frustração,
admiração e medo podem ser facilmente provocados com o correto planejamento
do áudio de um jogo [Bernstein 1997]. Além de efeitos sonoros bem planejados,
a música também representa um importante papel na ambientação. Em todos os
filmes, por exemplo, o surgimento de qualquer música é significativo para uma
interação emocional com o observador. Quando a música surge, é passada a
sensação de que a cena a seguir é investida de significância emocional diferente
de outras cenas sem música [Deutsch 2000].
Jogos incluem música por muitas razões: para se identificar com uma audiência
particular; para fazer com que o jogador ouça o orgulho e a glória do sucesso ou
a vergonha e o ridículo da derrota; para transportar o jogador para mundos
futuros, passados ou alternativos; para trazê-los de volta à realidade. A música
instantaneamente adiciona definições e associações muito além do que estímulos
visuais podem fazer [Patterson 2001].
No entanto, a trilha sonora de mídias interativas como jogos não deve ser
composta do mesmo modo que trilhas de filmes por um simples motivo: jogos
são interativos; filmes, não. Isso significa que o jogador tem controle sobre o
jogo de algum modo, e que o jogo pede que o jogador interaja com ele de algum
modo. Esses controle e interação são as bases de o quanto um jogo pode se tornar
atrativo e imersivo, sendo esses aspectos básicos para jogos de sucesso [Patterson
2001]. É fato comprovado que a maioria dos jogos que tentam reproduzir
músicas como em filmes não são convincentes, pois apenas repetem a mesma
música por uma cadeia interminável de tempo. Para contornar esse fato, muitos
compositores têm usado loops de tamanhos variados como uma maneira de suprir
o ambiente com melodia, mas essa técnica é incapaz de providenciar uma
ambientação convincente devido à repetição monótona de padrões, fazendo com
que muitos jogadores desliguem o áudio de um jogo enquanto o utilizam,
inutilizando o trabalho e planejamento dos compositores e programadores de
áudio [Deutsch 2000]. Pelo simples fato de ser uma mídia interativa, é esperado
de um jogo ser totalmente dinâmico e sensível ao contexto, incluindo seu áudio,
que deve idealmente adaptar-se de acordo com as decisões do jogador e reagir de
acordo, ou ainda antecipar situações relevantes, aumentando seu impacto
emocional. Essa é a própria definição de áudio adaptativo [Whitmore 2003]
[Brandon 2006].
É importante aqui se diferenciar áudio adaptativo de áudio interativo. Áudio
interativo é o áudio gerado de algum modo quando o usuário realiza uma ação
qualquer com um dispositivo qualquer, como clicar em um mouse ou pressionar
uma tecla; áudio adaptativo é um subcampo dessa área mais geral, e trata de
áudio que se adapta ao contexto do jogo, seja através de reprodução de
seqüências previamente gravadas, seja através de síntese em tempo real, ou ainda
ambas [Brandon 2006].
Muito já foi feito na área em relação a áudio sensível ao contexto. Mesmo assim,
perto da evolução das placas gráficas, este campo está apenas despontando. Em
se tratando de jogos, um mercado de US$7.3 bilhões em 2004 que só tende a
crescer [Johnson 2006] e que exige cada vez mais investimentos das
desenvolvedoras a cada jogo produzido [Miller 1997], todos os aspectos de um
jogo têm que ser muito bem planejados antes de se começar seu
desenvolvimento, tentando sempre se obter o máximo de todos os aspectos para,
assim, obter melhores vendas. Isso foi o que propiciou a retomada na evolução
das técnicas de design de áudio. No entanto, é importante se notar que muito do
progresso obtido na área reside em tecnologias proprietárias, o que dificulta a
evolução dos coneitos [Bridgett 2006], já que compartilhar tecnologia não é
vantajoso para a competitividade das empresas no mercado de jogos, onde ou um
título é um sucesso, ou é relegado ao esquecimento, tendo a empresa que arcar
com todos os prejuízos.
Esse artigo tem como objetivo analisar a parte menos explorada desse tema, ou
seja, música sensível ao contexto ou música adaptativa (MA). Na seção 2, serão
tratadas as principais técnicas disponíveis para a produção de MA, onde também
são apontados exemplo reais de sua utilização. Na seção 3, são explicitados os
principais problemas em se unir segmentos de músicas, apresentando também
algumas tecnologias que realizam essa operação. A seção 4 apresenta aspectos de
comunicação entre a engine de música adaptativa e a engine do jogo. A seção 5
comenta duas engines reais de música adaptativa. Em seguida, a seção 6 trata das
considerações finais.
2. Tecnologias para Música Adaptativa
Desde os primórdios do desenvolvimento de jogos eletrônicos, viu-se os
benefícios da música adaptativa. Toma-se por exemplo um jogo do início dos
anos 80 para o Nintendo Entertainment System, chamado Popeye. A história do
desenho animado é bem conhecida: Popeye corteja a “beldade” Olive tendo
como rival o odioso Brutus, que não mede esforços para trapaceá-lo, sendo que,
sempre que Popeye come seu espinafre, ele adquire super-força, e derrota Brutus
nas mais variadas situações. O objetivo desse jogo é recolher os corações
lançados de cima de um balcão por Olive antes que eles atinjam o inferior da tela,
quando começam a afundar lentamente. Sempre que um coração afunda por
completo na borda inferior da tela, o jogo é encerrado. O diferencial desse jogo
em relação aos seus contemporâneos era que, sempre que um coração tocava o
fundo da tela e começava a afundar, a música sintetizada pelo chip sonoro do
NES adquiria um ritmo frenético, que preocupava o jogador e impulsionava-o a
coletar o mais rápido possível o coração que estava afundando. Em outra
situação, sempre que o personagem principal, Popeye, comia o espinafre que se
encontrava em pontos pré-determinados da tela, a música era alterada para o
bordão cantarolado pelo personagem nos desenhos animados para exaltar sua
força ao consumir espinafre, e essa música era tocada de um modo animado, que
compelia o personagem a atacar o inimigo Brutus, que fugia pela tela de jogo
com uma expressão de medo no rosto.
Apesar de ter uma dinâmica simples, o hoje praticamente desconhecido Popeye
continha os pontos essenciais das modernas engines de música adaptativa (EMA)
[Bernstein 1997]:
• Lógica de controle – uma coleção de comandos e scripts que controlam o
fluir da música dependendo dos estados do jogo;
• Segmentos – segmentos de áudio que podem ser rearranjados de acordo
com a lógica de controle.
No caso de Popeye, a lógica de controle era extremamente simples, pois apenas
monitorava dois pares de eventos: quando o coração tocava o chão do cenário e
quando Popeye o coletava; e quando Popeye comia o espinafre e quando o efeito
do espinafre acabava (figura 1). Não se tem registro de como o jogo manipulava
os segmentos de áudio.
Essa técnica de se modificar apenas a música ambiente for usada em
praticamente todos os jogos que faziam uso de MA nos anos 80 [Brandon 2006]:
no jogo Super Mario Bros. de 1985, por exemplo, sempre que o tempo máximo
para se finalizar um estágio estava perto do final, a música era sintetizada com
um ritmo mais apressado, passando a sensação de que o jogador deveria terminar
o estágio o mais depressa possível. No entanto, isso é perfeitamente justificável:
como os jogos interativos em si estavam em sua infância, não se pensava (nem se
podia pensar, devido às restrições tecnológicas) em processamento de áudio mais
avançado [Brandon 2006].
Figura 1. Lógica de controle da EMA do jogo Popeye
Em se tratando da lógica de controle, não há um padrão estabelecido atualmente
para sua implementação: cada programador implementa a lógica de controle que
mais está de acordo com o que ele, o designer de som e o compositor têm em
mente. Por esse motivo, não se tratará deste item individualmente, e sim quando
se explicitar exemplos de EMAs reais. No entanto, certos padrões podem ser
notados quando da manipulação dos segmentos de áudio, sendo estes padrões
abordados em seguida.
2.1. Padrões de segmentos de áudio em EMAs
Apenas para relembrar, EMAs permitem que a música mude de acordo com
mudanças no estado do jogo. Uma música sensível ao contexto não é composta
para reprodução linear; ao invés disso, ela é escrita de forma a permitir que uma
determinada seqüência musical (variando em comprimento de uma nota até a
vários minutos) tenha transições suaves para uma ou mais seqüências musicais
em qualquer ponto do tempo [Bernstein 1997].
Dentre todas as tecnologias utilizadas para se produzir MA, segundo [Whitmore
2003], duas são as mais utilizadas: manipulação de segmentos de wave files e
síntese MIDI. No entanto, segundo [Brandon 1998], três são os mais utilizados:
síntese MIDI, segmentos de wave files e redbook audio (wave file completo, sem
segmentação). Tendo em vista que duas das tecnologias apresentadas por
[Brandon 1998] (segmentos de wave files e redbook audio) foram agrupadas em
um único item por [Whitmore 2003] (manipulação de segmentos de wave files,
onde o Redbook audio é tratado como um “segmento total”, ou seja, sem
segmentação), aqui será apresentada a classificação de [Brandon 1998], com as
complementações propostas por [Whitmore 2003].
• Redbook audio – nome dado à música gravada e inserida diretamente no
jogo, respeitando as normas definidas pelo Redbook Audio Specifications
[WR 2006]. Como a música é previamente gravada, ela apresenta a
qualidade máxima passível de ser obtida pelo estúdio de gravação, sendo
mais similar em qualidade a uma música de trilha sonora de filme. No
entanto, não é possível se reproduzir duas faixas deste tipo de segmento ao
mesmo tempo, nem se fazer overlapping entre as faixas. Além disso,
pouco se pode fazer com esse tipo de segmento: no máximo fading ou
mixagem de alguns instrumentos sobre a música original, como no caso
do jogo Jade Empire, lançado para XBox em 2005, onde uma mixagem de
percussão/não-percussão é aplicada às músicas previamente gravadas em
wave files ou mp3 dependendo da cinemática sendo executada [Johnson
2006];
• Síntese MIDI baseada em wavetables – utilizar a capacidade de síntese de
uma placa de som disponibiliza à aplicação mais memória para
processamento 3D, manipulação de scripts e gerência de efeitos especiais.
Como as amostras de som estão armazenadas na placa de som, toda a
informação necessária é basicamente o controle para as amostras,
instruções MIDI, normalmente não excedendo 20KB por arquivo de
música, sendo que esse arquivo pode ser criado por qualquer programa
que suporte saída em MIDI. Além disso, esse tipo de arquivos oferece um
alto grau de flexibilidade, uma vez que cada nota musical é um
componente de dados que pode ser manipulado ou modificado para se
adaptar ao contexto. Ainda, mais de uma faixa de música pode ser
reproduzida simultaneamente, e é relativamente fácil se realizar fading e
overlapping entre faixas. No entanto, a qualidade da síntese depende
fortemente da wavetable de onde as amostras serão retiradas, motivo do
uso comedido desse tipo de tecnologia há até pouco tempo, já que toda a
interatividade possível é inútil se a qualidade da síntese é inferior. Esse
problema é remediado atualmente com a técnica de Downloadable Sounds
(DLS), proposta em 1997 pelo Interactive Audio Special Interest Group
(IA-SIG) [IASIG 2006], uma ramificação da MIDI Manufactures
Association, como uma tentativa de se padronizar a wavetable de
sintetizadores MIDI, fazendo com que todos os sintetizadores que
suportassem essa feature soassem virtualmente iguais, bastando apenas
que a wavetable seja carregada na memória da placa de som ou em
memória principal [Leonard 1998]. O jogo The Mark of Kri, lançado em
2002 para o PlayStation 2 é um exemplo de uma partitura altamente
adaptativa usando bancos de instrumentos customizados e arquivos MIDI;
• Digital modules (MODs) – é o nome dado a arquivos wave ou baseados
em Pulse Code Modulation que são separados em módulos depois de
gravados, podendo ser rearranjados dinamicamente. Com música MOD,
os desenvolvedores têm segmentos de alta qualidade que podem ser
individualmente rearranjados e manipulados usando o sintetizador de som
da placa analogamente aos arquivos MIDI, mas sem suas restrições.
Efeitos podem ser obtidos facilmente aplicando-os às amostras antes de
elas serem combinadas para formar o trecho de trilha a ser reproduzido. O
maior desafio dessa técnica é o projeto da música MOD, ou seja, projetar
uma seqüência de segmentos de áudio que possam ser rearranjadas
coerentemente. No entanto, quando bem projetada, oferece qualidade
semelhante a amostras de Redbook audio com a versatilidade de amostras
MIDI. No jogo Multiplayer Battletech, disponível entre 1996 e 2002 no
extinto servidor de jogos Kesmai, a lógica de controle determinava a
seleção de segmentos dentro de um estado de jogo e a seleção de um
conjunto de segmentos para continuar a partir do previamente selecionado,
quando o estado do jogo mudava. O jogo contava com uma biblioteca de
220 segmentos de música que podiam ser rearranjados algoritmicamente
pela lógica de controle. O resultado foi uma trilha sonora que estava
sempre relacionada à experiência de jogo.
É importante se salientar que todas essas tecnologias podem ser utilizadas em
conjunto, dependendo das necessidades e habilidades do programador.
3. Unindo segmentos
Realizar uma transição suave entre segmentos de música em um ambiente de
jogo não-linear é problemático, mas necessário para se manter uma linha coerente
de gameplay, pois garante a continuidade da melodia. A dificuldade em se criar
essas transições imperceptíveis reside no fato de que o momento de uma
transição só é conhecido em tempo de execução. Logo, a música e a EMA devem
estar preparadas para evoluir para o próximo segmento a qualquer momento de
uma maneira coerente. Por esse motivo, os limites de transição e sua
temporização são tão importantes [Whitmore 2003]: erros em algum desses
aspectos fazem com que a música não esteja contribuindo para o evento do jogo,
e sim para seu próprio evento, o que o cérebro do jogador perceberá e rejeitará
[Clark 2001].
Entre as técnicas usadas para se realizar transições imperceptíveis, as mais
utilizadas são [Whitmore 2003]:
• Transição segmento-a-segmento nos limites musicais – neste sistema,
quando um novo segmento é selecionado, o atual é reproduzido até seu
“limite”, e então o novo segmento começa. Sua vantagem é a
simplicidade, mas depende de uma cuidadosa escolha do próximo
segmento, ou então uma função de fade-in-fade-out ou outra similar deve
ser utilizada para suavizar a transição, o que nem sempre gera bons
resultados;
• Layering – essa abordagem adiciona e subtrai limites de segmentos,
entrelaçando-os. Essa técnica ganha na continuidade da música, já que
alguns instrumentos continuam tocando enquanto outros são adicionados
ou subtraídos da faixa de áudio. Sua deficiência reside na dificuldade de se
mover rapidamente para um segmento completamente diferente dos
previamente selecionados.
• Matriz de transição – a utilização de uma matriz de transição habilita à
lógica de controle do jogo selecionar uma transição apropriada entre
qualquer par de segmentos. Isso habilita a criação de transições para
situações específicas, criando transições dramáticas e naturais entre os
segmentos. O desafio aqui reside no compositor, porque compor e
produzir as várias possibilidades de transição forçam-no a pensar na
música de uma maneira completamente não linear. Alem disso, obriga que
um dado segmento seja sempre seguido do mesmo, podendo não oferecer
uma boa variabilidade sonora. Novamente, essa responsabilidade reside no
compositor.
Além disso, também é importante se selecionar um bom algoritmo de escolha de
segmentos. O cérebro humano é capaz de reconhecer todo o tipo de padrão, e
uma má escolha de segmentos pode levar a uma repetição excessiva dos mesmos,
e, com a repetição, vem a monotonia. No entanto, a escolha de segmentos não
pode ser totalmente randômica, pois a ausência de padrão de repetição também
não é agradável ao cérebro humano. Assim, o balanceamento correto entre a
monotonia e o caos é um fator crítico nesse tipo de música [Clark 2001].
Um outro cuidado que deve ser tomado é o de não providenciar muita
informação ao jogador. Às vezes, uma pista musical pode dizer demais, quando
deveria apenas ressaltar a mudança de estado do jogo. Por exemplo, em um
determinado jogo, um aumento na progressão dos acordes sempre significa para
o jogador que uma nave o está perseguindo. Então, sempre que o jogador ouve
esta mudança de acordes, em vez de ficar alerta para o que poderá ocorrer, ele já
sabe que uma nave o está perseguindo, o que torna o jogo previsível e monótono
[Bernstein 1997].
4. Interação com a engine de jogo
Apesar da EMA desenvolvida, é como ela se integra à engine do jogo que
determina sua efetividade. O mais avançado sistema de música e partitura
adaptativa irá falhar terrivelmente se não conseguir se comunicar com a engine
do jogo [Whitmore 2003], pois é ela que fornece dados para a lógica de controle
da EMA [Bernstein 1997].
Há vários modos de se realizar essa integração, e nada impede que essas técnicas
sejam combinadas. Há dois lados nesse sistema: que aspectos da música serão
alterados ou modificados pelo jogo; e como o jogo disparará essas mudanças na
música. Os aspectos da música que podem ser modificados incluem o volume, a
instrumentação, a harmonia, os efeitos de áudio, a mixagem, etc., e essas
modificações são dependentes do tipo de segmento e de união de segmentos
escolhidos. Esses aspectos já foram tratados nas seções acima.
Pelo outro lado, a engine de jogo pode usar vários triggers para modificar a
música. Esses triggers incluem [Whitmore 2003]:
• Triggers baseados na localização – quando uma mudança de cenário é
feita pelo jogador, como, por exemplo, ocorre a movimentação entre
ambientes: o personagem entra na água, e a música muda de acordo, como
se estivesse sendo ouvida debaixo d’água; ou o personagem entra em uma
caverna, e a música adquire mais reverberação (como em BanjoKazooie[1998] e Donkey Kong 64[1999], ambos para o Nintendo 64).
• Triggers de estado de jogo – acionado quando o estado do jogo muda,
como, por exemplo, quando um exército inimigo ataca sua vila e a música
muda para um ritmo que incite o jogador a usar seu próprio exército para
revidar (como em Age of Mythology [2002] para o PC);
• Triggers de inteligência artificial (IA) de personagens não-controláveis
(NPC) – acionado quando a inteligência artificial de um personagem nãocontrolável dispara um evento, como quando um inimigo percebe a
presença do jogador em seu território (como em Resident Evil 4[2005]
para GameCube).
• Triggers de evento – acionados quando um evento natural do jogo
acontece, sem a participação direta do jogador ou da IA dos NPCs, como,
por exemplo, quando a música se altera de acordo com a quantidade de
inimigos no campo de visão do jogador (como em Gex: Enter the
Gecko[1994] para PlayStation).
Para decidir qual espécie de trigger usar, deve ser levada em conta a dinâmica e a
natureza do jogo, e como o compositor e o programador gostariam de enfatizar
aquele evento ou emoção com a música. Logicamente, esses triggers podem ser
combinados, e a forma de como a engine do jogo repassa esses triggers à lógica
de controle da EMA depende da aplicação. Mais detalhes sobre essa interface são
providenciados nos estudos de caso a seguir.
5. EMAs Comentadas
Essa seção tem o objetivo de apresentar uma visão geral sobre duas EMAs reais,
cada uma em um contexto diferente: primeiro em um contexto local, com o jogo
Gex: Enter the Gecko, lançado em 1994 para o PlayStation [Miller 1997] [WG
2006]; e, no contexto de jogos massivos on-line, o jogo Anarchy Online, lançado
em 2001 para PC [Arve 2002] [WA 2006].
5.1. Gex: Enter the Gecko
5.1.1. Visão geral do esquema de jogo
Em Gex: Enter the Gecko, o personagem principal controla uma lagartixa, Gex,
que é um agente secreto do governo enviado para a dimensão Media para acabar
com os planos do lorde da televisão, Rez, de dominar a dimensão. O jogo, na
verdade, é uma paródia de vários filmes e programas de TV que faziam sucesso
na época. O jogador deve controlar Gex em modo terceira pessoa por um
ambiente 3D altamente interativo, entrando em televisões e perseguindo Rez e
seus comparsas através dos programas que estivessem passando.
5.1.2. Descrição geral da EMA
Essa EMA faz uso intensivo de síntese em tempo real de instruções MIDI. A
engine do jogo mantém uma variável de 7 bits que contabiliza o número de
inimigos na tela, e é atualizada constantemente por essa engine. Essa variável é
então periodicamente lida e enviada à lógica de controle da EMA, que ajusta o
áudio do jogo, o que caracteriza claramente um trigger de evento. O tamanho da
variável ser 7 bits é proposital, pois ela pode ser enviada diretamente aos
controladores padrão MIDI, limitados a 7 bits de dados úteis. Além disso, essa
EMA também contém triggers baseados na localização, uma vez que a música
também se altera de acordo com a localização do personagem.
A engine de Gex: Enter the Gecko tem comportamentos diferentes para cada
fase. Por exemplo, em uma fase chamada Scary-TV, que é uma paródia de filmes
de terror, há outros contadores que a engine de jogo gerencia e que são mandados
à EMA para alterar a síntese de música. Também aqui é usada a variável de
controle de número de inimigos na tela, que serve para aumentar o ritmo da
música soturna da fase a cada inimigo adicionado ao campo de visão do usuário.
Em outra fase, há sete power-ups para o personagem jogável espalhadas por sete
partes da fase, cada uma com uma música diferente. Ao pegar esse power-up, a
engine de jogo verifica qual deles foi pego e envia informações referentes a essa
localização à EMA do jogo, para que a música seja sintetizada de acordo.
5.2. Anarchy Online
5.2.1. Visão geral do esquema de jogo
Anarchy Online é um múltiplo e massivo jogo on-line de representação de papéis
(MMORPG), passado no ano de 29475 no planeta deserto de Rubi-ka e em suas
extra-dimensões gêmeas, as Shadowlands.
Como todo MMORPG, não há um objetivo específico nesse jogo. O jogador
deve criar seu personagem e evoluí-lo combatendo inimigos, ultrapassando
labirintos e calabouços e explorando o mundo, além de socializar com os outros
jogadores.
O esquema de visão do jogo também é em três dimensões, com visão em terceira
pessoa.
5.2.2. Descrição geral da EMA
Ao contrário de jogos em contexto local, onde o uso de MA é visto como uma
bem-vinda feature, em MMORPGs ela é bastante necessária, pois esse tipo de
jogo oferece uma experiência de gameplay de potencialmente milhares de horas,
onde um jogador pode viajar pelo mundo virtual por diversas horas por dia, o que
aumenta o risco de ele se cansar de uma música monotonicamente repetida. Com
o passar do tempo, mesmo uma música que a princípio pareceu agradável, pode
tornar-se irritante depois de algumas horas contínuas de jogo.
A tecnologia de MA adotada por Anarchy Online é a de MODs. No total, 750
módulos de música são armazenadas e relacionadas em uma variação da matriz
de transição: ao invés da matriz, onde, dado um segmento, apenas um poderia
segui-lo, optou-se por se usar um grafo de segmentos. Uma esquematização desse
grafo pode ser vista na figura 2.
Pode-se ver que cada amostra tem várias possibilidades de seqüenciamento, e é
tarefa do compositor informar a duração da amostra e sua velocidade. Ao término
de uma amostra, a seguinte começa a ser tocada, e assim sucessivamente,
enquanto durar o período de jogo do usuário.
Cada camada (nome dado aos segmentos de áudio pela EMA de Anarchy Online)
pode mudar para qualquer outra camada, dependendo da movimentação do
jogador (o que caracteriza um trigger baseado na locomoção): observando-se a
figura 2, digamos que esteja tocando o segmento a1.wav no deserto, e o jogador
realiza um teletransporte para a floresta, onde deveria estar tocando o segmento
c2.wav. Como não há uma transição direta da camada a1.wav para a camada
c2.wav, a EMA então procura pelo menor caminho possível até c2.wav via
camadas aX, onde X representa um número qualquer, realizando a transição. Não
foram encontrado dados referentes a como proceder caso não haja um caminho
até c2.wav passando apenas por camadas a.
Figura 2. Esquema de precedência dos segmentos de áudio de Anarchy
Online
A música por camadas é usada principalmente em combates para refletir quão
bem – ou mal – o jogador está se saindo, assim como para ilustrar a força do
oponente: um oponente mais forte torna a música mais intensa; um menos forte a
faz menos intensa, sendo que a engine de jogo mantém à lógica de controle da
EMA atualizada periodicamente sobre o estado do jogo.
Há uma deficiência nesse sistema como ele foi originalmente proposto: a
transição entre camadas só pode ocorrer quando a camada atual terminou sua
reprodução. Isso significa que a música potencialmente não estaria sincronizada
com o evento ao qual deveria se relacionar, causando um impacto errôneo e, às
vezes, desagradável. No entanto, uma solução para este problema já foi proposta:
implementar crossfading baseado na progressão dos acordes, entrelaçando duas
camadas a qualquer momento, realizando a modificação entre camadas de uma
forma mais rápida que a atualmente implementada.
6. Considerações finais
Música adaptativa é um campo ainda muito novo, com muitas dificuldades ainda
pendentes. Desde o início do desenvolvimento de jogos, essa técnica foi
empregada em maior ou menor escala, sempre limitada pela tecnologia.
Atualmente, com o que se sabe de MA e com a o conhecimento tecnológico
adquirido, já se consegue excelentes resultados em jogos com essa técnica, e esse
campo só tende a crescer, com a chegada de consoles novos e mais poderosos.
Referências
Bernstein, D. (1997) “Creating an Interactive Audio Environment”,
http://www.gamasutra.com/features/19971114/bernstein_01.htm, Novembro
(2006).
Miller, M. (1997) “Producing Interactive Audio: Thoughts, Tools, and
Techniques”, http://www.gamasutra.com/features/19971114/miller_01.htm,
Novembro (2006).
Prince, B. (1997) “Tricks and Techniques for Sound Effect Design”,
http://www.gamasutra.com/features/19960819/prince_01.htm, Novembro
(2006).
Brandon, A. (1998) “Interactive Music: Merging Quality with Effectiveness”,
http://www.gamasutra.com/features/19980327/brandon_01.htm, Novembro
(2006).
Leonard, N. (1998) “Downloadable Sounds: Down and Out in Cyberspace”,
http://www.neilleonard.com/articles/dls.htm, Novembro (2006).
Deutsch, S. (2000) “Harnessing the Power of Music and Sound Design in
Interactive Media”,
http://web.archive.org/web/20040119011032/media.bournemouth.ac.uk/smd/a
rticles/article3.html, Novembro (2006).
Clark, A. (2001) “Adaptive Music”,
http://www.gamasutra.com/resource_guide/20010515/clark_01.htm,
Novembro (2006).
Patterson, S. (2001) “Interactive Music Sequencer Design”,
http://www.gamasutra.com/resource_guide/20010515/patterson_01.htm,
Novembro (2006).
Arve, B. (2002) “The Music of Anarchy Online: Creating Music for MMOGs”,
http://www.gamasutra.com/resource_guide/20020916/lagim_01.htm,
Novembro (2006).
Whitmore, G. (2003) “Design with Music in Mind: A Guide to Adaptive Audio
for Game Designers”,
http://www.gamasutra.com/resource_guide/20030528/whitmore_01.shtml,
Novembro (2006).
Brandon, A. (2006) “Adaptive audio”,
http://www.iasig.org/pubs/features/adaptaudio/adaptiveaudio.shtml,
Novembro (2006).
Bridgett, R. (2006) “Audible Words, Pt. 2: 'Updating the State of Critical Writing
in Game Sound”,
http://www.gamasutra.com/features/20060831/audio_03.shtml, Novembro
(2006).
Johnson, H. (2006) “Audio Gains in Videogames”,
http://mixonline.com/mag/audio_audio_gains_videogames/index.html,
Novembro (2006).
[IASIG 2006] Interactive Audio Special Interest Group (2006) ,
http://www.iasig.org/, Novembro (2006).
[WA 2006] Wikipedia (2006) “Anarchy Online”,
http://en.wikipedia.org/wiki/Anarchy_online, Novembro (2006).
[WG 2006] Wikipedia (2006) “Gex: Enter the Gecko”,
http://en.wikipedia.org/wiki/Gex_%28video_game_series%29#Gex:_Enter_th
e_Gecko, Novembro (2006).
[WR 2006] Wikipedia (2006) “Redbook CD Specifications”,
http://en.wikipedia.org/wiki/Red_Book_(audio_CD_standard), Novembro
(2006).