文脈の調がメロディの記憶に与える影響
−短期記憶と長期記憶での違い−
吉野 巌
yoshino@psych.let.hokudai.ac.jp
北海道大学大学院文学研究科
〒060-0810 札幌市北区北10条西7丁目
概 要
本研究は、調的に曖昧なメロディを用い、短期記憶再認課題と長期記憶再認課題において文脈の調がメロディの再認に与える影響の違いについて調べた。非音楽熟達者、絶対音感を持たない音楽熟達者、絶対音感をもつ音楽熟達者が、音階の文脈に引き続いて呈示されるメロディ(2つの調の可能性がある)の短期もしくは長期記憶事態における再認課題を行った。その音階文脈の調はターゲットメロディに対して可能な2つの調のどちらかであった。標準/学習メロディと比較/テストメロディの文脈の調は同じか異なるかのどちらかであった。短期記憶課題では、3つの被験者群のいずれにおいても文脈条件間の差は認められず、被験者群間の差のみが認められた。長期記憶課題では、被験者群間の差は認められなかったが、文脈条件間の差が3つ全ての被験者群で認められ、文脈の効果が示された。
キーワード:メロディの再認、文脈、調性的体制化、短期記憶、長期記憶
The effect of context key on melody recognition:
The difference between short-term and long-term memory
Iwao YOSHINO
Department of Psychology, Hokkaido University
N10 W7, Kita-ku, Sapporo 060-0810, JAPAN
Abstract
This paper examines the effect of "context key" on recognition of the melodies with two possible keys, using short-term and long-term recognition tasks. Inexperienced listeners, experienced listeners without AP, and experienced listeners with AP performed a short or long term recognition task in which brief melodies with two possible keys were presented with a scale context. The key of the scale was selected from the two possible keys for a melody. The context key of the standard / learned melody and the comparison / tested melody was either the same or different; same context condition, different context condition. In the short-term task, listeners responded whether the standard and the comparison was same or different, ignoring context. In the long-term task, they listened to a melody and responded whether or not they had heard the presented melody in the preceding familiarization phase. In the short-term recognition task, there were no differences between same and different context conditions for all three listener groups. In the long-term recognition task, there were significant differences between same and different context conditions for all three listener groups, but no significant differences between subject groups.
Key words: melody recognition, context, tonal organization, short-term memory, long-term memory.
はじめに
調性的体制化の処理によって音列の各構成音の間にはゲシュタルト的な“まとまり”が形成され、音列はメロディらしく聞こえるようになり、同時に調性感がもたらされる (吉野, 1998a)。しかし、調性的体制化が全ての音列に対して安定して行われるとは限らない。例えば、無調的な音列に対して、多くの聞き手は、ほとんどの場合中心音を定めるのが困難である。また、複数の調性的体制化の仕方があるために調の知覚が曖昧になるメロディもある。一般的に、可能でもっともらしい体制化の方法が複数ある刺激の知覚は安定せず、複数の解釈が入れ替わって知覚される。しかし、特定の解釈以外を排除する文脈の後にその刺激が提示されるなら、その文脈に基づく体制化によってその刺激は知覚される。調的に曖昧な音列の場合、もし複数の調のうちの1つのみを喚起する文脈を提示した後でそのメロディを提示するならば、その音列は文脈によって喚起された調に基づいて調性的に体制化されるであろう。例えば、Bb major の音階を提示した後に音列“F4, G4, F4, Bb4, D4, C4”(Bb major か F major)を提示すれば、この音列はBb majorで調性的に体制化されるであろう。
ところで、Bb majorで体制化された音列“F4, G4, F4, Bb4, D4, C4”は、F majorで体制化された同じ音列とは異なる音列として知覚されるのであろうか。こうした問題は、図地反転図形、奥行反転図形、意味的反転図形などの視覚的な曖昧刺激に関しては答えるのに難しいことではない。すなわち、片方の体制化によって知覚されたものは、もう一方の体制化によって知覚されたものとは明らかに異なっている。しかし、上述の例のような、調的に曖昧なメロディの知覚については、異なる調的文脈のもとで提示した音列が元の音列として再認されるかどうかを調べる必要がある。
Dowling (1986) は、これに類似した方法でメロディの長期再認実験を行い、聞き手が音程か音階ステップのどちらの音高情報をメロディを符号化するのに用いるのか調べようとした。その結果、音楽非経験者の再認成績は文脈に関係なく低い、中程度の経験者の再認成績は文脈によって異なる、プロの音楽家の成績は非常に高く文脈の影響を受けないことが示された。このことからDowling は、非経験者はメロディの記憶に“pitch-interval 的表象”を用い、中程度の経験者は“音階ステップ的表象”を用い、プロの音楽家はより洗練された表象を用いるとした。
Dowling (1986) の結果から考えると、非経験者とプロの音楽家は異なる調的文脈のもとで提示される2つの音列を同じメロディとして、中程度の経験者は異なるメロディとして知覚する、ということになる。ただし、Dowling の“長期再認記憶実験”は、標準刺激と比較刺激の間の遅延時間が平均40秒であり、短期記憶課題に近い状況であった。遅延時間の長さはメロディの再認に大きく影響することが知られているので、文脈の調がメロディ再認に与える影響についても、直後再認の場合、学習したメロディ(より長期的な記憶)の再認の場合など、複数の状況で調べてみる必要があるであろう。また、Dowling は音楽経験者を中程度の被験者とプロの音楽家に分けたが、絶対音感保持者と絶対音感を持たない経験者では、メロディ記憶のストラテジーが異なっていることが十分考えられる。
本研究は、短期再認記憶課題(実験1)と長期再認記憶課題(実験2)において、文脈の調が調的に曖昧なメロディの再認に与える影響を調べ、その違いについて検討する。また、音楽非経験者、絶対音感をもたない音楽経験者、絶対音感をもつ音楽経験者を比較し、彼らのメロディ符号化の違いについて調べる。
実験1
実験1は、短期記憶的状況において文脈の調がメロディの再認に与える影響を調べる。本実験は単純な直後再認課題を用いる。
方 法
被験者
音楽非経験者群 (Inexperienced: IE群) 、絶対音感を持たない音楽経験者群 (Experienced & Not AP: EN群) 、絶対音感を持つ音楽経験者群 (AP群) 、の3群×各15名の計45名であった。
材料
標準刺激32音列は、単旋律の6音高から構成され、いずれも全音階的に2種類の調で解釈が可能なものである。比較刺激32音列は、半数が標準刺激と全く同じで、もう半数は2音目から5音目までのうち1音だけ音高が異なっていた。ただし、音の変更は音列の旋律線の形状と調性が維持されるようになされた。
全ての音列(標準・比較刺激)の前には、調的文脈として音階が提示された。文脈は、標準刺激の直前に提示するもの(第1文脈)と比較刺激の直前に提示するもの(第2文脈)の2種類で、いずれも、標準刺激に対して解釈可能な2種のいずれかの調の上昇音階であった。また、文脈の調性感を高めるため、標準・比較刺激の提示中に、文脈音階の主音をおよそ1オクターブ下の音域で提示した。全試行の半分は2つの文脈の調が同じである“同調文脈条件”であり、残りの半分は2つの文脈の調が異なる“異調文脈条件”であった。標準・比較刺激、文脈の音階の各音高の長さは 0.5秒であった。
全ての刺激は、マッキントッシュ・コンピュータ上のMIDIシーケンサー・ソフト "Performer"で作成・制御され、Tone Generator "YAMAHA MU50" によって提示された。音色は、標準・比較刺激がピアノ音、文脈の音階と主音はオルガン音を使用した。
手続き
1試行では(図1参照)、合図音 (1s)、第1文脈の音階 (4s)、標準刺激と文脈音階の主音 (3s)、遅延時間 (1s)、第2文脈の音階 (4s)、比較刺激と文脈音階の主音 (3s) が順に提示された。被験者は試行間隔 (5s) の間に、標準刺激と比較刺激が同じか異なるかを判断した。練習試行4試行の後、全32試行がランダムな順で行われた。

結 果
Hit 率から False alarm 率を減じた値(修正再認率)を正再認率として使用した。各被験者群・各文脈条件ごとの正再認率を図2に示す。この正再認率に関して、3(被験者群)×2(文脈条件)の2要因で分散分析を行った結果、被験者群の主効果が有意であった(F (2, 42) = 68.18, p < .0001)。各被験者群の再認率は、AP群: .80、EN群: .48、IE群: .13 であり、AP群とEN群、EN群とIE群の間にそれぞれ有意な差が見出された(Tukey の下位検定: HSD = .14, α< .05)。文脈条件の主効果は有意ではなかった(F (1, 42) = .26, p > .10)。
考 察
短期再認課題では、3つの被験者群のいずれにおいても同調文脈条件と異調文脈条件との間に再認率の差は見られなかった。すなわち、この課題を行った聞き手は文脈刺激による影響を受けたとは考えられない。彼らは、メロディ全体の違いという認知的特徴よりもむしろ知覚的特徴である音高の変化に注意を向けていたのかもしれない。いずれにせよ本実験の結果は、新奇メロディの直後再認では音程パターンに基づく情報を利用しにくいという先行研究の結果(Dowling, 1978, 1991; Dowling, Kwak & Andrews, 1995)と一致しているといえる。
再認成績は、予想されたものではあるが経験者AP群が最もよく、経験者EN群、非経験者IE群の順で低くなった。絶対音感をもつ音楽経験者は音列を絶対音名で言語的に符号化することによって文脈条件に関係なく正確な再認ができたと考えられる。音楽非経験者の再認成績が悪かったのは、彼らが細かい音程の幅まで記憶することが難しく、多くの先行研究(Bartlett & Dowling, 1980; Cuddy & Cohen, 1976; Trainor & Trehub, 1992)が指摘するように旋律線の形状を維持した比較刺激を識別することが困難であるからであろう。一方、絶対音感をもたない音楽経験者の再認成績が文脈の影響を受けなかったことは予想に反する結果であった。仮に彼らが正確な相対音感を有しており標準刺激と比較刺激を文脈の調に基づいて音階音で符号化していたとしたら、異調文脈条件の再認成績は悪くなったはずである。しかし、この結果は彼らが本実験課題ではそうした符号化を行わなかったことを示している。実際、実験後の報告によると、彼らは標準刺激の各音高を音階音(移動ド)で符号化できた時もあればできなかった時もあるということであった。
実験2
実験2は、長期記憶的状況において文脈の調がメロディの再認に与える影響を調べる。本実験は、学習セッションと再認セッションからなる単純な長期再認課題を用いる。学習セッションでは、被験者は調的文脈付きの標準メロディを5回ずつ聞いて記憶した。再認セッションでは、被験者は調的文脈付きの標準メロディかディストラクタを聞いてそのメロディを学習セッションで聞いたかどうかを答えた。
方 法
被験者
音楽非経験者群 (IE群) 、絶対音感を持たない音楽経験者群 (EN群) 、絶対音感を持つ音楽経験者群 (AP群) 、の3群×各13名の計39名であった。音楽経験者は10年以上の音楽訓練の経験をもっていた。なお、実験1に参加した被験者は実験2には参加していない。
材料
本実験では、実験1で使用した32音列を含む、全48曲の音列を用いた。実験1と同様に、全ての音列は単旋律の6音高から構成され、いずれも全音階的に2種類の調で解釈が可能なものである。48音列のうちの半数は記憶されるべき標準刺激として使用され、学習セッション・再認セッションの両方で提示された。標準刺激は、再認セッションにおいてどの音も変えられずに提示された。残りの半数は再認セッションでのディストラクタとして使用された。
全ての音列(標準刺激、ディストラクタ)の前には、実験1と同様に、調的文脈として上昇音階と主音が提示された。文脈の調は、その音列に対して解釈可能な2種のいずれかであった。学習セッションでは、各標準刺激が5回提示され、その毎回に同じ調の文脈が先行して提示された。再認セッションでは、24の標準刺激のうち半数で学習セッションと同じ調の文脈が提示され(同調文脈条件)、残りの半数では学習セッションとは異なる調の文脈が提示された(異調文脈条件)。ディストラクタの文脈の調は、その音列に対して可能な2つの調から任意に選ばれた。標準刺激、ディストラクタ、文脈の音階の各音高の長さは、実験1と同じ 0.5秒であった。
刺激の作成・制御・提示に用いた機器、刺激の音色等は、実験1と同じである。
手続き
学習セッション.各音列とそれに先行する文脈が5回続けて提示された。上述のように、ある標準刺激には5回とも同じ調の文脈が先行して提示された。被験者は、文脈の音階を無視しメロディをよく聞いて憶えるよう教示された。
再認セッション.学習セッション終了後10分間の休憩をはさみ、再認記憶テストを行った。1試行では、合図音 (1s)、文脈の音階 (4s)、標準刺激もしくはディストラクタと文脈音階の主音 (3s)が順に提示された。被験者は試行間隔 (5s) の間に、そのメロディが学習セッション時に聞いた“old”刺激であるか“new”刺激であるかを判断した。被験者は文脈は無視するように教示されていた。練習試行4試行の後、全48試行がランダムな順で行われた。
結 果
実験1と同様に修正再認率を使用した。ただし、FA率を各文脈条件ごとに求めることはできないので、各文脈条件ごとの正再認率の算出にはFA率の平均を用いた。
各被験者群・各文脈条件ごとの正再認率を図3に示す。この正再認率に関して、3(被験者群)×2(文脈条件)の2要因で分散分析を行った結果、文脈条件の主効果が有意であった(F (1, 36) = 32.14, p < .0001)。再認率は異調文脈条件(M = .34)よりも同調文脈条件(M = .52)で有意に高かった。被験者群の主効果は有意ではく(F (2, 36) = .92, p > .90)、各被験者群の正再認率はAP群: .44、EN群: .42、IE群: .42 であった。文脈条件と被験者群の交互作用が有意であった(F (2, 36) = 3.49, p < .05)。この交互作用はAP群における文脈条件間の差が他の2被験者群のものより大きいことを示している。ただし、単純主効果の検定を行ったところ、文脈条件の主効果はいずれの被験者群においても有意であったが、被験者群の主効果はどちらの文脈条件においても有意ではなかった。
考 察
長期再認課題では、全ての被験者群において文脈条件間に再認率の違いが見られた。経験者EN群だけでなく、経験者AP群と非経験者IE群も文脈の調の影響を受けた。異調文脈条件でのHit率がチャンスレベルに近かった(AP: .50, EN: .58, IE: .61)ことから、異なる調の文脈が先行提示されると、学習セッションで聞いたメロディを同じメロディとしては知覚しなかったといえる。一方FA率はそれほど高くないので、課題が難しすぎたためにHit率が低くなったわけではない。異なる調によって体制化された結果、異なるメロディとして知覚されたと言えるかもしれない。
実験1では被験者群の主効果が見られたが、実験2では見出されなかった。短期記憶状況での再認では、音楽経験者はメロディの各構成音に言語的なラベルをつけるという音楽能力を利用することができた。しかし、実験2の状況では、学習セッションと再認セッションとの間に平均25分の間隔があったため、音楽経験者でも言語的なラベルを保持し続けることはできなかったと考えられる。非経験者も含め、どの被験者群の聞き手も、記憶痕跡の中の同じような情報にアクセスしたといえるのではないだろうか。
被験者群間の違いは被験者群と文脈条件の交互作用にのみ見られた。文脈条件間の再認率の差はEN群とIE群に関しては約 .11であったが、AP群に関しては .28であった。このことは、AP群の聞き手は絶対音感に依存せず、むしろ相対的なピッチ情報を利用したことを示唆しており、解釈するのが難しいところである。
一般的考察
本研究は、調的に曖昧なメロディの再認が短期記憶課題では文脈の調の影響を受けないが長期記憶課題では影響を受けることを示した。新奇メロディの短期再認記憶では、聞き手は調性的体制化の処理の結果を利用しなかったのかもしれない。再認成績は聞き手の知覚ストラテジー、つまり音列を言語的に符号化(AP群: AP, EN群: 不完全な相対音感)するか旋律線として符号化(IE群)するか、に依存していた可能性がある。
一方、長期記憶的状況では、ある調的文脈で聞かれたメロディは異なる調的文脈で聞かれると異なるメロディとして知覚されうること、再認成績には音楽経験による違いがないことがわかった。このことから、長期記憶内のメロディ表象は調性的体制化の処理結果を反映させたものであり、本質的に音楽経験に関わらず同じであることが推定されるであろう。非経験者の再認成績が音楽経験者と同じであったことは驚くべきことではない。なぜなら、非経験者は少なくとも暗黙的に調性的体制化の処理を行っており、手続きさえ工夫すれば彼らが認知した調の反応を得ることができるからである(星野・阿部, 1984; Yoshino, 1998b)。馴染み深いメロディのピッチパターンの再認は、音楽経験者だけでなく非経験者でも成績の高いことが知られている (Dowling & Fujitani, 1971; Smith et al., 1994)。実験2では、学習セッションで標準刺激を5回も繰り返し提示しており、再認セッションの状況は、そうした馴染み深いメロディの再認に類似した状況であったかもしれない。
実験2で見られた文脈の調の効果は、状況依存記憶における一般的な文脈効果で説明されるかもしれない。しかし、本実験での文脈の調の効果が、特殊な刺激である“2種の可能な調で知覚されうるメロディ”で起こったということに注意する必要がある。もしこの効果が単純な状況依存記憶によって説明されるのであれば、調的に“曖昧ではないメロディ”の再認も同様に文脈の調の影響を受けるはずである。しかしながら、ある特定の調にはっきり感じられるメロディが、それとは異なる調の文脈に続いて提示されたとき、異なるメロディとして知覚されることは考えにくいことであろう。
引用文献
Bartlett, J. C., & Dowling, W. J. (1980). The recognition of transposed melodies: A key-distance effect in developmental perspective. Journal of Experimental Psychology: Human Perception & Performance, 6, 501-515.
Cuddy, L. L., & Cohen, A. J. (1976). Recognition of transposed melodic sequences. Quarterly Journal of Experimental Psychology, 28, 255-270.
Dowling, W. J. (1978). Scale and contour: Two components of a theory of memory for melodies. Psychological Review, 85, 341-354.
Dowling, W. J. (1986). Context effects on melody recognition: Scale-step versus interval representations. Music Perception, 3, 281-296.
Dowling, W. J. (1991). Tonal strength and melody recognition after long and short delays. Perception & Psychophysics, 50, 305-313.
Dowling, W. J., & Fujitani, D. S. (1971). Contour, interval, and pitch recognition in memory for melodies. Journal of the Acoustical Society of America, 49, 524-531.
Dowling, W. J., Kwak, S., & Andrews, M. W. (1995). The time course of recognition of novel melodies. Perception & Psychophysics, 57, 136-149.
星野悦子・阿部純一 (1984). メロディ認知における“調性感”と終止音導出. 心理学研究, 54, 344-350.
Smith, J. D., Kemler Nelson, D. G., Grohskopf, L. A., & Appleton, T. (1994). What child is this? What interval was that? Familiar tunes and music perception in novice listeners. Cognition, 52, 23-54.
Trainor, L. J., & Trehub, S. E. (1992). A comparison of infants' and adults' sensitivity to Western musical structure. Journal of Experimental Psychology: Human Perception & Performance, 18, 394-402.
吉野巌 (1998a). 異なる時代のメロディに対する調の解釈. 音楽知覚認知研究. 4, 81-99.
Yoshino, I. (1998b). Can non-musicians interpret the key of a melody? Proceedings of the fifth international conference on music perception and cognition, 225-229.