Web Audio API

序文

これまでの Web 上のオーディオはかなり未発達なもので、ごく最近まで Flash や QuickTime のようなプラグインを通して配信しなくてはなりませんでした。HTML5 での audio 要素の導入は、基本的なストリーミング・オーディオ再生を可能にする重要なものです。しかし、より複雑なオーディオアプリケーションを扱うには、それだけではまだ充分に強力ではありません。洗練された Web ベースのゲームやインタラクティブ・アプリケーションのためには別の解決策が必要とされます。この仕様では、近年のデスクトップ・オーディオ制作アプリケーションに見られるミキシング、プロセシング、フィルタリング処理に加え、近年のゲームオーディオエンジンに見られるような機能も持たせる事を目標とします。

この API はさまざまな使用例 [webaudio-usecases] を考慮して設計されています。理想的にはすべての使用例が、JavaScript から制御される最適化された C++ エンジンを使って無理なく実装でき、ブラウザーで動作するようにサポートされなくてはなりません。とは言っても、近年のデスクトップ・オーディオソフトウェアは極めて高度な機能を持ち、それらの一部はこのシステムを使ったとしても構築する事が困難か不可能と考えられます。Apple 社の Logic Audio がそのようなアプリケーションの 1 つであり、外部 MIDI コントローラー、任意のプラグイン・オーディオエフェクトやシンセサイザー、高度に最適化されたオーディオファイルのディスクへの読み込み/書き出し、密に統合されたタイムストレッチなどなどをサポートしています。それでもなお、ここで提案するシステムは、音楽に関するものを含めて、かなり複雑なゲームやインタラクティブ・アプリケーションの広い範囲を充分にサポートする事が可能です。またそれは、WebGL によってもたらされる、より高度なグラフィックスの機能をよく引き立たせる事が可能です。このAPIはより高度な機能を後から追加できるように設計されています。

機能

この API は、これらの基本機能をサポートします:

単純な、あるいは複雑なミキシング/エフェクト・アーキテクチャーのためのモジュラールーティング
内部処理に 32 ビット浮動小数を使用した高いダイナミックレンジ
非常に高度なリズムの精度を必要とするドラムマシンやシーケンサーなどのアプリケーションのための、低レイテンシーなサンプル単位の時間精度での音の再生。これには、エフェクトを動的に生成できるようにする事も含まれます
エンベロープ、フェードイン/フェードアウト、グラニュラーエフェクト、フィルタースイープ、LFO などのためのオーディオパラメーターのオートメーション
分割や結合など、オーディオストリームのチャンネルに対する柔軟な扱い
audio または video media element からのオーディオに対する処理
getUserMedia() からの MediaStream を使用したライブオーディオ入力に対する処理
WebRTC との統合
- MediaStreamTrackAudioSourceNode と [webrtc] を使ってリモート・ピアから受け取ったオーディオの処理
- 生成または加工されたオーディオストリームの MediaStreamAudioDestinationNode と [webrtc] を使ったリモート・ピアへの送信
Script での直接的なオーディオストリームの合成および加工
3D ゲームや没入環境を幅広くサポートする空間音響 :
- パンニングモデル: 等価パワー, HRTF, パススルー
- 距離減衰
- サウンドコーン
- 障害物 / 遮蔽物
- ソース / リスナー
広範囲の線形エフェクト、特に非常に高い品質のルーム・エフェクトに使用できるコンボリューションエンジン。これによって可能なエフェクトの例を以下に示します:
- 小さい / 大きい部屋
- 大聖堂
- コンサートホール
- 洞窟
- トンネル
- 廊下
- 森
- 野外劇場
- ドア越しの遠くの部屋
- 極端なフィルター
- 風変りな巻き戻し効果
- 極端なコムフィルター効果
ミックス全体の制御やスウィートニング ( 訳注:ビデオに効果音などをつける MA 作業 ) のためのダイナミック・コンプレッション
効率的なリアルタイムの時間領域および周波数領域解析 / ミュージックビジュアライザーのサポート
効率的な双二次フィルターによる、ローパス、ハイパス、その他一般的なフィルター
ディストーションやその他の非線形エフェクトのためのウェーブシェイピング・エフェクト
オシレーター

モジュラールーティング

モジュラールーティングによって異なる AudioNode オブジェクト同士を任意に接続できます。それぞれのノードは入力および出力を持っています。ソースノードは入力は持たず、ひとつの出力を持ちます。デスティネーションノードはひとつの入力を持ち、出力は持っていません。フィルターなどの他のノードはソースとデスティネーションの間に配置することができます。2 つのオブジェクトが互いに接続している場合、低レベルのストリーム形式の詳細について開発者が煩わされる事なく、適正な処理が行われます。例えばもしモノラルの音声ストリームがステレオの入力に接続されていても、左右のチャンネルに適正にミックスされます。

最も単純な例は、ひとつの音声ソースを出力に直接接続したものです。すべての接続は単一の AudioDestinationNode を持つ AudioContext 内部で行われます:

この単純なルーティングを図示します。この例では単一の音を再生しています:

const context = new AudioContext();
 
 function playSound() {
   const source = context.createBufferSource();
   source.buffer = dogBarkingBuffer;
   source.connect(context.destination);
   source.start(0);
 }

これはもっと複雑な例で、3 つのソースとコンボリューションリバーブが最終出力段にあるダイナミックコンプレッサーを介して送られます:

let context;let compressor;let reverb;let source1, source2, source3;let lowpassFilter;let waveShaper;let panner;let dry1, dry2, dry3;let wet1, wet2, wet3;let masterDry;let masterWet;function setupRoutingGraph () {  context = new AudioContext();  // Create the effects nodes.  lowpassFilter = context.createBiquadFilter();  waveShaper = context.createWaveShaper();  panner = context.createPanner();  compressor = context.createDynamicsCompressor();  reverb = context.createConvolver();  // Create master wet and dry.  masterDry = context.createGain();  masterWet = context.createGain();  // Connect final compressor to final destination.  compressor.connect(context.destination);  // Connect master dry and wet to compressor.  masterDry.connect(compressor);  masterWet.connect(compressor);  // Connect reverb to master wet.  reverb.connect(masterWet);  // Create a few sources.  source1 = context.createBufferSource();  source2 = context.createBufferSource();  source3 = context.createOscillator();  source1.buffer = manTalkingBuffer;  source2.buffer = footstepsBuffer;  source3.frequency.value = 440;  // Connect source1  dry1 = context.createGain();  wet1 = context.createGain();  source1.connect(lowpassFilter);  lowpassFilter.connect(dry1);  lowpassFilter.connect(wet1);  dry1.connect(masterDry);  wet1.connect(reverb);  // Connect source2  dry2 = context.createGain();  wet2 = context.createGain();  source2.connect(waveShaper);  waveShaper.connect(dry2);  waveShaper.connect(wet2);  dry2.connect(masterDry);  wet2.connect(reverb);  // Connect source3  dry3 = context.createGain();  wet3 = context.createGain();  source3.connect(panner);  panner.connect(dry3);  panner.connect(wet3);  dry3.connect(masterDry);  wet3.connect(reverb);  // Start the sources now.  source1.start(0);  source2.start(0);  source3.start(0);}

モジュラールーティングはまた AudioNode の出力を別の AudioNode の動きを制御する AudioParam パラメーターに接続する事もできます。この場合は、ノードからの出力は入力信号ではなくモジュレーション信号として働きます。

modular routing3 — モジュラールーティングによってオシレーターの出力で別のオシレーターの周波数を変調する図

function setupRoutingGraph() {  const context = new AudioContext();  // Create the low frequency oscillator that supplies the modulation signal  const lfo = context.createOscillator();  lfo.frequency.value = 1.0;  // Create the high frequency oscillator to be modulated  const hfo = context.createOscillator();  hfo.frequency.value = 440.0;  // Create a gain node whose gain determines the amplitude of the modulation signal  const modulationGain = context.createGain();  modulationGain.gain.value = 50;  // Configure the graph and start the oscillators  lfo.connect(modulationGain);  modulationGain.connect(hfo.detune);  hfo.connect(context.destination);  hfo.start(0);  lfo.start(0);}

API の概要

定義されているインターフェースは次のとおりです:

AudioContext インターフェースは、AudioNode 間の接続を表すオーディオ信号グラフを保持します。
AudioNode インターフェースは、オーディオのソース、オーディオの出力、その間にある処理モジュールを表します。AudioNode はモジュラー方式で動的に互いに接続されます。AudioNode は AudioContext のコンテキスト内に存在します。
AnalyserNode インターフェースは、ミュージックビジュアライザーやその他の視覚化アプリケーションで使用される AudioNode です。
AudioBuffer インターフェースは、メモリー内に保持されるオーディオのリソースで使用されます。これらはワンショットの音、またはもっと長いオーディオクリップを表します。
AudioBufferSourceNode インターフェイーは、AudioBuffer からの音を発生する AudioNode です。
AudioDestinationNode インターフェースは、AudioNode のサブクラスでオーディオの最終的な出力地点を表します。
AudioParam インターフェースは、AudioNode の個別の機能、例えば音量などを制御します。
AudioListener インターフェースは、PannerNode と共に空間音響のために使用されます。
AudioWorklet インターフェースは、スクリプトでオーディオを直接処理するカスタムノードを作成するファクトリーを表します。
AudioWorkletGlobalScope インターフェースは、AudioWorkletProcessor の処理スクリプトが実行されるコンテキストです。
AudioWorkletNode インターフェースは、AudioWorkletProcessor で処理される AudioNode を表します。
AudioWorkletProcessor インターフェースは、Audio ワーカー内の 1 つのノードのインスタンスを表します。
BiquadFilterNode インターフェースは、次のような一般的な低次のフィルターの AudioNode です:
- ローパス
- ハイパス
- バンドパス
- ローシェルフ
- ハイシェルフ
- ピーキング
- ノッチ
- オールパス
ChannelMergerNode インターフェースは、複数のオーディオストリームからひとつのオーディオストリームにチャンネルの結合を行う AudioNode です。
ChannelSplitterNode インターフェースは、ルーティンググラフ内のオーディオストリームの個別のチャンネルにアクセスするために使用される AudioNode です。
ConstantSourceNode インターフェースは、AudioParam による値のオートメーションが可能な定数値を出力する AudioNode です。
ConvolverNode インターフェースは、( 例えばコンサートホールでの音のような ) リアルタイム線形エフェクトを加える AudioNode です。
DelayNode インターフェースは、動的に調整可能な遅延を行う AudioNode です。
DynamicsCompressorNode インターフェースは、ダイナミクス・コンプレッションのための AudioNode です。
GainNode インターフェースは、明示的なゲイン制御を行う AudioNode です。
IIRFilterNode インターフェースは、一般的な IIR フィルターの AudioNode です。
MediaElementAudioSourceNode インターフェースは、audio、video その他のメディア要素を音源とする AudioNode です。
MediaStreamAudioSourceNode インターフェースは、ライブオーディオ入力やリモート・ピアから受け取ったような MediaStream を音源とする AudioNode です。
MediaStreamTrackAudioSourceNode インターフェースは、MediaStreamTrack からのオーディオを音源とする AudioNodeです。
MediaStreamAudioDestinationNode インターフェースは、リモート・ピアに送信する MediaStream を出力先とする AudioNode です。
PannerNode インターフェースは、3D 空間での空間音響/空間定位のための AudioNode です。
PeriodicWave インターフェースは、OscillatorNode で使用されるカスタム周期波形を指定するために使用されます。
OscillatorNode インターフェースは、周期的な波形を発生する AudioNode です。
StereoPannerNode インターフェースは、ステレオストリームで入力された信号の equal-power 方式の定位を行う AudioNode です。
WaveShaperNode インターフェースは、例えばディストーションや微妙なウォーミング効果 ( 訳注:いわゆるサチュレーション効果の事 ) など、非線形のウェーブシェイピング・エフェクトを加えるための AudioNode です。

また非推奨ですがまだ削除されておらず、置き換えの実装が予定されているいくつかの Web Audio API があります。

ScriptProcessorNode インターフェースは、スクリプトでオーディオを直接生成または処理するための AudioNode です。
AudioProcessingEvent インターフェースは、ScriptProcessorNode オブジェクトと共に用いられるイベントタイプです。

1. オーディオ API

1.1. `BaseAudioContext` インターフェース

このインターフェースは AudioNode オブジェクトのセットとそれらの接続を表します。それによって AudioDestinationNode に任意の信号をルーティングする事を可能にします。ノードはコンテキストから作成され、お互いに接続されます。

BaseAudioContext は直接的にはインスタンス化されず、代わりに AudioContext (リアルタイムレンダリングの場合)と OfflineAudioContext (オフラインレンダリングの場合)が拡張された具体的なインターフェースとなっています。

BaseAudioContext は、初期状態では空のプロミスの順序付きリストである [[pending promises]] という内部スロットによって作成されます。

enum AudioContextState {
   "suspended",
   "running",
   "closed"
 };

列挙値の説明
"`suspended`"	このコンテキストは現在中断 ( コンテキストの時間は進まず、オーディオハードウェアはパワーダウン / 解放 ) してる可能性があります。
"`running`"	オーディオは処理状態にあります。
"`closed`"	このコンテキストは解放され、もうオーディオ処理に使用できません。すべてのシステムオーディオリソースは解放されました。

callback DecodeErrorCallback = void (DOMException error);
 
 callback DecodeSuccessCallback = void (AudioBuffer decodedData);
 
 [Exposed=Window]
 interface BaseAudioContext : EventTarget {
   readonly attribute AudioDestinationNode destination;
   readonly attribute float sampleRate;
   readonly attribute double currentTime;
   readonly attribute AudioListener listener;
   readonly attribute AudioContextState state;
   [SameObject, SecureContext]
   readonly attribute AudioWorklet audioWorklet;
   attribute EventHandler onstatechange;
 
   AnalyserNode createAnalyser ();
   BiquadFilterNode createBiquadFilter ();
   AudioBuffer createBuffer (unsigned long numberOfChannels,
                             unsigned long length,
                             float sampleRate);
   AudioBufferSourceNode createBufferSource ();
   ChannelMergerNode createChannelMerger (optional unsigned long numberOfInputs = 6);
   ChannelSplitterNode createChannelSplitter (
     optional unsigned long numberOfOutputs = 6);
   ConstantSourceNode createConstantSource ();
   ConvolverNode createConvolver ();
   DelayNode createDelay (optional double maxDelayTime = 1.0);
   DynamicsCompressorNode createDynamicsCompressor ();
   GainNode createGain ();
   IIRFilterNode createIIRFilter (sequence<double> feedforward,
                                  sequence<double> feedback);
   OscillatorNode createOscillator ();
   PannerNode createPanner ();
   PeriodicWave createPeriodicWave (sequence<float> real,
                                    sequence<float> imag,
                                    optional PeriodicWaveConstraints constraints = {});
   ScriptProcessorNode createScriptProcessor(
     optional unsigned long bufferSize = 0,
     optional unsigned long numberOfInputChannels = 2,
     optional unsigned long numberOfOutputChannels = 2);
   StereoPannerNode createStereoPanner ();
   WaveShaperNode createWaveShaper ();
 
   Promise<AudioBuffer> decodeAudioData (
     ArrayBuffer audioData,
     optional DecodeSuccessCallback? successCallback,
     optional DecodeErrorCallback? errorCallback);
 };

1.1.1. 属性

audioWorklet, AudioWorklet 型, readonly

[worklets-1] と AudioWorklet のアルゴリズムにより定義された AudioWorkletProcessor クラスのスクリプトをインポート可能な Worklet オブジェクトへのアクセスを行います。

currentTime, double 型, readonly

コンテキストのレンダリンググラフで最後に処理されたオーディオブロックの最後のサンプルフレームの次のサンプルの秒で表した時刻です。もしコンテキストのレンダリンググラフがまだオーディオブロックを処理していない場合 currentTime は 0 になります。

currentTime の時間軸で 0 はグラフで処理される最初のブロックの最初のサンプルフレームに対応します。このシステムの経過時間は BaseAudioContext が生成するオーディオストリームの経過時間に対応し、それはシステム内の他の時計には同期しないかも知れません。( OfflineAudioContext では、ストリームはどのデバイスでも能動的に再生されないため、実時間とはまったく違う進み方になります )

Web Audio API のすべてのスケジュールされた時刻は currentTime に対する相対値になります。

BaseAudioContext が "running" 状態にあるとき、この属性の値は単調増加し、レンダリングスレッドにより 1 レンダリング量子に対応する均一な増分で更新されます。そのため動作中のコンテキストでは、currentTime はシステムがオーディオブロックを処理するに従って徐々に増加し、常に次に処理されるオーディオブロックの先頭の時刻を表します。それはまた現在の状態に対する変更が効力を持つ最も早い時刻でもあります。

currentTime は制御スレッドが戻るまでにアトミックに読み取られなくてはなりません ( MUST )。

destination, AudioDestinationNode 型, readonly

AudioDestinationNode は単一の入力を持ち、すべてのオーディオの最終的な出口を表しています。通常これは実際のオーディオハードウェアを表します。動作中のすべての AudioNode は直接または間接的にこの destination に接続されます。

listener, AudioListener 型, readonly

AudioListener は 3D 空間音響で使用されます。

onstatechange, EventHandler 型

BaseAudioContext に AudioContext の状態が変化したとき ( 例えば、対応する Promise がリゾルブされたときなど ) にディスパッチされるイベントの EventHandler を設定するために使用されるプロパティです。 AudioContext の状態を直接問い合わせる事ができる Event 型のイベントがイベントハンドラーに発行されます。新たに作成された AudioContextは常に suspended 状態から開始し、状態の変化イベントは異なる状態への遷移の度に発行されます。このイベントは oncomplete イベントが発行される前に発行されます。

sampleRate, float 型, readonly

BaseAudioContext が扱うオーディオのサンプルレート ( 1 秒あたりのサンプルフレーム数 ) です。コンテキスト内のすべての AudioNode はこのレートで動作する事を想定しています。これを想定するため、サンプレートコンバータや " 可変速 " 処理はリアルタイム処理内ではサポートされません。ナイキスト周波数はこのサンプルレートの半分の値となります。

state, AudioContextState 型, readonly

AudioContext の現在の状態を表します。その値は制御スレッドの状態と同じです。

1.1.2. メソッド

createAnalyser()

AnalyserNode のファクトリーメソッドです。

パラメーターなし

戻り値: AnalyserNode

createBiquadFilter()

いくつかの一般的なフィルタータイプに設定可能な 2 次フィルターを表す BiquadFilterNode のファクトリーメソッドです。

パラメーターなし

戻り値: BiquadFilterNode

createBuffer(numberOfChannels, length, sampleRate)

与えられたサイズの AudioBuffer を作成します。バッファ内のデータは 0 ( 無音 ) で初期化されます。もし、引数のどれかが負、0 または範囲外の場合、NotSupportedError 例外を発生します ( MUST )。

BaseAudioContext.createBuffer() メソッドの引数。
パラメーター	型	Null可	省略可	説明
`numberOfChannels`	unsigned long	✘	✘	バッファが持つチャンネル数を指定します。実装は少なくとも 32 チャンネルをサポートしなくてはなりません ( MUST )。
`length`	unsigned long	✘	✘	バッファのサイズをサンプルフレーム数で指定します。これは少なくとも1でなくてはなりません ( MUST )。
`sampleRate`	float	✘	✘	バッファ内のリニア PCM オーディオデータのサンプルレートを秒あたりのサンプルフレーム数で表します。実装は少なくとも 8000 から 96000 の範囲をサポートしなくてはなりません ( MUST )。

戻り値: AudioBuffer

createBufferSource()

AudioBufferSourceNode のファクトリーメソッドです。

パラメーターなし

戻り値: AudioBufferSourceNode

createChannelMerger(numberOfInputs)

チャンネルマージャーを表す ChannelMergerNode のファクトリーメソッドです。numberOfInputs が 1 より小さいかサポートされる数より大きい場合は IndexSizeError 例外を発生します ( MUST )。

BaseAudioContext.createChannelMerger(numberOfInputs) メソッドの引数。
パラメーター	型	Null可	省略可	説明
`numberOfInputs`	unsigned long	✘	✔	入力の数を指定します。値は 32 までサポートされなくてはなりません ( MUST )。もし指定されない場合は `6` となります。

戻り値: ChannelMergerNode

createChannelSplitter(numberOfOutputs)

チャンネルスプリッターを表す ChannelSplitterNode のファクトリーメソッドです。numberOfOutputs が 1 より小さいかサポートされる数より大きい場合は、IndexSizeError 例外を発生します ( MUST )。

BaseAudioContext.createChannelSplitter(numberOfOutputs) メソッドの引数。
パラメーター	型	Null可	省略可	説明
`numberOfOutputs`	unsigned long	✘	✔	出力の数を指定します。値は 32 までサポートされなくてはなりません ( MUST )。もし指定されない場合は `6` となります。

戻り値: ChannelSplitterNode

createConstantSource()

ConstantSourceNode のファクトリーメソッドです。

パラメーターなし

戻り値: ConstantSourceNode

createConvolver()

ConvolverNode のファクトリーメソッドです。

パラメーターなし

戻り値: ConvolverNode

createDelay(maxDelayTime)

DelayNode のファクトリーメソッドです。初期化時のデフォルト遅延時間は 0 秒です。

BaseAudioContext.createDelay(maxDelayTime) メソッドの引数。
パラメーター	型	Null可	省略可	説明
`maxDelayTime`	double	✘	✔	遅延機能の遅延時間の最大値を秒で指定します。指定する場合は、その値は 0 よりも大きく 3 分よりも小さくなければなりません ( MUST )。そうでない場合 `NotSupportedError` 例外を発生します ( MUST )。指定しない場合は `1` となります。

戻り値: DelayNode

createDynamicsCompressor()

DynamicsCompressorNode のファクトリーメソッドです。

パラメーターなし

戻り値: DynamicsCompressorNode

createGain()

GainNode のファクトリーメソッドです。

パラメーターなし

戻り値: GainNode

createIIRFilter(feedforward, feedback)

BaseAudioContext.createIIRFilter() メソッドの引数。
パラメーター	型	Null可	省略可	説明
`feedforward`	sequence<double>	✘	✘	IIR フィルターの伝達関数のフィードフォワード ( 分子 ) の係数の配列です。この配列の最大の長さは 20 です。もしすべての値が 0 の場合、`InvalidStateError` 例外を発生します ( MUST )。配列の長さが 0 または 20 より大きい場合は `NotSupportedError` 例外を発生します ( MUST )。
`feedback`	sequence<double>	✘	✘	IIR フィルターの伝達関数のフィードバック ( 分母 ) の係数の配列です。この配列の最大の長さは20です。もし配列の最初の要素が 0 の場合、`InvalidStateError` 例外を発生します ( MUST )。もし配列の長さが 0 または 20 より大きい場合は `NotSupportedError` 例外を発生します ( MUST )。

戻り値: IIRFilterNode

createOscillator()

OscillatorNode のファクトリーメソッドです。

パラメーターなし

戻り値: OscillatorNode

createPanner()

PannerNode のファクトリーメソッドです。

パラメーターなし

戻り値: PannerNode

createPeriodicWave(real, imag, constraints)

PeriodicWave を作成するファクトリーメソッドです。

このメソッドを呼び出したとき、以下の手順が実行されます:

もし real と imag が同じ長さでない場合、IndexSizeError が発生します ( MUST )。
o を PeriodicWaveOptions 型の新しいオブジェクトとします。
このファクトリーメソッドに各々渡された real および imag パラメーターを、o の同じ名前の属性として設定します。
o の disableNormalization 属性を、ファクトリーメソッドに渡された constraints 属性の disableNormalization の値に設定します。
このファクトリーメソッドが呼ばれた BaseAudioContext を最初の引数とし、o を渡して新しい PeriodicWave p を作成します。
p を返します。

BaseAudioContext.createPeriodicWave() メソッドの引数。
パラメーター	型	Null可	省略可	説明
`real`	sequence<float>	✘	✘	コサインパラメーターの数値列です。詳細の説明についてはコンストラクタの引数 `real` を参照してください。
`imag`	sequence<float>	✘	✘	サインパラメーターの数値列です。詳細の説明についてはコンストラクタの引数 `imag` を参照してください。
`constraints`	PeriodicWaveConstraints	✘	✔	指定されていない場合は、波形は正規化されます。そうでない場合、波形は `constraints` に与えられた値に従って正規化されます。

戻り値: PeriodicWave

createScriptProcessor(bufferSize, numberOfInputChannels, numberOfOutputChannels)

ScriptProcessorNode のファクトリーメソッドです。このメソッドは廃止予定 ( DEPRECATED ) で、AudioWorkletNode で置き換えられます。スクリプトによるオーディオデータ直接処理のための ScriptProcessorNode を作成します。 bufferSize または numberOfInputChannels または numberOfOutputChannels が範囲外の場合、 IndexSizeError 例外を発生します ( MUST )。

numberOfInputChannels と numberOfOutputChannels の両方を 0 にはできません。この場合、IndexSizeError 例外を発生します ( MUST )。

BaseAudioContext.createScriptProcessor(bufferSize, numberOfInputChannels, numberOfOutputChannels) メソッドの引数。
パラメーター	型	Null可	省略可	説明
`bufferSize`	unsigned long	✘	✔	`bufferSize` パラメーターはサンプルフレーム数でバッファのサイズを指定します。もしそれが渡されない場合、または値が 0 である場合、実装はノードのライフタイムを通して一定な、動作環境に最適な2の累乗のバッファサイズを選択します。それ以外の場合は明示的にバッファサイズを指定します。それは次の値のどれかでなければなりません: 256、512、1024、2048、4096、8192、16384 ( MUST )。この値は `onaudioprocess` イベントが発生する頻度とそれぞれの呼び出しでどれだけのサンプルフレームを処理する必要があるかを制御します。`bufferSize` が小さい値ならばレイテンシーは低く ( 良く ) なります。オーディオが途切れ、グリッジが発生する事を避けるには大きな値が必要となります。レイテンシーとオーディオ品質の間のバランスを取るためには、プログラマーはこのバッファサイズを指定せず、実装に最適なバッファサイズを選択させる事が推奨されます。もしこのパラメーターの値が上に示した許された2の累乗の値でない場合、`IndexSizeError` 例外を発生します ( MUST )。
`numberOfInputChannels`	unsigned long	✘	✔	このパラメーターはこのノードの入力チャンネル数を指定します。デフォルトの値は 2 です。32 チャンネルまでの値がサポートされなくてはなりません。チャンネル数がサポート外の場合、`NotSupportedError` 例外を発生します。
`numberOfOutputChannels`	unsigned long	✘	✔	このパラメーターはこのノードの出力チャンネル数を指定します。デフォルトの値は 2 です。32 チャンネルまでの値がサポートされなくてはなりません。チャンネル数がサポート外の場合、`NotSupportedError` 例外を発生します。

戻り値: ScriptProcessorNode

createStereoPanner()

StereoPannerNode のファクトリーメソッドです。

パラメーターなし

戻り値: StereoPannerNode

createWaveShaper()

非線形な歪み効果を表す WaveShaperNode のファクトリーメソッドです。

パラメーターなし

戻り値: WaveShaperNode

decodeAudioData(audioData, successCallback, errorCallback)

ArrayBuffer 内にあるオーディオファイルのデータを非同期にデコードします。ArrayBuffer は、例えば XMLHttpRequest で responseType に "arraybuffer" を指定した場合の response 属性としてロードされます。オーディオファイルデータは audio 要素でサポートされるどのフォーマットでも構いません。decodeAudioData() に渡されるバッファは [mimesniff] で説明される手順で判定されるコンテントタイプを持ちます。

この関数の基本的なインターフェースの手段は戻り値の promise ではありますが、歴史的な理由からコールバックのパラメーターも提供されています。

decodeAudioData が呼ばれたとき、制御スレッド上では次の手順を実行します ( MUST ):

promise を新しい promise とします。
もし audioData に対する、IsDetachedBuffer ([ECMASCRIPT] で説明されています) が false の場合、次の手順を実行します:
1. promise を [[pending promises]] に追加します。
2. audioData ArrayBuffer を Detach します。この操作は [ECMASCRIPT] で説明されています。もしこの操作に失敗した場合はステップ 3 にジャンプします。
3. 別のスレッドで実行されるデコード処理をキューにいれます。
そうでなければ、次の手順を実行します:
1. error を DataCloneError とします。
2. promise を error でリジェクトし、[[pending promises]]から削除します。
3. errorCallback を error で呼び出すタスクをキューに入れます。
promise を返します。

制御スレッドでもレンダリングスレッドでもない、デコーディングスレッドと呼ばれる別のスレッドで実行されるデコード処理がキューに入れられるとき、次の手順が発生します ( MUST )。

注 : 複数回の decodeAudioData の呼び出しを処理するため、複数のデコーディングスレッドが並列して走る事もあります。

can decode を初期状態が true のブーリアンフラグとします。
MIME Sniffing §6.2 Matching an audio or video type pattern を用いて、audioData の MIME タイプの決定を試みます。もしオーディオまたはビデオのパターンマッチングアルゴリズムが undefined を返した場合 can decode を false に設定します。
もし can decode が true の場合、エンコードされている audioData をリニア PCM にデコードを試みます。もし失敗した場合は can decode を false に設定します。
もし can decode が false の場合制御スレッド
のイベントループで次のステップを実行するためのタスクをキューに入れます:
1. error を EncodingError という名前の DOMException とします。
  1. promiseをerrorでリジェクトし、[[pending promises]]から削除します。
2. もし errorCallback が存在している場合は errorCallback を error で呼び出します。
そうでなければ:
1. デコードされたリニア PCM の結果を得て、AudioContext のサンプルレートがaudioDataのサンプルレートと異なっていたらリサンプルを行います。
2. 制御スレッドのイベントループで次のステップを実行するためのタスクをキューに入れます:
  1. buffer を最終的な結果 ( 必要ならサンプルレート変換を行った後 ) を保持した AudioBuffer とします。
  2. promise を buffer を持ってリゾルブします。
  3. もしsuccessCallbackが存在していればsuccessCallbackをbufferを持って呼び出します。

BaseAudioContext.decodeAudioData() メソッドの引数。
パラメーター	型	Null可	省略可	説明
`audioData`	ArrayBuffer	✘	✘	圧縮されたオーディオデータを含む ArrayBuffer です。
`successCallback`	DecodeSuccessCallback?	✔	✔	デコードが完了したときに呼び出されるコールバック関数です。コールバック関数の引数は 1 つでデコードされた PCM オーディオデータをあらわす AudioBuffer になります。
`errorCallback`	DecodeErrorCallback?	✔	✔	オーディオファイルをデコード中にエラーが起こった場合に呼び出されるコールバック関数です。

戻り値: Promise<AudioBuffer>

1.1.3. コールバック `DecodeSuccessCallback()` パラメーター

decodedData, AudioBuffer 型: デコードしたオーディオデータを保持する AudioBuffer。

1.1.4. コールバック `DecodeErrorCallback()` パラメーター

error, DOMException 型: デコード中に発生したエラー。

1.1.5. ライフタイム

AudioContext は一度作成された後、これ以上再生する音がなくなるまで、あるいはページを移動するまで再生を続けます。

1.1.6. 内部検査やシリアライゼーションの基本機能の欠如

Web Audio API は音源のスケジューリングに fire-and-forget アプローチを取っています。つまり、音源ノードは、AudioContext のライフタイムの間のひとつひとつの音に対応して作成され、明示的にグラフからの削除は行いません。これはシリアライゼーション API とは互換性がなく、そのためシリアライズ可能な固定的なノードのセットもありません。

さらに、内部検査のための API を持つためにはスクリプトの中身のガベージコレクションの監視が必要になります。

1.1.7. `BaseAudioContext` サブクラスに関連付けられるシステムリソース

サブクラス、AudioContext と OfflineAudioContext はコストの高いオブジェクトと考えるべきです。これらのオブジェクトの作成には、高プライオリティのスレッドまたは低レイテンシーのシステムオーディオを含み、どちらも消費電力への影響があります。通常は、1 つのドキュメント内に 1 つ以上の AudioContext を作成する事は不必要です。

BaseAudioContext のサブクラスの作成または再開は、そのコンテキストがシステムリソースを取得する事を含みます。このためには AudioContext としてはシステムオーディオのストリームを作成する事も必要です。これらの動作はコンテキストが関連するオーディオグラフから出力の生成を開始する際に処理を戻します。

なお、ユーザーエージェントは実装で定められた最大数の AudioContext を持つ事ができ、それ以上の新しい AudioContext の作成は失敗して、throwing NotSupportedError 例外を発生します。

プログラマーは suspend および close を使う事で、スレッド、プロセスおよびオーディオストリームを含むシステムリソースの解放を行う事ができます。BaseAudioContext をサスペンドする事で、実装は一部のリソースを解放して後で resume を呼び出したときに再開できるようにします。 AudioContext のクローズによって、実装はすべてのリソースを解放し、再度使用したり再開したりはできなくなります。

注 : これは例えば、定期的なコールバックの呼び出しを待つ事やハードウェアが処理可能になるのを待つ事も含みます。

1.2. `AudioContext` インターフェース

このインターフェースは、その AudioDestinationNode がデバイスへのリアルタイム出力によって直接ユーザーに信号が届くオーディオグラフを表します。多くの場合、１つのドキュメントにつき 1 つの AudioContext が使用されます。

enum AudioContextLatencyCategory {
     "balanced",
     "interactive",
     "playback"
 };

列挙値の説明
"`balanced`"	オーディオ出力のレイテンシーと安定性/消費電力のバランスを取ります。
"`interactive`"	オーディオ出力のレイテンシーをグリッジが発生しない最小値にする。これがデフォルトになります。
"`playback`"	オーディオ出力のレイテンシーよりも再生の途切れを起こさない事を優先します。消費電力は最も低くなります。

[Exposed=Window]
 interface AudioContext : BaseAudioContext {
   constructor (optional AudioContextOptions contextOptions = {});
   readonly attribute double baseLatency;
   readonly attribute double outputLatency;
   AudioTimestamp getOutputTimestamp ();
   Promise<void> resume ();
   Promise<void> suspend ();
   Promise<void> close ();
   MediaElementAudioSourceNode createMediaElementSource (HTMLMediaElement mediaElement);
   MediaStreamAudioSourceNode createMediaStreamSource (MediaStream mediaStream);
   MediaStreamTrackAudioSourceNode createMediaStreamTrackSource (
     MediaStreamTrack mediaStreamTrack);
   MediaStreamAudioDestinationNode createMediaStreamDestination ();
 };

ユーザーエージェントがコンテキストの状態を "suspended"から "running"に移行できる場合、AudioContext がスタート可能であると言います。ユーザーエージェントは、AudioContext の関連するグローバルオブジェクトがスティッキーアクティベーションを持っている場合にのみ許可するために、この初期遷移を遅延させることができます。

AudioContext は内部にスロットを持っている :

[[suspended by user]]: コンテキストがユーザーのコードによって中断されているかどうかを表すブーリアンフラグ。初期値は false です。

1.2.1. コンストラクター

AudioContext(contextOptions)

現在の設定オブジェクトの対応するドキュメントが完全にアクティブでない場合は InvalidStateError を発生して、次の手順を中止します。

AudioContext を作成する際は、以下の手順を実行します:

AudioContext 上の制御スレッドの状態を suspended に設定します。
AudioContext 上のレンダリングスレッドの状態を suspended に設定します。
[[pending resume promises]]をこの AudioContext 上のスロットとし、初期状態を空の promise のリストとします。
もし contextOptions が与えられていれば、オプションを適用します:
1. この AudioContext の内部レイテンシーを latencyHint の項に書かれているように、contextOptions.latencyHint に従って設定します。
2. もし contextOptions.sampleRate が指定されていれば、この AudioContext の sampleRate をその値に設定します。そうでなければ、デフォルト出力デバイスのサンプルレートを使用します。もし選択されたサンプルレートが出力デバイスのサンプルレートと異なる場合、この AudioContext はオーディオ出力を出力デバイスのサンプルレートに合うようにリサンプリングしなくてはなりません ( MUST )。
  
  注 : もしリサンプリングが必要とされる場合、AudioContext のレイテンシーに大きな影響があるかも知れません。
もし AudioContext がスタート可能ならば、処理を開始するための制御メッセージを送ります。
この AudioContext オブジェクトを返します。

処理を開始するための制御メッセージを送るには次の手順を実行します:

システムリソースの取得を試みます。もし失敗した場合は以降の手順を中止します。
AudioContext のレンダリングスレッドの状態を running に設定します。
制御スレッドのイベントループで以下の手順を実行するためのタスクをキューに入れます:
1. AudioContext の state 属性を "running" に設定します。
2. AudioContext に statechange という名前のシンプルイベントを発行するためのタスクをキューに入れます。

注 : 残念ながら、AudioContext の作成の失敗についてプログラム上の通知をすることはできません。ユーザーエージェントは、デベロッパーツールコンソールのようなログメカニズムにアクセスできる場合、これを知らせるメッセージをログに記録することをお勧めします。

AudioContext.constructor(contextOptions) メソッドの引数。
パラメーター	型	Null可	省略可	説明
`contextOptions`	AudioContextOptions	✘	✔	`AudioContext` をどのように作成するかをユーザーが指定するオプション。

1.2.2. 属性

baseLatency, double 型, readonly

これは AudioContext が AudioDestinationNode からオーディオサブシステムにオーディオを渡す処理で発生するレイテンシーの秒数を表します。これには AudioDestinationNode の出力とオーディオハードウェアの間で発生するかも知れないその他の処理による追加のレイテンシーは含まれず、特にオーディオグラフ自体に発生するレイテンシーは含まれません。

例えばもし、オーディオコンテキストが 44.1 kHz で動作しており、AudioDestinationNode の実装が内部でダブルバッファリングによるレンダリング量子の出力処理を行う場合、処理のレイテンシーは、約 \((2\cdot128)/44100 = 5.805 \mathrm{ ms}\) となります。

outputLatency, double 型, readonly

オーディオ出力処理のレイテンシーの秒数の見積もり。つまり、UA がホストシステムにバッファを再生を要求した時間から、バッファ内の最初のサンプルが実際にオーディオ出力デバイスで処理される時間までの間隔。この後者の時間は、スピーカーやヘッドフォンのような音の信号を発生するデバイスがサンプルの音を発生する時間を指します。

outputLatency 属性の値はプラットフォームと接続されているオーディオ出力デバイスに依存します。outputLatency 属性の値は接続されているオーディオ出力デバイスが同じである限り、コンテキストのライフタイムを通じて変化する事はありません。もしオーディオ出力デバイスが変化したならば、outputLatency 属性の値もそれに従ってアップデートされます。

1.2.3. メソッド

close()

AudioContext をクローズし、使用中のシステムリソースを解放します。これは、AudioContext が作成したすべてのオブジェクトを自動的に開放はしませんが、AudioContext の currentTime の進行を止め、オーディオデータの処理を停止します。

close が呼ばれたとき、以下の手順が実行されます:

promise を新しい Promise とします。
もし AudioContext の制御スレッドの状態フラグが closed であった場合、promise を InvalidStateError でリジェクトし、これらの手順を中断して promise を返します。
AudioContext の制御スレッドの状態フラグを closed に設定します。
AudioContext をクローズするための制御メッセージをキューに入れます。
promise を返します。

AudioContext をクローズするための制御メッセージを実行する事は、レンダリングスレッドで、以下の手順を実行する事を意味します:

システムリソースの解放を試みます。
レンダリングスレッドの状態を suspended に設定します。

これによりレンダリングは停止します。
もしこの制御メッセージがドキュメントがアンロードされる事に対する反応として実行されているなら、このアルゴリズムを中止します。

この場合、制御スレッドへの通知は必要ありません。
制御スレッドのイベントループで以下の手順を実行するタスクをキューに入れます :
1. promise をリゾルブします。
2. もし AudioContext の state 属性が既に "closed" でない場合:
  1. AudioContext の state 属性を "closed" に設定します。
  2. AudioContext で statechange という名前のシンプルイベントを発行するためのタスクをキューに入れます。

AudioContext がクローズされた場合、AudioContext に接続されているすべての MediaStream と HTMLMediaElement はその出力を無視されます。つまり、これらはもうスピーカーなどの出力デバイスに出力されなくなります。より柔軟な挙動のためには、 HTMLMediaElement.captureStream() の使用を検討してください。

注 : AudioContext がクローズされるとき、実装はサスペンドの場合よりも積極的に多くのリソースを解放する事ができます。

パラメーターなし

戻り値: Promise<void>

createMediaElementSource(mediaElement)

指定された HTMLMediaElement から MediaElementAudioSourceNode を作成します。このメソッドの呼び出しにより、HTMLMediaElement からのオーディオの再生は AudioContext の処理グラフに再ルーティングされるようになります。

AudioContext.createMediaElementSource() メソッドの引数。
パラメーター	型	Null可	省略可	説明
`mediaElement`	HTMLMediaElement	✘	✘	再ルーティングされるメディアエレメントです。

戻り値: MediaElementAudioSourceNode

createMediaStreamDestination()

MediaStreamAudioDestinationNode を作成します。

パラメーターなし

戻り値: MediaStreamAudioDestinationNode

createMediaStreamSource(mediaStream)

MediaStreamAudioSourceNode を作成します。

AudioContext.createMediaStreamSource() メソッドの引数。
パラメーター	型	Null可	省略可	説明
`mediaStream`	MediaStream	✘	✘	音源となるメディアストリームです。

戻り値: MediaStreamAudioSourceNode

createMediaStreamTrackSource(mediaStreamTrack)

MediaStreamTrackAudioSourceNode を作成します。

AudioContext.createMediaStreamTrackSource() メソッドの引数。
パラメーター	型	Null可	省略可	説明
`mediaStreamTrack`	MediaStreamTrack	✘	✘	音源となる `MediaStreamTrack` です。その `kind` 属性は `"audio"` でなくてはならず、そうでない場合は、`InvalidStateError` 例外を発生します ( MUST )。

戻り値: MediaStreamTrackAudioSourceNode

getOutputTimestamp()

コンテキストのオーディオストリームについて、2 つの関連する位置情報を含む新しい AudioTimestamp インスタンスを返します: contextTime メンバーには、オーディオ出力デバイスによって現在レンダリングされているサンプルフレームの時間 ( つまり出力されているオーディオストリームの位置 ) が含まれます。これにはコンテキストの currentTime と同じ単位と起点を使用します。そして performanceTime メンバーには、contextTime に格納された値に対応するサンプルフレームが performance.now() ( [hr-time-2] で説明されています ) と同じ単位および起点で、オーディオ出力デバイスによってレンダリングされる瞬間を推定する時間が含まれます。

コンテキストのレンダリンググラフがまだオーディオブロックを処理していないときに getOutputTimestamp を呼び出すと、両方のメンバーが 0 である AudioTimestamp インスタンスを返します。

コンテキストのレンダリンググラフがオーディオブロックの処理を開始すると、その currentTime 属性の値は常に getOutputTimestamp メソッドの呼び出しで取得される contextTime 値より大きくなります。

getOutputTimestamp メソッドから返された値は、コンテキストの時刻のわずかに後になるパフォーマンスの時刻の見積もりを得るのに使用できます:

function outputPerformanceTime(contextTime) {
   const timestamp = context.getOutputTimestamp();
   const elapsedTime = contextTime - timestamp.contextTime;
   return timestamp.performanceTime + elapsedTime * 1000;
 }

上の例での見積もりの精度は、引数の値が現在の出力オーディオストリームの位置にどれほど近いかによって決まります: つまり与えられた contextTime が timestamp.contextTime に近いほど、得られた推定の精度は良くなります。

注 : コンテキストの currentTime と getOutputTimestamp メソッドの呼び出しから得られた contextTime の値の差は、currentTime が不均一な時間間隔で増加する可能性があるため、信頼できる出力レイテンシーの見積もりとみなす事はできず、代わりに outputLatency 属性を使用する必要があります。

パラメーターなし

戻り値: AudioTimestamp

resume()

AudioContext の currentTime の進行が停止している場合、再開させます。

resume が呼ばれた時、以下のステップが実行されます :

promiseを新しい Promise とします。
もし AudioContext の制御スレッドの状態が closed であれば promise は InvalidStateError でリジェクトされ、これらのステップは中止して promise を返します。
[[suspended by user]] を false に設定します。
もしこのコンテキストがスタート可能でない場合 promise を [[pending promises]] と [[pending resume promises]] に加え、これらのステップを中止して promise を返します。
AudioContext の制御スレッドの状態を running に設定します。
AudioContext を再開するための制御メッセージをキューに入れます。
promise を返します。

AudioContext を再開するための制御メッセージを実行するとは、次のステップをレンダリングスレッドで実行する事を意味します:

システムリソースの取得を試みます。
AudioContext のレンダリングスレッドの状態を running に設定します。
オーディオグラフのレンダリングを開始します。
失敗した場合は制御スレッドで以下を実行してこれらのステップを中止します :
1. [[pending resume promises]] から全ての promise を順番にリジェクトして [[pending resume promises]] を空にします。
2. さらに、これらの promise を [[pending promises]] から削除します。
制御スレッドのイベントループ上でこれらのステップを実行するためのタスクをキューに入れます :
1. [[pending resume promises]] を空にします。さらに、これらの promise を [[pending promises]] から削除します。
2. promise をリゾルブします。
3. もし AudioContext の state 属性が既に "running" でない場合 :
  1. AudioContext の state 属性を "running" に設定します。
  2. AudioContext で statechange という名前のシンプルイベントを発行するためのタスクをキューに入れます。

パラメーターなし

戻り値: Promise<void>

suspend()

AudioContext の currentTime の進行を中断し、デスティネーションで再生するために既に処理を終えた現在のコンテキストの処理ブロックを再生し、その後システムがオーディオハードウェアの占有を解放できるようにします。これは一般的に、アプリケーションがしばらくの間 AudioContext を必要とせず、一時的に AudioContext に関連付けられたシステムリソースを解放したいことがアプリケーションに分かっているときに役に立ちます。この promise は、フレームバッファが空のとき ( ハードウェアに渡されたとき )、またはコンテキストがすでに suspended 状態のときは即座に ( 副作用なしで ) リゾルブされます。コンテキストがクローズされた場合、promise はリジェクトされます。

suspend が呼び出された場合、以下の手順を実行します:

promise を新しい Promise とします。
もし AudioContext の制御スレッドの状態が closed の場合、promise を InvalidStateError でリジェクトし、これらの手順を中止して promise を返します。
promise を [[pending promises]] に追加します。
[[suspended by user]] を true に設定します。
AudioContext の制御スレッドの状態を suspended に設定します。
AudioContext をサスペンドするための制御メッセージをキューに入れます。
promise を返します。

AudioContext をサスペンドするための制御メッセージを実行する、とはレンダリングスレッドで、以下の手順を実行する事を意味します:

システムリソースの解放を試みます。
AudioContext のレンダリングスレッドの状態を suspended に設定します。
制御スレッドのイベントループで以下の手順を実行するタスクをキューに入れます:
1. promise をリゾルブします。
2. もし AudioContext の state 属性が既に "suspended" でない場合:
  1. AudioContext の state 属性を "suspended" に設定します。
  2. AudioContext で statechange という名前のシンプルイベントを発行するタスクをキューに入れます。

AudioContext がサスペンドされている間 MediaStream の出力は無視されます。つまり、メディアストリームのリアルタイム性によって、データは失われます。HTMLMediaElement も同様に、システムが再開されるまでその出力は無視されます。AudioWorkletNode および ScriptProcessorNode は、サスペンド中は処理ハンドラーの呼び出しが止まりますが、コンテキストがリジュームされると再開します。AnalyserNode では、ウィンドウ関数の目的そのものにより、データは連続ストリームとみなされます。つまり、resume()/suspend() によって AnalyserNode のデータストリームに無音は発生しません。特に、AudioContext がサスペンドされているときに AnalyserNode の関数を繰り返し呼び出した際は、同じデータが返されなければなりません ( MUST )。

パラメーターなし

戻り値: Promise<void>

1.2.4. `AudioContextOptions`

AudioContextOptions ディクショナリは AudioContext のユーザー指定のオプションを決めるために使用されます。

dictionary AudioContextOptions {
   (AudioContextLatencyCategory or double) latencyHint = "interactive";
   float sampleRate;
 };

1.2.4.1. ディクショナリー `AudioContextOptions` メンバー

latencyHint, (AudioContextLatencyCategory または double) 型, デフォルト値は "interactive"

オーディオ出力のレイテンシーと消費電力の間のトレードオフに影響を与える、再生のタイプを指示します。

latencyHint の値は、AudioContextLatencyCategory から選択する事が推奨されます。ただし、レイテンシーと消費電力をより細かくバランスを取るために、レイテンシーの秒数を double 型で指定することもできます。数値を適切に解釈するのはブラウザーの裁量に委ねられています。実際に使用されるレイテンシーは、AudioContext の baseLatency 属性によって与えられます。

sampleRate, float 型

作成される AudioContext の sampleRate をこの値に設定します。サポートされている値は AudioBuffer のサンプルレートと同じです。指定されたサンプルレートがサポートされていない場合は NotSupportedError 例外を発生します ( MUST )。

もし sampleRate が指定されていない場合、この AudioContext の出力デバイスが推奨するサンプルレートが使用されます。

1.2.5. `AudioTimestamp`

dictionary AudioTimestamp {
   double contextTime;
   DOMHighResTimeStamp performanceTime;
 };

1.2.5.1. ディクショナリー `AudioTimestamp` メンバー

contextTime, double 型: BaseAudioContext の currentTime の時間軸内の時刻を表します。
performanceTime, DOMHighResTimeStamp 型: Performance インターフェースの実装における時間軸内の時刻を表します ( [hr-time-2] で説明されています )。

1.3. `OfflineAudioContext` インターフェース

OfflineAudioContext は、レンダリング/ミックスダウンのための特殊なタイプの BaseAudioContext で、( 潜在的には ) リアルタイムよりも高速に動作します。これはオーディオハードウェアに対してレンダリングせず、可能な限り高速にレンダリングした結果を AudioBuffer に格納して promise を返します。

[Exposed=Window]
 interface OfflineAudioContext : BaseAudioContext {
   constructor(OfflineAudioContextOptions contextOptions);
   constructor(unsigned long numberOfChannels, unsigned long length, float sampleRate);
   Promise<AudioBuffer> startRendering();
   Promise<void> resume();
   Promise<void> suspend(double suspendTime);
   readonly attribute unsigned long length;
   attribute EventHandler oncomplete;
 };

1.3.1. コンストラクター

OfflineAudioContext(contextOptions)

もし現在の設定オブジェクトに対応するドキュメントが完全にアクティブでない場合 InvalidStateError を発生しこれらのステップを中止します。

c を新しい OfflineAudioContext オブジェクトとします。c を次のように初期化します:

c の制御スレッドの状態を "suspended" とします。
c のレンダリングスレッドの状態を "suspended" とします。
channelCount を contextOptions.numberOfChannels とした AudioDestinationNode を作成します。

OfflineAudioContext.constructor(contextOptions) メソッドの引数。
パラメーター	型	Null可	省略可	説明
`contextOptions`				このコンテキストを作成する際に必要な初期化パラメーター

OfflineAudioContext(numberOfChannels, length, sampleRate)

OfflineAudioContext は AudioContext.createBuffer と同じ引数で作成できます。もし引数のどれかが負、0、または範囲外の場合は NotSupportedError 例外を発生します ( MUST )。

OfflineAudioContext は、次の呼び出し

new OfflineAudioContext({
     numberOfChannels: numberOfChannels,
     length: length,
     sampleRate: sampleRate
 })

が行われたのと同じように作成されます。

OfflineAudioContext.constructor(numberOfChannels, length, sampleRate) メソッドの引数。
パラメーター	型	Null可	省略可	説明
`numberOfChannels`	unsigned long	✘	✘	バッファが持つチャンネルの数を指定します。サポートされているチャンネル数については、 `createBuffer()` を参照してください。
`length`	unsigned long	✘	✘	バッファのサイズをサンプルフレーム数で指定します。
`sampleRate`	float	✘	✘	バッファ内のリニア PCM オーディオデータのサンプルレートをサンプルフレーム / 秒で記述します。有効なサンプルレートについては、`createBuffer()` を参照してください。

1.3.2. 属性

length, unsigned long 型, readonly: サンプルフレーム数で表したバッファのサイズです。これは、コンストラクタの length パラメーターの値と同じです。
oncomplete, EventHandler 型: OfflineAudioCompletionEvent 型の EventHandler です。これは OfflineAudioContext で最後に発行されるイベントです。

1.3.3. メソッド

startRendering()

現在の接続と変化のスケジュールが与えられると、オーディオのレンダリングが開始されます。

レンダリングされたオーディオデータを取得する主な方法は、promise の戻り値を経由する方法ですが、インスタンスは歴史的な理由により、complete という名前のイベントも発生させます。

[[rendering started]] をこの OfflineAudioContext の内部スロットとします。このスロットは false に初期化されます。

startRendering が呼び出されたとき、制御スレッドで次の手順を実行しなくてはなりません ( MUST ) :

OfflineAudioContext の [[rendering started]] スロットが true の場合、InvalidStateError でリジェクトした promise を返し、これらの手順を中止します。
OfflineAudioContext の [[rendering started]] スロットを true に設定します。
promise を新しい Promise とします。
contextOptions パラメーターでこのインスタンスのコンストラクタに渡された numberOfChannels、length、および sampleRate の値にそれぞれ等しいチャンネル数、長さ、およびサンプルレートを持つ、新しい AudioBuffer を作成します。このバッファを OfflineAudioContext の内部スロット [[rendered buffer]] に割り当てます。
前項の AudioBuffer コンストラクタ呼び出し中に例外が発生した場合、この例外を持って promise をリジェクトします。
そうでなく、バッファが正常に作成された場合は、オフラインレンダリングを開始します。
promise を [[pending promises]] に追加します。
promise を返します。

オフラインレンダリングを開始するには、その際に作成されたレンダリングスレッドで次の手順が実行されなくてはなりません ( MUST )。

現在の接続と変化のスケジュールが与えられたら、length 長のオーディオのサンプルフレームを [[rendered buffer]] にレンダリングし始めます。
レンダリング量子ごとにチェックを行い、必要ならば サスペンド します。
もしサスペンドされていたコンテキストが再開された場合、バッファへのレンダリングを継続します。
レンダリングが完了したら、制御スレッドのイベントループで次の手順を実行するタスクをキューに入れます:
1. startRendering() によって作成された promise を [[rendered buffer]] をもってリゾルブします。
2. OfflineAudioCompletionEvent のインスタンスの renderedBuffer プロパティに [[rendered buffer]] を設定し、complete という名前のイベントを発行するタスクをキューに入れます。

パラメーターなし

戻り値: Promise<AudioBuffer>

resume()

OfflineAudioContext がサスペンドされていた場合、その currentTime の進行を再開します。

resumte が呼び出された場合これらのステップを実行します。

promise を新しい Promise とします。
次の条件が真となった場合、これらのステップを中止し promise を InvalidStateError でリジェクトします :
- OfflineAudioContext の制御スレッドの状態 closed になった。
- OfflineAudioContext の [[rendering started]] スロットが false になった。
OfflineAudioContext の制御スレッドの状態フラグを running に設定します。
OfflineAudioContext を再開させるための制御メッセージをキューに入れます。
promise を返します。

OfflineAudioContext を再開する制御メッセージを実行するとは、これらのステップをレンダリングスレッドで実行する事を意味します :

OfflineAudioContext の制御スレッドの状態を running に設定します。
オーディオグラフのレンダリングを開始します。
失敗した場合は制御スレッドで promise をリジェクトする制御メッセージをキューに入れ、これらのステップを中止します :
制御スレッドのイベントループで、これらのステップを実行するタスクをキューに入れます :
1. promise をリゾルブします。
2. もし OfflineAudioContext の state 属性が既に "running" でない場合 :
  1. OfflineAudioContext の state 属性を "running" に設定します。
  2. OfflineAudioContext 上で statechange という名前のシンプルイベントを発行するためのタスクをキューに入れます。

パラメーターなし

戻り値: Promise<void>

suspend(suspendTime)

指定された時刻にオーディオコンテキストの時間進行の停止をスケジュールし、promise を返します。これは一般的に、OfflineAudioContext でオーディオグラフを同期して操作する場合に有用です。

サスペンドの最大の精度はレンダリング量子のサイズであり、指定されたサスペンドの時刻は最も近いレンダリング量子の境界に丸められることに注意してください。このため、同じ量子化されたフレーム内で複数のサスペンドをスケジュールすることはできません。また精度の高いサスペンドを確実に行うには、コンテキストが動作中でない間にスケジューリングを行う必要があります。

OfflineAudioContext.suspend() メソッドの引数。
パラメーター	型	Null可	省略可	説明
`suspendTime`	double	✘	✘	指定された時刻にレンダリングのサスペンドをスケジューリングします。時刻はレンダリング量子のサイズで量子化されて丸められます。量子化されたフレーム番号が負の値、または現在の時刻より小さいか同じ、またはレンダリング全体の長さより大きいか同じ、または同じ時刻に別のサスペンドがスケジュールされているの場合、promise は `InvalidStateError` でリジェクトされます。

戻り値: Promise<void>

1.3.4. `OfflineAudioContextOptions`

これは OfflineAudioContext の作成の際に使用するオプションを指定します。

dictionary OfflineAudioContextOptions {
   unsigned long numberOfChannels = 1;
   required unsigned long length;
   required float sampleRate;
 };

1.3.4.1. ディクショナリー `OfflineAudioContextOptions` メンバー

length, unsigned long 型: サンプルフレーム数で表したレンダリングされる AudioBuffer の長さ。
numberOfChannels, unsigned long 型, デフォルトは 1: この OfflineAudioContext のチャンネル数。
sampleRate, float 型: この OfflineAudioContext のサンプルレート。

1.3.5. `OfflineAudioCompletionEvent` インターフェース

これは、歴史的な理由から OfflineAudioContext に発行される Event オブジェクトです。

[Exposed=Window]
 interface OfflineAudioCompletionEvent : Event {
   constructor (DOMString type, OfflineAudioCompletionEventInit eventInitDict);
   readonly attribute AudioBuffer renderedBuffer;
 };

1.3.5.1. 属性

renderedBuffer, AudioBuffer 型, readonly: レンダリングしたオーディオデータを保持する AudioBuffer です。

1.3.5.2. `OfflineAudioCompletionEventInit`

dictionary OfflineAudioCompletionEventInit : EventInit {
   required AudioBuffer renderedBuffer;
 };

1.3.5.2.1. ディクショナリー `OfflineAudioCompletionEventInit` メンバー

renderedBuffer, AudioBuffer 型: イベントの renderedBuffer 属性に割り当てる値。

1.4. `AudioBuffer` インターフェース

このインターフェースは、メモリー上にあるオーディオデータを表します。そのフォーマットはノンインタリーブな 32 ビットの浮動小数点のリニア PCM で、通常は \([-1, 1]\) の範囲になりますが、値はこの範囲に限定はされません。これは 1 つまたは複数のチャンネルを持つことができます。通常、PCM データの長さはかなり短く ( 通常は 1 分未満 ) と想定されています。音楽サウンドトラックなどのより長いサウンドの場合、audio 要素と MediaElementAudioSourceNode によるストリーミングを使うべきです。

AudioBuffer は、1 つ以上の AudioContext によって使用され、OfflineAudioContext と AudioContext の間で共有する事もできます。

AudioBuffer には 4 つの内部スロットがあります：

[[number of channels]]: この AudioBuffer のオーディオチャンネルの数、符号なし long 型です。
[[length]]: この AudioBuffer の各チャンネルの長さ、符号なし long 型です。
[[sample rate]]: Hz で表した AudioBuffer のサンプルレート、float 型です。
[[internal data]]: オーディオのサンプルデータを保持するデータブロックです。

[Exposed=Window]
 interface AudioBuffer {
   constructor (AudioBufferOptions options);
   readonly attribute float sampleRate;
   readonly attribute unsigned long length;
   readonly attribute double duration;
   readonly attribute unsigned long numberOfChannels;
   Float32Array getChannelData (unsigned long channel);
   void copyFromChannel (Float32Array destination,
                         unsigned long channelNumber,
                         optional unsigned long bufferOffset = 0);
   void copyToChannel (Float32Array source,
                       unsigned long channelNumber,
                       optional unsigned long bufferOffset = 0);
 };

1.4.1. コンストラクター

AudioBuffer(options)

options の値のいずれかが公称範囲外にある場合は、NotSupportedError 例外を発生し、以下の手順を中止します。
b を新しい AudioBuffer オブジェクトとします。
コンストラクタで渡された AudioBufferOptions の属性 numberOfChannels、length、sampleRate の値をそれぞれ内部スロット [[number of channels]]、[[length]]、[[sample rate]] に割り当てます。
この AudioBuffer の内部スロット [[internal data]] を CreateByteDataBlock([[length]] * [[number of channels]]) を呼び出した結果に設定します。

注 : これは、下層にある記憶域をゼロに初期化します。
b を返します。

AudioBuffer.constructor(options) メソッドの引数。
パラメーター	型	Null可	省略可	説明
`options`	AudioBufferOptions	✘	✘	`AudioBufferOptions` はこの `AudioBuffer` のプロパティを決定します。

1.4.2. 属性

duration, double 型, readonly

PCM オーディオデータの長さで、単位は秒です。

これは [[sample rate]] と AudioBuffer の [[length]] から計算され、[[length]] を [[sample rate]] で割る事で求められます。

length, unsigned long 型, readonly

サンプルフレーム数で表した PCM オーディオデータの長さです。これは [[length]] の値を返さなければなりません ( MUST )。

numberOfChannels, unsigned long 型, readonly

個別のオーディオチャンネルの数です。これは [[number of channels]] の値を返さなければなりません ( MUST )。

sampleRate, float 型, readonly

サンプル / 秒で表した PCM オーディオデータのサンプルレートです。これは、[[sample rate]] の値を返さなければなりません ( MUST )。

1.4.3. メソッド

copyFromChannel(destination, channelNumber, bufferOffset)

copyFromChannel() メソッドは、AudioBuffer の指定されたチャンネルからサンプルを destination の配列にコピーします。

buffer を \(N_b\) フレームの AudioBuffer とし、\(N_f\) を destination 配列の要素数とし、\(k\) を bufferOffset の値とします。このとき、 buffer から destination にコピーされるフレームの数は \(\max(0, \min(N_b - k, N_f))\) となります。もしこれが \(N_f\) より小さい場合、destination の残りの要素は変更されません。

AudioBuffer.copyFromChannel() メソッドの引数。
パラメーター	型	Null可	省略可	説明
`destination`	Float32Array	✘	✘	チャンネルデータがコピーされる配列です。
`channelNumber`	unsigned long	✘	✘	データをコピーするチャンネルのインデックスです。`channelNumber` が `AudioBuffer` のチャンネル数と同じか大きい場合、`IndexSizeError` 例外を発生します ( MUST )。
`bufferOffset`	unsigned long	✘	✔	オプションのオフセットで、デフォルトは 0 です。`AudioBuffer` のこのオフセットから始まるデータが `destination` にコピーされます。

戻り値: void

copyToChannel(source, channelNumber, bufferOffset)

copyToChannel() メソッドは、source 配列から AudioBuffer の指定されたチャンネルにサンプルをコピーします。

もし、source がバッファにコピーできない場合は UnknownError を発生する事があります。

buffer を \(N_b\) フレームの AudioBuffer とし \(N_f\) を source 配列の要素数とし、\(k\) を bufferOffset の値とします。このとき、source から buffer にコピーされるフレームの数は \(\max(0, \min(N_b - k, N_f))\) となります。これが \(N_f\) より小さい場合、buffer の残りの要素は変更されません。

AudioBuffer.copyToChannel() メソッドの引数。
パラメーター	型	Null可	省略可	説明
`source`	Float32Array	✘	✘	チャンネルデータがコピーされる元の配列です。
`channelNumber`	unsigned long	✘	✘	データをコピーする先のチャンネルのインデックスです。もし `channelNumber` が `AudioBuffer` のチャンネル数より大きいか同じ場合、`IndexSizeError` を発生します ( MUST )。
`bufferOffset`	unsigned long	✘	✔	データをコピーする先を示すオプションのオフセットで、デフォルトは 0 です。`source` からのデータが `AudioBuffer` のこのオフセットから始まる場所にコピーされます。

戻り値: void

getChannelData(channel)

コンテンツの取得で説明されているルールに従って、新しい Float32Array の [[internal data]] に格納されているバイトの参照を取得またはバイトのコピーを取得します。

もし、[[internal data]] (訳注: の読み出し) または新しい Float32Array の作成ができなかった場合は、UnknownError を発生する事があります。

AudioBuffer.getChannelData() メソッドの引数。
パラメーター	型	Null可	省略可	説明
`channel`	unsigned long	✘	✘	このパラメーターは、データを取得する特定のチャンネルを表すインデックスです。インデックス値 0 は最初のチャンネルを表します。このインデックス値は `[[number of channels]]` より小さくなくてはならず ( MUST )、そうでない場合は `IndexSizeError` 例外を発生します ( MUST )。

戻り値: Float32Array

注 : copyToChannel() と copyFromChannel() メソッドはより大きな配列のビューである Float32Array を渡す事で配列の一部だけを埋めるのに使用できます。 AudioBuffer のチャンネルからデータを読み取ってまとめて処理する場合、不要なメモリの割り当てとコピーを回避するため、getChannelData() を呼び出して結果の配列にアクセスするよりも、copyFromChannel()をお勧めします。

APIの実装が AudioBuffer の内容が必要になったとき、AudioBuffer の内容の取得という内部処理が起動されます。この処理は呼び出し元に変更不能なチャンネルデータを返します。

AudioBuffer の内容の取得処理が発生した場合は次の手順で実行されます:

AudioBuffer の ArrayBuffer の一部でも IsDetachedBuffer 処理に対して true を返した場合、これらの手順を中止し、呼び出し元に長さ 0 のチャンネルデータバッファを返します。
この AudioBuffer の getChannelData() によってこれまでに返された配列のすべての ArrayBuffer をデタッチします。

注 : AudioBuffer は createBuffer() または AudioBuffer コンストラクターを介してのみ作成できるため、これは例外を起こしません。
これらの ArrayBuffer の下層にある [[internal data]] を保持したまま、それらへの参照を呼び出し側に返します。
AudioBuffer のデータのコピーを保持する ArrayBuffer をアタッチして次回の getChannelData() の呼び出しで返せるようにします。

AudioBuffer の内容の取得処理は、次の場合に呼び出されます:

AudioBufferSourceNode.start が呼び出されると、ノードの buffer の内容の取得を行います。この処理が失敗した場合は何も再生されません。
AudioBufferSourceNode.start があらかじめ呼び出されている状態で、AudioBufferSourceNode の buffer が設定されたとき、その設定処理が AudioBuffer の内容の取得を行います。この処理が失敗した場合、何も再生されません。
ConvolverNode の buffer がある AudioBuffer に設定されたとき AudioBuffer の内容の取得が行われます。
AudioProcessingEvent のディスパッチが完了すると、その outputBuffer の内容の取得が行われます。

注 :これは copyToChannel() は現在 AudioNode が AudioBuffer の内容を取得して使用中の AudioBuffer の内容を変更するためには使えない事を意味します。AudioNode は以前に取得したデータを使い続けます。

1.4.4. `AudioBufferOptions`

これは AudioBuffer の作成に使用するオプションを指定します。 length と sampleRate メンバーは必須です。

dictionary AudioBufferOptions {
   unsigned long numberOfChannels = 1;
   required unsigned long length;
   required float sampleRate;
 };

1.4.4.1. ディクショナリー `AudioBufferOptions` メンバー

このディクショナリのメンバーが取れる値には制約があります。createBuffer() を参照してください。

length, unsigned long 型: サンプルフレーム数で表されるバッファの長さです。制約については length を参照してください。
numberOfChannels, unsigned long 型, デフォルトは 1: バッファのチャンネル数です。制約については numberOfChannels を参照してください。
sampleRate, float 型: Hz で表されるバッファのサンプルレートです。制約については sampleRate を参照してください。

1.5. `AudioNode` インターフェース

AudioNode は AudioContext を構成するブロックです。このインターフェースは、音源、音の出力先、および中間の処理モジュールを表しています。これらのモジュールは互いに接続されて、音をオーディオハードウェアに出力するための処理グラフを形成します。それぞれのノードは入力や出力を持つ事ができます。ソースノードは入力を持たず、単一の出力を持ちます。フィルターのようなほとんどの処理ノードは、1 つの入力と 1 つの出力を持ちます。それぞれのタイプの AudioNode はどのようにオーディオを処理したり合成するのかの詳細が異なっています。しかし一般的に AudioNode は ( 持っていれば ) 入力を処理し、( 持っていれば ) その出力にオーディオ信号を送り出します。

それぞれの出力は 1 つ以上のチャンネルを持っています。正確なチャンネル数はそれぞれの AudioNode の詳細に依存します。

出力は 1 つ以上の AudioNode の入力に接続でき、つまり ファンアウト がサポートされています。入力は初期状態では接続されていません。しかし、1 つ以上の AudioNode の出力から接続する事ができ、即ち、ファンインがサポートされています。AudioNode の出力を AudioNode の入力に接続するため connect() メソッドが呼ばれたとき、それをその入力への接続と呼びます。

各 AudioNode の入力はその時々で特定のチャンネル数を持ちます。この数はその入力への接続によって変化します。もし入力が接続を持っていない場合、チャンネル数は 1 で無音となります。

AudioNode は各々の入力について、その入力へのすべての接続のミキシングを行います。この詳細な基準となる要件については § 4 チャンネルのアップミックスとダウンミックスセクションを参照してください。

AudioNode の入力および内部の処理は、そのノードが出力を接続されているか、またそれらの出力が AudioContext の AudioDestinationNode に最終的に到達しているかどうかに関わらず、AudioContext の時刻を踏まえて継続的に行われます。

[Exposed=Window] interface AudioNode : EventTarget {
   AudioNode connect (AudioNode destinationNode,
                      optional unsigned long output = 0,
                      optional unsigned long input = 0);
   void connect (AudioParam destinationParam, optional unsigned long output = 0);
   void disconnect ();
   void disconnect (unsigned long output);
   void disconnect (AudioNode destinationNode);
   void disconnect (AudioNode destinationNode, unsigned long output);
   void disconnect (AudioNode destinationNode,
                    unsigned long output,
                    unsigned long input);
   void disconnect (AudioParam destinationParam);
   void disconnect (AudioParam destinationParam, unsigned long output);
   readonly attribute BaseAudioContext context;
   readonly attribute unsigned long numberOfInputs;
   readonly attribute unsigned long numberOfOutputs;
   attribute unsigned long channelCount;
   attribute ChannelCountMode channelCountMode;
   attribute ChannelInterpretation channelInterpretation;
 };

1.5.1. AudioNode の作成

AudioNode の作成には 2 つの方法があります: 特定のインターフェースのコンストラクタを使用する方法、と BaseAudioContext または AudioContext のファクトリーメソッドを使用する方法です。

AudioNode のコンストラクタの最初の引数として渡される BaseAudioContext は、作成される AudioNode が関連する BaseAudioContext と呼ばれます。同様に、ファクトリーメソッドを使用する場合、AudioNode が関連する BaseAudioContext はこのファクトリーメソッドが呼び出される BaseAudioContext です。

BaseAudioContext c 上のファクトリーメソッドの呼び出しにより、特定のタイプ n の新しい AudioNode を作成するには、次の手順を実行します:

node を型 n の新しいオブジェクトとします。
option を、このファクトリーメソッドに関連付けられたインターフェースに関連付けられた型のディクショナリーとします。
ファクトリーメソッドに渡される各パラメーターについて、option 内の名前が一致するディクショナリメンバーをこのパラメーターの値に設定します。
node の作成のために c と option を引数として n のコンストラクターを呼び出します。
node を返します。

AudioNode から継承したオブジェクト o を初期化する事は、このインターフェースのコンストラクタに引数 context と dict を渡して、次のステップを実行することを意味します。

context を o が関連付けられた BaseAudioContext とします。
numberOfInputs、numberOfOutputs、channelCount、channelCountMode、channelInterpretation の値を、各 AudioNode のセクションで説明するそれぞれのインターフェースのデフォルト値に設定します。
渡されたdictのそれぞれのメンバーについて、k をメンバーのキー、v をその値として以下の手順を実行します。手順の実行の際に何らかの例外が発生した場合は反復処理を中止し、例外をアルゴリズムの呼び出し元 ( コンストラクターまたはファクトリーメソッド ) に伝えます。
1. k がこのインターフェースの AudioParam の名前である場合、この AudioParam の value 属性を v に設定します。
2. そうでなく、k がこのインターフェースの属性の名前である場合、この属性に関連付けられたオブジェクトを v に設定します。

ファクトリーメソッドに関連するインターフェースは、このメソッドから返されるオブジェクトのインターフェースです。インターフェースに関連するオプションオブジェクトは、このインターフェースのコンストラクタに渡すことができるオプションオブジェクトです。

AudioNode は [DOM] で説明されているように EventTarget です。つまり、他の EventTarget がイベントを受け入れるのと同じ方法で、イベントを AudioNode にディスパッチすることができます。

enum ChannelCountMode {
   "max",
   "clamped-max",
   "explicit"
 };

ChannelCountMode は、ノードの channelCount および channelInterpretation の値と組み合わせて、ノードへの入力をどのようにミックスするかを制御する computedNumberOfChannels を決定するために使用されます。computedNumberOfChannels は次のように決定されます。ミックスがどのように行われるかの詳細については、§ 4 チャンネルのアップミックスとダウンミックスを参照してください。

列挙値の説明
"`max`"	computedNumberOfChannels は入力となっている全接続のチャンネル数の最大値になります。このモードでは `channelCount` は無視されます。
"`clamped-max`"	computedNumberOfChannels は "`max`" のときと同じように計算されますが、指定された `channelCount` を上限に制限されます。
"`explicit`"	computedNumberOfChannels の値は `channelCount` によって指定された値そのものになります。

enum ChannelInterpretation {
   "speakers",
   "discrete"
 };

列挙値の説明
"`speakers`"	アップミックス式またはダウンミックス式を使用します。チャンネル数がスピーカーの基本レイアウトに合致しない場合は、"`discrete`" に戻します。
"`discrete`"	アップミックスの場合は、チャンネルを使い切るまで順に埋めて行き、余っているチャンネルには 0 を出力します。ダウンミックスでは、可能な限りチャンネルを順に埋め、余ったチャンネルは捨てられます。

1.5.2. AudioNode Tail-Time

AudioNode はテールタイムを持つことができます。これは AudioNode に無音が供給されている場合でも、出力が無音では無い可能性があることを意味します。

AudioNode は過去の入力が将来の出力に影響するような内部処理状態を持っている場合、非ゼロのテールタイムを持っています。 AudioNode は、入力が音のある状態から無音に移行した後でも、計算されたテールタイムの間、音を出力し続ける場合があります。

1.5.3. AudioNode のライフタイム

AudioNode は次のいずれかの条件が満たされている場合、レンダリング量子の間アクティブに処理を続けます。

AudioScheduledSourceNode は現在のレンダリング量子の少なくとも一部で再生されている場合にのみアクティブに処理されます。
MediaElementAudioSourceNode はその メディア要素 が現在のレンダリング量子の少なくとも一部で再生されている場合にのみアクティブに処理されます。
MediaStreamAudioSourceNode または MediaStreamTrackAudioSourceNode は関連付けられている MediaStreamTrack オブジェクトの readyState 属性が "live" で、muted 属性が false で、enabled 属性が true である場合にアクティブに処理されます。
循環の中に入っている DelayNode は現在のレンダリング量子の出力サンプルの絶対値が \( 2^{-126} \) 以上の場合にのみアクティブに処理されます。
ScriptProcessorNode は、その入力または出力が接続されている場合にアクティブに処理されます。
AudioWorkletNode は AudioWorkletProcessor の [[callable process]] が true を返して、active source フラグが true であるか、入力のどれかに接続されている AudioNode がアクティブに処理している場合にアクティブに処理されます。
他のすべての AudioNode は、その入力のどれかに接続された AudioNode がアクティブに処理を行っているのであればアクティブな処理を開始し、他のアクティブに処理を行っている AudioNode から受け取った入力が出力に影響を与えなくなったときにアクティブな処理を停止します。

注 : これは AudioNode がテールタイムを持つ事を考慮に入れます。

アクティブに処理を行っていない AudioNode は 1 チャンネルの無音を出力します。

1.5.4. 属性

channelCount, unsigned long 型

channelCount はノードへの入力の接続におけるアップミックスおよびダウンミックスの際に使用されるチャンネル数です。値が別途定められている特定のノードを除いて、デフォルトは 2 です。この属性は入力を持たないノードでは意味を持ちません。もしこの値が 0、あるいは実装のチャンネル数の最大値より大きい値にセットされた場合、NotSupportedError 例外を発生します ( MUST )。

さらに、一部のノードではこれに加えてチャンネル数の制約があります:

AudioDestinationNode

この動作は、接続先のデスティネーションノードが AudioContext か OfflineAudioContext かによって異なります:

AudioContext: チャンネル数は 1 から maxChannelCount の間でなければなりません ( MUST )。この範囲外の値を設定しようとすると、IndexSizeError 例外を発生します ( MUST )。
OfflineAudioContext: チャンネル数を変更することはできません。値を変更しようとすると InvalidStateError 例外を発生します ( MUST )。

AudioWorkletNode

「§ 1.32.3.3.2 AudioWorkletNodeOptions によるチャンネルの設定」でのチャンネル設定を参照してください。

ChannelMergerNode

チャンネル数を変更することはできません。値を変更しようとすると InvalidStateError 例外を発生します ( MUST )。

ChannelSplitterNode

チャンネル数を変更することはできません。値を変更しようとすると InvalidStateError 例外を発生します ( MUST )。

ConvolverNode

チャンネル数は 2 より大きくできません。2 より大きい値を設定しようとすると NotSupportedError 例外を発生します ( MUST )。

DynamicsCompressorNode

チャンネル数は 2 より大きい値にはできません。2 より大きい値に変更しようとすると NotSupportedError 例外を発生します ( MUST )。

PannerNode

チャンネル数は 2 より大きくすることはできません。2 より大きな値に変更しようとすると NotSupportedError 例外を発生します ( MUST )。

ScriptProcessorNode

チャンネル数は変更することができません。変更しようとすると NotSupportedError 例外を発生します ( MUST )。

StereoPannerNode

チャンネル数は 2 より大きくすることはできません。2 より大きな値に変更しようとすると NotSupportedError 例外を発生します ( MUST )。

この属性の詳細については、§ 4 チャンネルのアップミックスとダウンミックスを参照してください。

channelCountMode, ChannelCountMode 型

channelCountMode は、ノードの入力への接続をアップミックスおよびダウンミックスするときに、チャンネルがどのようにカウントされるかを決定します。デフォルト値は "max" です。この属性は、入力のないノードには影響しません。

さらに、一部のノードでは、チャンネル数モードが取れる値について channelCountMode の制約があります。

AudioDestinationNode: AudioDestinationNode が OfflineAudioContext の destination ノードである場合、チャンネル数モードは変更できません。値を変更しようとすると InvalidStateError 例外を発生します ( MUST )。
ChannelMergerNode: チャンネル数モードは "explicit" から変更できません。値を変更しようとすると InvalidStateError 例外を発生します ( MUST )。
ChannelSplitterNode: チャンネル数モードは "explicit" から変更できません。値を変更しようとすると InvalidStateError 例外を発生します ( MUST )。
ConvolverNode: チャンネル数モードは "max" に設定する事はできません。値を "max" に設定しようとすると NotSupportedError 例外を発生します ( MUST )。
DynamicsCompressorNode: チャンネル数モードは "max" に設定する事はできません。値を "max" に設定しようとすると NotSupportedError 例外を発生します ( MUST )。
PannerNode: チャンネル数モードは "max" に設定する事はできません。値を "max" に設定しようとすると NotSupportedError 例外を発生します ( MUST )。
ScriptProcessorNode: チャンネル数モードは "explicit" から変更できません。値を変更しようとすると NotSupportedError 例外を発生します ( MUST )。
StereoPannerNode: チャンネル数モードは "max" に設定する事はできません。値を "max" に設定しようとすると NotSupportedError 例外を発生します ( MUST )。

この属性の詳細については、§ 4 チャンネルのアップミックスとダウンミックスを参照してください。

channelInterpretation, ChannelInterpretation 型

channelInterpretation は、ノードの入力への接続をアップミックスまたはダウンミックスするときに、個々のチャンネルをどのように扱うかを決定します。デフォルト値は "speakers" です。この属性は、入力のないノードには影響しません。

さらに、一部のノードでは、チャンネルの解釈として取れる値に追加の channelInterpretation の制約があります。

ChannelSplitterNode: チャンネルの解釈は "discrete" から変更することはできません。値を変更しようとすると InvalidStateError 例外を発生します ( MUST )。

この属性の詳細については、§ 4 チャンネルのアップミックスとダウンミックスを参照してください。

context, BaseAudioContext 型, readonly

この AudioNode. を所有する BaseAudioContext です。

numberOfInputs, unsigned long 型, readonly

この AudioNode の入力の数です。ソースノードではこれは 0 になります。この属性は多くの AudioNode のタイプであらかじめ決められていますが、ChannelMergerNode や AudioWorkletNode のようないくつかの AudioNode では入力の数は可変です。

numberOfOutputs, unsigned long 型, readonly

この AudioNode から出る出力の数です。この属性はいくつかの AudioNode ではあらかじめ決められた値ですが、ChannelSplitterNode や AudioWorkletNode などでは可変になります。

1.5.5. メソッド

connect(destinationNode, output, input)

あるノードの特定の出力から別のノードの特定の入力への接続は 1 つだけ存在できます。同じ端子間の複数回の接続は無視されます。

例えば:

nodeA.connect(nodeB);
nodeA.connect(nodeB);

は次のものと同じ効果になります。

nodeA.connect(nodeB);

このメソッドは、destination の AudioNode オブジェクトを返します。

AudioNode.connect(destinationNode, output, input) メソッドの引数。
パラメーター	型	Null可	省略可	説明
`destinationNode`				`destination` パラメーターは接続先の `AudioNode` です。もし `destination` が他の `AudioContext` によって作成された `AudioNode` の場合、`InvalidAccessError` 例外を発生します ( MUST )。つまり `AudioNode` は複数の `AudioContext` 間で共有する事はできません。「チャンネルのアップミックスとダウンミックス」で説明されているように複数の `AudioNode` が同じ `AudioNode` に接続する事はできます。
`output`	unsigned long	✘	✔	`output` パラメーターは `AudioNode` のどの出力から接続するかを指定するインデックスです。もしこのパラメーターが範囲外の場合、`IndexSizeError` 例外を発生します ( MUST )。 connect() を複数回呼び出して `AudioNode` の出力から複数の入力に接続する事は可能です。つまり、"ファンアウト"がサポートされています。
`input`				`input` パラメーターは接続先の `AudioNode` のどの入力に接続するかを指定するインデックスです。もしこのパラメーターが範囲外の場合、`IndexSizeError` 例外を発生します ( MUST )。ある `AudioNode` から他の `AudioNode` に循環を作るような接続を行う事も可能です: つまりある `AudioNode` から、最初の `AudioNode` の入力か `AudioParam` に接続を行っている別の `AudioNode` に対して接続を行う事ができます。

戻り値: AudioNode

connect(destinationParam, output)

AudioNode を AudioParam に接続し、パラメーターの値を a-rate の信号で制御します。

connect() を複数回呼び出す事で、1 つの AudioNode の出力を複数の AudioParam に接続する事が可能です。即ち "ファンアウト"がサポートされています。

connect() を複数回呼び出す事で、複数の AudioNode を 1 つの AudioParam に接続する事が可能です。即ち"ファンイン"がサポートされています。

AudioParam はそれに接続されているすべての AudioNode の出力からレンダリングされたオーディオデータを取り出し、それがモノラルでなければ、ダウンミックスによってモノラルに変換します。そして接続されている各出力をミックスし、さらに最終的にパラメーターが持っているタイムラインの変化スケジュールを含む固有値 ( AudioParam に何も接続されていない状態での value ) とミックスします。

モノラルへのダウンミックスは、channelCount = 1、channelCountMode = "explicit"、および channelInterpretation = "speakers" の AudioNode のダウンミックスに相当します。

特定のノードの出力と特定の AudioParam の間の接続は 1 つのみ存在できます。同じ終端点を持つ複数の接続は無視されます。

例えば:

nodeA.connect(param);
nodeA.connect(param);

は次のものと同じ効果になります。

nodeA.connect(param);

AudioNode.connect(destinationParam, output) メソッドの引数。
パラメーター	型	Null可	省略可	説明
`destinationParam`	AudioParam	✘	✘	`destination` パラメーターは接続先の `AudioParam` です。このメソッドは `destination` の `AudioParam` オブジェクトを返しません。 `destinationParam` が属する `AudioNode` を作成した `BaseAudioContext` と、このメソッドが呼び出された `AudioNode` を作成した `BaseAudioContext` が異なる場合、`InvalidAccessError` 例外を発生します ( MUST )。
`output`	unsigned long	✘	✔	`output` パラメーターは `AudioNode` のどの出力から接続するかを指定するインデックスです。もし `parameter` が範囲外の場合、`IndexSizeError` 例外を発生します ( MUST )。

戻り値: void

disconnect()

AudioNode から出るすべての接続を切断します。

パラメーターなし

戻り値: void

disconnect(output)

AudioNode の 1 つの出力から他の AudioNode または AudioParam オブジェクトへの接続をすべて切断します。

AudioNode.disconnect(output) メソッドの引数。
パラメーター	型	Null可	省略可	説明
`output`	unsigned long	✘	✘	このパラメーターは接続を切る `AudioNode` の出力のインデックスです。これは与えられた出力から出るすべての接続を切断します。もしこのパラメーターが範囲外の場合、`IndexSizeError` 例外を発生します ( MUST )。

戻り値: void

disconnect(destinationNode)

AudioNode のすべての出力から特定の接続先となる AudioNode に繋がる接続を切断します。

AudioNode.disconnect(destinationNode) メソッドの引数。
パラメーター	型	Null可	省略可	説明
`destinationNode`				`destinationNode` パラメーターは切断する `AudioNode` です。これは与えられた `destinationNode` に対するすべての接続を切断します。もし `destinationNode` に対する接続がない場合、`InvalidAccessError` 例外を発生します ( MUST )。

戻り値: void

disconnect(destinationNode, output)

AudioNode の特定の出力から特定の接続先 AudioNode 入力への接続を切断します。

AudioNode.disconnect(destinationNode, output) メソッドの引数。
パラメーター	型	Null可	省略可	説明
`destinationNode`				`destinationNode` パラメーターは切断する `AudioNode` です。もし与えられた出力から `destinationNode` に対する接続がない場合、`InvalidAccessError` 例外を発生します ( MUST )。
`output`	unsigned long	✘	✘	`output` パラメーターは接続を切る `AudioNode` の出力を表すインデックスです。もしこのパラメーターが範囲外の場合は `IndexSizeError` 例外を発生します ( MUST )。

戻り値: void

disconnect(destinationNode, output, input)

AudioNode の特定の出力から接続先 AudioNode の特定の入力への接続を切断します。

AudioNode.disconnect(destinationNode, output, input) メソッドの引数。
パラメーター	型	Null可	省略可	説明
`destinationNode`				`destinationNode` パラメーターは切断する `AudioNode` です。もし与えられた出力から `destinationNode` への接続が存在しない場合、`InvalidAccessError` 例外を発生します ( MUST )。
`output`	unsigned long	✘	✘	`output` パラメーターは切断する `AudioNode` の出力のインデックスです。もしこのパラメーターが範囲外の場合、`IndexSizeError` 例外を発生します ( MUST )。
`input`				`input` パラメーターは切断する接続先 `AudioNode` の入力のインデックスです。もしこのパラメーターが範囲外の場合、`IndexSizeError` 例外を発生します ( MUST )。

戻り値: void

disconnect(destinationParam)

特定の接続先 AudioParam に繋がる AudioNode のすべての出力を切断します。この操作によって、この AudioNode からパラメーター値の計算への寄与は 0 となります。パラメーターの固有値はこの操作に影響されません。

AudioNode.disconnect(destinationParam) メソッドの引数。
パラメーター	型	Null可	省略可	説明
`destinationParam`	AudioParam	✘	✘	`destinationParam` パラメーターは切断する `AudioParam` です。もし `destinationParam` に対する接続がない場合は `InvalidAccessError` 例外を発生します ( MUST )。

戻り値: void

disconnect(destinationParam, output)

AudioNode の特定の出力から特定の AudioParam への接続を切断します。この操作によって、この AudioNode からパラメーター値の計算への寄与は 0 となります。パラメーターの固有値はこの操作に影響されません。

AudioNode.disconnect(destinationParam, output) メソッドの引数。
パラメーター	型	Null可	省略可	説明
`destinationParam`	AudioParam	✘	✘	`destinationParam` パラメーターは切断される `AudioParam` です。もし `destinationParam` への接続が存在しない場合、`InvalidAccessError` 例外を発生します ( MUST )。
`output`	unsigned long	✘	✘	`output` パラメーターは切断される `AudioNode` の出力のインデックスです。もし `parameter` が範囲外の場合、`IndexSizeError` 例外を発生します ( MUST )。

戻り値: void

1.5.6. `AudioNodeOptions`

これは、すべての AudioNode の生成の際に使用できるオプションを指定します。すべてのメンバーはオプションです。ただし、それぞれのノードで使われる値は、実際のノードに依存します。

dictionary AudioNodeOptions {
   unsigned long channelCount;
   ChannelCountMode channelCountMode;
   ChannelInterpretation channelInterpretation;
 };

1.5.6.1. ディクショナリー `AudioNodeOptions` メンバー

channelCount, unsigned long 型: channelCount 属性に要求するチャンネル数です。
channelCountMode, ChannelCountMode 型: channelCountMode 属性に要求するモードです。
channelInterpretation, ChannelInterpretation 型: channelInterpretation 属性に要求するモードです。

1.6. `AudioParam` インターフェース

AudioParam は AudioNode の例えば音量のような個別の機能をコントロールします。パラメーターは value 属性を使って特定の値に即時にセットする事ができます。あるいは ( AudioContext の currentTime 属性の時間軸で ) 非常に高い時間精度で値の変化のスケジュールを組む事ができ、エンベロープ、音量のフェード、LFO、フィルタースイープ、グレイン窓、などに応用する事ができます。このような方法で任意のタイムラインベースのオートメーション曲線をすべての AudioParam に対して設定する事が可能です。またさらに、AudioNode からの出力の音声信号を AudioParam に接続する事ができ、個別に持っているパラメーターの固有値に加算する事ができます。

いくつかの合成や処理の AudioNode は、オーディオサンプル単位で反映されなくてはならない ( MUST ) AudioParam 型の属性を持っています。その他の AudioParam はサンプル単位の精度は重要ではなく、その値の変化はより粗く取り込まれます。各 AudioParam は a-rate パラメーターつまりサンプル単位で反映される ( MUST )か、それ以外の k-rate パラメーターかが指定されます。

実装はそれぞれの AudioNode について、1 レンダリング量子ごとのブロック単位の処理を行わなくてはなりません ( MUST )。

それぞれのレンダリング量子に対して、k-rate パラメーターは最初のサンプルのタイミングで取り込まれ、その値はブロック全体に対して使用されなくてはなりません ( MUST )。a-rate パラメーターはブロック内のサンプルフレームごとに取り込まれなくてはなりません ( MUST )。 AudioParam によっては、automationRate 属性を "a-rate" または "k-rate" のいずれかに設定することによって、レートを制御できます。詳細については、個々の AudioParam の説明を参照してください。

各 AudioParam は minValue および maxValue 属性を持っており、それがパラメーターの単純な公称範囲となっています。実際のパラメーターの値は \([\mathrm{minValue}, \mathrm{maxValue}]\) の範囲に制限されます。詳細は、「§ 1.6.3 値の計算」を参照してください。

多くの AudioParam では、minValue と maxValue は可能な最大限の範囲に設定されています。この場合、maxValue は、最も正の単精度浮動小数点値 ( 3.4028235e38 ) となります。( ただし、JavaScript では IEEE-754 倍精度浮動小数点値のみをサポートするため、これは 3.4028234663852886e38 と書かなくてはなりません ) 同様に、minValue は最も負の単精度浮動小数点値、つまり最も正の単精度浮動小数点値の符号を負にしたもの: -3.4028235e38 となります。( 同様に、これは JavaScript では -3.4028234663852886e38 として記述する必要があります )。

AudioParam は、0 個以上のオートメーションイベントのリストを保持しています。各オートメーションイベントは、AudioContext の currentTime 属性の時間軸におけるオートメーションイベント時刻に関連して、特定の時間範囲にわたるパラメーター値の変更を指定します。オートメーションイベントのリストは、オートメーションイベント時刻の昇順で管理されます。

オートメーションイベントの振る舞いは、AudioContext の現在の時刻とこのイベントのオートメーションイベント時刻とリスト内に隣接するイベントの関数になります。以下のオートメーションメソッドは、そのメソッドに固有のタイプの新しいイベントをイベントリストに追加し、変更します:

setValueAtTime() - SetValue
linearRampToValueAtTime() - LinearRampToValue
exponentialRampToValueAtTime() - ExponentialRampToValue
setTargetAtTime() - SetTarget
setValueCurveAtTime() - SetValueCurve

これらのメソッドが呼ばれるとき、次の規則が適用されます:

オートメーションイベント時刻は、使われるサンプルレートに対して量子化されません。カーブと傾斜を決定する式では、イベントをスケジューリングするときに与えられた正確な時刻を使用されます。
これらのイベントが、リストの中で既に 1 つまたは複数のイベントが存在する時刻に追加された場合、そのイベントの後で、時刻がより後ろのイベントの前に追加されます。
もし setValueCurveAtTime() が時刻 \(T\) と持続時間 \(D\) を指定して呼ばれたとき、\(T\) より後ろで \(T + D\) より手前に何らかのイベントが既に存在している場合、NotSupportedError 例外を発生します ( MUST )。言い換えれば、他のイベントを含む期間に値のカーブをスケジュールする事はできません。
同様に、時刻 \(T\) と持続時間 \(D\) で示される期間 \([T, T+D)\) に含まれる時刻を指定して何らかのオートメーションメソッドを呼んだ場合、NotSupportedError 例外を発生します ( MUST )。

注 : AudioParam の属性は、value 属性を除いて、読み取り専用です。

AudioParam のオートメーションレートは、automationRate 属性を次のいずれかの値で設定して選択できます。ただし、一部の AudioParam では、オートメーションレートを変更できるかどうかについて制約があります。

enum AutomationRate {
   "a-rate",
   "k-rate"
 };

列挙値の説明
"`a-rate`"	この `AudioParam` は、a-rate での処理に設定されます。
"`k-rate`"	この `AudioParam` は、k-rate での処理に設定されます。

各 AudioParam には内部スロット [[current value]] があり、AudioParam の defaultValue に初期設定されています。

[Exposed=Window]
 interface AudioParam {
   attribute float value;
   attribute AutomationRate automationRate;
   readonly attribute float defaultValue;
   readonly attribute float minValue;
   readonly attribute float maxValue;
   AudioParam setValueAtTime (float value, double startTime);
   AudioParam linearRampToValueAtTime (float value, double endTime);
   AudioParam exponentialRampToValueAtTime (float value, double endTime);
   AudioParam setTargetAtTime (float target, double startTime, float timeConstant);
   AudioParam setValueCurveAtTime (sequence<float> values,
                                   double startTime,
                                   double duration);
   AudioParam cancelScheduledValues (double cancelTime);
   AudioParam cancelAndHoldAtTime (double cancelTime);
 };

1.6.1. 属性

automationRate, AutomationRate 型

AudioParam のオートメーションの速度です。デフォルト値は実際の AudioParam に依存します。デフォルト値についてはそれぞれの AudioParam の説明を参照してください。

いくつかのノードには、次のような追加のオートメーション速度の制約があります:

AudioBufferSourceNode: AudioParam の playbackRate と detune は "k-rate" でなくてはなりません ( MUST )。速度が "a-rate" に変更された場合は、InvalidStateError が発生します。
DynamicsCompressorNode: AudioParam の threshold、knee、ratio、attack、および release は、"k-rate" でなければなりません ( MUST )。速度が "a-rate" に変更された場合、 InvalidStateError が発生します。
PannerNode: panningModel が "HRTF" の場合、PannerNode のすべての AudioParam に対する automationRate の設定は無視されます。同様に、AudioListener のすべての AudioParam の automationRate の設定は無視されます。この場合、AudioParam は、automationRate が "k-rate" に設定されているかのように動作します。

defaultValue, float 型, readonly

value 属性の初期値です。

maxValue, float 型, readonly

パラメーターが取ることができる名目上の最大値です。minValue と組み合わせて、これはこのパラメーターの公称範囲となります。

minValue, float 型, readonly

パラメーターが取ることができる名目上の最小値です。maxValue と組み合わせて、これはこのパラメーターの公称範囲となります。

value, float 型

パラメーターの浮動小数点の値です。この属性の初期値は defaultValue となります。

この属性を読み取ると、[[current value]] スロットの内容が返されます。返される値のアルゴリズムについては「§ 1.6.3 値の計算」を参照してください。

この属性を設定すると、要求された値を [[current value]] スロットに割り当て、現在の AudioContext の currentTime と [[current value]] を使って setValueAtTime() メソッドを呼び出す効果があります。setValueAtTime() で発生する例外がこの属性を設定する事でも発生する事があります。

1.6.2. メソッド

cancelAndHoldAtTime(cancelTime)

これは cancelTime と同じかそれ以降の時刻のスケジュールされたすべてのパラメーターの変化をキャンセルするという点で cancelScheduledValues() と似ていますが、それに加えて cancelTime の時点でのオートメーション値が、他のオートメーションイベントが起こるまで、保持されます。

オートメーションが動作中に cancelAndHoldAtTime()を呼び出してから cancelTime に達するまでの任意の時間の cancelAndHoldAtTime() に対するタイムラインの動作は非常に複雑です。それで cancelAndHoldAtTime() の動作は次のアルゴリズムで定義されます。

\(t_c\) を cancelTime の値とします。そして、

時刻 \(t_1\) におけるイベントを ( 存在すれば ) \(E_1\) とし、\(t_1\) が \(t_1 \le t_c\) を満たす最大の数であるとします。
時間 \(t_2\) におけるイベントを ( 存在すれば ) \(E_2\) とし、\(t_2\) が \(t_c \lt t_2\) を満たす最小の数であるとします。
もし \(E_2\) が存在すれば:
1. もし、\(E_2\) が linear または exponential 型の傾斜の場合、
  1. 実質的に \(E_2\) を書き換えて、時刻 \(t_c\) に終了し、最終値が元の傾斜の \(t_c\) の時点の値である同じ種類の傾斜とします。
  2. ステップ 5. に行きます。
2. そうでなければステップ 4. に行きます。
もし \(E_1\) が存在すれば:
1. もし \(E_1\) が setTarget イベントの場合、
  1. 時刻 \(t_c\) に setValueAtTime イベントを暗黙的に挿入し、setTarget が時刻 \(t_c\) に持つであろう値とします。
  2. ステップ 5. に行きます。
2. もし \(E_1\) が setValueCurve で、開始時刻が \(t_3\) 、持続時間が \(d\) の場合
  1. もし \(t_c \gt t_3 + d\) ならばステップ 5. に行きます。
  2. そうでなければ、
    1. 実質的にこのイベントを、開始時刻が \(t_3\)、新しい持続時間が \(t_c-t_3\) の setValueCurve イベントで置き換えます。しかしながら、これは単なる置き換えではありません。このオートメーションは、オリジナルと同じ出力を生成するために留意しなくてはならず ( MUST )、ただ異なる持続時間を使用して計算された出力ではありません。( これだと、値の曲線を少し違う方法でサンプリングして、異なる結果を生じることになります )。
    2. ステップ 5. に行きます。
時刻 \(t_c\) より後ろのすべてのイベントを削除します。

イベントが追加されない場合は、cancelAndHoldAtTime() の後のオートメーション値は、元のタイムラインが時刻 \(t_c\) に持つ定数値となります。

AudioParam.cancelAndHoldAtTime() メソッドの引数。
パラメーター	型	Null可	省略可	説明
`cancelTime`	double	✘	✘	この時刻以降の以前スケジュールされたパラメーターの変化はキャンセルされます。これは、`AudioContext` の `currentTime` 属性と同じ時間軸の時刻です。もし `cancelTime` が負であるか有限数でない場合、`RangeError` 例外を発生します ( MUST )。 `cancelTime` が `currentTime` より小さい場合は `currentTime` にクランプされます。

戻り値: AudioParam

cancelScheduledValues(cancelTime)

cancelTime と同じか後ろの時刻にスケジュールされたすべてのパラメーター変化を取り消します。スケジュールされたパラメーター変化を取り消すという事は、スケジュールされたイベントをイベントリストから削除することを意味します。オートメーションイベントの時刻が cancelTime 未満の現在動作中のオートメーションも取り消され、( そのオートメーション以前の ) 直前の値が直ちに復元されるため、このような取り消しは不連続を引き起こす可能性があります。cancelAndHoldAtTime() によってスケジュールされたすべてのホールド値で、cancelTime の後ろにホールドの時刻が発生した場合にもまた削除されます。

setValueCurveAtTime() の場合、\(T_0\) と \(T_D\) はそれぞれこのイベントの startTime と duration とします。そして cancelTime が \([T_0, T_0 + T_D]\) の範囲内にあるならば、イベントがタイムラインから削除されます。

AudioParam.cancelScheduledValues() メソッドの引数。
パラメーター	型	Null可	省略可	説明
`cancelTime`	double	✘	✘	この時刻以降で既にスケジュールされているパラメーター変化はキャンセルされます。これは `AudioContext` の `currentTime` 属性と同じ時間軸の時刻です。もし `cancelTime` が負であるか、有限数でない場合 `RangeError` 例外を発生します ( MUST )。 `cancelTime` が `currentTime` より小さい場合は `currentTime` にクランプされます。

戻り値: AudioParam

exponentialRampToValueAtTime(value, endTime)

前にスケジュールされているバラメーター値から指定された値まで、指数的に連続して値を変化させる事をスケジュールします。フィルターの周波数や再生スピードなどのパラメーターは人間の聴覚特性のため、指数的変化が適しています。

時間範囲 \(T_0 \leq t < T_1\) ( ここで \(T_0\) は前のイベントの時刻で \(T_1\) はこのメソッドに渡された endTime パラメーターです ) に対して次のように計算されます:

$$
   v(t) = V_0 \left(\frac{V_1}{V_0}\right)^\frac{t - T_0}{T_1 - T_0}
 $$

ここで \(V_0\) は時刻 \(T_0\) での値、\(V_1\) はこのメソッドに渡された value パラメーターです。もし \(V_0\) と \(V_1\) が、逆の符号を持つか \(V_0\) が 0 ならば、\(T_0 \le t \lt T_1\) に対して \(v(t) = V_0\) となります。

これはまた、0 に向かう指数カーブが不可能である事も示しています。setTargetAtTime() で適当な時間定数を選択する事で良い近似を得る事ができます。

もしこの ExponentialRampToValue イベント以降のイベントがない場合 \(t \geq T_1\), \(v(t) = V_1\) となります

もしこのイベントより前にイベントが存在しない場合、指数カーブは setValueAtTime(value, currentTime) が呼び出されたかのように動作します。ここで value は属性の現在の値で currentTime は exponentialRampToValueAtTime() が呼び出された時刻のコンテキストの currentTime です。

もし、前のイベントが SetTarget イベントの場合、\(T_0\) と \(V_0\) は SetTarget オートメーションの現在の時刻と値から選択されます。SetTarget イベントがまだ開始されていない場合、\(T_0\) はイベントの開始時刻であり、\(V_0\) は SetTarget イベントの開始直前の値です。この場合 ExponentialRampToValue イベントは実質的に SetTarget イベントを置き換えます。もし SetTarget イベントが既に開始されている場合、\(T_0\) は現在のコンテキストの時刻であり、\(V_0\) は時刻 \(T_0\) での現在の SetTarget オートメーションの値です。どちらの場合も、オートメーション曲線は連続しています。

AudioParam.exponentialRampToValueAtTime() メソッドの引数。
パラメーター	型	Null可	省略可	説明
`value`	float	✘	✘	パラメーターが指数変化により指定された時刻に到達する値です。この値が 0 の場合、`RangeError` 例外を発生します ( MUST )。
`endTime`	double	✘	✘	`AudioContext` の `currentTime` 属性と同じ時間軸で、指数変化が終了する時刻です。もし `endTime` が負の値または有限数でない場合 `RangeError` 例外を発生します ( MUST )。もし `endTime` が `currentTime` よりも小さい場合、`currentTime` にクランプされます。

戻り値: AudioParam

linearRampToValueAtTime(value, endTime)

前にスケジュールされているパラメーター値から指定された値まで、直線的に連続して値を変化させる事をスケジュールします。

時間範囲 \(T_0 \leq t < T_1\) ( ここで \(T_0\) は前のイベントの時刻、\(T_1\) はこのメソッドで指定された endTime です ) の間の値は次のように計算されます:

$$
   v(t) = V_0 + (V_1 - V_0) \frac{t - T_0}{T_1 - T_0}
 $$

ここで \(V_0\) は時刻 \(T_0\) での値、\(V_1\) はこのメソッドで指定された value パラメーターです。

もしこの LinearRampToValue イベント以降にイベントがない場合、\(t \geq T_1\), \(v(t) = V_1\)　となります。

もしこのイベントにより前にイベントが存在しない場合、直線変化は setValueAtTime(value, currentTime) が呼び出されたかのように動作します。ここで value は属性の現在の値で currentTime は linearRampToValueAtTime() が呼び出されたときのコンテキストの currentTime です。

もし、前のイベントが SetTarget イベントの場合、\(T_0\) と\(V_0\) は SetTarget オートメーションの現在の時刻と値から選択されます。つまり SetTarget イベントがまだ開始されていない場合、\(T_0\) はイベントの開始時刻であり、\(V_0\) は SetTarget イベントの開始直前の値です。この場合、LinearRampToValue イベントは実質的に SetTarget イベントを置き換えます。SetTarget イベントが既に開始されている場合、\(T_0\) は現在のコンテキストの時刻であり、\(V_0\) は時刻 T0 での現在の SetTarget オートメーションの値です。どちらの場合も、オートメーションの曲線は連続しています。

AudioParam.linearRampToValueAtTime() メソッドの引数。
パラメーター	型	Null可	省略可	説明
`value`	float	✘	✘	与えられた時刻にパラメーターが直線変化で到達する値です。
`endTime`	double	✘	✘	`AudioContext` の `currentTime` 属性と同じ時間軸で、オートメーションが終了する時刻です。もし `endTime` が負の値または有限数でない場合 `RangeError` 例外を発生します ( MUST )。もし `endTime` が `currentTime` よりも小さい場合、`currentTime` にクランプされます。

戻り値: AudioParam

setTargetAtTime(target, startTime, timeConstant)

指定の時刻から、指定の時定数によって指数的に目標の値に漸近を開始します。様々な使い方がありますが、これは ADSR エンベロープの "ディケイ" および "リリース" を実装する際に役立ちます。値は指定の時刻に即、目標値になるのではなく徐々に目標値に向かって変化する事に注意してください。

時間範囲 \(T_0 \leq t\) について、ここで \(T_0\) は startTime パラメーターの時刻として :

$$
   v(t) = V_1 + (V_0 - V_1)\, e^{-\left(\frac{t - T_0}{\tau}\right)}
 $$

ここで \(V_0\) は \(T_0\) ( startTime パラメーター ) での初期値 ( [[current value]] 属性の値 )、\(V_1\) は target パラメーター、そして \(\tau\) は timeConstant パラメーターです。

LinearRampToValue または ExponentialRampToValue イベントがこのイベントの後に続く場合、その動作はそれぞれ linearRampToValueAtTime() または exponentialRampToValueAtTime() で説明しています。他のすべてのイベントの場合は、SetTarget イベントは次のイベントの時点で終了します。

AudioParam.setTargetAtTime() メソッドの引数。
パラメーター	型	Null可	省略可	説明
`target`	float	✘	✘	パラメーターが指定の時刻から変化を開始する際の目標値です。
`startTime`	double	✘	✘	`AudioContext` の `currentTime` 属性と同じ時間軸で指数的漸近を開始する時刻です。もし `start` が負の値または有限数でない場合は `RangeError` 例外を発生します ( MUST )。もし、`startTime` が `currentTime` よりも小さい場合、`currentTime` の値にクランプされます。
`timeConstant`	float	✘	✘	目標値に漸近する一次フィルター ( 指数 ) の時定数です。この値が大きいと変化はゆっくりになります。値は負の値ではならず ( MUST )、そうでない場合 `RangeError` 例外を発生します ( MUST )。もし `timeConstant` がゼロの場合、出力値は直ちに最終値にジャンプします。より正確には、timeConstant は、ステップ入力応答 ( 0 から 1 への遷移 ) が与えられた場合、一次線形連続時間不変システムが値 \(1 - 1/e\) ( 約 63.2％ ) に達する時間です。

戻り値: AudioParam

setValueAtTime(value, startTime)

指定の時刻になるとパラメーター値を変更するようにスケジュールします。

もしこの SetValue イベントの後にもうイベントがない場合、 \(t \geq T_0\) に対して \(v(t) = V\) ここで \(T_0\) は startTime パラメーター、そして \(V\) は value パラメーターの値です。別の言い方をすれば、値は定数のまま保持されます。

もしこの SetValue イベントの次のイベント ( 時刻は \(T_1\) ) が LinearRampToValue または ExponentialRampToValue でない場合、\(T_0 \leq t < T_1\) に対して:

$$
   v(t) = V
 $$

別の言い方をすれば、値に "ステップ" を作ってこの期間、定数のまま保持されます。

この SetValue イベントに続く次のイベントが LinearRampToValue または ExponentialRampToValue の場合、linearRampToValueAtTime() または exponentialRampToValueAtTime() をそれぞれ参照してください。

AudioParam.setValueAtTime() メソッドの引数。
パラメーター	型	Null可	省略可	説明
`value`	float	✘	✘	指定の時刻にパラメーターが変化する値です。
`startTime`	double	✘	✘	`BaseAudioContext` の `currentTime` 属性と同じ時間軸で与えられた値に変化する時刻です。もし `startTime` が負の値または有限数でない場合は `RangeError` 例外を発生します ( MUST )。もし `startTime` が `currentTime` よりも小さい場合、`currentTime` にクランプされます。

戻り値: AudioParam

setValueCurveAtTime(values, startTime, duration)

指定の時刻と期間に対して、任意の値の配列を設定します。値の個数は必要とされる期間に合うようにスケーリングされます。

\(T_0\) を startTime、\(T_D\ を duration、\(V\) を values 配列、\(N\) を values 配列の長さとすると、期間 \(T_0 \le t < T_0 + T_D\) の間、次のようになります:

$$
   \begin{align*} k &= \left\lfloor \frac{N - 1}{T_D}(t-T_0) \right\rfloor \\
   \end{align*}
 $$

そして \(v(t)\) は \(V[k]\) と \(V[k+1]\) の間で直線補間されます。

曲線の期間が終了した後、(\(t \ge T_0 + T_D\)) に対して値は ( もしあれば ) 別のオートメーションイベントまで、最後の曲線の値を保持します。

時刻 \(T_0 + T_D\) 、値 \(V[N-1]\) として暗黙的な setValueAtTime() の呼び出しが行われ、以後のオートメーションは setValueCurveAtTime() イベントの終わりから開始するようになります。

AudioParam.setValueCurveAtTime() メソッドの引数。
パラメーター	型	Null可	省略可	説明
`values`	sequence<float>	✘	✘	パラメーター値の曲線を表す float 値のシーケンスです。これらの値は、指定された時刻から開始される、指定された期間に割り当てられます。このメソッドが呼び出されると、オートメーションのためにカーブの内部的なコピーが作成されます。そのため、それ以降に渡した配列の中身を変更しても `AudioParam` に対する効果はありません。この属性の `sequence<float>` オブジェクトの長さが 2 未満の場合、`InvalidStateError` が発生します ( MUST )。
`startTime`	double	✘	✘	`AudioContext` の `currentTime` 属性と同じ時間軸の曲線の適用を開始する時刻です。もし `startTime` が負の値または有限数でない場合 `RangeError` 例外を発生します ( MUST )。もし `startTime` が `currentTime` よりも小さい場合、`currentTime` の値にクランプされます。
`duration`	double	✘	✘	( `startTime` パラメーターの時刻の後 ) `values` パラメーターに基づいて値が計算される期間の秒数です。もし `duration` が ( 訳注: 0 を含まない ) 厳密に正でないか、有限数でない場合、`RangeError` 例外を発生します ( MUST )。

戻り値: AudioParam

1.6.3. 値の計算

AudioParam には、単純パラメーターと複合パラメーターという 2 つの異なる種類があります。単純パラメーター ( デフォルト ) は、AudioNode の最終的なオーディオ出力を計算するために単独で使用されます。複合パラメーターは、他の AudioParam と一緒に合わせて計算された値が、AudioNode の出力を計算するための入力となる AudioParam です。

computedValue はオーディオ DSP を制御する最終的な値であり、オーディオレンダリングスレッドによって、それぞれのレンダリング量子の時刻に計算します。

AudioParam の値の計算は 2 つの部分から成ります:

value 属性とオートメーションイベントから計算される paramIntrinsicValue の値。
オーディオDSPを制御する最終値であり、各レンダリング量子中にオーディオレンダリングスレッドによって計算される paramComputedValue。

これらの値は次のように計算されなくてはなりません (MUST):

paramIntrinsicValue は毎回計算されます。これは value 属性に直接設定された値であるか、以前または現在オートメーションイベントが存在するならばこれらのイベントから計算された値です。もしその時間範囲からオートメーションイベントが削除された場合 paramIntrinsicValue 値は変更されず value 属性が直接設定されるか時間範囲にオートメーションイベントが追加されるまで、以前の値のままになります。
[[current value]] をこのレンダリング量子の先頭での paramIntrinsicValue の値にします。
paramComputedValue は paramIntrinsicValue の値と入力される AudioParam バッファの値の合計です。合計が NaN の場合、合計を defaultValue に置き換えます。
この AudioParam が複合パラメーターの場合、他の AudioParam と組み合わせてその最終値を計算します。
computedValue を paramComputedValue に設定します。

computedValue の公称範囲は、このパラメーターが実質的に持つことができる最小値と最大値です。単純パラメーターの場合、computedValue はこのパラメーターの単純な公称範囲内にクランプされます。複合パラメーターでは、複合される別の AudioParam の値と合わせて計算された後、最終的な値が公称範囲にクランプされます。

オートメーションメソッドを使用する場合にも、クランプは依然として適用されます。ただし、オートメーション自体はクランプが全くないかのように実行され、オートメーションの値が出力される際にのみ、上記のクランプが実行されます。

例えば、ノード \(N\) が \([0, 1]\) の公称範囲を有する AudioParam \(p\) を持っているとき、次のオートメーションのシーケンスは

N.p.setValueAtTime(0, 0);
N.p.linearRampToValueAtTime(4, 1);
N.p.linearRampToValueAtTime(0, 2);

曲線の最初の勾配は 4 であり、最大値 1 に達すると出力は一定に保たれます。最後に、時刻 2 の近くで、曲線の傾きは -4 になります。これを図示したのが下のグラフで、破線はクリッピングされない場合に何が起こったかを示し、実線は公称範囲へのクリッピングによる audioparam の実際の予想される動作を示しています。

AudioParam automation clipping to nominal — AudioParam のオートメーションの公称範囲によるクリッピング。

1.6.4. `AudioParam` オートメーションの例

AudioParam automation — パラメーターオートメーションの例。

const curveLength = 44100;const curve = new Float32Array(curveLength);for (const i = 0; i < curveLength; ++i)  curve[i] = Math.sin(Math.PI * i / curveLength);const t0 = 0;const t1 = 0.1;const t2 = 0.2;const t3 = 0.3;const t4 = 0.325;const t5 = 0.5;const t6 = 0.6;const t7 = 0.7;const t8 = 1.0;const timeConstant = 0.1;param.setValueAtTime(0.2, t0);param.setValueAtTime(0.3, t1);param.setValueAtTime(0.4, t2);param.linearRampToValueAtTime(1, t3);param.linearRampToValueAtTime(0.8, t4);param.setTargetAtTime(.5, t4, timeConstant);// Compute where the setTargetAtTime will be at time t5 so we can make// the following exponential start at the right point so there’s no// jump discontinuity. From the spec, we have// v(t) = 0.5 + (0.8 - 0.5)*exp(-(t-t4)/timeConstant)// Thus v(t5) = 0.5 + (0.8 - 0.5)*exp(-(t5-t4)/timeConstant)param.setValueAtTime(0.5 + (0.8 - 0.5)*Math.exp(-(t5 - t4)/timeConstant), t5);param.exponentialRampToValueAtTime(0.75, t6);param.exponentialRampToValueAtTime(0.05, t7);param.setValueCurveAtTime(curve, t7, t8 - t7);

1.7. `AudioScheduledSourceNode` インターフェース

このインターフェースは、AudioBufferSourceNode、ConstantSourceNode、および OscillatorNode などのソースノードの共通の機能を表します。

( start() を呼び出すことによって ) ソースが開始されるより前は、ソースノードは無音 ( 0 ) を出力しなければなりません ( MUST )。(stop() を呼び出すことによって ) ソースが停止した後、ソースは無音 ( 0 ) を出力しなければなりません ( MUST )。

AudioScheduledSourceNode は直接インスタンス化することはできませんが、代わりにソースノードの具体的なインターフェースに拡張されています。

AudioScheduledSourceNode は関連付けられている BaseAudioContext の currentTime が AudioScheduledSourceNode が開始するように設定されている時間以上で、停止するように設定されている時間未満の場合に、再生中になります。

AudioScheduledSourceNode は作成時から内部にブーリアンスロット [[source started]] を持っており、最初は false に設定されています。

[Exposed=Window]
 interface AudioScheduledSourceNode : AudioNode {
   attribute EventHandler onended;
   void start(optional double when = 0);
   void stop(optional double when = 0);
 };

1.7.1. 属性

onended, EventHandler 型

この属性は AudioScheduledSourceNode 型のノードに送られる ended イベントの EventHandler ( HTML[HTML] で説明されています ) を設定します。ソースノードが ( 実際のノードによって決まる方法で ) 再生を停止した時 Event 型のイベント ( HTML [HTML] で説明されています ) がイベントハンドラーに送られます。

すべての AudioScheduledSourceNode は stop() によって設定された停止時間に達すると onended イベントが発行されます。 AudioBufferSourceNode の場合、再生が duration の時間に達したか、buffer 全体を再生し終わった場合にも、イベントが送出されます。

1.7.2. メソッド

start(when)

指定した時刻に音を再生するようにスケジュールします。

このメソッドが呼ばれると以下の手順を実行します:

もしこの AudioScheduledSourceNode の内部スロット [[source started]] が true ならば、 InvalidStateError 例外を発生します ( MUST ) 。
後述するパラメーターの制約のために発生するエラーがないかを調べます。もし何らかの例外が発生した場合、以降のステップを中止します。
この AudioScheduledSourceNode の内部スロット [[source started]] を true に設定します。
メッセージ内のパラメーター値を含めて AudioScheduledSourceNode を開始するための制御メッセージをキューに入れます。
次の条件が満たされた場合にのみレンダリングスレッドで実行するための制御メッセージを関連付けられた AudioContext に送信します :
1. コンテキストの制御スレッドの状態が suspendedである。
2. コンテキストがスタート可能である。
3. [[suspended by user]] フラグが false である。

AudioScheduledSourceNode.start(when) メソッドの引数。
パラメーター	型	Null可	省略可	説明
`when`	double	✘	✔	`when` パラメーターは、サウンドの再生開始時刻を秒単位で表します。これは、`AudioContext` の `currentTime` 属性と同じ時間軸を使用します。いつ `AudioScheduledSourceNode` が信号を出力するかは開始時刻に依存し、`when` の正確な値は常に丸めずにサンプルフレーム単位で使用されます。この値に 0 が渡された場合、または値が `currentTime` よりも小さい場合は、音が即時に再生されます。もし `when` が負の場合には `RangeError` 例外を発生します ( MUST )。

戻り値: void

stop(when)

正確な時刻に音の再生を停止するようにスケジュールします。もし stop がすでに呼び出された後に再度呼び出された場合は、最後の呼び出しだけが適用されます。後続のコールの前にバッファがすでに停止していない限り、前回の呼び出しで設定された停止時刻は適用されません。バッファがすでに停止している場合は、さらに stop を呼び出しても効果はありません。スケジュールされた開始時刻よりも前に停止時刻に達すると、音は再生されません。

このメソッドが呼ばれた時、以下のステップを実行します:

もしこの AudioScheduledSourceNode の内部スロット [[source started]] が true でない時、InvalidStateError 例外を発生します (MUST)。
後述するパラメーターの制約のために発生するエラーがないかを調べます。
パラメーター値を含めて AudioScheduledSourceNode を停止するための制御メッセージをキューに入れます。

もしノードが AudioBufferSourceNode の場合、AudioBufferSourceNode を停止する制御メッセージを実行することは、再生アルゴリズムの handleStop() 関数を呼び出すことを意味します。

AudioScheduledSourceNode.stop(when) メソッドの引数。
パラメーター	型	Null可	省略可	説明
`when`	double	✘	✔	`when` パラメーターは、ソースの再生を停止する時間 ( 秒 ) を示します。これは、`AudioContext` の `currentTime` 属性と同じ時間軸を使用します。この値に 0 が渡された場合、または値が `currentTime` よりも小さい場合は、音の再生は即時に停止します。もし `when` が負の場合には `RangeError` 例外を発生します ( MUST )。

戻り値: void

1.8. `AnalyserNode` インターフェース

このインターフェースはリアルタイムの周波数および時間領域の分析を可能にするノードを表します。オーディオストリームは加工されずに入力から出力に渡されます。

プロパティ	値	説明
`numberOfInputs`	1
`numberOfOutputs`	1	この出力は接続されずに放置される事もあります。
`channelCount`	2
`channelCountMode`	"`max`"
`channelInterpretation`	"`speakers`"
tail-time	No

[Exposed=Window]
 interface AnalyserNode : AudioNode {
   constructor (BaseAudioContext context, optional AnalyserOptions options = {});
   void getFloatFrequencyData (Float32Array array);
   void getByteFrequencyData (Uint8Array array);
   void getFloatTimeDomainData (Float32Array array);
   void getByteTimeDomainData (Uint8Array array);
   attribute unsigned long fftSize;
   readonly attribute unsigned long frequencyBinCount;
   attribute double minDecibels;
   attribute double maxDecibels;
   attribute double smoothingTimeConstant;
 };

1.8.1. コンストラクター

AnalyserNode(context, options)

コンストラクターが BaseAudioContext c とオプションオブジェクト option を指定して呼び出される場合、ユーザーエージェントは引数の context と options を使って AudioNode this を初期化しなくてはなりません ( MUST )。

AnalyserNode.constructor(context, options) メソッドの引数。
パラメーター	型	Null可	省略可	説明
`context`	BaseAudioContext	✘	✘	新しく作成される `AnalyserNode` が関連付けられる `BaseAudioContext` です。
`options`	AnalyserOptions	✘	✔	この `AnalyserNode` のオプションの初期パラメーター値です。

1.8.2. 属性

fftSize, unsigned long 型

周波数領域の分析に使用する FFT のサイズ ( サンプルフレーム数 ) です。これは 32 から 32768 までの 2 の累乗でなくてはならず ( MUST )、そうでなければ、IndexSizeError 例外を発生します ( MUST )。デフォルトの値は 2048 です。大きな FFT サイズは計算量が増加する事に注意してください。

fftSize が異なる値に変更されると、( getByteFrequencyData() および getFloatFrequencyData() の ) 周波数データの平滑化に関連するすべての状態がリセットされます。つまり、時間の経過による平滑化に使用される前のブロックのデータ、\(\hat{X}_{-1}[k]\) が、すべての \(k\) に対して 0 に設定されます。

fftSize を増加させた時、現在の時間領域のデータはそれまでと異なり、より過去のサンプルフレームを含んで伸長する必要があることに注意してください。これは実質的に AnalyserNode は最後の 32768 のサンプルフレームを常に保持しなければならない ( MUST ) ことを意味し、「現在の時間領域のデータ」は、常に最新の fftSize の大きさのサンプルフレームとなります。

frequencyBinCount, unsigned long 型, readonly

FFT サイズの半分の値です。

maxDecibels, double 型

maxDecibels は FFT 解析データを unsigned byte 値へ変換するスケーリングの際の最大パワー値です。デフォルトの値は -30 です。もしこの属性の値が minDecibels より小さいか同じ値に設定された場合 IndexSizeError 例外を発生します ( MUST )。

minDecibels, double 型

minDecibels は FFT 解析データを unsigned byte値へ変換するスケーリングの際の最少パワー値です。デフォルトの値は -100 です。もしこの属性の値が maxDecibels よりも大きいか同じに設定された場合 IndexSizeError 例外を発生します ( MUST )。

smoothingTimeConstant, double 型

0 -> 1 の範囲の値で、0 ならば最後の解析フレームに対して時間平均が取られない事を表します。デフォルトの値は 0.8 です。もしこの属性の値が 0 より小さいか 1 より大きい値が設定された場合 IndexSizeError 例外を発生します ( MUST )。

1.8.3. メソッド

getByteFrequencyData(array)

引数として渡された Uint8Array が保持するバイトへの参照を取得し現在の周波数データをコピーします。配列の要素が frequencyBinCount よりも少ない場合、超過した要素は削除されます。配列に frequencyBinCount よりも多くの要素がある場合超過した要素は無視されます。周波数データの計算には、最新の fftSize フレームが使用されます。

getByteFrequencyData() または getFloatFrequencyData() への別の呼び出しが前の呼び出しと同じレンダリング量子内で発生した場合、現在の周波数データは同じデータで更新されません。代わりに、以前に計算されたデータが返されます。

符号なしバイト配列に格納され値は次のように計算されます。 FFT ウィンドウ処理と平滑化で説明されているように \(Y[k]\) を現在の周波数データとします。次に、バイト値 \(b[k]\) は

$$
   b[k] = \left\lfloor
       \frac{255}{\mbox{dB}_{max} - \mbox{dB}_{min}}
       \left(Y[k] - \mbox{dB}_{min}\right)
     \right\rfloor
 $$

ここで \(\mbox{dB}_{min}\) は minDecibels、そして \(\mbox{dB}_{max}\) は maxDecibels です。もし \(b[k]\) が 0 から 255 の範囲外である場合は \(b[k]\) をその範囲に収まるようにクリップされます。

AnalyserNode.getByteFrequencyData() メソッドの引数。
パラメーター	型	Null可	省略可	説明
`array`	Uint8Array	✘	✘	このパラメーターは周波数領域の分析データをコピーする場所を示します。

戻り値: void

getByteTimeDomainData(array)

引数として渡された Uint8Array が保持するバイトへの参照を取得し現在の時間領域のデータ ( 波形データ ) をコピーします。配列の要素が fftSize よりも少ない場合、超過した要素は削除されます。配列に fftSize よりも多くの要素がある場合超過した要素は無視されます。計算には、最新の fftSize フレームが使用されます。

unsigned byte 配列に格納される値は次のように計算されます。\(x[k]\) を時間領域データとします。バイトの値、 \(b[k]\) は、

$$
   b[k] = \left\lfloor 128(1 + x[k]) \right\rfloor.
 $$

もし \(b[k]\) が 0 から 255 の範囲外の場合、\(b[k]\) は範囲内にクリップされます。

AnalyserNode.getByteTimeDomainData() メソッドの引数。
パラメーター	型	Null可	省略可	説明
`array`	Uint8Array	✘	✘	このパラメーターは時間領域のサンプルデータをコピーする場所を示します。

戻り値: void

getFloatFrequencyData(array)

引数として渡された Float32Array が保持するバイトへの参照を取得し現在の周波数データをコピーします。もし配列が frequencyBinCount よりも小さい場合、余った要素は捨てられます。もし配列が frequencyBinCount よりも大きい場合、余剰の要素は無視されます。最も最近の fftSize のフレームが周波数データの計算に使用されます。

以前の呼び出しと同じレンダリング量子内で getFloatFrequencyData() または getByteFrequencyData() が再度呼び出された場合、現在の周波数データは同じデータで更新されず、代わりに、以前に計算されたデータが返されます。

周波数データの単位は dB です

AnalyserNode.getFloatFrequencyData() メソッドの引数。
パラメーター	型	Null可	省略可	説明
`array`	Float32Array	✘	✘	このパラメーターは周波数領域の分析データをコピーする場所を示します。

戻り値: void

getFloatTimeDomainData(array)

引数として渡された Float32Array が保持するバイトへの参照を取得し、現在の時間領域データ ( 波形データ ) をコピーします。もし配列が fftSize よりも小さい場合、余った要素は捨てられます。もし配列が fftSize よりも大きい場合、余剰の要素は無視されます。最も最近の fftSize のフレームが (ダウンミックスされた後) 返されます。

AnalyserNode.getFloatTimeDomainData() メソッドの引数。
パラメーター	型	Null可	省略可	説明
`array`	Float32Array	✘	✘	このパラメーターは時間領域のサンプルデータをコピーする場所を示します。

戻り値: void

1.8.4. `AnalyserOptions`

これは AnalyserNode を生成する際に使用するオプションを指定します。すべてのメンバーは省略可能で、もし指定されない場合は通常のデフォルト値がノードの生成に使用されます。

dictionary AnalyserOptions : AudioNodeOptions {
   unsigned long fftSize = 2048;
   double maxDecibels = -30;
   double minDecibels = -100;
   double smoothingTimeConstant = 0.8;
 };

1.8.4.1. ディクショナリー `AnalyserOptions` メンバー

fftSize, unsigned long 型, defaulting to 2048: 周波数領域解析のための FFT サイズとして要求する初期値。
maxDecibels, double 型, デフォルトは -30: FFT 解析の最大パワー (dB) として要求する初期値。
minDecibels, double 型, デフォルトは -100: FFT 解析の最小パワー (dB) として要求する初期値。
smoothingTimeConstant, double 型, デフォルトは 0.8: FFT 解析のスムーズ化定数として要求する初期値。

1.8.5. 時間領域のダウンミックス

現在の時間領域データが計算されるとき、入力信号は channelCount が 1 であり、channelCountMode が "max" であり、channelInterpretation が "speakers" であるかのように、モノラルにダウンミックスされなければなりません。これは、AnalyserNode 自体の設定とは無関係です。最新の fftSize フレームがこのダウンミックス処理に使用されます。

1.8.6. FFT 窓関数と時間的スムージング

現在の周波数データが計算されたとき、次の処理が行われます:

現在の時間領域データを計算します。
時間領域の入力データに対してブラックマン窓を適用します。
窓関数を通した時間領域の入力データからイマジナリとリアルの周波数データを得るため、フーリエ変換を適用します。
周波数領域データに時間的スムージングの処理を行います。
dB への変換を行います。

次の式では \(N\) をこの AnalyserNode の fftSize 属性とします。

ブラックマン窓の適用は時間領域の入力に対して次の処理を行います。\(n = 0, \ldots, N - 1\) に対する \(x[n]\) は時間領域のデータです。ブラックマン窓は、

$$
 \begin{align*}
   \alpha &= \mbox{0.16} \\ a_0 &= \frac{1-\alpha}{2} \\
   a_1 &= \frac{1}{2} \\
   a_2 &= \frac{\alpha}{2} \\
   w[n] &= a_0 - a_1 \cos\frac{2\pi n}{N} + a_2 \cos\frac{4\pi n}{N}, \mbox{ for } n = 0, \ldots, N - 1
 \end{align*}
 $$

窓関数を通した信号 \(\hat{x}[n]\) は

$$
   \hat{x}[n] = x[n] w[n], \mbox{ for } n = 0, \ldots, N - 1
 $$

フーリエ変換の適用は次のようなフーリエ変換の計算から成ります。\(X[k]\) は複素周波数領域のデータで \(\hat{x}[n]\) は上で計算された窓関数を通した時間領域のデータです。そして、

$$
   X[k] = \frac{1}{N} \sum_{n = 0}^{N - 1} \hat{x}[n]\, W^{-kn}_{N}
 $$

ただし、 \(k = 0, \dots, N/2-1\) where \(W_N = e^{2\pi i/N}\).

周波数データの時間的スムージングは次のように処理されます:

\(\hat{X}_{-1}[k]\) を前回のブロックに対するこの処理の結果とします。前回のブロックは前回の時間的スムージング処理で計算されたバッファとして定義され、もし時間的スムージング処理が最初の 1 回目の場合は \(N\) 個の 0 からなる配列になります。
\(\tau\) をこの AnalyserNode の smoothingTimeConstant 属性とします。
\(X[k]\) を現在のブロックのフーリエ変換の適用の結果とします。

そしてスムージングされた値\(\hat{X}[k]\) は次の式で計算されます

$$
   \hat{X}[k] = \tau\, \hat{X}_{-1}[k] + (1 - \tau)\, \left|X[k]\right|
 $$

ただし、 \(k = 0, \ldots, N - 1\).

dBへの変換は次の処理で行われます。 \(\hat{X}[k]\) を時間的スムージングで計算された値として:

$$
   Y[k] = 20\log_{10}\hat{X}[k]
 $$

ただし、 \(k = 0, \ldots, N-1\).

この配列、\(Y[k]\) は getFloatFrequencyData() によって出力の配列にコピーされます。getByteFrequencyData() に対しては、\(Y[k]\) は minDecibels と maxDecibels の範囲内にクリップされ、minDecibels が 0、maxDecibels が 255 になるようにスケーリングされます。

1.9. `AudioBufferSourceNode` インターフェース

このインターフェースは AudioBuffer によってメモリー上に保持されているオーディオデータからのオーディオソースを表します。これはオーディオデータの再生に高度なスケジューリングの柔軟性と精度が要求される場合に役立ちます。もしネットワークからあるいはディスクからのデータをサンプル精度で再生する必要がある場合、再生機能の実装には AudioWorkletNode を使用しなくてはなりません。

start() メソッドはいつ再生されるかをスケジュールするために使用されます。start() メソッドを複数回呼び出す事はできません。再生は ( もし loop 属性が false の場合 ) バッファのオーディオデータがすべて再生されると、あるいは stop() メソッドが呼び出されて指定された時刻になると自動的に停止します。より詳細には start() および stop() の説明を参照してください。

プロパティ	値	説明
`numberOfInputs`	0
`numberOfOutputs`	1
`channelCount`	2
`channelCountMode`	"`max`"
`channelInterpretation`	"`speakers`"
tail-time	No

出力のチャンネル数は常に buffer 属性に指定された AudioBuffer のチャンネル数と同じになります。もし buffer が null の場合、チャンネルは無音の 1 チャンネルとなります。

さらに、バッファに複数のチャンネルがある場合 AudioBufferSourceNode の出力は、次のいずれかの条件が成立した後、レンダリング量子の開始時に 1 チャンネルの無音に変更する必要があります :

buffer の終わりに到達した
duration の終わりに到達した
stop の指定時刻に到達した

AudioBufferSourceNode の再生ヘッド位置は、バッファ内の最初のサンプルフレームの時刻を基準にした秒単位の時間オフセットとして定義される値です。その値はノードの playbackRate および detune パラメーターとは独立したものとして想定されます。一般に、再生ヘッド位置はサブサンプルの精度であり、正確なサンプルフレームの位置を参照するものではありません。その値は 0 とバッファ全体の長さの間で有効な値を取ります。

playbackRate および detune 属性は、複合パラメーターを形成します。それらは組み合わせて使用され、次のように computedPlaybackRate 値を決定します:

computedPlaybackRate(t) = playbackRate(t) * pow(2, detune(t) / 1200)

この複合パラメーターの公称範囲は \((-\infty, \infty)\) です。

AudioBufferSourceNode は作成されたときにブーリアンの内部スロット [[buffer set]] を持っており、初期値は false に設定されています。

[Exposed=Window]
 interface AudioBufferSourceNode : AudioScheduledSourceNode {
   constructor (BaseAudioContext context,
                optional AudioBufferSourceOptions options = {});
   attribute AudioBuffer? buffer;
   readonly attribute AudioParam playbackRate;
   readonly attribute AudioParam detune;
   attribute boolean loop;
   attribute double loopStart;
   attribute double loopEnd;
   void start (optional double when = 0,
               optional double offset,
               optional double duration);
 };

1.9.1. コンストラクター

AudioBufferSourceNode(context, options)

コンストラクターが BaseAudioContext c とオプションオブジェクト option を指定して呼び出される時、ユーザーエージェントは引数の context と options を使って AudioNode this を初期化しなくてはなりません ( MUST )。

AudioBufferSourceNode.constructor(context, options) メソッドの引数。
パラメーター	型	Null可	省略可	説明
`context`	BaseAudioContext	✘	✘	作成した新しい `AudioBufferSourceNode` が関連付けられる `BaseAudioContext` です。
`options`	AudioBufferSourceOptions	✘	✔	この `AudioBufferSourceNode` のオプションの初期パラメーター値です。

1.9.2. 属性

buffer, AudioBuffer 型, nullable

再生されるオーディオのリソースを表します。

buffer 属性を設定する際は次の手順が行われます:

new buffer を buffer に割り当てる AudioBuffer または null とします。
もし new buffer が null でなく、 [[buffer set]] が true ならば、InvalidStateError 例外を発生してこれらの手順を中止します。
もし new buffer が null でなければ、[[buffer set]] を true に設定します。
new buffer を buffer 属性に割り当てます。
もしこのノードで start() が既に呼ばれていた場合、この buffer の内容の取得処理を実行します。

detune, AudioParam 型, readonly

オーディオストリームをレンダリングする速度を変調する追加のパラメーターで、単位はセントです。このパラメーターは、playbackRate と組み合わせて computedPlaybackRate を計算する複合パラメーターです。

パラメーター	値	説明
`defaultValue`	0
`minValue`	最も負の単精度浮動小数点値	約 -3.4028235e38
`maxValue`	最も正の単精度浮動小数点値	約 3.4028235e38
`automationRate`	"`k-rate`"	オートメーション速度の制約があります。

loop, boolean 型

オーディオデータの loopStart と loopEnd で指定された範囲を繰り返してループ再生するかどうかを指定します。デフォルトは false です。

loopEnd, double 型

loop 属性が true の場合、ループの終了位置を示すオプションの再生ヘッド位置です。その値そのものはループ範囲に含まれません。そのデフォルトの value は 0 で、通常は 0 からバッファの長さの範囲の任意の値に設定できます。loopEnd が 0 より小さいまたは 0 である、または loopEnd がバッファの長さよりも長い場合、ループはバッファの最後が終了位置になります。

loopStart, double 型

loop 属性が true の場合にループを開始するオプションの再生ヘッド位置です。そのデフォルトの value は 0 で、0 からバッファの長さの範囲の任意の値に設定できます。もし loopStart が 0 より小さい場合、ループは 0 から開始します。もし loopStart がバッファの長さより大きい場合、ループはバッファの最後から開始します。

playbackRate, AudioParam 型, readonly

オーディオストリームをレンダリングする速度です。これは、detune と組み合わせて computedPlaybackRate が計算される複合パラメーターです。

パラメーター	値	説明
`defaultValue`	1
`minValue`	最も負の浮動小数点値	約 -3.4028235e38
`maxValue`	最も正の浮動小数点値	約 3.4028235e38
`automationRate`	"`k-rate`"	オートメーション速度の制約があります。

1.9.3. メソッド

start(when, offset, duration)

指定の時刻に音の再生開始をスケジュールします。

メソッドが呼び出されたとき、以下の手順が実行されます:

このノードで既に stop が呼び出されている場合、または既に start の呼び出しが発生している場合は、InvalidStateError 例外を発生します ( MUST )。
後述するパラメーターの制約のために発生するエラーがないか調べます。
AudioBufferSourceNode を開始するため、パラメーターと共に制御メッセージをキューに入れます。
関連付けられた AudioContext に制御メッセージを送って、次の条件が満たされている場合レンダリングスレッドで実行します :
1. コンテキストの制御スレッドの状態が suspended になっている。
2. コンテキストがスタート可能である。
3. [[suspended by user]] フラグが false になっている。

AudioBufferSourceNode を開始するための制御メッセージの実行は、後述の再生アルゴリズムで handleStart() 関数を呼び出すことを意味します。

AudioBufferSourceNode.start(when, offset, duration) メソッドの引数。
パラメーター	型	Null可	省略可	説明
`when`	double	✘	✔	`when` パラメーターは、再生の開始時刻を ( 秒で ) 指定します。これは `AudioContext` の `currentTime` 属性と同じ時間軸の時刻を使用します。もしこの値に 0 、あるいは currentTime よりも小さな値を渡した場合、音は即時に再生されます。もし `when` が負の値の場合、`RangeError` 例外を発生します ( MUST )。
`offset`	double	✘	✔	`offset` パラメーターは再生を開始する再生ヘッド位置を指定します。もしこの値に 0 が渡された場合、再生はバッファの先頭から開始されます。もし `offset` が負の値の場合は `RangeError` 例外を発生します ( MUST )。もし `offset` が `loopEnd` より大きく、`playbackRate` が正か 0 で、`loop` が `true` の場合は、再生は `loopEnd` から始まります。もし `offset` が `loopStart` より大きく、`playbackRate` が負、`loop` が `true` の場合、再生は `loopStart` から始まります。 `offset` は `startTime` に到達したとき [0, `duration`] の範囲に暗黙的にクランプされます。ここで `duration` はこの `AudioBufferSourceNode` の `buffer` 属性に設定されている `AudioBuffer` の `duration` 属性の値です。
`duration`	double	✘	✔	`duration` パラメータは、再生される音の持続時間を表し、全体または部分的なループの反復を含む、出力されるバッファ内容全体の秒数で表します。 `duration` の単位は、 `playbackRate` の影響とは無関係です。例えば、再生速度が 0.5 で 5 秒間の `duration` の場合、5 秒間分のバッファ内容が半分の速度で出力され、10 秒間の出力が生成されます。 duration が負の場合、`RangeError` 例外を発生します ( MUST )。

戻り値: void

1.9.4. `AudioBufferSourceOptions`

AudioBufferSourceNode を生成する際のオプションを指定します。すべてのメンバーは省略可能です。指定されていない場合、通常のデフォルト値がノードの生成に使用されます。

dictionary AudioBufferSourceOptions {
   AudioBuffer? buffer;
   float detune = 0;
   boolean loop = false;
   double loopEnd = 0;
   double loopStart = 0;
   float playbackRate = 1;
 };

1.9.4.1. ディクショナリー `AudioBufferSourceOptions` メンバー

buffer, AudioBuffer 型, nullable: 再生するオーディオのデータを指定します。これは buffer を AudioBufferSourceNode の buffer 属性に割り当てるのと等価です。
detune, float 型, デフォルトは 0: detune AudioParam の初期値です。
loop, boolean 型, デフォルトは false: loop 属性の初期値です。
loopEnd, double 型, デフォルトは 0: loopEnd 属性の初期値です。
loopStart, double 型, デフォルトは 0: loopStart 属性の初期値です。
playbackRate, float 型, デフォルトは 1: playbackRate 属性の初期値です。

1.9.5. ループ再生

このセクションは非基準情報です。基準としての要件については再生アルゴリズムを参照してください。

loop 属性を true に設定すると、端点 loopStart および loopEnd によって定義される範囲が、一度その範囲内のどこかが再生されると、その後範囲の再生を繰り返します。loop が true である間、ループ再生は次のいずれかが発生するまで続きます:

stop() が呼び出される。
スケジュールされた停止時刻に到達する。
start() が duration を指定して呼ばれている場合、その duration の値を超える。

ループの範囲は loopStart から自身を含まない loopEnd までの領域を占めているとみなされます。ループ範囲の再生方向は、ノードの再生速度の符号を考慮します。再生速度が正の場合、ループは loopStart から loopEnd まで; 再生速度が負の場合は loopEnd から loopStart までのループが発生します。

ループは start() の offset 引数の解釈には影響しません。再生は常に指定されたオフセットから開始され、再生中にループ範囲に差し掛かった場合にのみループが開始されます。

有効なループ開始点と終了点は、後述のアルゴリズムで定義されているように、0 からバッファの長さの間にある必要があります。loopEnd は、loopStart と同じかより後ろになるようにさらに制約されます。これらの制約のいずれかに沿わない場合は、ループ範囲はバッファ全体を指すとみなされます。

ループの端点はサブサンプルの精度で扱われます。端点が正確なサンプルフレームのオフセットにならない場合、または再生レートが 1 に等しくない場合、ループの再生は、ループの終了点と開始点が一致するように繋ぎ合わされ、それがバッファの連続した領域のオーディオであるように補間されます。

ループ関連のプロパティは、バッファの再生中に変化させても良く、一般に次のレンダリング量子から有効となります。正確な内容については、後述の基準としての再生アルゴリズムによって定義されます。

loopStart と loopEnd 属性のデフォルト値はどちらも 0 です。loopEnd の値が 0 である事はバッファ全体の長さと等価であるため、デフォルトのループ範囲はバッファ全体になります。

ループの端点の値は、バッファのサンプルレートを前提とした時間のオフセットとして表されています。これらの値は再生中に動的に変化可能なノードの playbackRate パラメーターとは無関係であることに注意してください。

1.9.6. AudioBuffer 内容の再生

この基準情報のセクションでは、再生中に動的に変化する可能性がある次の要素の組み合わせの影響を考慮しつつ、バッファ内容の再生について定義します。

サブサンプル精度で表現される開始オフセット。
サブサンプル精度で表現され、再生中に動的に変化可能なループポイント。
再生速度とデチューンパラメーター。これらは組み合わされて、単一の computedPlaybackRate となり、その値は有限の正または負の値となります。

AudioBufferSourceNode の出力を生成するための内部のアルゴリズムは、以下の原則に従います:

出力の効率または品質を向上させるため、バッファのリサンプリングが必要になったとき、任意に UA によって実行されます
サブサンプル単位の開始オフセットまたはループポイントは、サンプルフレーム間に補間を必要とすることがあります。
ループバッファの再生は、補間による影響を除いて、ループ部のオーディオ内容が連続して繰り返される非ループのバッファと同じように振舞わなくてはなりません。

アルゴリズムの説明は次のとおりです:

let buffer; // AudioBuffer employed by this nodelet context; // AudioContext employed by this node// The following variables capture attribute and AudioParam values for the node.// They are updated on a k-rate basis, prior to each invocation of process().let loop;let detune;let loopStart;let loopEnd;let playbackRate;// Variables for the node’s playback parameterslet start = 0, offset = 0, duration = Infinity; // Set by start()let stop = Infinity; // Set by stop()// Variables for tracking node’s playback statelet bufferTime = 0, started = false, enteredLoop = false;let bufferTimeElapsed = 0;let dt = 1 / context.sampleRate;// Handle invocation of start method callfunction handleStart(when, pos, dur) {  if (arguments.length >= 1) {    start = when;  }  offset = pos;  if (arguments.length >= 3) {    duration = dur;  }}// Handle invocation of stop method callfunction handleStop(when) {  if (arguments.length >= 1) {    stop = when;  } else {    stop = context.currentTime;  }}// Interpolate a multi-channel signal value for some sample frame.// Returns an array of signal values.function playbackSignal(position) {  /*    This function provides the playback signal function for buffer, which is a    function that maps from a playhead position to a set of output signal    values, one for each output channel. If |position| corresponds to the    location of an exact sample frame in the buffer, this function returns    that frame. Otherwise, its return value is determined by a UA-supplied    algorithm that interpolates between sample frames in the neighborhood of    position.    If position is greater than or equal to loopEnd and there is no subsequent    sample frame in buffer, then interpolation should be based on the sequence    of subsequent frames beginning at loopStart.   */   ...}// Generate a single render quantum of audio to be placed// in the channel arrays defined by output. Returns an array// of |numberOfFrames| sample frames to be output.function process(numberOfFrames) {  let currentTime = context.currentTime; // context time of next rendered frame  const output = []; // accumulates rendered sample frames  // Combine the two k-rate parameters affecting playback rate  const computedPlaybackRate = playbackRate * Math.pow(2, detune / 1200);  // Determine loop endpoints as applicable  let actualLoopStart, actualLoopEnd;  if (loop && buffer != null) {    if (loopStart >= 0 && loopEnd > 0 && loopStart < loopEnd) {      actualLoopStart = loopStart;      actualLoopEnd = Math.min(loopEnd, buffer.duration);    } else {      actualLoopStart = 0;      actualLoopEnd = buffer.duration;    }  } else {    // If the loop flag is false, remove any record of the loop having been entered    enteredLoop = false;  }  // Handle null buffer case  if (buffer == null) {    stop = currentTime; // force zero output for all time  }  // Render each sample frame in the quantum  for (let index = 0; index < numberOfFrames; index++) {    // Check that currentTime and bufferTimeElapsed are    // within allowable range for playback    if (currentTime < start || currentTime >= stop || bufferTimeElapsed >= duration) {      output.push(0); // this sample frame is silent      currentTime += dt;      continue;    }    if (!started) {      // Take note that buffer has started playing and get initial      // playhead position.      if (loop && computedPlaybackRate >= 0 && offset >= actualLoopEnd) {        offset = actualLoopEnd;      }      if (computedPlaybackRate < 0 && loop && offset < actualLoopStart) {        offset = actualLoopStart;      }      bufferTime = offset;      started = true;    }    // Handle loop-related calculations    if (loop) {      // Determine if looped portion has been entered for the first time      if (!enteredLoop) {        if (offset < actualLoopEnd && bufferTime >= actualLoopStart) {          // playback began before or within loop, and playhead is          // now past loop start          enteredLoop = true;        }        if (offset >= actualLoopEnd && bufferTime < actualLoopEnd) {          // playback began after loop, and playhead is now prior          // to the loop end          enteredLoop = true;        }      }      // Wrap loop iterations as needed. Note that enteredLoop      // may become true inside the preceding conditional.      if (enteredLoop) {        while (bufferTime >= actualLoopEnd) {          bufferTime -= actualLoopEnd - actualLoopStart;        }        while (bufferTime < actualLoopStart) {          bufferTime += actualLoopEnd - actualLoopStart;        }      }    }    if (bufferTime >= 0 && bufferTime < buffer.duration) {      output.push(playbackSignal(bufferTime));    } else {      output.push(0); // past end of buffer, so output silent frame    }    bufferTime += dt * computedPlaybackRate;    bufferTimeElapsed += dt * computedPlaybackRate;    currentTime += dt;  } // End of render quantum loop  if (currentTime >= stop) {    // End playback state of this node.  No further invocations of process()    // will occur.  Schedule a change to set the number of output channels to 1.  }  return output;}

次の非基準の図は、様々な主要シナリオでのアルゴリズムの動作を示しています。バッファの動的なリサンプリングは考慮されませんが、ループ位置の時間が変更されない限り、結果の再生には重大な影響はありません。すべての図において、次の規則が適用されます:

コンテキストのサンプルレートは 1000 Hz とします。
AudioBuffer の内容の最初のサンプルを x の原点とします。
出力信号は、start の時刻を x の原点としたサンプルフレームで示します。
UA は他の補間技術を使う事もできますが、直線補間として図示しています。
図に示されている duration の値は、start() の引数ではなく buffer を参照します。

この図は、バッファ内の最後のサンプルフレームの後にエンドポイントがある単純なループがあるバッファの基本的な再生を示しています:

AudioBufferSourceNode basic playback — `AudioBufferSourceNode` の基本再生

この図は、playbackRate の補間を示し、1 つおきに出力サンプルフレームが補間される、バッファコンテンツの半分の速度での再生を示しています。特に注目すべき点は、ループされた出力の最後のサンプルフレームで、ループの開始点を使用して補間されます。

AudioBufferSourceNode playbackRate interpolation — `AudioBufferSourceNode` playbackRate の補間

この図はサンプルレートの補間を示し、サンプルレートがコンテキストのサンプルレートの 50％であるバッファの再生を示しています。バッファとコンテキストとの間のサンプルレートの差を補正するために、計算された再生レートは 0.5 となります。結果の出力は前の例と同じですが、理由は異なります。

AudioBufferSourceNode sample rate interpolation — `AudioBufferSourceNode` サンプルレートの補間

この図は、バッファ内のオフセットがサンプルフレームのちょうど半分で始まるサブサンプルオフセットの再生を示しています。そのため、すべての出力フレームが補間されます:

AudioBufferSourceNode subsample offset playback — `AudioBufferSourceNode` サブサンプルオフセットの再生

この図は、ループの端点の小数点以下を持つフレームオフセットが、正確なサンプルフレームを参照している場合と同じように、オフセットに従ってバッファ内の補間データポイントにどのようにマップするかを示すサブサンプルループ再生を示しています:

AudioBufferSourceNode subsample loop playback — `AudioBufferSourceNode` サブサンプルのループ再生

1.10. `AudioDestinationNode` インターフェース

これはユーザーが聴く事になる最終的な音の出力地点を表す AudioNode です。それは多くの場合、スピーカーが接続されているオーディオ出力デバイスと考えられます。聴こえるべきすべてのレンダリングされた音は AudioContext のルーティンググラフの"終端点"であるこのノードに導かれます。AudioDestinationNode は 1 つの AudioContext に付き、AudioContext の destination 属性を介して 1 つだけ存在します。

AudioDestinationNode の出力はその入力を足し合わせることによって生成され、AudioContext の出力を例えば MediaStreamAudioDestinationNode、または MediaRecorder ( [mediastream-recording] で説明されています ) で取り込むこともできます。

AudioDestinationNode は、AudioContext または OfflineAudioContext のいずれかの出力先であり、チャンネルのプロパティはコンテキストが何であるかによって異なります。

AudioContext の場合のデフォルトは

プロパティ	値	説明
`numberOfInputs`	1
`numberOfOutputs`	1
`channelCount`	2
`channelCountMode`	"`explicit`"
`channelInterpretation`	"`speakers`"
tail-time	No

channelCount は、maxChannelCount と同じか小さい任意の値に設定できます。この値が有効な範囲内にない場合は、IndexSizeError 例外を発生します ( MUST )。具体的な例を挙げると、オーディオハードウェアが 8 チャンネル出力をサポートする場合、channelCount を 8 に設定する事で 8 チャンネルの出力をレンダリングすることができます。

OfflineAudioContext の場合のデフォルトは

プロパティ	値	説明
`numberOfInputs`	1
`numberOfOutputs`	1
`channelCount`	numberOfChannels
`channelCountMode`	"`explicit`"
`channelInterpretation`	"`speakers`"
tail-time	No

ここで numberOfChannels は OfflineAudioContext を生成するときに指定されたチャンネルの数です。この値は変更できません。channelCount が別の値に変更された場合、NotSupportedError 例外を発生します ( MUST )。

[Exposed=Window]
 interface AudioDestinationNode : AudioNode {
   readonly attribute unsigned long maxChannelCount;
 };

1.10.1. 属性

maxChannelCount, unsigned long 型, readonly: channelCount 属性に設定できるチャンネルの最大数です。( 通常の場合 ) 終点としてオーディオハードウェアを表す AudioDestinationNode は、オーディオハードウェアがマルチチャンネル対応である場合、2 よりも大きなオーディオチャンネルを出力する可能性があります。maxChannelCount は、このハードウェアがサポートできるチャンネルの最大数です。

1.11. `AudioListener` インターフェース

このインターフェースは人がオーディオシーンを聴く位置と方向を表します。すべての PannerNode オブジェクトは BaseAudioContext の listener との関係で空間音響処理を行います。空間音響についての詳細は § 6 空間音響 / 定位を参照してください。

positionX、positionY、positionZ パラメーターは、3D デカルト座標空間におけるリスナーの位置を表します。PannerNode オブジェクトは、これと個々の音源との相対位置を空間音響に使用します。

forwardX、forwardY、forwardZ パラメーターは、3D 空間内の方向ベクトルを表します。forward ベクトルと up ベクトルの両方が、リスナーの向きを決定するために使用されます。わかりやすく人間で言えば、forward ベクトルは、人の鼻がどの方向を指しているかを表します。up のベクトルは、人の頭の上を指している方向を表します。これらの 2 つのベクトルは線形独立であると考えられます。これらの値がどのように解釈されるかの基準としての要件については、§ 6 空間音響 / パンニングのセクションを参照してください。

[Exposed=Window]
 interface AudioListener {
   readonly attribute AudioParam positionX;
   readonly attribute AudioParam positionY;
   readonly attribute AudioParam positionZ;
   readonly attribute AudioParam forwardX;
   readonly attribute AudioParam forwardY;
   readonly attribute AudioParam forwardZ;
   readonly attribute AudioParam upX;
   readonly attribute AudioParam upY;
   readonly attribute AudioParam upZ;
   void setPosition (float x, float y, float z);
   void setOrientation (float x, float y, float z, float xUp, float yUp, float zUp);
 };

1.11.1. 属性

forwardX, AudioParam 型, readonly

3D デカルト座標空間内で、リスナーが向いている forward 方向の x 座標成分です。

パラメーター	値	説明
`defaultValue`	0
`minValue`	最も負の単精度浮動小数点値	約 -3.4028235e38
`maxValue`	最も正の単精度浮動小数点値	約 3.4028235e38
`automationRate`	"`a-rate`"

forwardY, AudioParam 型, readonly

3D デカルト座標空間内で、リスナーが向いている forward 方向の y 座標成分です。

パラメーター	値	説明
`defaultValue`	0
`minValue`	最も負の単精度浮動小数点値	約 -3.4028235e38
`maxValue`	最も正の単精度浮動小数点値	約 3.4028235e38
`automationRate`	"`a-rate`"

forwardZ, AudioParam 型, readonly

3D デカルト座標空間内で、リスナーが向いている forward 方向の z 座標成分です。

パラメーター	値	説明
`defaultValue`	-1
`minValue`	最も負の単精度浮動小数点値	約 -3.4028235e38
`maxValue`	最も正の単精度浮動小数点値	約 3.4028235e38
`automationRate`	"`a-rate`"

positionX, AudioParam 型, readonly

3D デカルト座標空間内での、オーディオリスナーの位置の x 座標です。

パラメーター	値	説明
`defaultValue`	0
`minValue`	最も負の単精度浮動小数点値	約 -3.4028235e38
`maxValue`	最も正の単精度浮動小数点値	約 3.4028235e38
`automationRate`	"`a-rate`"

positionY, AudioParam 型, readonly

3D デカルト座標空間内での、オーディオリスナーの位置の y 座標です。

パラメーター	値	説明
`defaultValue`	0
`minValue`	最も負の単精度浮動小数点値	約 -3.4028235e38
`maxValue`	最も正の単精度浮動小数点値	約 3.4028235e38
`automationRate`	"`a-rate`"

positionZ, AudioParam 型, readonly

3D デカルト座標空間内での、オーディオリスナーの位置の z 座標です。

パラメーター	値	説明
`defaultValue`	0
`minValue`	最も負の単精度浮動小数点値	約 -3.4028235e38
`maxValue`	最も正の単精度浮動小数点値	約 3.4028235e38
`automationRate`	"`a-rate`"

upX, AudioParam 型, readonly

3D デカルト座標空間内で、リスナーの頭上の up 方向の x 座標成分です。

パラメーター	値	説明
`defaultValue`	0
`minValue`	最も負の単精度浮動小数点値	約 -3.4028235e38
`maxValue`	最も正の単精度浮動小数点値	約 3.4028235e38
`automationRate`	"`a-rate`"

upY, AudioParam 型, readonly

3D デカルト座標空間内で、リスナーの頭上の up 方向の y 座標成分です。

パラメーター	値	説明
`defaultValue`	1
`minValue`	最も負の単精度浮動小数点値	約 -3.4028235e38
`maxValue`	最も正の単精度浮動小数点	約 3.4028235e38
`automationRate`	"`a-rate`"

upZ, AudioParam 型, readonly

3D デカルト座標空間内で、リスナーの頭上の up 方向の z 座標成分です

パラメーター	値	説明
`defaultValue`	0
`minValue`	最も負の単精度浮動小数点値	約 -3.4028235e38
`maxValue`	最も正の単精度浮動小数点値	約 3.4028235e38
`automationRate`	"`a-rate`"

1.11.2. メソッド

setOrientation(x, y, z, xUp, yUp, zUp)

このメソッドは非推奨 (DEPRECATED) です。これは forwardX.value、forwardY.value、forwardZ.value、upX.value、upY.value、upZ.value に、与えられた x、y、z、xUp、yUp、zUp の値をそれぞれ直接設定するのと等価です。

そのため、forwardX、forwardY、forwardZ、upX、upY、upZ の AudioParam のいずれかに、setValueCurveAtTime() を使用したオートメーションカーブがあるときに、このメソッドを呼び出すと NotSupportedError を発生します ( MUST )。

setOrientation() はリスナーが 3D デカルト座標空間でどの方向を指しているかを示します。forward ベクトルと up ベクトルの両方が与えられます。わかりやすく人間で言えば、forward ベクトルは、人の鼻がどの方向を向いているかを表します。up ベクトルは、人の頭の上を指している方向を表します。これらの2つのベクトルは線形独立であると考えられます。これらの値がどのように解釈されるかの基準としての要件については、§ 6 空間音響 / パンニングのセクションを参照してください。

x、y、z パラメーターは、3D 空間における forward 方向ベクトルを表し、デフォルト値は ( 0, 0, -1 ) になります。

xUp、yUp、zUp パラメーターは、3D 空間内の up 方向ベクトルを表し、デフォルト値は ( 0, 1, 0 ) になります。

AudioListener.setOrientation() メソッドの引数。
パラメーター	型	Null可	省略可	説明
`x`	float	✘	✘	`AudioListener` の forward x の方向
`y`	float	✘	✘	`AudioListener` の forward y の方向
`z`	float	✘	✘	`AudioListener` の forward z の方向
`xUp`	float	✘	✘	`AudioListener` の up x の方向
`yUp`	float	✘	✘	`AudioListener` の up y の方向
`zUp`	float	✘	✘	`AudioListener` の up z の方向

戻り値: void

setPosition(x, y, z)

このメソッドは非推奨 (DEPRECATED) です。これは、positionX.value、 positionY.value、 positionZ.value にそれぞれ与えられた x、y、z の値を直接設定することと等価です。

そのため、AudioListener の positionX、positionY、positionZ の AudioParam のいずれかに、setValueCurveAtTime() を使用したオートメーションカーブがあるときに、このメソッドを呼び出すと NotSupportedError を発生します ( MUST )。

setPosition() はリスナーの位置を 3D デカルト座標空間に設定します。PannerNode オブジェクトは、この位置と個々の音源の相対位置を空間音響に使用します。

x、y、z パラメーターは 3D 空間内の座標を表しています。

デフォルトの値は (0, 0, 0) です。

AudioListener.setPosition() メソッドの引数。
パラメーター	型	Null可	省略可	説明
`x`	float	✘	✘	`AudioListener` の位置の x 座標
`y`	float	✘	✘	`AudioListener` の位置の y 座標
`z`	float	✘	✘	`AudioListener` の位置の z 座標

1.11.3. 処理

AudioListener のパラメーターには AudioNode を接続する事ができ、それが同じグラフ内の PannerNode の出力にも影響を与えるため、ノードの順序付けアルゴリズムで処理の順序を計算する際には AudioListener を考慮する必要があります。このためグラフ内のすべての PannerNode は入力として AudioListener を持っています。

1.12. `AudioProcessingEvent` インターフェース - DEPRECATED

これは ScriptProcessorNode ノードにディスパッチされる Event オブジェクトです。置き換えとなる AudioWorkletNode は異なるアプローチを使用するため、ScriptProcessorNode が削除される際には削除されます。

このイベントのハンドラーは inputBuffer 属性を経由してオーディオデータにアクセスすることによって、( もしあれば ) 入力からのオーディオを処理します。処理の結果 ( または入力がない場合は合成したデータ ) であるオーディオデータは、outputBuffer に格納されます。

[Exposed=Window]
 interface AudioProcessingEvent : Event {
   constructor (DOMString type, AudioProcessingEventInit eventInitDict);
   readonly attribute double playbackTime;
   readonly attribute AudioBuffer inputBuffer;
   readonly attribute AudioBuffer outputBuffer;
 };

1.12.1. 属性

inputBuffer, AudioBuffer 型, readonly: 入力となるオーディオデータを含む AudioBuffer です。これは createScriptProcessor() メソッドの numberOfInputChannels パラメーターと等しい数のチャンネルを持っています。この AudioBuffer は、onaudioprocess 関数の範囲内でのみ有効です。このスコープの外では値は意味を持ちません。
outputBuffer, AudioBuffer 型, readonly: 出力のオーディオデータを書き込まなくてはならない AudioBuffer です ( MUST )。この AudioBuffer は createScriptProcessor() メソッドの numberOfOutputChannels パラメーターと等しい数のチャンネルを持っています。onaudioprocess 関数のスコープ内のスクリプトコードは、この AudioBuffer のチャンネルデータを表す Float32Array 配列を変更することを期待されています。このスコープの外でのスクリプトによる AudioBuffer の変更では、オーディオに対する効果は発生しません。
playbackTime, double 型, readonly: AudioContext の currentTime と同じ時間軸で表される、このオーディオが再生される時刻です。

1.12.2. `AudioProcessingEventInit`

dictionary AudioProcessingEventInit : EventInit {
   required double playbackTime;
   required AudioBuffer inputBuffer;
   required AudioBuffer outputBuffer;
 };

1.12.2.1. ディクショナリー `AudioProcessingEventInit` メンバー

inputBuffer, AudioBuffer 型: イベントの inputBuffer 属性に割り当てられる値です。
outputBuffer, AudioBuffer 型: イベントの outputBuffer 属性に割り当てられる値です。
playbackTime, double 型: イベントの playbackTime 属性に割り当てられる値です。

1.13. `BiquadFilterNode` インターフェース

BiquadFilterNode は、よくある低次フィルターを実装した AudioNode です。

低次フィルターは基本的なトーンコントロール (バス、ミドル、トレブル) やグラフィックイコライザーやより高度なフィルターを構成するブロックです。複数の BiquadFilterNode フィルターを組み合わせてより複雑なフィルターを作る事もできます。フィルターのパラメーターの frequency などを時間と共に変化させてフィルタースイープやその他の効果を得る事もできます。それぞれの BiquadFilterNode は下の IDL で紹介する様々な一般的なフィルターの型のうちの 1 つに設定する事ができます。デフォルトのフィルターの型は "lowpass" です。

frequency と detune は複合パラメーターで、どちらも a-rate パラメーターです。これらは computedFrequency の値を決定するために一緒に使用されます:

computedFrequency(t) = frequency(t) * pow(2, detune(t) / 1200)

この複合パラメーターの公称範囲は [ 0 , Nyquist frequency ] です。

プロパティ	値	説明
`numberOfInputs`	1
`numberOfOutputs`	1
`channelCount`	2
`channelCountMode`	"`max`"
`channelInterpretation`	"`speakers`"
tail-time	Yes	入力がゼロでも無音ではない出力を出し続けます。これは IIR フィルターのため、フィルターの処理はゼロではない入力を永遠に生成しますが、実際には、出力が十分にゼロに近くなる有限時間に制限されます。実際の時間はフィルターの係数に依存します。

出力のチャンネル数は常に入力のチャンネル数と同じになります。

enum BiquadFilterType {
   "lowpass",
   "highpass",
   "bandpass",
   "lowshelf",
   "highshelf",
   "peaking",
   "notch",
   "allpass"
 };

列挙値の説明
"`lowpass`"	ローパスフィルターはカットオフ周波数より低い周波数をそのまま通し、カットオフよりも高い周波数を減衰させます。これは標準的な2次のレゾナントローパスフィルターの実装で、12dB / オクターブのロールオフを持ちます。 frequency カットオフ周波数です。 Q カットオフ周波数にどれだけピークを付けて共振させるかを制御します。大きな値はより強く共振させます。 gain このフィルターのタイプでは使用しません。
"`highpass`"	ハイパスフィルターはローパスフィルターの反対の機能を持ちます。カットオフ周波数よりも高い周波数をそのまま通し、カットオフよりも低い周波数を減衰させます。これは標準的な2次レゾナントハイパスフィルターの実装で、12dB / オクターブのロールオフを持ちます。 frequency これより低い周波数を減衰させるカットオフ周波数です。 Q カットオフ周波数にどれだけピークを付けて共振させるかを制御します。大きな値はより強く共振させます。 gain このフィルターのタイプでは使用しません。
"`bandpass`"	バンドパスフィルターはある範囲の周波数をそのまま通し、この周波数範囲より下および上の周波数を減衰させます。これは 2 次のバンドパスフィルターを実装しています。 frequency 周波数範囲の中心周波数です。 Q 周波数範囲の幅を制御します。この幅は Q の値が増加すると狭くなります。 gain このフィルターのタイプでは使用しません。
"`lowshelf`"	ローシェルフフィルターはすべての周波数を通しますが、低い周波数だけを増幅 ( または減衰 ) させます。これは2次のローシェルフフィルターを実装しています。 frequency 増幅 ( または減衰 ) させる上限の周波数です。 Q このフィルターのタイプでは使用しません。 gain dB で表した増幅率です。もしこの値が負ならばその周波数は減衰されます。
"`highshelf`"	ハイシェルフフィルターはローシェルフフィルターとは反対に、すべての周波数を通しますが高い周波数だけを増幅します。これは2次のハイシェルフフィルターを実装しています。 frequency 増幅 ( または減衰 ) させる下限の周波数です。 The lower limit of the frequences where the boost (or attenuation) is applied. Q このフィルターのタイプでは使用しません。 gain dB で表した増幅率です。もしこの値が負ならばその周波数は減衰されます。
"`peaking`"	ピーキングフィルターはすべての周波数を通しますが、ある周波数の範囲だけが増幅 ( または減衰 ) されます。 frequency 増幅される中心の周波数です。 Q 増幅される周波数の幅を制御します。値が大きいと幅は狭くなります。 gain dB で表した増幅率です。もしこの値が負ならばその周波数は減衰されます。
"`notch`"	ノッチフィルター ( バンドストップまたはバンドリジェクション・フィルターとも呼ばれます ) は、バンドパスフィルターの逆の機能です。ある周波数を除くすべての周波数を通します。 frequency ノッチを適用する中心の周波数です。 Q 減衰させる周波数の幅を制御します。大きな値は幅が狭い事を意味します。 gain このフィルターのタイプでは使用しません。
"`allpass`"	オールパスフィルターはすべての周波数を通しますが、周波数の変化に対して位相が変化します。これは2次のオールパスフィルターを実装しています。 frequency 位相変化が発生する中心の周波数です。別の見方では群遅延が最大になる周波数です。 Q 中心周波数での位相変化がどれくらい急峻であるかを制御します。値が大きいと、より急峻な位相変化で大きな群遅延である事を意味します。 gain このフィルターのタイプでは使用しません。

BiquadFilterNode の属性はすべて a-rate の AudioParam です。

[Exposed=Window]
 interface BiquadFilterNode : AudioNode {
   constructor (BaseAudioContext context, optional BiquadFilterOptions options = {});
   attribute BiquadFilterType type;
   readonly attribute AudioParam frequency;
   readonly attribute AudioParam detune;
   readonly attribute AudioParam Q;
   readonly attribute AudioParam gain;
   void getFrequencyResponse (Float32Array frequencyHz,
                              Float32Array magResponse,
                              Float32Array phaseResponse);
 };

1.13.1. コンストラクター

BiquadFilterNode(context, options)

BiquadFilterNode.constructor(context, options) メソッドの引数。
パラメーター	型	Null可	省略可	説明
`context`	BaseAudioContext	✘	✘	この新しい `BiquadFilterNode` が関連付けられる `BaseAudioContext` です。
`options`	BiquadFilterOptions	✘	✔	この `BiquadFilterNode` のオプションの初期パラメーター値です。

1.13.2. 属性

Q, AudioParam 型, readonly

フィルターの Q ファクターです。

lowpass および highpass フィルターの場合、Q 値は dB 単位であると解釈されます。これらのフィルターの公称範囲は \([-Q_{lim}, Q_{lim}]\) となり、ここで \(Q_{lim}\) は \(10^{Q/20}\) がオーバーフローしない最大の値です。これは約 \(770.63678\) となります。

bandpass、notch、allpass、peaking フィルターの場合、この値はリニア値です。この値はフィルターの帯域幅に関連しているため、正の値でなければなりません。公称範囲は \([0, 3.4028235e38]\) で、上限は最も正の単精度浮動小数点値です。

これは lowshelf、highshelf フィルターでは使用されません。

パラメーター	値	説明
`defaultValue`	1
`minValue`	最も負の単精度浮動小数点値	約 -3.4028235e38 ですが、さまざまなフィルターでの実際の制限については上記を参照してください。
`maxValue`	最も正の単精度浮動小数点値	約 3.4028235e38 ですが、さまざまなフィルターでの実際の制限については上記を参照してください。
`automationRate`	"`a-rate`"

detune, AudioParam 型, readonly

周波数のデチューン値で単位はセントです。これは frequency と組み合わされて複合パラメーターとなり、computedFrequency を決定します。

パラメーター	値	説明
`defaultValue`	0
`minValue`	\(\approx -153600\)
`maxValue`	\(\approx 153600\)	この値は約 \(1200\ \log_2 \mathrm{FLT\_MAX}\) であり、ここで FLT_MAX は最も大きな `float` の値です。
`automationRate`	"`a-rate`"

frequency, AudioParam 型, readonly

Hz であらわした BiquadFilterNode が働く周波数です。これは detune と組み合わされて複合パラメーターとなり computedFrequency を決定します。

パラメーター	値	説明
`defaultValue`	350
`minValue`	0
`maxValue`	ナイキスト周波数
`automationRate`	"`a-rate`"

gain, AudioParam 型, readonly

フィルターのゲインで、単位は dB です。ゲインは lowshelf、highshelf、peaking 型のフィルターでのみ使用されます。

Parameter	Value	Notes
`defaultValue`	0
`minValue`	最も負の単精度浮動小数点値	約 -3.4028235e38
`maxValue`	\(\approx 1541\)	この値は約 \(40\ \log_{10} \mathrm{FLT\_MAX}\) で、ここで FLT_MAX は最も大きな `float` の値です。
`automationRate`	"`a-rate`"

type, BiquadFilterType 型

この BiquadFilterNode のタイプです。デフォルトの値は "lowpass" です。type 属性の値によって他のパラメーターの正確な意味が変わってきます。

1.13.3. メソッド

getFrequencyResponse(frequencyHz, magResponse, phaseResponse)

フィルターの各パラメーターの現在の値 [[current value]] に基づいて、指定の周波数に対する周波数応答を同期的に計算します。 3つの引数は、同じ長さの Float32Array である必要があります。そうでない場合、InvalidAccessError を発生します ( MUST ) 。

返される周波数応答は、現在の処理ブロックに対してサンプリングされた AudioParam を使用して計算されなくてはなりません ( MUST )。

BiquadFilterNode.getFrequencyResponse() メソッドの引数。
パラメーター	型	Null可	省略可	説明
`frequencyHz`	Float32Array	✘	✘	このパラメーターは応答特性を計算する周波数の配列を Hz で指定します。
`magResponse`	Float32Array	✘	✘	このパラメーターは振幅特性のリニアな値を受け取る配列を指定します。もし `frequencyHz` パラメーターが [0, sampleRate/2] の範囲にない場合 (ここで `sampleRate` は `AudioContext` の `sampleRate` 属性の値です)、対応する `magResponse` 配列の同じインデックスには `NaN` が格納されなくてはなりません ( MUST )。
`phaseResponse`	Float32Array	✘	✘	このパラメーターは、位相応答の値をラジアンで受け取る出力配列を指定します。もし `frequencyHz` パラメータの値が [0; sampleRate / 2] の範囲にない場合 (ここで `sampleRate` は `AudioContext` の `sampleRate` 属性の値です)、対応する `phaseResponse` 配列の同じインデックスには `NaN` が格納されなくてはなりません ( MUST )。

戻り値: void

1.13.4. `BiquadFilterOptions`

これは BiquadFilterNode を作成するときに使用されるオプションを指定します。すべてのメンバーはオプションです。指定されていない場合は、通常のデフォルト値を使用してノードが作成されます。

dictionary BiquadFilterOptions : AudioNodeOptions {
   BiquadFilterType type = "lowpass";
   float Q = 1;
   float detune = 0;
   float frequency = 350;
   float gain = 0;
 };

1.13.4.1. ディクショナリー `BiquadFilterOptions` メンバー

Q, float 型, デフォルトは 1: Q の初期値として要求する値です。
detune, float 型, デフォルトは 0: detune の初期値として要求する値です。
frequency, float 型, デフォルトは 350: frequency の初期値として要求する値です。
gain, float 型, デフォルトは 0: gain の初期値として要求する値です。
type, BiquadFilterType 型, デフォルトは "lowpass": フィルターの type の初期値として要求する値です。

1.13.5. フィルター特性

BiquadFilterNode であるタイプのフィルターを実装する方法は複数あり、それぞれが非常に様々な特性を持っています。このセクションの式はフィルターのタイプごとの特性を決定するもので、「準拠した実装」が実装しなければならないフィルターについて記述しています。これらの式は Audio EQ Cookbook で見られる式を基にしています。

BiquadFilterNode のオーディオ処理の伝達関数は

$$
  H(z) = \frac{\frac{b_0}{a_0} + \frac{b_1}{a_0}z^{-1} + \frac{b_2}{a_0}z^{-2}}
                                           {1+\frac{a_1}{a_0}z^{-1}+\frac{a_2}{a_0}z^{-2}}
 $$

これは時間領域での次の式と等価です:

$$
 a_0 y(n) + a_1 y(n-1) + a_2 y(n-2) =
   b_0 x(n) + b_1 x(n-1) + b_2 x(n-2)
 $$

フィルターの初期状態は 0 です。

注 : 固定状態のフィルターは安定していますが、AudioParam のオートメーションを使って不安定なバイクワッドフィルターを作る事も可能です。これを管理するのは開発者の責任になります。

注 : UAは、フィルター状態に NaN 値が発生したことをユーザーに通知する警告を生成する場合があります。これは通常、フィルターが不安定である事を示しています。

上記の伝達関数内の係数はそれぞれのノードのタイプによって異なります。BiquadFilterNode の AudioParam の computedValue を基として次の中間変数が計算のために必要になります。

\(F_s\) をこの AudioContext の sampleRate 属性の値とします。
\(f_0\) を computedFrequency の値とします。
\(G\) を gain AudioParam の値とします。
\(Q\) を Q AudioParam の値とします。

これらより

$$
 \begin{align*}
   A &= 10^{\frac{G}{40}} \\
   \omega_0 &= 2\pi\frac{f_0}{F_s} \\
   \alpha_Q &= \frac{\sin\omega_0}{2Q} \\
   \alpha_{Q_{dB}} &= \frac{\sin\omega_0}{2 \cdot 10^{Q/20}} \\
   S &= 1 \\
   \alpha_S &= \frac{\sin\omega_0}{2}\sqrt{\left(A+\frac{1}{A}\right)\left(\frac{1}{S}-1\right)+2}
 \end{align*}
 $$

各フィルタータイプに対応する 6 つの係数 (\(b_0, b_1, b_2, a_0, a_1, a_2\)) は:

"lowpass"

$$
   \begin{align*}
     b_0 &= \frac{1 - \cos\omega_0}{2} \\
     b_1 &= 1 - \cos\omega_0 \\
     b_2 &= \frac{1 - \cos\omega_0}{2} \\
     a_0 &= 1 + \alpha_{Q_{dB}} \\
     a_1 &= -2 \cos\omega_0 \\
     a_2 &= 1 - \alpha_{Q_{dB}}
   \end{align*}
 $$

"highpass"

$$
   \begin{align*}
     b_0 &= \frac{1 + \cos\omega_0}{2} \\
     b_1 &= -(1 + \cos\omega_0) \\
     b_2 &= \frac{1 + \cos\omega_0}{2} \\
     a_0 &= 1 + \alpha_{Q_{dB}} \\
     a_1 &= -2 \cos\omega_0 \\
     a_2 &= 1 - \alpha_{Q_{dB}}
   \end{align*}
 $$

"bandpass"

$$
   \begin{align*}
     b_0 &= \alpha_Q \\
     b_1 &= 0 \\
     b_2 &= -\alpha_Q \\
     a_0 &= 1 + \alpha_Q \\
     a_1 &= -2 \cos\omega_0 \\
     a_2 &= 1 - \alpha_Q
   \end{align*}
 $$

"notch"

$$
   \begin{align*}
     b_0 &= 1 \\
     b_1 &= -2\cos\omega_0 \\
     b_2 &= 1 \\
     a_0 &= 1 + \alpha_Q \\
     a_1 &= -2 \cos\omega_0 \\
     a_2 &= 1 - \alpha_Q
   \end{align*}
 $$

"allpass"

$$
   \begin{align*}
     b_0 &= 1 - \alpha_Q \\
     b_1 &= -2\cos\omega_0 \\
     b_2 &= 1 + \alpha_Q \\
     a_0 &= 1 + \alpha_Q \\
     a_1 &= -2 \cos\omega_0 \\
     a_2 &= 1 - \alpha_Q
   \end{align*}
 $$

"peaking"

$$
   \begin{align*}
     b_0 &= 1 + \alpha_Q\, A \\
     b_1 &= -2\cos\omega_0 \\
     b_2 &= 1 - \alpha_Q\,A \\
     a_0 &= 1 + \frac{\alpha_Q}{A} \\
     a_1 &= -2 \cos\omega_0 \\
     a_2 &= 1 - \frac{\alpha_Q}{A}
   \end{align*}
 $$

"lowshelf"

$$
   \begin{align*}
     b_0 &= A \left[ (A+1) - (A-1) \cos\omega_0 + 2 \alpha_S \sqrt{A})\right] \\
     b_1 &= 2 A \left[ (A-1) - (A+1) \cos\omega_0 )\right] \\
     b_2 &= A \left[ (A+1) - (A-1) \cos\omega_0 - 2 \alpha_S \sqrt{A}) \right] \\
     a_0 &= (A+1) + (A-1) \cos\omega_0 + 2 \alpha_S \sqrt{A} \\
     a_1 &= -2 \left[ (A-1) + (A+1) \cos\omega_0\right] \\
     a_2 &= (A+1) + (A-1) \cos\omega_0 - 2 \alpha_S \sqrt{A})
   \end{align*}
 $$

"highshelf"

$$
   \begin{align*}
     b_0 &= A\left[ (A+1) + (A-1)\cos\omega_0 + 2\alpha_S\sqrt{A} )\right] \\
     b_1 &= -2A\left[ (A-1) + (A+1)\cos\omega_0 )\right] \\
     b_2 &= A\left[ (A+1) + (A-1)\cos\omega_0 - 2\alpha_S\sqrt{A} )\right] \\
     a_0 &= (A+1) - (A-1)\cos\omega_0 + 2\alpha_S\sqrt{A} \\
     a_1 &= 2\left[ (A-1) - (A+1)\cos\omega_0\right] \\
     a_2 &= (A+1) - (A-1)\cos\omega_0 - 2\alpha_S\sqrt{A}
   \end{align*}
 $$

1.14. `ChannelMergerNode` インターフェース

ChannelMergerNode は高度なアプリケーションで、ChannelSplitterNode と組み合わせて使われます。

プロパティ	値	説明
`numberOfInputs`	説明を参照してください。	デフォルトは 6 ですが、`ChannelMergerOptions`、`numberOfInputs`、または `createChannelMerger` で指定された値によって決まります。
`numberOfOutputs`	1
`channelCount`	1	channelCount の制約があります。
`channelCountMode`	"`explicit`"	channelCountMode の制約があります。
`channelInterpretation`	"`speakers`"
tail-time	No

このインターフェースは複数のオーディオストリームからチャンネルを結合して 1 つのオーディオストリームにする AudioNode を表します。これは可変数の入力 (デフォルトは 6 ) の入力を持ちますが、すべての入力を接続する必要はありません。出力は 1 つでそのオーディオストリームは、入力が全てアクティブに処理されていれば、接続された入力の数と同じ数のチャンネル数を持ちます。

複数の入力を 1 つの出力にまとめるとき、それぞれの入力は指定されたミキシングルールによって 1 チャンネル ( モノラル ) にダウンミックスされます。接続されていない入力も 1 チャンネルの無音 としてカウントされて出力されます。入力ストリームを変える事は出力のチャンネルの順序に 影響しません。

例えば、デフォルトの ChannelMergerNode に 2 つのステレオ入力を接続したとき、結合される前に 1 番目と 2 番目の入力はそれぞれモノラルにダウンミックスされます。出力は 6 チャンネルのストリームで最初の 2 チャンネルが 2 つの (ダウンミックスされた) 入力に割り当てられ、残りのチャンネルは無音になります。

また、ChannelMergerNode は複数のオーディオストリームを例えば 5.1 サラウンドシステムのような決まった順序のマルチチャンネルスピーカー配列に合わせて並べるのに使用する事ができます。マージャーは ( 左、右等のような ) チャンネルの識別を行わず、単純に入力された順序でチャンネルを組み合わせます。

[Exposed=Window]
 interface ChannelMergerNode : AudioNode {
   constructor (BaseAudioContext context, optional ChannelMergerOptions options = {});
 };

1.14.1. コンストラクター

ChannelMergerNode(context, options)

ChannelMergerNode.constructor(context, options) メソッドの引数。
パラメーター	型	Null可	省略可	説明
`context`	BaseAudioContext	✘	✘	この新しい `ChannelMergerNode` が関連付けられる `BaseAudioContext` です。
`options`	ChannelMergerOptions	✘	✔	この `ChannelMergerNode` のオプションの初期パラメーター値です。

1.14.2. `ChannelMergerOptions`

dictionary ChannelMergerOptions : AudioNodeOptions {
   unsigned long numberOfInputs = 6;
 };

1.14.2.1. ディクショナリー `ChannelMergerOptions` メンバー

numberOfInputs, unsigned long 型, デフォルトは 6: ChannelMergerNode の入力の数です。この値に対する制約については、createChannelMerger() を参照してください。

1.15. `ChannelSplitterNode` インターフェース

ChannelSplitterNode は高度なアプリケーションで、ChannelMergerNode と組み合わせて使われます。

プロパティ	値	説明
`numberOfInputs`	1
`numberOfOutputs`	説明を参照してください。	デフォルトは 6 ですが、それ以外に `ChannelSplitterOptions.numberOfOutputs` または `createChannelSplitter` または、`コンストラクター` の `ChannelSplitterOptions` ディレクトリの `numberOfOutputs` メンバーで指定された値から決定されます。
`channelCount`	`numberOfOutputs`	channelCount の制約があります。
`channelCountMode`	"`explicit`"	channelCountMode の制約があります。
`channelInterpretation`	"`discrete`"	channelInterpretation の制約があります。
tail-time	No

このインターフェースはルーティンググラフ中のオーディオストリームの個別のチャンネルにアクセスする AudioNode を表しています。これは 1 つの入力と入力のオーディオストリームのチャンネル数と同じ数の "アクティブ" な出力を持ちます。例えば、ステレオの入力ストリームが ChannelSplitterNode に接続された場合、アクティブな出力は 2 ( 1 つは左チャンネルから、もう 1 つは右チャンネルから ) になります。常に合計 N 個の出力 ( AudioContext の createChannelSplitter() の numberOfOutputs パラメーター ( 訳注:またはコンストラクターのオプション ) で決まります ) があり、この値が渡されない場合のデフォルトの数は 6 になります。"アクティブ" でないすべての出力は無音を出力し、通常はどこにも接続されません。

この例ではスプリッターはチャンネルの ( 例えば左チャンネル、右チャンネルなどの ) 識別はせず、単純に入力チャンネルの順序に従って出力チャンネルを分割する事に注意してください。

ChannelSplitterNode を使うアプリケーションの 1 つに、個別のチャンネルそれぞれのゲインの制御を必要とする "マトリックス・ミキシング" を行うものがあります。

[Exposed=Window]
 interface ChannelSplitterNode : AudioNode {
   constructor (BaseAudioContext context, optional ChannelSplitterOptions options = {});
 };

1.15.1. コンストラクター

ChannelSplitterNode(context, options)

ChannelSplitterNode.constructor(context, options) メソッドの引数。
パラメーター	型	Null可	省略可	説明
`context`	BaseAudioContext	✘	✘	この新しい `ChannelSplitterNode` が関連付けられる `BaseAudioContext` です。
`options`	ChannelSplitterOptions	✘	✔	この `ChannelSplitterNode` のオプションの初期パラメーター値です。

1.15.2. `ChannelSplitterOptions`

dictionary ChannelSplitterOptions : AudioNodeOptions {
   unsigned long numberOfOutputs = 6;
 };

1.15.2.1. ディクショナリー `ChannelSplitterOptions` メンバー

numberOfOutputs, unsigned long 型, デフォルトは 6: ChannelSplitterNode の出力の数です。この値の制約については、createChannelSplitter() を参照してください。

1.16. `ConstantSourceNode` インターフェース

このインターフェースは、名目上一定の値を出力するオーディオソースを表します。これは、一般的な定数ソースノードとして便利で、offset をオートメーションするか、別のノードを接続することで、生成可能な AudioParam であるかのように使用できます。

このノードの出力は 1 つだけで、1 チャンネル ( モノラル ) で構成されます。

プロパティ	値	説明
`numberOfInputs`	0
`numberOfOutputs`	1
`channelCount`	2
`channelCountMode`	"`max`"
`channelInterpretation`	"`speakers`"
tail-time	No

[Exposed=Window]
 interface ConstantSourceNode : AudioScheduledSourceNode {
   constructor (BaseAudioContext context, optional ConstantSourceOptions options = {});
   readonly attribute AudioParam offset;
 };

1.16.1. コンストラクター

ConstantSourceNode(context, options)

ConstantSourceNode.constructor(context, options) メソッドの引数。
パラメーター	型	Null可	省略可	説明
`context`	BaseAudioContext	✘	✘	この新しい `ConstantSourceNode` が関連付けられる `BaseAudioContext` です。
`options`	ConstantSourceOptions	✘	✔	この `ConstantSourceNode のオプションの初期パラメーター値です。`

1.16.2. 属性

offset, AudioParam 型, readonly

ソースとなる定数です。

パラメーター	値	説明
`defaultValue`	1
`minValue`	最も負の単精度浮動小数点値	約 -3.4028235e38
`maxValue`	最も正の単精度浮動小数点値	約 3.4028235e38
`automationRate`	"`a-rate`"

1.16.3. `ConstantSourceOptions`

ConstantSourceNode を生成するオプションを指定します。すべてのメンバーはオプションです。指定されていない場合、通常のデフォルトがノードの生成に使用されます。

dictionary ConstantSourceOptions {
   float offset = 1;
 };

1.16.3.1. ディクショナリー `ConstantSourceOptions` メンバー

offset, float 型, デフォルトは 1: このノードの offset AudioParam の初期値です。

1.17. `ConvolverNode` インターフェース

このインターフェースはインパルスレスポンスに従って線形コンボリューションエフェクトを適用する処理ノードを表します。

プロパティ	値	説明
`numberOfInputs`	1
`numberOfOutputs`	1
`channelCount`	2	channelCount の制限があります。
`channelCountMode`	"`clamped-max`"	channelCountMode の制限があります。
`channelInterpretation`	"`speakers`"
tail-time	Yes	入力が無くても `buffer` の長さだけ、無音でない音声を出力し続けます。

このノードの入力はモノラル (1 チャンネル) またはステレオ (2 チャンネル) であり増やす事はできません。より多いチャンネル数のノードからの接続は、適宜ダウンミックスされます。

このノードには、channelCount の制約および channelCountchannelCountMode の制約があります。これらの制約は、ノードへの入力がモノラルかステレオかを確実にします。

[Exposed=Window]
 interface ConvolverNode : AudioNode {
   constructor (BaseAudioContext context, optional ConvolverOptions options = {});
   attribute AudioBuffer? buffer;
   attribute boolean normalize;
 };

1.17.1. コンストラクター

ConvolverNode(context, options)

コンストラクターが BaseAudioContext context とオプションオブジェクト options と共に呼び出された場合、次の手順を実行します:

属性 normalize を disableNormalization の値の逆に設定します。
バッファ が存在する場合は、buffer 属性をその値に設定します。

注 :これは、バッファが normalize 属性の値に従って正規化されることを意味します。
o を新しい AudioNodeOptions ディクショナリーとします。
もし options に channelCount が存在している場合は o の channelCount を同じ値に設定します。
もし options に channelCountMode が存在している場合は o の channelCountMode を同じ値に設定します。
もし options に channelInterpretation が存在している場合は o の channelInterpretation を同じ値に設定します。
c、o を使って AudioNode this を初期化します。

ConvolverNode.constructor(context, options) メソッドの引数。
パラメーター	型	Null可	省略可	説明
`context`	BaseAudioContext	✘	✘	この新しい `ConvolverNode` が関連付けられる `BaseAudioContext` です。
`options`	ConvolverOptions	✘	✔	この `ConvolverNode` のオプションの初期パラメーター値です。

1.17.2. 属性

buffer, AudioBuffer 可, nullable: この属性が設定された時点で、buffer と normalize 属性の状態を使って、このインパルス応答の指定の正規化がされた ConvolverNode が構成されます。この属性の初期値は null です。

buffer 属性を設定する際には、以下の手順を同期的に実行します:

バッファの チャンネル数 が 1、2、4 のどれかでない、あるいはバッファの サンプルレート が関連付けられた BaseAudioContext の サンプルレート と同じでない場合 NotSupportedError を発生します ( MUST )。
AudioBuffer の内容を取得します。

注 : buffer に新しいバッファを設定する際、オーディオにグリッジが発生します。もしこれが望ましくない場合、置き換え用の新規の ConvolverNode を作成して両者の間でクロスフェードさせる事が推奨されます。

注 : ConvolverNode は、入力が 1 チャンネルで、かつ buffer が 1 チャンネルの場合にのみ、モノラル出力を生成します。それ以外のすべてのケースで、出力はステレオになります。特に buffer が 4 チャンネルであり、2 チャンネルの入力がある場合、ConvolverNode は "true" ステレオマトリックスの畳み込みを実行します。基準となる情報については、チャンネル構成図を参照してください。

normalize, boolean 型

buffer 属性がセットされたときに、バッファのインパルス応答を equal-power による正規化でスケーリングするかどうかを制御します。様々なインパルス応答を読み込んだ場合に、Convolver が、より均一な出力レベルを出せるように、デフォルト値は true になっています。もし normalize が false に設定されている場合、畳み込みはインパルス応答の前処理/スケーリングなしでレンダリングされます。この値を変更した場合、もう一度 buffer 属性を設定するまで有効になりません。

buffer 属性が設定されたときに normalize 属性が false である場合、ConvolverNode は、buffer 内に保持されているインパルス応答そのままに、線形畳み込みを実行します。

そうでなく、もし、buffer 属性が設定されたときに normalize 属性が true である場合、ConvolverNode は、まず、buffer 内のオーディオデータのスケーリングされた RMS パワー解析を実行して、以下のアルゴリズムにより normalizationScale を計算します:

function calculateNormalizationScale(buffer) {  const GainCalibration = 0.00125;  const GainCalibrationSampleRate = 44100;  const MinPower = 0.000125;  // Normalize by RMS power.  const numberOfChannels = buffer.numberOfChannels;  const length = buffer.length;  let power = 0;  for (let i = 0; i < numberOfChannels; i++) {    let channelPower = 0;    const channelData = buffer.getChannelData(i);    for (let j = 0; j < length; j++) {      const sample = channelData[j];      channelPower += sample * sample;    }    power += channelPower;  }  power = Math.sqrt(power / (numberOfChannels * length));  // Protect against accidental overload.  if (!isFinite(power) || isNaN(power) || power < MinPower)    power = MinPower;  let scale = 1 / power;  // Calibrate to make perceived volume same as unprocessed.  scale *= GainCalibration;  // Scale depends on sample-rate.  if (buffer.sampleRate)    scale *= GainCalibrationSampleRate / buffer.sampleRate;  // True-stereo compensation.  if (numberOfChannels == 4)    scale *= 0.5;  return scale;}

処理の際には、ConvolverNode はこの計算された normalizationScale の値を使い、入力と ( buffer で表される ) インパルス応答との線形畳み込みの結果に乗算して最終的な出力を得ます。または、入力に対して事前に normalizationScale を乗算したり、インパルス応答に normalizationScale を事前に乗算したバージョンを作成しておくなど、数学的に同等の演算を使用してもかまいません。

1.17.3. `ConvolverOptions`

ConvolverNode を作成する際のオプションを指定します。すべてのメンバーはオプションです。指定されていない場合、ノードは通常のデフォルトを使用して作成します。

dictionary ConvolverOptions : AudioNodeOptions {
   AudioBuffer? buffer;
   boolean disableNormalization = false;
 };

1.17.3.1. ディクショナリー `ConvolverOptions` メンバー

buffer, AudioBuffer 可, nullable: ConvolverNode に要求するバッファ。このバッファは、 disableNormalization の値に従って正規化されます。
disableNormalization, boolean 型, デフォルトは false: ConvolverNode の normalize 属性として要求する初期値とは逆の値です。

1.17.4. 入力、インパルスレスポンス、出力のチャンネル構成

実装は 1 または 2 チャンネルの入力に対する様々なリバーブエフェクトを実現するために次のような ConvolverNode のインパルスレスポンスのチャンネル構成をサポートしなくてはなりません ( MUST )。

下の図に示すように、単一チャンネルのコンポリューションはモノラルオーディオ入力に対してモノラルインパルスレスポンスを使用してモノラル出力を得ます。残りの図は、入力チャンネル数が 1 または 2 のモノラルまたはステレオの再生で buffer のチャンネル数が 1、2、4 の場合を示しています。開発者がより複雑な任意のマトリックスを必要とするなら ChannelSplitterNode と複数の単一チャンネルの ConvolverNode および ChannelMergerNode を使用して構成する事もできます。

もしこのノードがアクティブに処理をしていない場合は出力は 1 チャンネルの無音になります。

注 : 下の図はアクティブに処理をしている時を示しています。

reverb matrixing — `ConvolverNode` を使用する際にサポートされる入出力チャンネル数

1.18. `DelayNode` インターフェース

ディレイ機能はオーディオアプリケーションの基本的な構成要素です。このインターフェースは単一の入力と単一の出力を持つ AudioNode です。

プロパティ	値	説明
`numberOfInputs`	1
`numberOfOutputs`	1
`channelCount`	2
`channelCountMode`	"`max`"
`channelInterpretation`	"`speakers`"
tail-time	Yes	最大で、ノードの `maxDelayTime` まで、入力がゼロでも無音ではないオーディオを出力し続けます。

出力のチャンネル数は、常に入力のチャンネル数と同じになります。

これは入力されるオーディオ信号を一定の量だけ遅延させます。具体的には各時刻 t において、入力信号 input(t) に対して、遅延時間 delayTime(t)、出力信号 output(t) とすると出力は output(t) = input(t - delayTime(t)) となります。デフォルトの delayTime は 0 秒 (遅延なし)です。

DelayNode の入力のチャンネル数を変えたとき (つまり出力チャンネル数もまた変化します)、ノードからまだ出力されておらず内部状態にあるサンプルが残っているかも知れません。すべての内部のディレイ機能のミキシングは単一のチャンネルレイアウトで動作しているため、もしこのような変更前の異なるチャンネル数のサンプルを受け取った場合、それらは新しく受け取られた入力と結合される前にアップミックスまたはダウンミックスされなくてはなりません ( MUST )。

注 : 定義により、DelayNode は、遅延の量に等しいオーディオ処理レイテンシーをもたらします。

[Exposed=Window]
 interface DelayNode : AudioNode {
   constructor (BaseAudioContext context, optional DelayOptions options = {});
   readonly attribute AudioParam delayTime;
 };

1.18.1. コンストラクター

DelayNode(context, options)

コンストラクターが BaseAudioContext c とオプションオブジェクト option を指定して呼び出される場合、ユーザーエージェントは引数の context と options を使ってAudioNode this を初期化しなくてはなりません ( MUST )。

DelayNode.constructor(context, options) メソッドの引数。
パラメーター	型	Null可	省略可	説明
`context`	BaseAudioContext	✘	✘	この新しい `DelayNode` が関連付けられる `BaseAudioContext` です。
`options`	DelayOptions	✘	✔	この `DelayNode` のオプションの初期パラメーター値です。

1.18.2. 属性

delayTime, AudioParam 型, readonly

適用する遅延 ( 単位は秒 ) の量を表す AudioParam オブジェクトです。デフォルトの value は 0 ( 遅延なし ) です。最小の値は 0 で最大の値は AudioContext の createDelay() メソッドの引数 maxDelayTime またはコンストラクタの DelayOptions の maxDelayTime メンバーで決定されます。

もし DelayNode が循環の一部である場合、delayTime 属性の最小値は 1 レンダリング量子にクランプされます。

パラメーター	値	説明
`defaultValue`	0
`minValue`	0
`maxValue`	`maxDelayTime`
`automationRate`	"`a-rate`"

1.18.3. `DelayOptions`

これは、DelayNode を生成するオプションを指定します。すべてのメンバーはオプションです。指定されていない場合、ノードは通常のデフォルトを使用して生成されます。

dictionary DelayOptions : AudioNodeOptions {
   double maxDelayTime = 1;
   double delayTime = 0;
 };

1.18.3.1. ディクショナリー `DelayOptions` メンバー

delayTime, double 型, デフォルトは 0: ノードの遅延時間の初期値です。
maxDelayTime, double 型, デフォルトは 1: ノードの最大遅延時間です。制約については createDelay(maxDelayTime) を参照してください。

1.18.4. 処理

DelayNode は delayTime 秒のオーディオを保持する内部バッファを持っています。

DelayNode の処理は、遅延ラインへの書き込みと遅延ラインからの読み取りの2つの部分に分かれています。これは 2 つの内部的な AudioNode を介して行われます（開発者が使用するものではなく、ノードの内部動作の説明を簡単にするためのものです）。これらはどちらも DelayNode によって作成されます。

DelayNode の DelayWriter を作成するということは、AudioNode と同じインターフェースを持ち、DelayNode の内部バッファに入力オーディオを書き込むオブジェクトを作成することを意味します。基となる DelayNode と同じ入力の接続を持ちます。

DelayNode の DelayReader を作成するということは、AudioNode と同じインターフェースを持ち、DelayNode の内部バッファからオーディオデータを読み取ることができるオブジェクトを作成することを意味します。基となる DelayNode と同じ AudioNode に接続されます。 DelayReader はソースノードです。

入力バッファを処理するとき、DelayWriter はオーディオを DelayNode の内部バッファに書き込まなくてはなりません ( MUST )。

出力バッファを生成するとき、DelayReader は対応する DelayWriter delayTime 秒前に書き込まれたオーディオを正確に生成しなくてはなりません ( MUST )。

注 :これは、チャンネル数の変更は遅延時間が経過した後に反映されることを意味します。

1.19. `DynamicsCompressorNode` インターフェース

DynamicsCompressorNode は、ダイナミクスコンプレッション効果を実装した AudioNode です。

ダイナミクス・コンプレッションは音楽制作やゲーム・オーディオで非常に良く使用されます。これは信号の音量が大きな部分を抑え、音量が小さな部分を持ち上げます。全体として、より大きく、豊かで隙間のない音を作る事ができます。これは特に、多くの個別サウンドを同時に再生するゲームと音楽アプリケーションで、全体の信号レベルを制御してスピーカーへの出力のクリッピング ( 歪み ) を避けるために重要です。

プロパティ	値	説明
`numberOfInputs`	1
`numberOfOutputs`	1
`channelCount`	2	channelCount の制約があります。
`channelCountMode`	"`clamped-max`"	channelCountMode の制約があります。
`channelInterpretation`	"`speakers`"
tail-time	Yes	このノードはルックアヘッド遅延のため、ノードへの入力がゼロでも無音ではないオーディオを出力し続けるテールタイムを持っています。

[Exposed=Window]
 interface DynamicsCompressorNode : AudioNode {
   constructor (BaseAudioContext context,
                optional DynamicsCompressorOptions options = {});
   readonly attribute AudioParam threshold;
   readonly attribute AudioParam knee;
   readonly attribute AudioParam ratio;
   readonly attribute float reduction;
   readonly attribute AudioParam attack;
   readonly attribute AudioParam release;
 };

1.19.1. コンストラクター

DynamicsCompressorNode(context, options)

[[internal reduction]] を、デシベル単位の浮動小数点数を保持する this の内部スロットとします。 [[internal reduction]] を 0.0 に設定します。

ADynamicsCompressorNode.constructor(context, options) メソッドの引数。
パラメーター	型	Null可	省略可	説明
`context`	BaseAudioContext	✘	✘	この新しい `DynamicsCompressorNode` が関連付けられる `BaseAudioContext` です。
`options`	DynamicsCompressorOptions	✘	✔	この `DynamicsCompressorNode` のオプションの初期パラメーター値です。

1.19.2. 属性

attack, AudioParam 型, readonly

ゲインを 10dB 下げるために必要な時間 ( 単位は秒 ) です。

パラメーター	値	説明
`defaultValue`	.003
`minValue`	0
`maxValue`	1
`automationRate`	"`k-rate`"	オートメーション速度の制限があります。

knee, AudioParam 型, readonly

スレッショルドより上の一定の範囲を表すデシベル値で、この範囲で "ratio" に曲線で滑らかに移行します。

パラメーター	値	説明
`defaultValue`	30
`minValue`	0
`maxValue`	40
`automationRate`	"`k-rate`"	オートメーション速度の制限があります。

ratio, AudioParam 型, readonly

出力が 1dB 変化する事に対する入力の dB 変化量です。

パラメーター	値	説明
`defaultValue`	12
`minValue`	1
`maxValue`	20
`automationRate`	"`k-rate`"	オートメーション速度の制限があります。

reduction, float 型, readonly

メーター表示のための読み取り専用のデシベル値であり、コンプレッサーが現在信号に適用しているゲインリダクションの量を表します。信号が入力されていない場合、値は 0 ( ゲイン減少なし ) になります。この属性が読み取られると、内部スロット [[internal reduction]] の値を返します。

release, AudioParam 型, readonly

ゲインを 10dB 上げるために必要な時間 ( 単位は秒 ) です。

パラメーター	値	説明
`defaultValue`	.25
`minValue`	0
`maxValue`	1
`automationRate`	"`k-rate`"	オートメーション速度の制限があります。

threshold, AudioParam 型, readonly

この値以上でコンプレッションを開始する dB 値です。

パラメーター	値	説明
`defaultValue`	-24
`minValue`	-100
`maxValue`	0
`automationRate`	"`k-rate`"	オートメーション速度の制限があります。

1.19.3. `DynamicsCompressorOptions`

これは、code class="idl">DynamicsCompressorNode の生成に使用するオプションを指定します。すべてのメンバーはオプションです。指定されていない場合、通常のデフォルトがノードの生成に使用されます。

dictionary DynamicsCompressorOptions : AudioNodeOptions {
   float attack = 0.003;
   float knee = 30;
   float ratio = 12;
   float release = 0.25;
   float threshold = -24;
 };

1.19.3.1. ディクショナリー `DynamicsCompressorOptions` メンバー

attack, float 型, デフォルトは 0.003: attack AudioParam の初期値です。
knee, float 型, デフォルトは 30: knee AudioParam の初期値です。
ratio, float 型, デフォルトは 12: ratio AudioParam の初期値です。
release, float 型, デフォルトは 0.25: release AudioParam の初期値です。
threshold, float 型, デフォルトは -24: threshold AudioParam の初期値です。

1.19.4. 処理

ダイナミクスコンプレッションはさまざまな方法で実装できますが、DynamicsCompressorNode は、次の特性を持つダイナミクスプロセッサを実装しています:

固定長の先読みを行います ( これは、DynamicsCompressorNode が信号チェーンに固定のレイテンシーを追加することを意味します )。
アタック速度、リリース速度、スレッショルド、ニー特性、およびレシオを設定可能とします。
サイドチェインはサポートされません。
ゲインリダクションは、DynamicsCompressorNode の reduction プロパティを介してレポートされます。
コンプレッションカーブは 3 つの部分からなります:
- 最初のパートは入力と同一です : \(f(x) = x\)
- 二番目のパートはソフトニー部分で、単調増加関数でなくてはなりません ( MUST )。
- 三番目のパートは線形関数です : \(f(x) = \frac{1}{ratio} \cdot x \)
この曲線は、入力レベルに基づいて連続的かつ区分的に微分可能であり、目標とする出力レベルに対応したものでなければなりません ( MUST )。

この曲線を図示すると次のようになります:

Graphical representation of a compression curve — スレッショルドとニー部分 ( ソフトまたはハード ) を含む典型的な圧縮カーブ

内部的には、DynamicsCompressorNode は、他の AudioNode とゲイン低減値を計算するための特別なアルゴリズムの組み合わせで記述されています。

下の AudioNode グラフが内部で使用されています。input と output はそれぞれ、AudioNode の入力と出力、context はこの DynamicsCompressorNode の BaseAudioContext コンテキスト、そして AudioNode のように動作する特殊オブジェクトをインスタンス化する新しいクラス EnvelopeFollower です:

const delay = new DelayNode(context, {delayTime: 0.006});
const gain = new GainNode(context);
const compression = new EnvelopeFollower();
 
input.connect(delay).connect(gain).connect(output);
input.connect(compression).connect(gain.gain);

Schema of the internal graph used by the DynamicCompressorNode — `DynamicsCompressorNode` 処理アルゴリズムの一部として使用される内部 `AudioNode` の図

注 : これはプリディレイとゲインリダクションの適用について実装しています。

以下のアルゴリズムは、ゲイン低減値を生成するために入力信号に適用されるエンベロープフォロワーオブジェクトによって実行される処理を記述しています。エンベロープフォロワーには、浮動小数点値を保持する 2 つのスロットがあります。これらの値は、このアルゴリズムの呼び出し間で維持されます。

[[detector average]] を浮動小数点の値とし、0.0 に初期化します。
[[compressor gain]] を浮動小数点の値とし、1.0 に初期化します。

以下のアルゴリズムにより、オーディオのレンダリング量子の入力の各サンプルについて、reduction gain の値を決定することができます。

attack と release は、それぞれ処理時に ( k-rate パラメーターとして ) サンプリングされた attack と release の値に、この DynamicsCompressorNode が関連付けられている BaseAudioContext のサンプルレートを乗算されています。
ディテクター平均 をスロット [[detector average]] の値とします。
コンプレッサーゲイン をスロット [[compressor gain]] の値とします。
処理されるレンダリング量子の各サンプル input ごとに、以下の手順を実行します:
1. input の絶対値が 0.0001 未満の場合は、減衰率は 1.0 です。そうでない場合、shaped input を input の絶対値に圧縮カーブを適用した値とし、減衰率 は shaped input を input の絶対値で割った値とします。
2. 減衰率 が コンプレッサーゲイン よりも大きい場合は、リリース状態 を true とし、それ以外の場合は false とします。
3. デテクターカーブを 減衰率 に適用した結果を デテクター率 とします。
4. デテクター平均 を 減衰率 から減算し、その結果に デテクター率 を掛けます。そしてこの新しい結果を デテクター平均 に加えます。
5. デテクター平均 は最大 1.0 にクランプされます。
6. エンベロープ速度 は、attack と release の値に基づいてエンベロープ速度の計算を行った結果とします。
7. もし、リリース状態 が true である場合、コンプレッサーゲイン を コンプレッサーゲイン に エンベロープ速度 を乗じた値に設定し、最大 1.0 にクランプします。
8. そうでなく、リリース状態 が false の場合、ゲイン増分 を デテクター平均 から コンプレッサーゲイン を引いたものにします。ゲイン増分 に エンベロープ速度を掛け、その結果を コンプレッサーゲイン に加算します。
9. コンプレッサーゲイン にメイクアップゲインの計算の戻り値を掛けて、リダクションゲインを計算します。
10. メーターゲイン は リダクションゲイン をデシベルに変換したものとします。
[[compressor gain]] を コンプレッサーゲイン に設定します。
[[detector average]] を デテクター平均 に設定します。
内部スロット [[internal reduction]] を メーターゲイン の値にアトミックに設定します。

注 : この手順は、ブロックの処理ごとに一度、処理の最後にメーターゲインを更新します。

メイクアップゲインは、コンプレッサーのレシオ、ニー、およびスレッショルドパラメーターにのみ依存する固定された増幅ステージで入力信号には依存しません。この目的は、コンプレッサーの出力レベルを入力レベルと同程度に高めることです。

メイクアップゲインの計算は以下の手順の実行を意味します :

フルレンジゲイン は、値 1.0 に圧縮カーブを適用することによって返される値とします。
フルレンジメイクアップゲインはフルレンジゲインの逆数とします。
フルレンジメイクアップゲイン の 0.6 乗の結果を返します。

エンベロープ速度の計算は、コンプレッサーゲイン と デテクター平均 の比に関数を適用することによって行われます。ユーザーエージェントは、エンベロープ関数の形状を選択することができます。ただし、この関数は次の制約を遵守しなければなりません ( MUST )。

エンベロープ速度は、コンプレッサーゲイン と デテクター平均 の比から計算しなければなりません ( MUST )。

注 : アタックのときには、この数値は 1 以下で、リリースのときにはこの数値は 1 よりも大きくなります。
アタックの曲線は \([0, 1]\) の範囲で連続した単調増加関数でなければなりません ( MUST )。この曲線の形は attack によって制御される場合もあります ( MAY )。
リリースの曲線は、常に 1 より大きい連続的で単調減少関数でなければなりません ( MUST )。この曲線の形状は、release によって制御される場合もあります ( MAY )。

この処理は、コンプレッサーゲイン と デテクター平均 の比に関数を適用して計算された値を返します。

アタックまたはリリース時の変化率に detector curve を適用すると、適応型リリース の実装が可能になります。関数は次の制約を守らなければなりません ( MUST )：

関数の出力は \([0,1]\) の範囲でなくてはなりません ( MUST )。
関数は連続で単調増加でなくてはなりません ( MUST )。

注 : 例えば 適用型リリース を実行して、リリースが速くてコンプレッションが遅いコンプレッサー、あるいは、アタックとリリースのカーブの形状が同じではないコンプレッサーも許されます。

値に圧縮カーブを適用するとは、サンプルが関数に渡され、計算された値が返される事を意味します。この関数は次の特性を持たなくてはなりません ( MUST ):

threshold および knee は、threshold および knee の値をそれぞれ、このブロックの処理時に ( k-rate パラメーターとして ) サンプリングされリニア値に変換したものとします。
ratio は、このブロックの処理時に (k-rate パラメーターとして ) サンプリングされた ratio の値とします。
この関数は、threshold の値までは直線的で同一 ( すなわち、\(f(x) = x\) ) です。
threshold から threshold + knee までは、ユーザーエージェントは曲線の形状を選択できます。関数全体は単調増加し続けなければなりません ( MUST )。

注 : knee が 0 の場合、DynamicsCompressorNode はハードニーコンプレッサーと呼ばれます。
この関数は、threshold とソフトニーの後の ratio に基づく直線の関数 ( すなわち、\(f(x) = \frac{1}{ratio} \cdot x \) ) となります。

リニアゲインの値 \(v\) からデシベルへの変換は、以下の手順の実行を意味します:

もし \(v\) が 0 ならば -1000 を返します。
そうでなければ、 \( 20 \, \log_{10}{v} \) を返します。

デシベルからリニアゲインへの変換は、値 \(v\) に対して \(10^{v/20}\) を返す事を意味します。

1.20. `GainNode` インターフェース

オーディオ信号のゲインを変える事はオーディオアプリケーションでは基本的な処理です。このインターフェースは 1 つの信号入力と 1 つの信号出力を持つ AudioNode です:

プロパティ	値	説明
`numberOfInputs`	1
`numberOfOutputs`	1
`channelCount`	2
`channelCountMode`	"`max`"
`channelInterpretation`	"`speakers`"
tail-time	No

GainNode の入力データの各チャンネルの各サンプルは gain AudioParam の computedValue が乗じられます ( MUST )。

[Exposed=Window]
 interface GainNode : AudioNode {
   constructor (BaseAudioContext context, optional GainOptions options = {});
   readonly attribute AudioParam gain;
 };

1.20.1. コンストラクター

GainNode(context, options)

GainNode.constructor(context, options) メソッドの引数。
パラメーター	型	Null可	省略可	説明
`context`	BaseAudioContext	✘	✘	この新しい `GainNode` が関連付けられる `BaseAudioContext` です。
`options`	GainOptions	✘	✔	この `GainNode` のオプションの初期パラメーター値です。

1.20.2. 属性

gain, AudioParam 型, readonly

適用される増幅度の大きさを表します。

パラメーター	値	説明
`defaultValue`	1
`minValue`	最も負の単精度浮動小数点値	約 -3.4028235e38
`maxValue`	最も正の単精度浮動小数点値	約 3.4028235e38
`automationRate`	"`a-rate`"

1.20.3. `GainOptions`

これは、GainNode の作成に使用するオプションを指定します。すべてのメンバーはオプションです。指定されていない場合は、通常のデフォルトがノードの作成に使用されます。

dictionary GainOptions : AudioNodeOptions {
   float gain = 1.0;
 };

1.20.3.1. ディクショナリー `GainOptions` メンバー

gain, float 型, デフォルトは 1.0: gain AudioParam の初期値です。

1.21. `IIRFilterNode` インターフェース

IIRFilterNode は汎用の IIR フィルターを実装した AudioNode です。一般的には高次のフィルターについては次のような理由で BiquadFilterNode を利用するのが最善です:

一般的に数値的な問題に関して敏感ではありません
フィルターのパラメーターがオートメーションできます
すべての偶数次 IIR フィルターの作成に使用できます

しかしながら奇数次フィルターは作成できず、もしそのようなフィルターが必要でオートメーションが不要ならば IIR フィルターが適切かもしれません。

一度作成された後、IIR フィルターの係数は変更する事ができません。

プロパティ	値	説明
`numberOfInputs`	1
`numberOfOutputs`	1
`channelCount`	2
`channelCountMode`	"`max`"
`channelInterpretation`	"`speakers`"
tail-time	Yes	ゼロの入力に対して非ゼロのオーディオを出力し続けます。これは IIR フィルターであるため、ゼロ以外の入力が永続的に生成されますが、実際には、出力が十分にゼロに近くなる有限時間に制限される可能性があります。実際の時間はフィルター係数に依存します。

出力のチャンネル数は常に入力のチャンネル数と同じになります。

[Exposed=Window]
 interface IIRFilterNode : AudioNode {
   constructor (BaseAudioContext context, IIRFilterOptions options);
   void getFrequencyResponse (Float32Array frequencyHz,
                              Float32Array magResponse,
                              Float32Array phaseResponse);
 };

1.21.1. コンストラクター

IIRFilterNode(context, options)

IIRFilterNode.constructor(context, options) メソッドの引数
パラメーター	型	Null可	省略可	説明
`context`	BaseAudioContext	✘	✘	この新しい `IIRFilterNode` が関連付けられる `BaseAudioContext` です。
`options`	IIRFilterOptions	✘	✘	この `IIRFilterNode` のオプションの初期パラメーター値です。

1.21.2. メソッド

getFrequencyResponse(frequencyHz, magResponse, phaseResponse)

与えられた現在のフィルターパラメーターの設定で、指定された周波数の周波数応答を同期的に計算します。 3 つのパラメーターは、同じ長さの Float32Array でなければならず ( MUST )、そうでなければ InvalidAccessError を発生します ( MUST )。

IIRFilterNode.getFrequencyResponse() メソッドの引数
パラメーター	型	Null可	省略可	説明
`frequencyHz`	Float32Array	✘	✘	このパラメーターは、応答を計算する周波数の配列を Hz で指定します。
`magResponse`	Float32Array	✘	✘	このパラメーターは、リニア振幅応答の出力結果を受け取る配列を指定します。もし `frequencyHz` パラメーターの値が [0, sampleRate / 2] の範囲にない場合 ( ここで `sampleRate` は `AudioContext` の `sampleRate` プロパティの値です )、`magResponse` 配列の同じインデックスの対応する値は `NaN` にならなくてはなりません ( MUST )。
`phaseResponse`	Float32Array	✘	✘	このパラメーターは、ラジアンで出力される位相応答値を受け取る配列を指定します。もし `frequencyHz` パラメーターの値が [0; sampleRate / 2] の範囲にない場合 ( ここで、`sampleRate` は `AudioContext` の `sampleRate` プロパティの値です )、`phaseResponse` 配列の同じインデックスの対応する値は `NaN` にならなくてはなりません ( MUST )。

戻り値 : void

1.21.3. IIRFilterOptions

IIRFilterOptions ディクショナリは、IIRFilterNode のフィルター係数を指定するために使用されます。

dictionary IIRFilterOptions : AudioNodeOptions {
   required sequence<double> feedforward;
   required sequence<double> feedback;
 };

1.21.3.1. ディクショナリー `IIRFilterOptions` メンバー

feedforward, sequence<double> 型: IIRFilterNode のフィードフォワード係数です。このメンバーは必須です。他の制約については、createIIRFilter() の feedforward 引数を参照してください。
feedback, sequence<double> 型: IIRFilterNode のフィードバック係数です。このメンバーは必須です。他の制約については、createIIRFilter() の feedback 引数を参照してください。

1.21.4. フィルターの定義

createIIRFilter() または コンストラクター の IIRFilterOptions ディクショナリで指定される フィードフォワード 係数を \(b_m\)フィードバック 係数を \(a_n\) とします。すると一般的な IIR フィルターの伝達関数は次のように与えられます。

$$
   H(z) = \frac{\sum_{m=0}^{M} b_m z^{-m}}{\sum_{n=0}^{N} a_n z^{-n}}
 $$

ここで \(M + 1\) は \(b\) 配列の長さ、\(N + 1\) は \(a\) 配列の長さです。係数 \(a_0\) は 0 であってはいけません ( MUST ) ( createIIRFilter() の フィードバックパラメーター を参照してください )。\(b_m\) の少なくとも 1 つは非 0 でなくてはなりません ( MUST ) ( createIIRFilter() の フィードフォワードパラメーター を参照してください ))。

同じように、時間領域の式については:

$$
   \sum_{k=0}^{N} a_k y(n-k) = \sum_{k=0}^{M} b_k x(n-k)
 $$

フィルターの初期状態は、オールゼロ状態です。

注 : UAは、フィルターの状態に NaN 値が発生したことをユーザーに通知する警告を出す場合があります。これは通常、不安定なフィルターを示しています。

1.22. `MediaElementAudioSourceNode` インターフェース

このインターフェースは audio または video 要素からの音声ソースを表します。

プロパティ	値	説明
`numberOfInputs`	0
`numberOfOutputs`	1
tail-time reference	No

出力のチャンネル数は HTMLMediaElement で参照されるメディアのチャンネル数に対応します。そのため、メディア要素の src 属性を変更する事によって、このノードの出力のチャンネル数が変化します。

MediaElementAudioSourceNode は、AudioContext createMediaElementSource() メソッドまたは コンストラクター の MediaElementAudioSourceOptions ディクショナリーの mediaElement メンバーを使用して、HTMLMediaElement を指定して作成されます。

HTMLMediaElement は MediaElementAudioSourceNode が作成された後、オーディオが直接音として再生されなくなる代わりに MediaElementAudioSourceNode からルーティンググラフを通して再生されるようになる事を除けば、MediaElementAudioSourceNode を使わない場合と全く同じように振る舞わなくてはなりません ( MUST )。つまり、ポーズ、シーク、ボリューム、src 属性の変更、その他 HTMLMediaElement としての見掛けは MediaElementAudioSourceNode を使用していない場合と同様に通常どおり働かなくてはなりません ( MUST )。

const mediaElement = document.getElementById('mediaElementID');
 const sourceNode = context.createMediaElementSource(mediaElement);
 sourceNode.connect(filterNode);

[Exposed=Window]
 interface MediaElementAudioSourceNode : AudioNode {
   constructor (AudioContext context, MediaElementAudioSourceOptions options);
   [SameObject] readonly attribute HTMLMediaElement mediaElement;
 };

1.22.1. コンストラクター

MediaElementAudioSourceNode(context, options)

AudioNode this を context と options を引数として初期化します。

MediaElementAudioSourceNode.constructor(context, options) メソッドの引数
パラメーター	型	Null可	省略可	説明
`context`	AudioContext	✘	✘	この新しい `MediaElementAudioSourceNode` が関連付けられる `AudioContext` です。
`options`	MediaElementAudioSourceOptions	✘	✘	この `MediaElementAudioSourceNode` の初期パラメーター値です。

1.22.2. 属性

mediaElement, HTMLMediaElement 型, readonly: この MediaElementAudioSourceNode を生成する際に使用される HTMLMediaElement です。

1.22.3. `MediaElementAudioSourceOptions`

MediaElementAudioSourceNode を生成する際のオプションを指定するために使用されます。

dictionary MediaElementAudioSourceOptions {
   required HTMLMediaElement mediaElement;
 };

1.22.3.1. ディクショナリー `MediaElementAudioSourceOptions` メンバー

mediaElement, HTMLMediaElement 型: 再ルーティングされるメディアエレメントです。この指定は必須です ( MUST )。

1.22.4. MediaElementAudioSourceNode とクロスオリジン・リソースに関するセキュリティ

HTMLMediaElement はクロスオリジン・リソースの再生が可能です。Web Audio はリソースの内容の検査が、( 例えば、MediaElementAudioSourceNode や AudioWorkletNode や ScriptProcessorNode を使ってサンプルを読む事で ) 可能なので、もしある origin からのスクリプトが別の origin からのリソースの内容を検査する事で情報の漏洩が起こり得ます。

これを防ぐため、MediaElementAudioSourceNode は、もしその HTMLMediaElement がフェッチアルゴリズム [FETCH] の実行により CORS-cross-origin とラベルが付けられている場合、通常の HTMLMediaElement の出力の代わりに無音を出力しなくてはなりません ( MUST )。

1.23. `MediaStreamAudioDestinationNode` インターフェース

このインターフェースは kind が "audio" の 1 つの MediaStreamTrack を持つ MediaStream を表すオーディオの出力地点となります。この MediaStream は、ノードが作成された時点で作られ、stream 属性を通じてアクセスする事ができます。このストリームは、getUserMedia() によって得られた MediaStream と同様の方法で使う事ができ、例えば、RTCPeerConnection ( [webrtc] で説明されています ) の addStream() メソッドを使って、リモートピアに送る事ができます。

プロパティ	値	説明
`numberOfInputs`	1
`numberOfOutputs`	0
`channelCount`	2
`channelCountMode`	"`explicit`"
`channelInterpretation`	"`speakers`"
tail-time	No

入力のチャンネル数はデフォルトで 2 (ステレオ)です。

[Exposed=Window]
 interface MediaStreamAudioDestinationNode : AudioNode {
   constructor (AudioContext context, optional AudioNodeOptions options = {});
   readonly attribute MediaStream stream;
 };

1.23.1. コンストラクター

MediaStreamAudioDestinationNode(context, options)

context と options を引数として AudioNode this を初期化します。

MediaStreamAudioDestinationNode.constructor(context, options) メソッドの引数
パラメーター	型	Null可	省略可	説明
`context`	AudioContext	✘	✘	この新しい `MediaStreamAudioDestinationNode` が関連付けられる `BaseAudioContext` です。
`options`	AudioNodeOptions	✘	✔	この `MediaStreamAudioDestinationNode` のオプションの初期パラメーター値です。

1.23.2. 属性

stream, MediaStream 型, readonly: ノード自身と同じチャンネル数の 1 つの MediaStreamTrack を持つ MediaStream で、その kind 属性は "audio" です。

1.24. `MediaStreamAudioSourceNode` インターフェース

このインターフェースは、MediaStream からのオーディオソースを表します。

プロパティ	値	説明
`numberOfInputs`	0
`numberOfOutputs`	1
tail-time reference	No

出力のチャンネル数は、MediaStreamTrack のチャンネル数に対応します。 MediaStreamTrack が終了すると、この AudioNode の出力は 1 チャンネルの無音となります。

[Exposed=Window]
 interface MediaStreamAudioSourceNode : AudioNode {
   constructor (AudioContext context, MediaStreamAudioSourceOptions options);
   [SameObject] readonly attribute MediaStream mediaStream;
 };

1.24.1. コンストラクター

MediaStreamAudioSourceNode(context, options)

options の mediaStream メンバーが、kind 属性の値が "audio" である MediaStreamTrack が少なくとも 1 つある MediaStream を参照していない場合は、InvalidStateError をスローし、これらの手順を中止します。そうでない場合は、このストリームを inputStream とします。
tracks を kind が "audio" の MediaStreamTrack 全てのリストとします。
tracks 内の要素を id 属性の code unit 値を基にソートします。
AudioNode this を context と options を使って初期化　します。
この MediaStreamAudioSourceNode の内部スロット [[input track]] を tracks の最初の要素とします。これがこの MediaStreamAudioSourceNode の入力オーディオとして使用されるトラックになります。

構築後に、コンストラクターに渡された MediaStream に変更を加えても、この AudioNode の出力に影響を与えません。

スロット[[input track]] は、MediaStreamTrack への参照を維持するためにのみ使用されます。

注 : これは、MediaStreamAudioSourceNode のコンストラクターによって選択されたトラックをこのコンストラクターに渡された MediaStream から削除しても、MediaStreamAudioSourceNode は同じトラックから入力を取得し続けることを意味します。

注 : 歴史的な理由により、出力するトラックをどのように選択するかは任意です。代わりに MediaStreamTrackAudioSourceNode を使用すると、入力として使用するトラックを明示的に選択できます。

MediaStreamAudioSourceNode.constructor(context, options) メソッドの引数
パラメーター	型	Null可	省略可	説明
`context`	AudioContext	✘	✘	この新しい `MediaStreamAudioSourceNode` が関連付けられる `AudioContext` です。
`options`	MediaStreamAudioSourceOptions	✘	✘	この `MediaStreamAudioSourceNode` の初期パラメーター値です。

1.24.2. 属性

mediaStream, MediaStream 型, readonly: この MediaStreamAudioSourceNode を構築するときに使用される MediaStream です。

1.24.3. `MediaStreamAudioSourceOptions`

MediaStreamAudioSourceNode を構築するためのオプションを指定します。

dictionary MediaStreamAudioSourceOptions {
   required MediaStream mediaStream;
 };

1.24.3.1. ディクショナリー `MediaStreamAudioSourceOptions` メンバー

mediaStream, MediaStream 型: ソースとなるメディアストリームです。これは必須になります ( MUST )。

1.25. `MediaStreamTrackAudioSourceNode` インターフェース

このインターフェースは MediaStreamTrack からの音源を表します。

プロパティ	値	説明
`numberOfInputs`	0
`numberOfOutputs`	1
tail-time reference	No

出力のチャンネル数は MediaStreamTrack のチャンネル数に対応したものになります。

[Exposed=Window]
 interface MediaStreamTrackAudioSourceNode : AudioNode {
   constructor (AudioContext context, MediaStreamTrackAudioSourceOptions options);
 };

1.25.1. コンストラクター

MediaStreamTrackAudioSourceNode(context, options)

mediaStreamTrack の kind 属性が "audio" でない場合は、InvalidStateError を発生し、これらの手順を中止します。
context と options を引数として AudioNode this を初期化します。

MediaStreamTrackAudioSourceNode.constructor(context, options) メソッドの引数
パラメーター	型	Null可	省略可	説明
`context`	AudioContext	✘	✘	この新しい `MediaStreamTrackAudioSourceNode` が関連付けられる `AudioContext` です。
`options`	MediaStreamTrackAudioSourceOptions	✘	✘	この `MediaStreamTrackAudioSourceNode` の初期パラメーター値です。

1.25.2. `MediaStreamTrackAudioSourceOptions`

MediaStreamTrackAudioSourceNode を構築するためのオプションを指定します。これは必須になります。

dictionary MediaStreamTrackAudioSourceOptions {
   required MediaStreamTrack mediaStreamTrack;
 };

1.25.2.1. ディクショナリー `MediaStreamTrackAudioSourceOptions` メンバー

mediaStreamTrack, MediaStreamTrack 型: 音源となるメディアストリームトラックです。 >この MediaStreamTrack の kind 属性が "audio" InvalidStateError を発生します ( MUST )。

1.26. `OscillatorNode` インターフェース

OscillatorNode は周期的な波形を発生するオーディオソースを表しています。これは一般的に使われるいくつかの波形に設定する事ができます。さらにこれは PeriodicWave オブジェクトを使って任意の周期波形に設定する事が可能です。

オシレーターは音の合成において一般的な基本構成ブロックです。OscillatorNode は start() メソッドで指定された時刻に音の発生を開始します。

数学的に言えば、連続した時間の周期波形は周波数領域で考えた場合、非常に高い ( あるいは無限に高い ) 周波数情報を持つ事ができます。この波形があるサンプルレートの離散時間のデジタルオーディオ信号としてサンプリングされる場合、波形をデジタル化する前にナイキスト周波数よりも高い高周波数成分の除去 ( フィルターで取り除く事 ) を考慮しなくてはなりません ( MUST )。これを行わない場合、( ナイキスト周波数よりも ) 高い周波数の エイリアス がナイキスト周波数よりも低い周波数に鏡像として折り返されます。多くの場合、これは音として聴こえる好ましくないノイズを引き起こします。これはオーディオ DSP における基本的で良く知られている原理です。

このエイリアスを避けるため、実装に使う事のできるいくつかの実践的な手段があります。しかしこれらの手段によらず、理想的な離散時間のデジタルオーディオ信号は数学的には完全に定義されます。( CPU の負荷という意味で) 実装のコスト対、理想への忠実性というトレードオフが実装上の問題になります。

実装はこの理想を達成するためにいくらかの考慮をする事が期待されますが、ローエンドのハードウェアでは低品質ローコストな手段を考慮する事も合理的です。

frequency と detune はどちらも a-rate パラメーターで、複合パラメーターとなります。これらは computedOscFrequency の値を決定するために組み合わされて使用されます:

computedOscFrequency(t) = frequency(t) * pow(2, detune(t) / 1200)

OscillatorNode の各時刻での瞬間的な位相は、ノードの正確なスタート時刻において位相角をゼロとして、computedOscFrequency を時間で積分したものになります。 computedOscFrequency の公称範囲は [-ナイキスト周波数, ナイキスト周波数] となります。

プロパティ	値	説明
`numberOfInputs`	0
`numberOfOutputs`	1
`channelCount`	2
`channelCountMode`	"`max`"
`channelInterpretation`	"`speakers`"
tail-time	No

enum OscillatorType {
   "sine",
   "square",
   "sawtooth",
   "triangle",
   "custom"
 };

列挙値の説明
"`sine`"	サイン波
"`square`"	デューティ比 0.5 の矩形波
"`sawtooth`"	鋸歯状波
"`triangle`"	三角波
"`custom`"	カスタム周期波形

[Exposed=Window]
 interface OscillatorNode : AudioScheduledSourceNode {
   constructor (BaseAudioContext context, optional OscillatorOptions options = {});
   attribute OscillatorType type;
   readonly attribute AudioParam frequency;
   readonly attribute AudioParam detune;
   void setPeriodicWave (PeriodicWave periodicWave);
 };

1.26.1. コンストラクター

OscillatorNode(context, options)

コンストラクターが BaseAudioContext c とオプションオブジェクト option を指定して呼び出された時、ユーザーエージェントは引数の context と options を使って AudioNode this を初期化しなくてはなりません ( MUST )。

OscillatorNode.constructor(context, options) メソッドの引数
パラメーター	型	Null可	省略可	説明
`context`	BaseAudioContext	✘	✘	この新しい `OscillatorNode` が関連付けられる `BaseAudioContext` です
`options`	OscillatorOptions	✘	✔	この `OscillatorNode` の初期パラメーター値です。

1.26.2. 属性

detune, AudioParam 型, readonly

( セントで表される ) デチューン値で、これは frequency を与えられた量だけオフセットします。デフォルトの value は 0 です。このパラメーターは a-rate です。これは frequency と組み合わせて複合パラメーターとなり、computedOscFrequency を決定します。下の表で示される公称範囲により、このパラメータを使用して frequency を可能な周波数範囲全体にわたってデチューンすることができます。

パラメーター	値	説明
`defaultValue`	0
`minValue`	\(\approx -153600\)
`maxValue`	\(\approx 153600\)	この値は約 \(1200\ \log_2 \mathrm{FLT\_MAX}\) となります。ここで FLT_MAX は `float` の最大値です。
`automationRate`	"`a-rate`"

frequency, AudioParam 型, readonly

( Hz:ヘルツで表される ) 周期波形の周波数で、そのデフォルトの value は 440 です。このパラメーターは a-rate です。これは、detune と組み合わされて複合パラメーターとなり、computedOscFrequency を構成します。その公称範囲は [-ナイキスト周波数, ナイキスト周波数] です。

パラメーター	値	説明
`defaultValue`	440
`minValue`	-ナイキスト周波数
`maxValue`	ナイキスト周波数
`automationRate`	"`a-rate`"

type, OscillatorType 型

周期波形の形状です。"custom" 以外の波形の定数値は直接設定する事ができます。(訳注: "custom" を直接設定しようとすると ) InvalidStateError 例外を発生します ( MUST )。カスタム波形を設定するには setPeriodicWave() メソッドを使用する事ができ、それによってこの属性は "custom" に設定されます。デフォルト値は "sine" です。属性が設定されたとき、オシレーターの位相は保存されなくてはなりません ( MUST )。

1.26.3. メソッド

setPeriodicWave(periodicWave)

PeriodicWave で与えられる任意のカスタム周期波形を設定します。

OscillatorNode.setPeriodicWave() メソッドの引数
パラメーター	型	Null可	省略可	説明
`periodicWave`	PeriodicWave	✘	✘	オシレーターが使用するカスタム波形

戻り値: void

1.26.4. `OscillatorOptions`

これは、OscillatorNode を作成するときに使用されるオプションを指定します。すべてのメンバーはオプションです。指定されていない場合、通常のデフォルト値がオシレーターの作成に使用されます。

dictionary OscillatorOptions : AudioNodeOptions {
   OscillatorType type = "sine";
   float frequency = 440;
   float detune = 0;
   PeriodicWave periodicWave;
 };

1.26.4.1. ディクショナリー `OscillatorOptions` メンバー

detune, float 型, デフォルトは 0: OscillatorNode の detune の初期値です。
frequency, float 型, デフォルトは 440: OscillatorNode の frequency の初期値です。
periodicWave, PeriodicWave 型: OscillatorNode の PeriodicWave です。もしこれが指定されているならば、type に有効な値が設定されていても無視され、"custom" が指定されたように処理されます。
type, OscillatorType 型, デフォルトは "sine": 生成するオシレーターのタイプです。これが periodicWave を指定せずに "custom" に設定されている場合、InvalidStateError 例外を発生します ( MUST )。 periodicWave が指定されている場合、type に有効な値があっても無視され、"custom"　に設定されているかのように扱われます。

1.26.5. 基本波形の位相

様々なオシレーターのタイプのための理想的な数学的波形をここで定義します。概要としてはすべての波形は時間 0 のときに正の傾きを持つ奇関数として数学的に定義されます。実際にオシレーターで生成される波形はエイリアシングの影響を避けるため少し異なったものになります。

オシレーターは、適切なフーリエ級数で、disableNormalization を false に設定した PeriodicWave を使用してこれらの基本波形を作成した場合と同じ結果を生成しなくてはなりません ( MUST )。

"sine"

サイン波のオシレーター波形は:

$$
   x(t) = \sin t
 $$

"square"

矩形波のオシレーター波形は:

$$
   x(t) = \begin{cases}
          1 & \mbox{for } 0≤ t < \pi \\
          -1 & \mbox{for } -\pi < t < 0.
          \end{cases}
 $$

これは、波形が周期 \(2\pi\) の奇関数であることを利用して、すべての \(t\) に拡張されます。

"sawtooth"

鋸歯状波オシレーターの波形は上昇波形です:

$$
   x(t) = \frac{t}{\pi} \mbox{ for } -\pi < t ≤ \pi;
 $$

これは、波形が周期 \(2\pi\) の奇関数であることを利用して、すべての \(t\) に拡張されます。

"triangle"

三角波オシレーターの波形は:

$$
   x(t) = \begin{cases}
            \frac{2}{\pi} t & \mbox{for } 0 ≤ t ≤ \frac{\pi}{2} \\
            1-\frac{2}{\pi} \left(t-\frac{\pi}{2}\right) & \mbox{for }
            \frac{\pi}{2} < t ≤ \pi.
          \end{cases}
 $$

これは、波形が周期 \(2\pi\) の奇関数であることを利用して、すべての \(t\) に拡張されます。

1.27. `PannerNode` インターフェース

このインターフェースは、入力オーディオストリームを 3 次元空間に配置 / 空間化する処理ノードを表します。空間化は、BaseAudioContext の AudioListener ( listener 属性 ) に関連しています。

プロパティ	値	説明
`numberOfInputs`	1
`numberOfOutputs`	1
`channelCount`	2	channelCount の制約があります。
`channelCountMode`	"`clamped-max`"	channelCountMode の制約があります。
`channelInterpretation`	"`speakers`"
tail-time	Maybe	もし `panningModel` が "`HRTF`" に設定されている場合、ノードは頭部応答の固有の処理のために無音入力に対して非無音の出力を生成します。そうでなければ、テールタイム参照はありません。

このノードの入力は、モノラル ( 1 チャンネル ) またはステレオ ( 2 チャンネル ) のいずれかであり、増加させることはできません。より少ないまたは多いチャンネルを持つノードからの接続は、適切にアップミックスまたはダウンミックスされます。

もしノードがアクティブに処理されている場合、このノードの出力はステレオ ( 2 チャンネル ) に固定されており、変更する事はできません。もしノードがアクティブに処理されていない場合、出力は 1 チャンネルの無音となります。

PanningModelType 列挙値は 3D 空間でのオーディオの定位にどのアルゴリズムを使用するかを決定します。デフォルトは ""equalpower" です。

enum PanningModelType {
     "equalpower",
     "HRTF"
 };

列挙値の説明

"equalpower"

単純で効率的な空間音響アルゴリズムで、等価パワーによるパンニングを行います。

注 : このパンニングモデルを使用すると、このノードの出力を計算するために使用されるすべての AudioParam は a-rate になります。.

"HRTF"

より高品質な空間音響アルゴリズムで、人体を使ったインパルスレスポンス測定からのコンボリューション処理を使用します。このパンニング方法はステレオ出力にレンダリングされます。

注 : このパンニングモデルを使用すると、このノードの出力を計算するために使用されるすべての AudioParam は k-rate になります。

PannerNode の AudioParam の有効なオートメーション速度は panningModel と AudioParam の automationRate によって決まります。panningModel が "HRTF" の場合、有効なオートメーション速度は automationRate の設定とは無関係に "k-rate" になります。それ以外の場合、有効なオートメーション速度は automationRate の値になります。

DistanceModelType 列挙値は音源がリスナーから離れていったとき、音量を減衰させるためにどのアルゴリズムを使用するかを決定します。デフォルトは "inverse" です。

次のそれぞれの距離モデルの説明で、\(d\) はリスナーとパンナーの距離、\(d_{ref}\) は refDistance 属性の値、\(d_{max}\) は maxDistance 属性の値、\(f\) は rolloffFactor の値です。

enum DistanceModelType {
   "linear",
   "inverse",
   "exponential"
 };

列挙値の説明

"linear"

distanceGain を次のように計算する直線距離モデルです:

$$
   1 - f\ \frac{\max\left[\min\left(d, d’_{max}\right), d’_{ref}\right] - d’_{ref}}{d’_{max} - d’_{ref}}
 $$

ここで \(d’_{ref} = \min\left(d_{ref}, d_{max}\right)\) および \(d’_{max} = \max\left(d_{ref}, d_{max}\right)\) とします。 \(d’_{ref} = d’_{max}\) の場合、このリニアモデルが取る値は \(1-f\) になります。

\(d\) は\(\left[d’_{ref},\, d’_{max}\right]\) の範囲に制限される事に注意してください。

"inverse"

distanceGain を次のように計算する、距離の逆数モデルです:

$$
   \frac{d_{ref}}{d_{ref} + f\ \left[\max\left(d, d_{ref}\right) - d_{ref}\right]}
 $$

ここで、\(d\) は \(\left[d_{ref},\, \infty\right)\) の範囲に制限されます。もし \(d_{ref} = 0\) の場合、距離の逆数モデルの値は \(d\) と \(f\) の値とは無関係に 0 になります。

"exponential"

distanceGain を次のように計算する指数距離モデルです:

$$
   \left[\frac{\max\left(d, d_{ref}\right)}{d_{ref}}\right]^{-f}
 $$

ここで、\(d\) は \(\left[d_{ref},\, \infty\right)\) の範囲に制限されます。もし \(d_{ref} = 0\)の場合、指数距離モデルの値は \(d\) と \(f\) の値とは無関係に 0 になります。

[Exposed=Window]
 interface PannerNode : AudioNode {
   constructor (BaseAudioContext context, optional PannerOptions options = {});
   attribute PanningModelType panningModel;
   readonly attribute AudioParam positionX;
   readonly attribute AudioParam positionY;
   readonly attribute AudioParam positionZ;
   readonly attribute AudioParam orientationX;
   readonly attribute AudioParam orientationY;
   readonly attribute AudioParam orientationZ;
   attribute DistanceModelType distanceModel;
   attribute double refDistance;
   attribute double maxDistance;
   attribute double rolloffFactor;
   attribute double coneInnerAngle;
   attribute double coneOuterAngle;
   attribute double coneOuterGain;
   void setPosition (float x, float y, float z);
   void setOrientation (float x, float y, float z);
 };

1.27.1. コンストラクター

PannerNode(context, options)

PannerNode.constructor(context, options) メソッドの引数
パラメーター	型	Null可	省略可	説明
`context`	BaseAudioContext	✘	✘	この新しい `PannerNode` が関連付けられる `BaseAudioContext` です。
`options`	PannerOptions	✘	✔	この `PannerNode` のオプションの初期パラメーター値です。

1.27.2. 属性

coneInnerAngle, double 型

音源の指向性パラメーターで、度で表す角度です。この角度の内部では音量減衰が生じません。デフォルトの値は 360 で、角度が [ 0, 360 ] の範囲外の場合の動作は未定義です。

coneOuterAngle, double 型

音源の指向性パラメーターで、度で表す角度です。この角度の外部では音量は coneOuterGain の一定値に減衰します。デフォルト値は 360 です。角度が [ 0, 360 ] の範囲外の場合の動作は未定義です。

coneOuterGain, double 型

音源の指向性パラメーターで、角度が coneOuterAngle の外側の場合の減衰率です。デフォルト値は 0 です。これは、( dB 値ではなく ) [ 0, 1 ] の範囲の線形値です。パラメーターがこの範囲外の場合は、InvalidStateError を発生します ( MUST )。

distanceModel, DistanceModelType 型

この PannerNode によって使用される距離モデルを指定します。デフォルトは "inverse" です。

maxDistance, double 型のイベント

音源とリスナーの間の最大距離で、これ以上距離が離れても音量はそれ以上減衰しません。デフォルト値は 10000 です。これが正の値に設定されていない場合、RangeError 例外を発生します ( MUST )。

orientationX, AudioParam 型, readonly

3D デカルト座標空間で音源が向いている方向のベクトルの \(x\) 成分を表します。

パラメーター	値	説明
`defaultValue`	1
`minValue`	最も負の単精度浮動小数点値	約 -3.4028235e38
`maxValue`	最も正の浮動小数点値	約 3.4028235e38
`automationRate`	"`a-rate`"	オートメーション速度の制約があります。

orientationY, AudioParam 型, readonly

3D デカルト座標空間で音源が向いている方向のベクトルの \(y\) 成分を表します。

パラメーター	値	説明
`defaultValue`	0
`minValue`	最も負の単精度浮動小数点値	約 -3.4028235e38
`maxValue`	最も正の単精度浮動小数点値	約 3.4028235e38
`automationRate`	"`a-rate`"	オートメーション速度の制約があります。

orientationZ, AudioParam 型, readonly

3D デカルト座標空間で音源が向いている方向のベクトルの \(z\) 成分を表します。

パラメーター	値	説明
`defaultValue`	0
`minValue`	最も負の単精度浮動小数点値	約 -3.4028235e38
`maxValue`	最も正の単精度浮動小数点値	約 3.4028235e38
`automationRate`	"`a-rate`"	オートメーション速度の制約があります。

panningModel, PanningModelType 型

この PannerNode で使用されるバンニングモデルを指定します。デフォルトは "equalpower" です。

positionX, AudioParam 型, readonly

3D デカルト座標空間で音源の位置の \(x\) 座標を表します。

パラメーター	値	説明
`defaultValue`	0
`minValue`	最も負の単精度浮動小数点値	約 -3.4028235e38
`maxValue`	最も正の単精度浮動小数点値	約 3.4028235e38
`automationRate`	"`a-rate`"	オートメーション速度の制約があります。

positionY, AudioParam 型, readonly

3D デカルト座標空間で音源の位置の \(y\) 座標を表します。

パラメーター	値	説明
`defaultValue`	0
`minValue`	最も負の単精度浮動小数点値	約 -3.4028235e38
`maxValue`	最も正の単精度浮動小数点値	約 3.4028235e38
`automationRate`	"`a-rate`"	オートメーション速度の制約があります。

positionZ, AudioParam 型, readonly

3D デカルト座標空間で音源の位置の \(z\) 座標を表します。

パラメーター	値	説明
`defaultValue`	0
`minValue`	最も負の単精度浮動小数点値	約 -3.4028235e38
`maxValue`	最も正の単精度浮動小数点値	約 3.4028235e38
`automationRate`	"`a-rate`"	オートメーション速度の制約があります。

refDistance, double 型

音源がリスナーから離れていったときの音量減衰の基準となる距離です。これより距離が短いと音量は減衰しません。デフォルトの値は 1 です。もしこの値を負の値に設定すると RangeError 例外を発生します ( MUST )。

rolloffFactor, double 型

音源がリスナーが離れていったときの音量減衰の速さを表します。デフォルトの値は 1 です。もしこの値が負の値の場合は RangeError 例外を発生します ( MUST )。

rolloffFactor の公称範囲は、rolloffFactor が持つことができる最小値と最大値です。値が範囲外の場合はこの範囲内におさまるようにクランプされます。公称範囲は、distanceModel によって以下のように依存します:

"linear": 公称範囲は \([0, 1]\) です。
"inverse": 公称範囲は \([0, \infty)\) です。
"exponential": 公称範囲は \([0, \infty)\) です。

1.27.3. メソッド

setOrientation(x, y, z)

このメソッドは非推奨 (DEPRECATED) です。これは orientationX.value、orientationY.value、および orientationZ.value 属性をそれぞれ x、y、z パラメーターで直接設定することと等価です。

したがって、このメソッドが呼び出された時点で orientationX、orientationY、および orientationZ の AudioParam のいずれかに setValueCurveAtTime() を使用してオートメーションカーブが設定されている場合は、NotSupportedError を発生します ( MUST )。

音源が 3D デカルト座標空間でどの方向を指しているかを指定します。( cone 属性によって制御される ) 音の指向性に応じて、リスナーから離れたところにある音は、非常に小さくなったり完全に無音になったりすることがあります。

x, y, z パラメーターは 3D 空間内での方向ベクトルを表します。

デフォルトの値は ( 1, 0, 0 ) です。

PannerNode.setOrientation() メソッドの引数
パラメーター	型	Null可	省略可
`x`	float	✘	✘
`y`	float	✘	✘
`z`	float	✘	✘

戻り値: void

setPosition(x, y, z)

このメソッドは非推奨 (DEPRECATED) です。これは positionX.value、positionY.value、positionZ.value 属性をそれぞれ x、y、z パラメーターで直接設定することと等価です。

したがって、positionX、positionY、および positionZ の AudioParam のいずれかに、このメソッドが呼び出された時点で setValueCurveAtTime() を使用してオートメーションカーブが設定されている場合は、NotSupportedError を発生します ( MUST )。

listener 属性を基準にして音源の位置を設定します。座標系は 3D デカルト座標系が使用されます。

x, y, z パラメーターは 3D 空間内の座標を表します。

デフォルトの値は (0, 0, 0) です。

PannerNode.setPosition() メソッドの引数
パラメーター	型	Null可	省略可
`x`	float	✘	✘
`y`	float	✘	✘
`z`	float	✘	✘

戻り値: void

1.27.4. `PannerOptions`

PannerNode を生成する際のオプションを指定します。すべてのメンバーはオプションです。指定されていない場合、通常のデフォルト値がノードの生成に使用されます。

dictionary PannerOptions : AudioNodeOptions {
   PanningModelType panningModel = "equalpower";
   DistanceModelType distanceModel = "inverse";
   float positionX = 0;
   float positionY = 0;
   float positionZ = 0;
   float orientationX = 1;
   float orientationY = 0;
   float orientationZ = 0;
   double refDistance = 1;
   double maxDistance = 10000;
   double rolloffFactor = 1;
   double coneInnerAngle = 360;
   double coneOuterAngle = 360;
   double coneOuterGain = 0;
 };

1.27.4.1. ディクショナリー `PannerOptions` メンバー

coneInnerAngle, double 型, デフォルトは 360: ノードの coneInnerAngle 属性の初期値です。
coneOuterAngle, double 型, デフォルトは 360: ノードの coneOuterAngle 属性の初期値です。
coneOuterGain, double 型, デフォルトは 0: ノードの coneOuterGain 属性の初期値です。
distanceModel, DistanceModelType 型, デフォルトは "inverse": ノードが使用する距離モデルです。
maxDistance, double 型, デフォルトは 10000: ノードの maxDistance 属性の初期値です。
orientationX, float 型, デフォルトは 1: orientationX AudioParam の \(x\) の初期値です。
orientationY, float 型, デフォルトは 0: orientationY AudioParam の \(y\) の初期値です。
orientationZ, float 型, デフォルトは 0: orientationZ AudioParam の \(z\) の初期値です。
panningModel, PanningModelType 型, デフォルトは "equalpower": ノードが使用するパンニングモデルです。
positionX, float 型, デフォルトは 0: positionX AudioParam が使用する \(x\) 座標の初期値です。
positionY, float 型, デフォルトは 0: positionY AudioParam が使用する \(y\) 座標の初期値です。
positionZ, float 型, デフォルトは 0: positionZ AudioParam が使用する \(z\) 座標の初期値です。
refDistance, double 型, デフォルトは 1: ノードの refDistance 属性の初期値です。
rolloffFactor, double 型, デフォルトは 1: ノードの rolloffFactor 属性の初期値です。

1.27.5. チャンネルの制限

StereoPannerNode のチャンネルの制限が、PannerNode にも適用されます。

1.28. `PeriodicWave` インターフェース

PeriodicWave は OscillatorNode で使用される任意の周期波形を表します。

拠した実装は少なくとも 8192 要素までの PeriodicWave をサポートしなければなりません ( MUST )。

A 準拠した実装は少なくとも 8192 要素までの PeriodicWave をサポートしなければなりません ( MUST )。

[Exposed=Window]
 interface PeriodicWave {
   constructor (BaseAudioContext context, optional PeriodicWaveOptions options = {});
 };

1.28.1. コンストラクター

PeriodicWave(context, options)

p を新しい PeriodicWave オブジェクトとします。[[real]] と [[imag]] を Float32Array 型の 2 つの内部スロット、そして [[normalize]] を内部スロットとします。
以下のケースのどれかに従って options を処理します:
1. もし options.real と options.imag の両方が存在していたら
  1. もし options.real と options.imag の長さが違う、あるいはもしどちらかの長さが 2 より小さい場合、IndexSizeError を発生し、このアルゴリズムを中止します。
  2. [[real]] と [[imag]] を options.real と同じ長さの配列とします。
  3. options.real から [[real]] に、options.imag から [[imag]] に全ての要素をコピーします。
2. もし options.real だけが存在する場合
  1. もし options.real の長さが 2 より小さい場合、IndexSizeError を発生し、このアルゴリズムを中止します。
  2. [[real]] と [[imag]] を options.real と同じ長さの配列にします。
  3. options.real を [[real]] にコピーし、[[imag]] を全て 0 にします。
3. もし options.imag だけが存在する場合
  1. もし options.imag の長さが 2 よりも小さい場合、IndexSizeError を発生してこのアルゴリズムを中止します。
  2. [[real]] と [[imag]] を options.imag と同じ長さの配列にします。
  3. options.imag を [[imag]] にコピーし、[[real]] を全て 0 にします。
4. それ以外の場合
  1. [[real]] と [[imag]] を長さ 2 の配列にし、0 で埋めます。
  2. [[imag]] のインデックス 1 を 1 にします。
  注 : OscillatorNode の PeriodicWave にこの設定をする事は組み込み型の "sine" を使う事と等価になります。
[[real]] と [[imag]] の両方のインデックス 0 の値を 0 にします。 ( これは DC 成分を 0 にします。)
[[normalize]] を PeriodicWaveOptions の PeriodicWaveConstraints の disableNormalization 属性の逆の値にします。
p を返します。

PeriodicWave.constructor(context, options) メソッドの引数
パラメーター	型	Null可	省略可	説明
`context`	BaseAudioContext	✘	✘	この新しい `PeriodicWave` に関連付けられる `BaseAudioContext` です。 `AudioBuffer` と異なり、 `PeriodicWave` は `AudioContext` または `OfflineAudioContext` をまたいで共有する事はできません。これは関連付けられる特別な `BaseAudioContext` になります。
`options`	PeriodicWaveOptions	✘	✔	この `PeriodicWave` のオプションの初期化バラメーター値です。

1.28.2. `PeriodicWaveConstraints`

PeriodicWaveConstraints ディクショナリは、波形の正規化を指定するために使用されます。

dictionary PeriodicWaveConstraints {
   boolean disableNormalization = false;
 };

1.28.2.1. ディクショナリー `PeriodicWaveConstraints` メンバー

disableNormalization, boolean 型, デフォルトは false: 周期波形が正規化されるかどうかを制御します。もし true の場合、波形は正規化されません。それ以外の場合、波形は正規化されます。

1.28.3. `PeriodicWaveOptions`

PeriodicWaveOptions ディクショナリは、波形の構成方法を指定するために使用されます。 real または imag のいずれかだけが指定されている場合、もう片方は、ディクショナリメンバーの説明で後述するように、同じ長さですべて 0 の配列であるかのように扱われます。どちらも指定されていない場合は、type が "sine" の OscillatorNode と等価な PeriodicWave が作成されなくてはなりません ( MUST )。両方を指定する場合、それらのシーケンスは同じ長さでなければなりません。そうでない場合は NotSupportedError 例外を発生します ( MUST )。

dictionary PeriodicWaveOptions : PeriodicWaveConstraints {
   sequence<float> real;
   sequence<float> imag;
 };

1.28.3.1. ディクショナリー `PeriodicWaveOptions` メンバー

imag, sequence<float> 型: imag パラメーターは sine 項の配列を表します。最初の要素 ( インデックス 0 ) はフーリエ級数には存在しません。2 番目の要素 ( インデックス 1 ) は基本周波数を表します。3 番目の要素は最初の倍音を表し、以下同様に続きます。
real, sequence<float> 型: real パラメーターは cosine 項の配列を表します。最初の要素 ( インデックス 0 ) は周期波形の DC オフセットです。 2 番目の要素 ( インデックス 1 ) は基本周波数を表します。3 番目の要素は最初の倍音を表し、以下同様に続きます。

1.28.4. 波形の生成

createPeriodicWave() メソッドは PeriodicWave のフーリエ係数を指定する２つの配列を引数とします。\(a\) と \(b\) をそれぞれ長さ \(L\) の [[real]] と [[imag]] の配列とします。そして時間領域の基本的な波形、\(x(t)\) は次のように計算されます:

$$
   x(t) = \sum_{k=1}^{L-1} \left[a[k]\cos2\pi k t + b[k]\sin2\pi k t\right]
 $$

これが基本的な (正規化されていない) 波形になります。

1.28.5. 波形の正規化

この PeriodicWave の内部スロット [[normalize]] が true ( デフォルト ) の場合、前のセクションで定義した波形は最大値が 1 になるように正規化されます。正規化は次のように行われます。

以下を求めます。

$$
   \tilde{x}(n) = \sum_{k=1}^{L-1} \left(a[k]\cos\frac{2\pi k n}{N} + b[k]\sin\frac{2\pi k n}{N}\right)
 $$

ここで、N は2の累乗です。( 注: \(\tilde{x}(n)\) は便宜上、逆 FFT を使用して計算されます ) 固定値の正規化係数 \(f\) は次のように計算されます:

$$
   f = \max_{n = 0, \ldots, N - 1} |\tilde{x}(n)|
 $$

結果、実際の正規化された波形 \(\hat{x}(n)\) は:

$$
   \hat{x}(n) = \frac{\tilde{x}(n)}{f}
 $$

この固定値の正規化係数は、すべての生成された波形に適用しなくてはなりません ( MUST )。

1.28.6. オシレーター係数

組み込み済みのオシレータータイプは PeriodicWave オブジェクトを使用して作られます。完全性のため、それぞれの組み込みオシレータータイプのための PeriodicWave の係数をここに定めます。これは、正規化を行わない組み込み型が欲しい場合に有用です。

次の記述において、\(a\) はcreatePeriodicWave() で使用するリアル係数の配列で \(b\) はイマジナリ係数の配列です。すべてのケースで波形は奇関数のため、すべての \(n\) に対して \(a[n] = 0\) となります。また、すべてのケースで \(b[0] = 0\) です。そのため、\(n \ge 1\) の \(b[n]\) だけが以下に規定されています。

"sine"

$$
   b[n] = \begin{cases}
            1 & \mbox{for } n = 1 \\
            0 & \mbox{otherwise}
          \end{cases}
 $$

"square"

$$
   b[n] = \frac{2}{n\pi}\left[1 - (-1)^n\right]
 $$

"sawtooth"

$$
   b[n] = (-1)^{n+1} \dfrac{2}{n\pi}
 $$

"triangle"

$$
   b[n] = \frac{8\sin\dfrac{n\pi}{2}}{(\pi n)^2}
 $$

1.29. `ScriptProcessorNode` インターフェース - DEPRECATED

このインターフェースは、スクリプトを使用して直接オーディオを生成、処理、または分析できる AudioNode です。このノードタイプは廃止予定で、AudioWorkletNode に置き換えられました。この文章は、実装がこのノードタイプを削除するまでの参考としてのみここに記載されています。

This interface is an AudioNode which can generate, process, or analyse audio directly using a script. This node type is deprecated, to be replaced by the AudioWorkletNode; this text is only here for informative purposes until implementations remove this node type.

プロパティ	値	説明
`numberOfInputs`	1
`numberOfOutputs`	1
`channelCount`	`numberOfInputChannels`	これは、このノードを生成するときに指定されたチャンネルの数です。channelCount の制約があります。
`channelCountMode`	"`explicit`"	channelCountMode の制約があります。
`channelInterpretation`	"`speakers`"
tail-time	No

ScriptProcessorNode は bufferSize として次の値のどれかで作成されます ( MUST ) : 256, 512, 1024, 2048, 4096, 8192, 16384 。この値は、onaudioprocess イベントがディスパッチされる周期とそれぞれの呼び出しで処理が必要なサンプルフレームの数を制御します。onaudioprocess イベントは、ScriptProcessorNode が少なくとも 1 つの入力または 1 つの出力が接続されている場合にのみディスパッチされます。bufferSize の数値が小さいほど、レイテンシーは低く ( 良く ) なります。オーディオの途切れやグリッジを避けるには、より大きい値が必要になります。この値は、createScriptProcessor() に bufferSize 引数が渡されなかった場合、または 0 に設定されている場合、実装によって自動的に選択されます。

numberOfInputChannels と numberOfOutputChannels は入力と出力のチャンネル数を決定します。numberOfInputChannels と numberOfOutputChannels の両方が 0 になるのは不正になります。

[Exposed=Window]
 interface ScriptProcessorNode : AudioNode {
   attribute EventHandler onaudioprocess;
   readonly attribute long bufferSize;
 };

1.29.1. 属性

bufferSize, long 型, readonly: onaudioprocess が呼び出されるたびに処理される必要のあるバッファのサイズ ( 単位はサンプルフレーム ) です。有効な値は ( 256, 512, 1024, 2048, 4096, 8192, 16384 ) です。
onaudioprocess, EventHandler: ScriptProcessorNode ノードに送出される onaudioprocess イベントの EventHandler ( HTML[HTML] で説明されています ) を設定するために使用されるプロパティです。AudioProcessingEvent 型のイベントがイベントハンドラーにディスパッチされます。

1.30. `StereoPannerNode` インターフェース

このインターフェースは、入力されるオーディオストリームを低コストのパンニングアルゴリズムを使用して、ステレオに配置するノードを表します。このパン効果はオーディオをステレオのストリーム内で定位させるために良く使われるものです。

プロパティ	値	説明
`numberOfInputs`	1
`numberOfOutputs`	1
`channelCount`	2	channelCount の制約があります。
`channelCountMode`	"`clamped-max`"	channelCountMode の制約があります。
`channelInterpretation`	"`speakers`"
tail-time	No

このノードの入力はステレオ ( 2 チャンネル ) であり増やす事はできません。より少ない、あるいは多いチャンネル数のノードから接続された場合は適切にアップミックスまたはダウンミックスされます。

このノードの出力はステレオ ( 2 チャンネル ) に固定されており、構成を変える事はできません。

[Exposed=Window]
 interface StereoPannerNode : AudioNode {
   constructor (BaseAudioContext context, optional StereoPannerOptions options = {});
   readonly attribute AudioParam pan;
 };

1.30.1. コンストラクター

StereoPannerNode(context, options)

コンストラクターが BaseAudioContext c とオプションオブジェクト option を指定して呼び出される場合、ユーザーエージェントは引数の context と option を使って AudioNode this を初期化しなくてはなりません ( MUST )。

StereoPannerNode.constructor(context, options) メソッドの引数
パラメーター	型	Null可	省略可	説明
`context`	BaseAudioContext	✘	✘	この新しい `StereoPannerNode` が関連付けられる `BaseAudioContext` です。
`options`	StereoPannerOptions	✘	✔	この `StereoPannerNode` のオプションの初期パラメーター値です。

1.30.2. 属性

pan, AudioParam 型, readonly

出力されるステレオイメージ中での入力の定位を指定します。-1 ならば完全な左、+1 ならば完全な右になります。

パラメーター	値	説明
`defaultValue`	0
`minValue`	-1
`maxValue`	1
`automationRate`	"`a-rate`"

1.30.3. `StereoPannerOptions`

これは、StereoPannerNode の生成に使用するオプションを指定します。すべてのメンバーはオプションです。指定されていない場合、通常のデフォルトがノードの生成に使用されます。

dictionary StereoPannerOptions : AudioNodeOptions {
   float pan = 0;
 };

1.30.3.1. ディクショナリー `StereoPannerOptions` メンバー

pan, float 型, デフォルトは 0: pan AudioParam の初期値です。

1.30.4. チャンネルの制限

処理について上記の定義による制約があるため、StereoPannerNode での処理は 2 チャンネルまでのオーディオのミキシングを行い、 2 チャンネルのオーディオを生成する事に限られています。( 訳注:それ以上のチャンネル数を扱いたい場合は ) ChannelSplitterNode を使用し、GainNode によるサブグラフでの中間的な処理を行って ChannelMergerNode を通して再度結合する処理によって任意のパンニングとミキシングを実現する事は可能です。

1.31. `WaveShaperNode` インターフェース

WaveShaperNode は非線形の歪み効果を実装した AudioNode です。

非線形ウェーブシェイピング歪みは、微妙な非線形ウォーミング効果やはっきりしたディストーションの両方のエフェクトでよく使用されています。任意の非線形シェイピング曲線を指定する事ができます。

プロパティ	値	説明
`numberOfInputs`	1
`numberOfOutputs`	1
`channelCount`	2
`channelCountMode`	"`max`"
`channelInterpretation`	"`speakers`"
tail-time	Maybe	`oversample` 属性が "`2x`" または "`4x`" に設定されている場合にのみ、テールタイムがあります。このテールタイムの実際の持続時間は実装によって異なります。

出力のチャンネル数は常に入力のチャンネル数に同じです。

enum OverSampleType {
   "none",
   "2x",
   "4x"
 };

列挙値の説明
"`none`"	オーバーサンプリングを行いません。
"`2x`"	2 倍オーバーサンプリングを行います。
"`4x`"	4 倍オーバーサンプリングを行います。

[Exposed=Window]
 interface WaveShaperNode : AudioNode {
   constructor (BaseAudioContext context, optional WaveShaperOptions options = {});
   attribute Float32Array? curve;
   attribute OverSampleType oversample;
 };

1.31.1. コンストラクター

WaveShaperNode(context, options)

WaveShaperNode.constructor(context, options) メソッドの引数
パラメーター	型	Null可	省略可	説明
`context`	BaseAudioContext	✘	✘	この新しい `WaveShaperNode` が関連付けられる `BaseAudioContext` です。
`options`	WaveShaperOptions	✘	✔	この `WaveShaperNode` のオプションの初期パラメーター値です。

1.31.2. 属性

curve, Float32Array 型, nullable

ウェーブシェイピング・エフェクトで使用されるシェイピング曲線です。入力信号は名目上 [-1, 1] の範囲内になります。この範囲内のそれぞれの入力サンプルはシェイピング曲線にインデックスされ、信号レベル 0 が配列の要素が奇数個の場合は中央の値、そうでなく要素が偶数個の場合は、配列内のもっとも中心に近い 2 つの値が補間された値になります。-1 より小さいサンプル値は、カーブ配列の最初の値に対応します。+1 より大きいサンプル値は、カーブ配列の最後の値に対応します。

実装は曲線の配列の隣接した値から直線補間を行わなくてはなりません ( MUST )。curve 属性の初期値は null で、これは WaveShaperNode は入力を変更せずにそのまま出力する事を意味します。

曲線の値は [-1; 1] の範囲に等間隔で広がっています。これは curve の値が偶数個の場合は信号 0 に対応する値を持っていない事を意味し、curve が奇数個の値の場合は信号 0 に対応する値を持っている事を意味します。出力は次のアルゴリズムで決定されます。

\(x\) を入力サンプルとし、 \(y\) を対応するノードの出力、\(c_k\) を \(k\) 番目の curve の要素、 \(N\) を curve の長さとします。

次のように置き

$$
   \begin{align*}
   v &= \frac{N-1}{2}(x + 1) \\
   k &= \lfloor v \rfloor \\
   f &= v - k
   \end{align*}
 $$

そして

$$
   \begin{align*}
   y &=
     \begin{cases}
     c_0 & v \lt 0 \\
     c_{N-1} & v \ge N - 1 \\
     (1-f)\,c_k + fc_{k+1} & \mathrm{otherwise}
     \end{cases}
   \end{align*}
 $$

この属性に 2 よりも小さい 長さ の Float32Array が設定された場合は InvalidStateError を発生します ( MUST )。

この属性が設定される際に WaveShaperNode はカーブの内部コピーを作成します。そのため属性に設定された後で配列の内容を変更しても効果はありません。

curve 属性を設定する際には、次の手順を実行します:

new curve を curve に割り当てられる、Float32Array または null とします。
もし new curve が null でなく、 [[curve set]] が true であれば InvalidStateError を発生し、この手順を中止します。
もし new curve が null でないならば [[curve set]] を true に設定します。
new curve を curve 属性に設定します。

注 : 入力値が 0 の時に、ゼロではない出力値を生成するカーブを使用すると、このノードへの入力が接続されていない場合でもこのノードは DC 信号を生成します。これはノードが下流のノードから切断されるまで続きます。

oversample, OverSampleType 型

シェイピング曲線に ( 行うならば ) どのようなオーバーサンプリングを行うかを指定します。デフォルト値は "none" で、曲線は直接入力サンプルに適用される事を意味します。値、"2x" または "4x" はエイリアシングを避けて処理の品質を向上させ、"4x" が最も良い品質となります。アプリケーションによっては非常に高精度なシェイピング曲線を得るためにオーバーサンプリングを使用しない方が良い場合もあります。

値が "2x" または "4x" の場合は次の手順を実行しなくてはならない事を意味します ( MUST ):

入力のサンプルを AudioContext のサンプルレートの 2x または 4x にアップサンプリングします。そのため、それぞれのレンダリング量子は 128 サンプルから 256 ( 2x の場合 ) または 512 ( 4x の場合 ) サンプルになります。
シェイピング曲線を摘要します。
結果を AudioContext のサンプルレートにダウンサンプリングして戻します。つまり処理された 256 ( または 512 ) のサンプルから最終的な結果の 128 サンプルを生成します。

正確なアップサンプリングおよびダウンサンプリングフィルターは定められておらず、( 低エイリアシング等の ) 音の品質、低レイテンシー、パフォーマンス等をチューニングする事もできます。

注 : オーバーサンプリングを使用すると、アップサンプリングとダウンサンプリングのフィルターにより、ある程度のオーディオ処理レイテンシーが発生します。このレイテンシーの量は、実装ごとに異なります。

1.31.3. `WaveShaperOptions`

WaveShaperNode を作成するためのオプションを指定します。すべてのメンバーはオプションです。指定されていない場合、通常のデフォルトがノードの作成に使用されます。

dictionary WaveShaperOptions : AudioNodeOptions {
   sequence<float> curve;
   OverSampleType oversample = "none";
 };

1.31.3.1. ディクショナリー `WaveShaperOptions` メンバー

curve, sequence<float> 型: ウェーブシェイピング効果で使用するシェイピング曲線です。
oversample, OverSampleType 型, デフォルトは "none": シェイピングの際に使用するオーバーサンプリングのタイプです。

1.32. `AudioWorklet` インターフェース

[Exposed=Window, SecureContext]
 interface AudioWorklet : Worklet {
 };

1.32.1. 概念

AudioWorklet オブジェクトを使用すると、開発者はレンダリングスレッドでオーディオを処理するための ( JavaScript や WebAssembly コードのような ) スクリプトを提供する独自の AudioNode をサポートできます。この処理メカニズムにより、オーディオグラフ内の他の組み込み AudioNode とのスクリプトコードの同期実行が保証されます。

このメカニズムを実現するためには、AudioWorkletNode と AudioWorkletProcessor という関連するオブジェクトのペアを定義しなければなりません ( MUST )。前者は、他の AudioNode オブジェクトと同様に、メインのグローバルスコープのインターフェースを表し、後者は、AudioWorkletGlobalScope という名前の特殊なスコープ内で内部的なオーディオ処理を実装します。

AudioWorklet concept — `AudioWorkletNode` と `AudioWorkletProcessor`

各 BaseAudioContext は、AudioWorklet を 1 つだけ保持します。この AudioWorklet を使用してインポートされたスクリプトは、その BaseAudioContext に関連付けられ、オーディオを処理するために作成された 1 つの AudioWorkletGlobalScope で実行されます。

addModule(moduleUrl) メソッドを介してスクリプトをインポートすると、 AudioWorkletGlobalScope 内に AudioWorkletProcessor のクラス定義が登録されます。インポートされたクラスのコンストラクターと、コンストラクターから作成されたアクティブなインスタンスの 2 つの内部ストレージ領域があります。

AudioWorklet は 1 つの内部スロットを持っています :

ノード名-パラメーター記述子マップ。このマップには「ノード名-プロセッサーコンストラクターマップ」から parameterDescriptors の値に関連付けられた一意に識別可能な一連の文字列キーが含まれています。この内部ストレージは registerProcessor() メソッドを呼び出した結果として、レンダリングスレッドで生成されます。この生成は、コンテキストの audioWorklet 上の addModule() によって返される promise をリゾルブする前に完了することが保証されています。

// bypass-processor.js script file, runs on AudioWorkletGlobalScope
 class BypassProcessor extends AudioWorkletProcessor {
   process (inputs, outputs) {
     // Single input, single channel.
     const input = inputs[0];
     const output = outputs[0];
     output[0].set(input[0]);
 
     // Process only while there are active inputs.
     return false;
   }
 };
 
 registerProcessor('bypass-processor', BypassProcessor);

// The main global scope
 const context = new AudioContext();
 context.audioWorklet.addModule('bypass-processor.js').then(() => {
   const bypassNode = new AudioWorkletNode(context, 'bypass-processor');
 });

メイングローバルスコープ内で AudioWorkletNode のインスタンス化を行うと、それに対応する AudioWorkletProcessor も AudioWorkletGlobalScope 内に作成されます。これらの 2 つのオブジェクトは、§2 処理モデルで説明する非同期メッセージ通信を介して通信します。

1.32.2. `AudioWorkletGlobalScope` インターフェース

この特別な実行コンテキストは、オーディオのレンダリングスレッドで、スクリプトを使用したオーディオデータの直接的な生成、処理、および分析が可能になるように設計されています。ユーザーが供給するスクリプトコードは、このスコープ内で評価され、1 つまたは複数の AudioWorkletProcessor サブクラスを定義します。このサブクラスは、AudioWorkletProcessor のインスタンス化に使用され、メインスコープ内の AudioWorkletNode と 1 対 1 に関連付けられます。

1 つ以上の AudioWorkletNode を含む各 AudioContext ごとに、 1 つの AudioWorkletGlobalScope が存在します。インポートされたスクリプトは、[worklets-1] で定義されているように UA によって実行されます。

AudioWorkletGlobalScope には、次の内部スロットがあります。

ノード名-プロセッサコンストラクターマップは プロセッサー名→AudioWorkletProcessorConstructor インスタンス、というキーと値のペアを格納するマップです。最初このマップは空で、registerProcessor() メソッドが呼び出されたときに生成されます。
保留中プロセッサー構築ーデータは、対応する AudioWorkletProcessor のインスタンス化のために AudioWorkletNode コンストラクターによって生成された一時データを格納します。保留中プロセッサー構築データには、次の項目が含まれています。
- ノード参照は最初は空になっています。この記憶域は AudioWorkletNode のコンストラクターから引き渡される AudioWorkletNode への参照を記憶します。
- 引き渡されたポートは最初は空になっています。この記憶域は、 AudioWorkletNode コンストラクターから引き渡される、デシリアライズされた MessagePort を記憶します。

注 : AudioWorkletGlobalScope には、これらのインスタンスによって共有されるその他のデータやコードも含まれる事があります。例えば、複数のプロセッサがウェーブテーブルやインパルス応答を定義する ArrayBuffer を共有する事もあります。

注 : 各 AudioWorkletGlobalScope は、単一の BaseAudioContext と、そのコンテキストの単一のオーディオレンダリングスレッドに関連付けられています。これにより、グローバルスコープ内のコードが並列スレッドで実行されてデータ競合が発生する事を防止します。

callback AudioWorkletProcessorConstructor = AudioWorkletProcessor (object options);
 
 [Global=(Worklet, AudioWorklet), Exposed=AudioWorklet]
 interface AudioWorkletGlobalScope : WorkletGlobalScope {
   void registerProcessor (DOMString name,
                           AudioWorkletProcessorConstructor processorCtor);
   readonly attribute unsigned long long currentFrame;
   readonly attribute double currentTime;
   readonly attribute float sampleRate;
 };

1.32.2.1. 属性

currentFrame, unsigned long long 型, readonly: 現在処理中のオーディオブロックのフレーム。BaseAudioContext の内部スロット [[current frame]] の値と等しくなければなりません。
currentTime, double 型, readonly: 現在処理中のオーディオブロックのコンテキストの時間。定義により、これは制御スレッドで直近に観測された BaseAudioContext の currentTime 属性の値と等しくなります。
sampleRate, float 型, readonly: 関連付けられた BaseAudioContext のサンプルレートです。

1.32.2.2. メソッド

registerProcessor(name, processorCtor)

AudioWorkletProcessor から派生したクラスのコンストラクターを登録します。

registerProcessor(name, processorCtor) メソッドが呼び出されたとき、以下の手順が実行されます。もしいずれかのステップで例外が発生した場合、残りのステップは中止されます。

もし name が空文字列の場合は NotSupportedError 例外を発生します。
もし name がノード名-プロセッサーコンストラクターマップのキーとして既に存在する場合、 NotSupportedError 例外を発生します。
IsConstructor(argument=processorCtor) の結果が false の場合 TypeError 例外を発生します。
prototype を Get(O=processorCtor, P="prototype") の結果とします。
もし Type(argument=prototype) の結果が Object でない場合は TypeError 例外を発生します。
parameterDescriptorsValue を Get(O=processorCtor, P="parameterDescriptors") の結果とします。
もし parameterDescriptorsValue が undefined でない場合は次の手順を実行します:
1. parameterDescriptorSequence を parameterDescriptorsValue から sequence<AudioParamDescriptor> 型の IDL 値への変換の結果とします。
2. paramNames を空の配列とします。
3. parameterDescriptorSequence の各々の descriptor に対して :
  1. paramName を 記述子 内のメンバー name の値とします。 paramNames にすでに paramName の値が含まれている場合は、 NotSupportedError を発生します。
  2. paramNames 配列に paramName を追加します。
  3. defaultValue を descriptor 内のメンバー defaultValue の値とします。
  4. minValue を descriptor 内のメンバー minValue の値にします。
  5. maxValue を descriptor 内のメンバー maxValue の値にします。
  6. もし defaultValue が minValue より小さいか maxValue より大きい場合、InvalidStateError を発生します。
キーと値のペア、name → processorCtor を、関連付けられた AudioWorkletGlobalScope のノード名-プロセッサーコンストラクターマップに追加します。
制御スレッドでキーと値のペア name → parameterDescriptorSequence を関連する BaseAudioContext のノード名-パラメーター記述子マップに追加するため、タスクをキューに入れます。

注 : クラスコンストラクターは一度だけルックアップされるため、登録後に動的に変更される事はありません。

AudioWorkletGlobalScope.registerProcessor(name, processorCtor) メソッド
パラメーター	型	Null可	省略可	説明
`name`	DOMString	✘	✘	登録されるクラスのコンストラクターを表す文字列キーです。このキーは、`AudioWorkletNode` の生成時に `AudioWorkletProcessor` のコンストラクタを参照するために使用されます。
`processorCtor`	AudioWorkletProcessorConstructor	✘	✘	`AudioWorkletProcessor` から派生したクラスのコンストラクターです。

戻り値: void

1.32.2.3. `AudioWorkletProcessor` の実体化

AudioWorkletNode 構築の最後にプロセッサー構築データという名前の構造体がスレッド間転送用に準備されます。この構造体には、次の項目が含まれています :

name、これはノード名-プロセッサーコンストラクターマップで検索される DOMStringです。
node、これは作成された AudioWorkletNode への参照です。
options、これは AudioWorkletNode の コンストラクター に指定された AudioWorkletNodeOptions をシリアル化したものです。
port、これは AudioWorkletNode の ポート とペアになった MessagePort をシリアル化したものです。

AudioWorkletGlobalScope に転送されたデータが到着すると、レンダリングスレッドは以下のアルゴリズムを呼び出します :

constructionData を、制御スレッドから転送されたプロセッサー構築データとします。
processorName、nodeReference、および serializedPort をそれぞれ constructionData の　名前、ノード、およびポートとします。
serializedOptions を constructionData の options とします。
deserializedPort を StructuredDeserialize(serializedPort, 現在の realm) の結果とします。
deserializedOptions を StructuredDeserialize(serializedOptions, 現在の realm)の結果とします。
processorCtor を AudioWorkletGlobalScope のノード名-プロセッサーコンストラクターマップで processorName を調べた結果とします。
nodeReference と deserializedPort を、それぞれこの AudioWorkletGlobalScope の保留中のプロセッサー構築データのノード参照と引き渡されたポートに保存します。
deserializedOptions の引数を使用して、processorCtor からコールバック関数を作成します。

1.32.3. `AudioWorkletNode` インターフェース

このインターフェースは、制御スレッド上に存在するユーザー定義の AudioNode を表します。ユーザーは、BaseAudioContext から AudioWorkletNode を作成することができ、そのノードは他の組み込み AudioNode と接続してオーディオグラフを形成することができます。

プロパティ	値	説明
`numberOfInputs`	1
`numberOfOutputs`	1
`channelCount`	2
`channelCountMode`	"`max`"
`channelInterpretation`	"`speakers`"
tail-time	説明を参照してください。	テールタイムはノード自身が管理します。

すべての AudioWorkletProcessor には、初期値が true のアクティブソースフラグが関連付けられています。このフラグは、入力へのコネクションが 1 つもない場合、ノードをメモリーに保持してオーディオ処理を実行させます。

[Exposed=Window]
 interface AudioParamMap {
   readonly maplike<DOMString, AudioParam>;
 };

このインターフェースは readonly maplike によって "entries"、"forEach"、"get"、"has"、"keys"、"values"、@@iterator、"size" ゲッターのメソッドを持ちます。

[Exposed=Window, SecureContext]
 interface AudioWorkletNode : AudioNode {
   constructor (BaseAudioContext context, DOMString name,
                optional AudioWorkletNodeOptions options = {});
   readonly attribute AudioParamMap parameters;
   readonly attribute MessagePort port;
   attribute EventHandler onprocessorerror;
 };

1.32.3.1. コンストラクター

AudioWorkletNode(context, name, options)

AudioWorkletNode.constructor(context, name, options) メソッドの引数
パラメーター	型	Null可	省略可	説明
`context`	BaseAudioContext	✘	✘	新しく作成される `AudioWorkletNode` が関連付けられる `BaseAudioContext` です。
`name`	DOMString	✘	✘	`BaseAudioContext` の「ノード名-パラメーター記述子マップ」のキーとして使用可能な文字列です。
`options`	AudioWorkletNodeOptions	✘	✔	この `AudioWorkletNode` の初期パラメーター値オプションです。

コンストラクターが呼び出されると、ユーザーエージェントは制御スレッドで次の手順を実行する必要があります ( MUST )。

AudioWorkletNode コンストラクターが context、nodeName、options を指定して呼び出された場合：

nodeName が BaseAudioContext のノード名-パラメータ記述子マップにキーとして存在しない場合は InvalidStateError 例外を発生してこれらの手順を中止します。
node を this の値とします。
context と options を引数として AudioNode node を初期化します。
options を使用して node の入力、出力、出力チャンネルを構成します。何からの例外が発生した場合は残りの手順を中止します。
messageChannel を新しい MessageChannel とします。
nodePort を messageChannel の port1 属性とします。
processorPortOnThisSide を messageChannel の port2 属性とします。
serializedProcessorPort を StructuredSerializeWithTransfer(processorPortOnThisSide, « processorPortOnThisSide ») の結果とします。
options ディレクトリーを optionsObject に変換します。
serializedOptions を StructuredSerialize(optionsObject) の結果とします。
node の port を nodePort に設定します。
parameterDescriptors をノード名-パラメーター記述子マップから nodeName を取得した結果とします :
1. audioParamMap を新しい AudioParamMap とします。
2. parameterDescriptors の各 descriptor に対して :
  1. paramName を descriptor 内の name メンバーの値とします。
  2. audioParam を新しい AudioParam のインスタンスとして、automationRate、defaultValue、minValue、maxValue を descriptor の対応するメンバーの値と同じにします。
  3. キー-値ペア、paramName → audioParam を audioParamMap のエントリーに追加します。
3. もし parameterData が options 内に存在している場合、次の手順を実行します :
  1. parameterData を parameterData の値とします。
  2. parameterData　のそれぞれの paramName → paramValue に対して :
    1. もし audioParamMap に paramName をキーとするマップエントリーがあれば、audioParamInMap をそのエントリーとします。
    2. audioParamInMap の value プロパティを paramValue に設定します。
4. node の parameters を audioParamMap に設定します。
nodeName、node、serializedOptions、および serializedProcessorPort で構成されるプロセッサー構築データを使用して、対応する AudioWorkletProcessor の コンストラクター を呼び出す制御メッセージをキューに入れます。

1.32.3.2. 属性

onprocessorerror, EventHandler 型

プロセッサーのコンストラクター、プロセスメソッド、またはユーザー定義のクラスメソッドが、処理できない例外を発生した時プロセッサーは、関連付けられた AudioWorkletNode で ErrorEvent を使用して processorerror という名前のイベントを発生させるタスクをキューに入れます。

ErrorEvent は、制御スレッド上でその message、filename、lineno、colno 属性を使用して適切に作成および初期化されます。

処理できない例外が発生した時、プロセッサーはそのライフタイムを通じて無音を出力する事に注意してください。

parameters, AudioParamMap 型, readonly

parameters 属性は、関連付けられた名前を持つ AudioParam オブジェクトのコレクションです。この maplike オブジェクトは、インスタンス化の際に AudioWorkletProcessor クラスのコンストラクター内の AudioParamDescriptor のリストから生成されます。

port, MessagePort 型, readonly

すべての AudioWorkletNode には MessagePort 型の port が関連付けられています。これは対応する AudioWorkletProcessor オブジェクトのポートに接続され、AudioWorkletNode と AudioWorkletProcessor のペア間の双方向通信を可能にします。

注 : この ポート の "message" イベントにイベントリスナーを登録する作成者は、 MessageChannel のいずれかの末端（ AudioWorkletProcessor または AudioWorkletNode 側）で close を呼び出して、リソースを回収できるようにする必要があります。

1.32.3.3. `AudioWorkletNodeOptions`

AudioWorkletNodeOptions ディクショナリーは、AudioWorkletNode のインスタンスの属性の初期化に使用されます。

dictionary AudioWorkletNodeOptions : AudioNodeOptions {
   unsigned long numberOfInputs = 1;
   unsigned long numberOfOutputs = 1;
   sequence<unsigned long> outputChannelCount;
   record<DOMString, double> parameterData;
   object processorOptions;
 };

1.32.3.3.1. ディレクトリー `AudioWorkletNodeOptions` メンバー

numberOfInputs, unsigned long 型, デフォルトは 1: これは、AudioNode の numberOfInputs 属性の値を初期化するために使用されます。
numberOfOutputs, unsigned long 型, デフォルトは 1: これは、AudioNode の numberOfOutputs 属性の値を初期化するために使用されます。
outputChannelCount, sequence<unsigned long> 型: この配列は、各出力のチャンネル数を構成するために使用されます。
parameterData, record<DOMString, double> 型: これは AudioWorkletNode で一致する名前を持つ AudioParam の初期値を設定するために使用されるユーザー定義のキーと値のペアのリストです。
processorOptions, object 型: これは、AudioWorkletNode に関連付けられている AudioWorkletProcessor インスタンスのカスタムプロパティを初期化するために使用するユーザー定義データを保持します。

1.32.3.3.2. `AudioWorkletNodeOptions` によるチャンネルの設定

次のアルゴリズムは、AudioWorkletNodeOptions を使用してさまざまなチャンネル構成を設定する方法を示しています。

node をこのアルゴリズムを摘要する AudioWorkletNode のインスタンスとします。
numberOfInputs と numberOfOutputs の両方が 0 の場合、NotSupportedError を発生して残りの手順を中止します。
もし outputChannelCount が存在しているなら、
1. もし outputChannelCount の値のどれかが 0 または実装の最大チャンネル数よりも大きい場合は NotSupportedError を発生して残りの手順を中止します。
2. もし outputChannelCount の長さが numberOfOutputs と等しくない場合は IndexSizeError を発生して残りの手順を中止します。
3. numberOfInputs と numberOfOutputs の両方が 1 の場合、node の出力のチャンネル数を outputChannelCount の 1 つの値に設定します。
4. それ以外の場合は、node の k 番目の出力のチャンネル数を outputChannelCount シーケンスの k 番目の要素に設定して返します。
もし outputChannelCount が存在していない場合、
1. もし numberOfInputs と numberOfOutputs の両方が 1 の場合、node の出力の初期チャンネル数を 1 に設定して返します。
  
  注 : この場合、出力されるチャンネル数は実行時の入力と channelCountMode に基く computedNumberOfChannels に動的に変更されます。
2. それ以外の場合は、node の各出力のチャンネル数を 1 に設定して返します。

1.32.4. `AudioWorkletProcessor` インターフェース

このインターフェースは、オーディオのレンダリングスレッドで実行されるオーディオ処理コードを表します。それは AudioWorkletGlobalScope 内に存在し、クラスの定義は実際のオーディオ処理メカニズムを表します。 AudioWorkletProcessor の構築は、AudioWorkletNode の構築の結果としてのみ行われる事に注意してください。

[Exposed=AudioWorklet]
 interface AudioWorkletProcessor {
   constructor ();
   readonly attribute MessagePort port;
 };

AudioWorkletProcessor は 2 つの内部スロットを持っています :

[[node reference]]: 関連付けられた AudioWorkletNode への参照です。
[[callable process]]: process() が呼び出し可能な有効な関数かどうかを表すブーリアンフラグです。

1.32.4.1. コンストラクター

AudioWorkletProcessor()

AudioWorkletProcessor のコンストラクターが呼び出されると、次の手順がレンダリングスレッドで実行されます。

nodeReference を、現在の AudioWorkletGlobalScope の保留中のプロセッサー構築データのノード参照を検索した結果とします。もしスロットが空の場合は TypeError 例外を発生します。
以下の手順のどこかで例外が発生した場合は、これらのサブステップが実行されます :
1. 保留中のプロセッサー構築データのスロットを空にします。
2. コンストラクターのアルゴリズムの残りの手順を中止して、制御スレッドで ErrorEvent を使用して nodeReference で processorerror という名前のイベントを発生させるタスクをキューに入れます。
processor を this の値とします。
processor の [[node reference]] を nodeReference に設定します。
processor の [[callable process]] を true に設定します。
deserializedPort を保留中のプロセッサー構築データから引き渡されたポートを検索した結果とします。
processor の port を deserializedPort に設定します。
保留中のプロセッサー構築データスロットを空にします。

1.32.4.2. 属性

port, MessagePort 型, readonly

すべての AudioWorkletProcessor は、MessagePort 型の関連付けられた port を持っています。これは対応する AudioWorkletNode オブジェクト上のポートに接続され、AudioWorkletNode と AudioWorkletProcessor の間の双方向通信を可能にします。

注 : この port の "message" イベントにイベントリスナーを登録した作成者は、リソースが回収されるように MessageChannel のどちらかの末端 ( AudioWorkletProcessor または AudioWorkletNode 側 ) で close を呼び出す必要があります。

1.32.4.3. メソッド

ユーザーは AudioWorkletProcessor を拡張することによって、独自のオーディオプロセッサを定義する事ができます。このサブクラスは、オーディオ処理アルゴリズムを実装した process() という名前のメソッドを定義する必要があり ( MUST ) 、また AudioParamDescriptor のイテラブルである parameterDescriptors という名前の静的プロパティを持つことができます。

process(inputs, outputs, parameters)

AudioWorkletProcessor のオーディオ処理アルゴリズムを実装します。

process() メソッドは、 AudioWorkletNode がアクティブに処理を行う状態であれば、レンダリング量子ごとにオーディオレンダリングスレッドによって同期的に呼び出されます。

このメソッドの戻り値は、AudioWorkletProcessor が関連付けられた AudioWorkletNode のライフタイムを制御します。

このライフタイムのポリシーは、次のようなケースを含み、組み込みノードに見られるさまざまなアプローチをサポートします:

入力された信号を変換するノードで、接続された入力やスクリプト参照が存在する間のみアクティブになります。このようなノードは、接続された入力の有無で AudioWorkletNode がアクティブに処理が起こるかどうかを決定できるように、process() から false を返さなくてはなりません ( SHOULD ) 。
入力された信号を変換するが、入力が切断された後もテールタイムの間だけアクティブのままになるノード。この場合、process() は、inputs のチャンネルがゼロであることが判明してからもしばらくの間、true を返さなくてはなりません ( SHOULD )。このテールタイム間隔の開始と終了を測るために、現在の時間をグローバルスコープの currentTime から取得するか、またはプロセッサの内部状態に応じて動的に時間間隔を計算することができます。
出力のソースとして機能する、一般的なライフタイムを持っているノードの場合。そのようなノードでは process() から出力を生成しなくなるまで true を返さなくてはなりません ( SHOULD )。

以上の定義は、process() の実装から戻り値が提供されない場合、効果は false を返すのと同じであることを意味します ( 有効な戻り値が偽となる undefined であるため ) 。これは、アクティブな入力がある場合にのみアクティブとなる AudioWorkletProcessor にとって妥当な動作です。

AudioWorkletProcessor.process(inputs, outputs, parameters)) メソッドの引数
パラメーター	型	Null可	省略可	説明
`inputs`				ユーザーエージェントによって供給される入力接続からの入力オーディオバッファです。`sequence<sequence<Float32Array>>` の型を持ちます。`inputs[n][m]` は、\(n\) 番目の入力の \(m\)th 番目のチャンネルのオーディオサンプルの `Float32Array` です。入力の数はコンストラクト時に固定されますが、チャンネルの数は computedNumberOfChannels に基づいて動的に変更できます。現在のレンダリング量子の間、`AudioWorkletNode` の \(n\) 番目の入力に接続されているアクティブに処理している `AudioNode` が存在しない場合、`inputs[n]` の内容は空の配列であり、0 チャンネルの入力が利用可能であることを示します。これは、`inputs[n]` の要素数をゼロにすることができる唯一の状況です。
`outputs`				ユーザーエージェントが消費する出力オーディオバッファです。`sequence<sequence<Float32Array>>` の型を持ちます。`outputs[n][m]` は、\(n\) 番目の出力の \(m\) 番目のチャンネルのオーディオサンプルを含む `Float32Array` オブジェクトです。各 Float32Array は 0 で埋められています。ノードが単一の出力を持つ場合にのみ、出力のチャンネル数は computedNumberOfChannels と一致します。
`parameters`				順序付けされたマップの name → parameterValues です。 parameters["name"] は name AudioParam のオートメーション値の入った Float32Array である parameterValues を返します。各配列について、配列にはレンダリング量子内のすべてのフレームに対するパラメーターの computedValue が含まれます。ただし、このレンダリング量子中にオートメーションがスケジュールされていない場合は、配列の長さが 1 で、配列の要素はレンダリング量子の間の AudioParam の定数値になります ( MAY )。

戻り値: boolean

次の例は、AudioWorkletProcessor で AudioParam を定義して使用する方法を示しています。

class MyProcessor extends AudioWorkletProcessor {
   static get parameterDescriptors() {
     return [{
       name: 'myParam',
       defaultValue: 0.5,
       minValue: 0,
       maxValue: 1,
       automationRate: "k-rate"
     }];
   }
 
   process(inputs, outputs, parameters) {
     // Get the first input and output.
     const input = inputs[0];
     const output = outputs[0];
     const myParam = parameters.myParam;
 
     // A simple amplifier for single input and output. Note that the
     // automationRate is "k-rate", so it will have a single value at index [0]
     // for each render quantum.
     for (let channel = 0; channel < output.length; ++channel) {
       for (let i = 0; i < output[channel].length; ++i) {
         output[channel][i] = input[channel][i] * myParam[0];
       }
     }
   }
 }

1.32.4.4. `AudioParamDescriptor`

AudioParamDescriptor ディクショナリーは、AudioWorkletNode で使用される AudioParam オブジェクトのプロパティを指定するために使用されます。

dictionary AudioParamDescriptor {
   required DOMString name;
   float defaultValue = 0;
   float minValue = -3.4028235e38;
   float maxValue = 3.4028235e38;
   AutomationRate automationRate = "a-rate";
 };

1.32.4.4.1. ディクショナリー `AudioParamDescriptor` メンバー

automationRate, AutomationRate 型, デフォルトは "a-rate"

デフォルトのオートメーション速度を表します。

defaultValue, float 型, デフォルトは 0

パラメーターのデフォルト値を表します。この値が float データ型の範囲外または minValue および maxValue で定義された範囲外の場合、NotSupportedError 例外を発生します ( MUST )。

maxValue, float 型, デフォルトは 3.4028235e38

最大値を表します。この値が float データ型の範囲外であるか、minValue より小さい場合、NotSupportedError 例外を発生します ( MUST )。この値 ( 訳注:デフォルト値 ) は、最も正の単精度浮動小数点値です。

minValue, float 型, デフォルトは -3.4028235e38

最小値を表します。この値が float データ型の範囲外であるか、maxValue より大きい場合、NotSupportedError 例外を発生します ( MUST )。この値 ( 訳注:デフォルト値 ) は、最も負の単精度浮動小数点値です。

name, DOMString 型

パラメーターの名前を表します。クラス定義を登録する際に重複した名前が見つかると、NotSupportedError 例外を発生します ( MUST )。

Represents the name of the parameter. A NotSupportedError exception MUST be thrown when a duplicated name is found when registering the class definition.

1.32.5. AudioWorklet イベントのシーケンス

次の図は、AudioWorklet に関連して発生する理想的なイベントのシーケンスを示しています:

この図に示す手順は AudioContext および関連する AudioWorkletGlobalScope の作成、それに続く AudioWorkletNode およびその関連する AudioWorkletProcessor の作成を含む 1 つの在りうるイベントシーケンスです。

AudioContext が作成されます。
メインスコープでは context.audioWorklet にスクリプトモジュールの追加が要求されます。
AudioWorkletGlobalScope がまだ存在しないため、新しくコンテキストに関連付けられて作成されます。これは AudioWorkletProcessor クラスの定義が評価されるグローバルスコープになります。( その後の呼び出しでは、このあらかじめ作成されたスコープが使用されます )。
インポートされたスクリプトは、新しく作成されたグローバルスコープで実行されます。
インポートされたスクリプトの実行の一環として、AudioWorkletProcessor は、AudioWorkletGlobalScope 内のキー ( 上図の"custom" ) の下に登録されます。これにより、グローバルスコープと AudioContext の両方にマップが設定されます。
addModule() 呼び出しの promise がリゾルブされます。
メインスコープでは、AudioWorkletNode がユーザーが指定したキーとオプションのディクショナリーを使って作成されます。
ノードの作成の一環として、このキーはインスタンス化のために正しい AudioWorkletProcessor サブクラスを探すために使用されます。
AudioWorkletProcessor サブクラスのインスタンスは、同じオプションディクショナリーの構造化された複製を持ってインスタンス化されます。このインスタンスは、既に作成された AudioWorkletNode とペアになっています。

1.32.6. AudioWorklet の例

1.32.6.1. ビットクラッシャーノード

ビットクラッシャーは、サンプル値を量子化する ( 低いビット深度をシミュレートする ) こと、および時間分解能を量子化すること ( より低いサンプルレートをシミュレートする ) の両方によってオーディオストリームの品質を低下させるメカニズムです。この例では、AudioWorkletProcessor 内で AudioParam ( この例では、a-rate として扱います ) を使用する方法を示します。

const context = new AudioContext();context.audioWorklet.addModule('bitcrusher.js').then(() => {  const osc = new OscillatorNode(context);  const amp = new GainNode(context);  // Create a worklet node. 'BitCrusher' identifies the  // AudioWorkletProcessor previously registered when  // bitcrusher.js was imported. The options automatically  // initialize the correspondingly named AudioParams.  const bitcrusher = new AudioWorkletNode(context, 'bitcrusher', {    parameterData: {bitDepth: 8}  });  osc.connect(bitcrusher).connect(amp).connect(context.destination);  osc.start();});

class Bitcrusher extends AudioWorkletProcessor {  static get parameterDescriptors () {    return [{      name: 'bitDepth',      defaultValue: 12,      minValue: 1,      maxValue: 16    }, {      name: 'frequencyReduction',      defaultValue: 0.5,      minValue: 0,      maxValue: 1    }];  }  constructor (options) {    // The initial parameter value can be set by passing |options|    // to the processor’s constructor.    super(options);    this._phase = 0;    this._lastSampleValue = 0;  }  process (inputs, outputs, parameters) {    const input = inputs[0];    const output = outputs[0];    const bitDepth = parameters.bitDepth;    const frequencyReduction = parameters.frequencyReduction;    if (bitDepth.length > 1) {      // The bitDepth parameter array has 128 sample values.      for (let channel = 0; channel < output.length; ++channel) {        for (let i = 0; i < output[channel].length; ++i) {          let step = Math.pow(0.5, bitDepth[i]);          // Use modulo for indexing to handle the case where          // the length of the frequencyReduction array is 1.          this._phase += frequencyReduction[i % frequencyReduction.length];          if (this._phase >= 1.0) {            this._phase -= 1.0;            this._lastSampleValue =              step * Math.floor(input[channel][i] / step + 0.5);          }          output[channel][i] = this._lastSampleValue;        }      }    } else {      // Because we know bitDepth is constant for this call,      // we can lift the computation of step outside the loop,      // saving many operations.      const step = Math.pow(0.5, bitDepth[0]);      for (let channel = 0; channel < output.length; ++channel) {        for (let i = 0; i < output[channel].length; ++i) {          this._phase += frequencyReduction[i % frequencyReduction.length];          if (this._phase >= 1.0) {            this._phase -= 1.0;            this._lastSampleValue =              step * Math.floor(input[channel][i] / step + 0.5);          }          output[channel][i] = this._lastSampleValue;        }      }    }    // No need to return a value; this node’s lifetime is dependent only on its    // input connections.  }});registerProcessor('bitcrusher', Bitcrusher);

注 : AudioWorkletProcessor クラスの定義では、作成者が提供するコンストラクターが明示的に this 以外のものを返す、あるいは super() を正しく呼び出さない場合 InvalidStateError 例外を発生します。

1.32.6.2. VU メーターノード

この簡単なサウンドレベルメーターの例は、ネイティブ AudioNode のように動作し、コンストラクターオプションを受け付け、AudioWorkletNode と AudioWorkletProcessor の間のスレッド間通信 ( 非同期 ) をカプセル化する AudioWorkletNode サブクラスを作成する方法を示しています。このノードは出力を使用しません。

/* vumeter-node.js: Main global scope */export default class VUMeterNode extends AudioWorkletNode {  constructor (context, updateIntervalInMS) {    super(context, 'vumeter', {      numberOfInputs: 1,      numberOfOutputs: 0,      channelCount: 1,      processorOptions: {        updateIntervalInMS: updateIntervalInMS || 16.67;      }    });    // States in AudioWorkletNode    this._updateIntervalInMS = updateIntervalInMS;    this._volume = 0;    // Handles updated values from AudioWorkletProcessor    this.port.onmessage = event => {      if (event.data.volume)        this._volume = event.data.volume;    }    this.port.start();  }  get updateInterval() {    return this._updateIntervalInMS;  }  set updateInterval(updateIntervalInMS) {    this._updateIntervalInMS = updateIntervalInMS;    this.port.postMessage({updateIntervalInMS: updateIntervalInMS});  }  draw () {    // Draws the VU meter based on the volume value    // every |this._updateIntervalInMS| milliseconds.  }};

/* vumeter-processor.js: AudioWorkletGlobalScope */const SMOOTHING_FACTOR = 0.9;const MINIMUM_VALUE = 0.00001;registerProcessor('vumeter', class extends AudioWorkletProcessor {  constructor (options) {    super();    this._volume = 0;    this._updateIntervalInMS = options.processorOptions.updateIntervalInMS;    this._nextUpdateFrame = this._updateIntervalInMS;    this.port.onmessage = event => {      if (event.data.updateIntervalInMS)        this._updateIntervalInMS = event.data.updateIntervalInMS;    }  }  get intervalInFrames () {    return this._updateIntervalInMS / 1000 * sampleRate;  }  process (inputs, outputs, parameters) {    const input = inputs[0];    // Note that the input will be down-mixed to mono; however, if no inputs are    // connected then zero channels will be passed in.    if (input.length > 0) {      const samples = input[0];      let sum = 0;      let rms = 0;      // Calculated the squared-sum.      for (let i = 0; i < samples.length; ++i)        sum += samples[i] * samples[i];      // Calculate the RMS level and update the volume.      rms = Math.sqrt(sum / samples.length);      this._volume = Math.max(rms, this._volume * SMOOTHING_FACTOR);      // Update and sync the volume property with the main thread.      this._nextUpdateFrame -= samples.length;      if (this._nextUpdateFrame < 0) {        this._nextUpdateFrame += this.intervalInFrames;        this.port.postMessage({volume: this._volume});      }    }    // Keep on processing if the volume is above a threshold, so that    // disconnecting inputs does not immediately cause the meter to stop    // computing its smoothed value.    return this._volume >= MINIMUM_VALUE;  }});

/* index.js: Main global scope, entry point */import VUMeterNode from './vumeter-node.js';const context = new AudioContext();context.audioWorklet.addModule('vumeter-processor.js').then(() => {  const oscillator = new OscillatorNode(context);  const vuMeterNode = new VUMeterNode(context, 25);  oscillator.connect(vuMeterNode);  oscillator.start();  function drawMeter () {    vuMeterNode.draw();    requestAnimationFrame(drawMeter);  }  drawMeter();});

2. 処理モデル

2.1. 背景

このセクションは非基準情報です。

低レイテンシーを必要とするリアルタイムオーディオシステムでは、しばしばコールバック関数を使用して実装されることがあります。コールバック関数は、再生が中断されないように、オーディオを処理する必要がある場合にオペレーティングシステムがプログラムを呼び出します。このようなコールバックは、優先度の高いスレッド ( 多くの場合、システム上で最優先 ) で呼び出されます。つまり、オーディオを扱うプログラムは、このコールバックからのみ実行され、レンダリングスレッドとコールバックの間のバッファリングによって必然的にレイテンシーが増加され、そうしないとシステムのグリッチに対する耐性が低下します。

この理由で、Web プラットフォーム上の伝統的な非同期処理の実行方法、つまりイベントループではスレッドが連続的に実行されていないため、ここでは有効ではありません。さらに、従来の実行コンテキスト ( Window や Worker ) では、多くの不必要で潜在的なブロッキング操作が利用できますが、これは許容できるレベルのパフォーマンスを実現するには望ましい事ではありません。

さらに、Worker モデルではスクリプトの実行コンテキストがそれぞれ必要な専用スレッドを作成しますが、すべての AudioNode は通常同じ実行コンテキストを共有します。

注 : このセクションでは、どのように実装しなくてはならないかではなく、最終的な結果がどのように見えるかを指定します。特に、メモリー処理の順序が入れ変わってしまわない限り、実装はメッセージキューを使用する代わりに、スレッド間の共有メモリーを使用してかまいません。

2.2. 制御スレッドとレンダリングスレッド

Web Audio APIは、制御スレッドとレンダリングスレッドを使用して実装しなければなりません ( MUST )。

制御スレッドは、 AudioContext がインスタンス化されるスレッドであり、開発者はオーディオグラフを操作します。つまり、 BaseAudioContext の操作が呼び出される場所です。レンダリングスレッドは、制御スレッドからの呼び出しに応じて実際のオーディオ出力が処理されるスレッドです。これは、AudioContext のオーディオを処理する場合はリアルタイムのコールバックベースのオーディオスレッドであり、OfflineAudioContext を使用してレンダリングおよびオーディオグラフ処理をオフラインで行う場合は通常のスレッドになります。

各スレッドには、現在の状態を示す内部スロットがあります。制御スレッドの状態は、state と等価であり、レンダリングスレッドでの対応部分であるレンダリングスレッドの状態とも等価です。これらのスロットは AudioContextState という値を持ちます。

制御スレッドは、[HTML] で説明されているような伝統的なイベントループを使用します。

レンダリングスレッドは、このセクションのオーディオグラフのレンダリングで説明されている特殊なレンダリングループを使用します。

制御スレッドからレンダリングスレッドへの通信は、制御メッセージの受け渡しを使用して行われます。逆方向の通信は、通常のイベントループタスクを使用して行われます。

各 AudioContext には、制御スレッドで実行中の制御メッセージのリストである単一の制御メッセージキューがあります。

制御メッセージをキューに入れる事は、BaseAudioContext の制御メッセージキューの最後にメッセージを追加することを意味します。

注 : たとえば、start() on an AudioBufferSourceNode source で start() の呼び出しに成功すると、関連付けられた BaseAudioContext の制御メッセージキューに制御メッセージが追加されます。

制御メッセージキュー内の制御メッセージは、挿入した時間順に並んでいます。したがって、最も古いメッセージは、制御メッセージキューの先頭にあるメッセージです。

制御メッセージキュー Q_A を別の制御メッセージキュー Q_B と入れ替えることは、以下の手順を実行することを意味します:

Q_C を新しい空の制御メッセージキューとします。
Q_A のすべての制御メッセージを Q_C に移動します。
Q_B のすべての制御メッセージを Q_A に移動します。
Q_C のすべての制御メッセージをQ_C に移動します。

2.3. 非同期処理

AudioNode のメソッドを呼び出すことは事実上非同期であり、同期部分と非同期部分の 2 つのフェーズで行わなければなりません ( MUST )。各メソッドについて、実行の一部は制御スレッドで発生します ( たとえば、パラメーターが無効な場合は例外を発生します )。また一部はレンダリングスレッドで ( たとえば AudioParam の値を変更するなど ) 発生します。

AudioNode と BaseAudioContext の各処理の説明では、同期処理のセクションには ⌛ が付いています。他のすべての処理は、[HTML] で説明されているように、並列に実行されます。

同期セクションは制御スレッド上で、直ちに実行されます。もし失敗した場合は、メソッドの実行が中止され、多くの場合は例外を発生します。成功した場合は、レンダリングスレッド上で実行される処理を指示する制御メッセージが、このレンダリングスレッドの制御メッセージキューに入れられます。

同期および非同期セクションの他のイベントに対する順序は同じでなくてなりません ( MUST ) : つまり 2 つの処理 A と B がそれぞれ同期と非同期のセクション A_Sync と A_Async、B_Sync と B_Async を持っている場合、A が B より先に発生したのであれば、A_Sync が B_Sync の前に発生し、A_Async は B_Async の前に発生します。言い換えれば、同期セクションと非同期セクションの入れ替えはできません。

2.4. オーディオグラフのレンダリング

オーディオグラフのレンダリングは 128 サンプルフレームのブロック単位で行われます。 128 サンプルフレームのブロックはレンダリング量子と呼ばれ、レンダリング量子のサイズは 128 です。

特定のスレッドでアトミックに発生する処理は、別のスレッドで他のアトミック処理が実行されていない場合にのみ実行できます。

制御メッセージキュー Q を持った BaseAudioContext G からのオーディオブロックをレンダリングするためのアルゴリズムは、複数の手順から構成されます。これはグラフをレンダリングするアルゴリズムにおいて、後でさらに詳細に説明します。

実際には、AudioContext のレンダリングスレッドではアイソクロナス方式で実行されるシステムレベルのオーディオコールバックから実行される事がよくあります。

OfflineAudioContext は、システムレベルのオーディオコールバックを持つ必要はありませんが、前のコールバックが終了するとすぐにコールバックが発生し、あたかもコールバックがあったかのように動作します。

オーディオコールバックも、タスクとして制御メッセージキューに入れられます。 UA は次のアルゴリズムを実行して、レンダリング量子を処理し、要求されたバッファサイズを満たすようなタスクを実行しなくてはなりません ( MUST)。プライマリメッセージキューに加えて、レンダリングスレッドは、AudioWorkletGlobalScope での Promise の解決などのマイクロタスク操作用のマイクロタスク用の別のタスクキューを持っています。

レンダリングループが開始された時、次の手順が一度だけ実行されなくてはなりません ( MUST )。

BaseAudioContext の内部スロット [[current frame]] を 0 に設定します。また、currentTime を 0 に設定します。

render result を false にします。
制御メッセージキュー処理します。
1. Q_rendering を空の制御メッセージキューとします。アトミックに Q_rendering と現在の制御メッセージキューを入れ替えます。
2. Q_rendering にメッセージが存在している間、次の手順を実行します :
  1. Q_rendering の最も古いメッセージの非同期セクションを実行します。
  2. Q_rendering の最も古いメッセージを削除します。
レングリング量子を処理します。
1. もし BaseAudioContext のレンダリングスレッドの状態が running でない場合、false を返します。
2. Order the AudioNodes of the BaseAudioContext to be processed.
  1. ordered node list を AudioNode と AudioListener の空のリストとします。これはこの順番付けアルゴリズムが終了した時に AudioNode と AudioListener の順序付きリストとなります。
  2. nodes を、この BaseAudioContext によって作成され、現在も有効なすべてのノードのセットとします。
  3. AudioListener を nodes に追加します。
  4. cycle breakers を空の DelayNode のセットにします。これは循環の一部であるすべての DelayNode が含まれるようになります。
  5. nodes 内のすべての AudioNode node に対して :
    1. もし node が DelayNode で循環の一部であれば、それを cycle breakers に追加し、nodes から削除します。
  6. cycle breakers 内の DelayNode delay のそれぞれに対して :
    1. delayWriter と delayReader をそれぞれ delay のための DelayWriter と DelayReader とします。 nodes に delayWriter と delayReader を追加します。すべての入力と出力から delay を切断します。
      
      Note: これは循環を切断します。DelayNode が循環内にある場合、その 2 つの端は分けて考えることができます。これは、循環内の遅延は 1 つのレンダリング量子よりも小さくできないためです。
  7. もし nodes に循環が含まれている場合は、この循環に含まれているるすべての AudioNode をミュートして、nodes から削除します。
  8. nodes 内のすべての要素はマークされていないと考えます。 nodes 内にマークされていない要素がある間 :
    1. nodes 内の要素 node を選択します。
    2. node を巡回します。
    ノードの巡回は次の手順の実行を意味します :
    1. もし node がマークされている場合は、これらの手順を中止します。
    2. node をマークします。
    3. もし node が AudioNode であれば、node の入力に接続されている AudioNode をそれぞれ巡回します。
    4. node の AudioParam param のそれぞれに対して :
      
      param に接続されている AudioNode param input node のそれぞれに対して :
      
      param input node を巡回します。
    5. node を ordered node list の最初に追加します。
  9. ordered node list の順序を反転します。
3. このブロックの AudioListener の AudioParam の値を計算します。
4. ordered node list 内のそれぞれの AudioNode に対して :
  1. この AudioNode の各 AudioParam について、次の手順を実行します :
    1. もしこの AudioParam に AudioNode が接続されている場合は、この AudioParam に接続されているすべての AudioNode が読み取りに使用できるようにしたバッファを合計し、結果のバッファをモノラルチャンネルにダウンミックスします。このバッファを入力 AudioParam バッファと呼びます。
    2. このブロックでのこの AudioParam の値を計算します。
    3. § 1.6.3 値の計算に従って、この AudioParam の [[current value]] スロットを設定するために制御メッセージをキューに入れます。
  2. もしこの AudioNode に入力に接続されている code class="idl">AudioNode がある場合は、この AudioNode に接続されているすべての AudioNode が読み取りに使用できるようにしたバッファを合計します。結果のバッファは入力バッファと呼ばれます。この AudioNode の入力チャンネル数と一致するように、アップまたはダウンミックスします。
  3. この AudioNode がソースノードである場合、オーディオのブロックを計算し、それを読み取り可能にします。
  4. もしこの AudioNode が AudioWorkletNode の場合、次のサブステップを実行します :
    1. processor を AudioWorkletNode に関連付けられた AudioWorkletProcessor のインスタンスとします。
    2. processor の [[callable process]] が true の場合、次の手順を実行します :
      1. processFunction を Get(O=processor, P="process") の結果とします。
      2. [[callable process]] を IsCallable(argument=processFunction) の戻り値に設定します。
      3. [[callable process]] が true の場合、processFunction を呼び出して、入力バッファ、出力バッファ、および入力 AudioParam バッファを引数として使用してオーディオのブロックを計算します。 outputs パラメーターを介して processFunction に渡された Float32Array の要素のコピーを含むバッファは読み取り可能になります。
      4. processFunction の最後に ToBoolean が戻り値に適用され、その結果は関連付けられた AudioWorkletProcessor のアクティブソースフラグに設定されます。これは、次に process() の後続の呼び出しが発生するかどうかに影響し、ノードのライフタイムに影響を与えます。
      5. そうでなく [[callable process]] が false の場合、制御スレッドに対してタスクをキューに入れ、関連付けられた AudioWorkletNode で processorerror という名前の ErrorEvent を発生させます。
    3. processor の [[callable process]] が false の場合、次の手順を実行します :
      1. 無音の出力バッファを読み取り可能にします。
    4. process メソッドの実行内で解決された Promise は AudioWorkletGlobalScope のマイクロタスクキューに入れられます。
  5. この AudioNode が destination ノードe である場合、この AudioNode の入力を記録します。
  6. それ以外の場合は、入力バッファを処理し、結果のバッファを読み取り可能にします。
5. 次の手順をアトミックに実行します。
  
  Atomically perform the following steps:
  1. [[current frame]] をレンダリング量子のサイズだけ進めます。
  2. currentTime を [[current frame]] を sampleRate で除算した値に設定します。
6. render result を true に設定します。
Perform a microtask checkpoint.
render result を返します。

ミュートは AudioNode に対して、このオーディオブロックのレンダリングでは、無音が出力されなければならないことを意味します。

AudioNode からバッファを読み取り可能にすることは、この AudioNode に接続されている他の AudioNode から安全に読み込める状態にすることを意味します。

注 : たとえば、実装では新しいバッファを割り当てるか、現在使用されていない既存のバッファを再利用してより精巧なメカニズムを選択することもできます。

AudioNode の入力を記録することは、この AudioNode の入力データを将来の使用のためにコピーすることを意味します。

オーディオブロックを計算するということは、この AudioNode のアルゴリズムを実行して 128 のサンプルフレームを生成することを意味します。

入力バッファを処理するということは、AudioNode のアルゴリズムの入力としてこの AudioNode の入力バッファと AudioParam の値を使用し、このアルゴリズムを実行することを意味します。

2.5. ドキュメントのアンロード

BaseAudioContext を使用するドキュメントに対して、更にドキュメントアンロード時のクリーンアップ手順が定義されています :

関連付けられたグローバルオブジェクトがドキュメントのウィンドウである AudioContext および OfflineAudioContext のそれぞれについて [[pending promises]] にあるプロミスのすべてを InvalidStateError でリジェクトします。
すべての デコーディングスレッド を停止します。
AudioContext または OfflineAudioContext を close() するための制御メッセージをキューに入れます。

3. 動的ライフタイム

3.1. 背景

注 : AudioContext と AudioNode のライフタイム特性の基準情報としての説明は AudioContext のライフタイムと AudioContext lifetime and AudioNode のライフタイムで説明されています。

このセクションは非基準情報です。

静的なルーティング設定の構築が可能である事に加えて、動的に割り当てられて限られたライフタイムを持つ「ボイス」に対して特別なエフェクトのルーティングを行う事が可能である必要があります。この議論のためにこれらの短期間だけ存在する音を "ノート" と呼びます。多くのオーディオアプリケーションがこのノートという考え方を組み込んでおり、例として、ドラムマシン、シーケンサー、多くのワンショットの音がゲームプレイに従ってトリガーされる 3D ゲームがあります。

従来のソフトウェアシンセサイザーでは、ノートは使用可能なリソースのプールから動的に割り当てられ、解放されます。ノートは MIDI ノートオン・メッセージを受信すると割り当てられます。それはそのノートが発音を終了するか、( もしループ再生でなければ ) サンプルデータの終わりに達したときに解放されます。それは、エンベロープで値が 0 のサスティンフェーズに達したり、MIDI ノートオフ・メッセージによってエンベロープのリリースフェーズに達したりする事で発生します。MIDI ノートオフの場合には、そのノートは即時ではなく、リリースエンベロープが終了した時点で解放されます。どの時間においても、多数のノートが再生中であり、常に新しいノートがルーティンググラフに追加され、古いノートが解放されながらそのノートの組は常に変化しています。

オーディオシステムはそれぞれの "ノート" イベントに対して、ルーティンググラフの一部分の切り落としを自動的に行います。1 つの "ノート" は 1 つの AudioBufferSourceNode で表され、それは直接、他の処理ノードに接続さする事ができます。ノートが再生を終了したとき、コンテキストは自動的にその AudioBufferSourceNode への参照を解放します。それによって、そのノードが接続されていた先のすべてのノードへの参照が解放され、という風に続きます。そのノードは自動的にグラフから切断され、すべての参照が無くなった時点で破棄されます。グラフ内の、長時間存在して動的なボイスから共有されるノードは明示的に管理する事ができます。複雑なように聞こえますが、これらはすべて、特別なハンドリングをする必要はなく、自動的に行われます。

3.2. 例

ローパスフィルター、パンナー、2 番目のゲインノードがワンショットの音から直接接続されています。そのため再生が終わったとき、コンテキストは自動的にそれら (点線内のすべて) を解放します。もしワンショットの音とそれに接続されているノードへの参照がもう無ければ、それらはすぐにグラフから外され破棄されます。ストリーミングのソースはグローバルな参照を持っており、それが明示的に切断されるまで接続されたままで残ります。JavaScript ではどうなるのかをここに示します:

let context = 0;let compressor = 0;let gainNode1 = 0;let streamingAudioSource = 0;// Initial setup of the "long-lived" part of the routing graphfunction setupAudioContext() {    context = new AudioContext();    compressor = context.createDynamicsCompressor();    gainNode1 = context.createGain();    // Create a streaming audio source.    const audioElement = document.getElementById('audioTagID');    streamingAudioSource = context.createMediaElementSource(audioElement);    streamingAudioSource.connect(gainNode1);    gainNode1.connect(compressor);    compressor.connect(context.destination);}// Later in response to some user action (typically mouse or key event)// a one-shot sound can be played.function playSound() {    const oneShotSound = context.createBufferSource();    oneShotSound.buffer = dogBarkingBuffer;    // Create a filter, panner, and gain node.    const lowpass = context.createBiquadFilter();    const panner = context.createPanner();    const gainNode2 = context.createGain();    // Make connections    oneShotSound.connect(lowpass);    lowpass.connect(panner);    panner.connect(gainNode2);    gainNode2.connect(compressor);    // Play 0.75 seconds from now (to play immediately pass in 0)    oneShotSound.start(context.currentTime + 0.75);}

4. チャンネルのアップミックスとダウンミックス

このセクションは基準情報です。

AudioNode　の入力には、すべての接続のチャンネルを組み合わせるためのミキシング規則を持っています。単純な例としては、もし入力がモノラル出力とステレオ出力から接続されている場合、そのモノラル接続は通常、ステレオにアップミックスされ、ステレオ接続と加算されます。しかしもちろん、すべての AudioNode のすべての入力について、その正確なミキシング規則を定義する事が重要です。すべての入力に対するデフォルトのミキシング規則は、特に非常に良く使われるモノラルとステレオのストリームに対しては、あまり詳細について煩わされる事なく "ちゃんと動作する" ように選ばれます。しかしもちろん、高度な使用例、特にマルチチャンネルの場合にはその規則は変更する事が可能です。

いくつかの用語の定義として、アップミックスは、小さなチャンネル数のストリームを受け取り、大きなチャンネル数のストリームに変換する処理を指します。ダウンミックスは、大きなチャンネル数のストリームを受け取り、小さなチャンネル数のストリームに変換する処理を指します。

AudioNode の入力はすべての出力からの接続をミックスする必要があります。この処理の一部として、任意の時刻における、入力の実際のチャンネル数を表す内部的な値、a data-link-type="dfn" href="#computednumberofchannels" id="ref-for-computednumberofchannels⑦">computedNumberOfChannels を計算します。

AudioNode のそれぞれの入力の実装は次のようにしなくてはなりません ( MUST ):

computedNumberOfChannels を計算します。
入力へのそれぞれの接続に対して:
1. 接続を、ノードの channelInterpretation 属性で与えられる ChannelInterpretation に従って computedNumberOfChannels にアップミックスまたはダウンミックスします。
2. ( 他の接続からの ) ミックスされたストリームとミックスします。これは各接続のステップ 1 でアップミックスまたはダウンミックスされた対応するそれぞれのチャンネルをそのままミックスします。

4.1. スピーカーチャンネル配置

channelInterpretation が "speakers" の場合、特定のチャンネル配置に対してのアップミックスおよびダウンミックスが定義されます。

モノラル ( 1 チャンネル )、ステレオ ( 2 チャンネル )、クワッド ( 4 チャンネル )、そして 5.1 ( 6 チャンネル ) がサポートされなくてはなりません ( MUST )。それ以外のチャンネル配置についてはこの仕様の将来のバージョンでサポートされるかもしれません。

4.2. チャンネルの順序

チャンネルの順序は次の表で定義されます。個々のマルチチャンネルのフォーマットには、間にあるすべてのチャンネルをサポートしていないものがあります ( MAY )。実装は、供給されたチャンネルを、以下に定義された順序で、存在しないチャンネルをスキップして割り当てなければなりません ( MUST )。

順序	ラベル	モノ	ステレオ	クワッド	5.1
0	SPEAKER_FRONT_LEFT	0	0	0	0
1	SPEAKER_FRONT_RIGHT		1	1	1
2	SPEAKER_FRONT_CENTER				2
3	SPEAKER_LOW_FREQUENCY				3
4	SPEAKER_BACK_LEFT			2	4
5	SPEAKER_BACK_RIGHT			3	5
6	SPEAKER_FRONT_LEFT_OF_CENTER
7	SPEAKER_FRONT_RIGHT_OF_CENTER
8	SPEAKER_BACK_CENTER
9	SPEAKER_SIDE_LEFT
10	SPEAKER_SIDE_RIGHT
11	SPEAKER_TOP_CENTER
12	SPEAKER_TOP_FRONT_LEFT
13	SPEAKER_TOP_FRONT_CENTER
14	SPEAKER_TOP_FRONT_RIGHT
15	SPEAKER_TOP_BACK_LEFT
16	SPEAKER_TOP_BACK_CENTER
17	SPEAKER_TOP_BACK_RIGHT

4.3. 入力および出力チャンネル数に対するテールタイムの影響

AudioNode にゼロ以外のテールタイムがあり、入力チャンネルカウントに依存する出力チャンネルカウントがある場合、入力チャンネルカウントが変更されるときに AudioNode のテールタイムを考慮する必要があります。

入力のチャンネル数が減少する場合、出力チャネル数の変化は、大きなチャンネル数で受け取った入力がもう出力に影響を与えなくなった時に発生しなくてはなりません ( MUST )。

入力のチャンネル数が増加する場合の動作は AudioNode のタイプによって異なります :

DelayNode または DynamicsCompressorNode の場合、大きなチャンネル数で受け取った入力が出力に影響を及ぼし始める時に、出力チャンネルの数が増加しなくてはなりません ( MUST )。
テールタイムを持っている他の AudioNode の場合、出力チャンネルの数は即時に変化しなくてはなりません ( MUST )。

注 : ConvolverNode の場合、これはインパルス応答がモノラルの場合にのみ適用されます。それ以外の場合 ConvolverNode は、入力チャンネル数に関係なく常にステレオ信号を出力します。

注 : 直感的に、これによって処理の結果としてステレオ情報が失われることはありません。複数の異なるチャンネル数の入力レンダリング量子が出力レンダリング量子に寄与する場合、出力レンダリング量子のチャンネル数は、入力レンダリング量子の入力チャンネル数のスーパーセットになります。

4.4. アップミックスのスピーカー配置

Mono up-mix:
 
   1 -> 2 : up-mix from mono to stereo
     output.L = input;
     output.R = input;
 
   1 -> 4 : up-mix from mono to quad
     output.L = input;
     output.R = input;
     output.SL = 0;
     output.SR = 0;
 
   1 -> 5.1 : up-mix from mono to 5.1
     output.L = 0;
     output.R = 0;
     output.C = input; // put in center channel
     output.LFE = 0;
     output.SL = 0;
     output.SR = 0;
 
 Stereo up-mix:
 
   2 -> 4 : up-mix from stereo to quad
     output.L = input.L;
     output.R = input.R;
     output.SL = 0;
     output.SR = 0;
 
   2 -> 5.1 : up-mix from stereo to 5.1
     output.L = input.L;
     output.R = input.R;
     output.C = 0;
     output.LFE = 0;
     output.SL = 0;
     output.SR = 0;
 
 Quad up-mix:
 
   4 -> 5.1 : up-mix from quad to 5.1
     output.L = input.L;
     output.R = input.R;
     output.C = 0;
     output.LFE = 0;
     output.SL = input.SL;
     output.SR = input.SR;

4.5. ダウンミックスのスピーカー配置

ダウンミックスは例えば、 5.1 チャンネルのソース素材を処理しながらステレオで再生している場合、などに必要になります。

Mono down-mix:
 
   2 -> 1 : stereo to mono
     output = 0.5 * (input.L + input.R);
 
   4 -> 1 : quad to mono
     output = 0.25 * (input.L + input.R + input.SL + input.SR);
 
   5.1 -> 1 : 5.1 to mono
     output = sqrt(0.5) * (input.L + input.R) + input.C + 0.5 * (input.SL + input.SR)
 
 Stereo down-mix:
 
   4 -> 2 : quad to stereo
     output.L = 0.5 * (input.L + input.SL);
     output.R = 0.5 * (input.R + input.SR);
 
   5.1 -> 2 : 5.1 to stereo
     output.L = L + sqrt(0.5) * (input.C + input.SL)
     output.R = R + sqrt(0.5) * (input.C + input.SR)
 
 Quad down-mix:
 
   5.1 -> 4 : 5.1 to quad
     output.L = L + sqrt(0.5) * input.C
     output.R = R + sqrt(0.5) * input.C
     output.SL = input.SL
     output.SR = input.SR

4.6. チャンネル規則の例

// Set gain node to explicit 2-channels (stereo).gain.channelCount = 2;gain.channelCountMode = "explicit";gain.channelInterpretation = "speakers";// Set "hardware output" to 4-channels for DJ-app with two stereo output busses.context.destination.channelCount = 4;context.destination.channelCountMode = "explicit";context.destination.channelInterpretation = "discrete";// Set "hardware output" to 8-channels for custom multi-channel speaker array// with custom matrix mixing.context.destination.channelCount = 8;context.destination.channelCountMode = "explicit";context.destination.channelInterpretation = "discrete";// Set "hardware output" to 5.1 to play an HTMLAudioElement.context.destination.channelCount = 6;context.destination.channelCountMode = "explicit";context.destination.channelInterpretation = "speakers";// Explicitly down-mix to mono.gain.channelCount = 1;gain.channelCountMode = "explicit";gain.channelInterpretation = "speakers";

5. オーディオ信号の値

5.1. オーディオサンプルのフォーマット

リニアパルスコード変調 ( リニア PCM ) は、オーディオ値が一定の間隔でサンプリングされ、2 つの連続する値の間の量子化レベルが線形的に均一である形式を表します。

本仕様で、信号の値がスクリプトから見える状態になる場合、多くは Float32Array オブジェクトの形で、リニア 32 ビット浮動小数点パルスコード変調形式 ( リニア 32 ビット浮動小数点 PCM ) 形式になります。

5.2. レンダリング

どのようなオーディオグラフでも destination ノードにおけるすべてのオーディオ信号の公称範囲は [-1, 1] です。この範囲外の値の信号、あるいは NaN、正の無限値、負の無限値のオーディオレンダリングはこの仕様では定義されていません。

6. 空間音響 / パンニング

6.1. 背景

近年の 3D ゲームで良く要求される機能として、動的な空間音響と複数の音源の 3D 空間での移動があります。例えば OpenAL がこの機能を持っています。

PannerNode を使って、オーディオストリームを AudioListener に対する相対的な空間位置に配置し、定位させる事ができます。BaseAudioContext は単一の AudioListener を持っています。パンナーとリスナーはどちらも右手系デカルト座標の 3D 空間内の位置を持っています。エフェクトの計算で使われる座標系は、メートルやフィートのような特別な単位とは独立した不変の座標系になっているため、座標空間で使用される単位は定められておらず、その必要もありません。( ソースストリームの ) PannerNode オブジェクトは音が放出される方向を示す orientation ベクトルを持っています。加えてそれらは音の指向性の強さを示す サウンドコーン を持っています。例えば、音が無指向性であれば、方向には関係なくどこからでも聴こえますが、指向性が強い場合、それがリスナーの方向を向いている場合にだけ聴こえます。( 人間の耳を表す ) AudioListener オブジェクトは人間が向いている方向を表すために forward と up のベクトルを持っています。

空間化の座標系を下の図に示し、デフォルト値を示します。見やすくするため AudioListener と PannerNode の場所はデフォルトの位置から移動しています。

panner-coord — AudioListener と PannerNode の属性を表示した座標系の図

レンダリングの間、PannerNode は アジマス と エレベーション を計算します。これらの値は空間音響をレンダリングするために実装によって内部的に使用されます。これらの値がどのように使われるかの詳細については、パンニングアルゴリズムセクションを参照してください。

6.2. アジマスとエレベーション

PannerNode の アジマス と エレベーション を計算するには、次のアルゴリズムを使用しなくてはなりません ( MUST )。実装は、以下のさまざまな AudioParam が "a-rate" なのか "k-rate" なのかを適切に考慮する必要があります。

// Let |context| be a BaseAudioContext and let |panner| be a// PannerNode created in |context|.// Calculate the source-listener vector.const listener = context.listener;const sourcePosition = new Vec3(panner.positionX.value, panner.positionY.value,                                panner.positionZ.value);const listenerPosition =    new Vec3(listener.positionX.value, listener.positionY.value,             listener.positionZ.value);const sourceListener = sourcePosition.diff(listenerPosition).normalize();if (sourceListener.magnitude == 0) {  // Handle degenerate case if source and listener are at the same point.  azimuth = 0;  elevation = 0;  return;}// Align axes.const listenerForward = new Vec3(listener.forwardX.value, listener.forwardY.value,                                 listener.forwardZ.value);const listenerUp =    new Vec3(listener.upX.value, listener.upY.value, listener.upZ.value);const listenerRight = listenerForward.cross(listenerUp);if (listenerRight.magnitude == 0) {  // Handle the case where listener’s 'up' and 'forward' vectors are linearly  // dependent, in which case 'right' cannot be determined  azimuth = 0;  elevation = 0;  return;}// Determine a unit vector orthogonal to listener’s right, forwardconst listenerRightNorm = listenerRight.normalize();const listenerForwardNorm = listenerForward.normalize();const up = listenerRightNorm.cross(listenerForwardNorm);const upProjection = sourceListener.dot(up);const projectedSource = sourceListener.diff(up.scale(upProjection)).normalize();azimuth = 180 * Math.acos(projectedSource.dot(listenerRightNorm)) / Math.PI;// Source in front or behind the listener.const frontBack = projectedSource.dot(listenerForwardNorm);if (frontBack < 0)  azimuth = 360 - azimuth;// Make azimuth relative to "forward" and not "right" listener vector.if ((azimuth >= 0) && (azimuth <= 270))  azimuth = 90 - azimuth;else  azimuth = 450 - azimuth;elevation = 90 - 180 * Math.acos(sourceListener.dot(up)) / Math.PI;if (elevation > 90)  elevation = 180 - elevation;else if (elevation < -90)  elevation = -180 - elevation;

6.3. パンニングアルゴリズム

モノラルからステレオ と ステレオからステレオ のバンニングがサポートされなくてはなりません ( MUST )。モノラルからステレオ の処理は入力への接続がすべてモノラルの場合に使用されます。そうでない場合、は ステレオからステレオ の処理が使用されます。

6.3.1. PannerNode の "equalpower" パンニング

これは単純で比較的安価なアルゴリズムで、基本的ですが妥当な結果を提供します。これは PannerNode で panningModel 属性が "equalpower" に設定されている場合に使用され、この場合 エレベーション の値は無視されます。このアルゴリズムは automationRate で指定された適切なレートを使用して実装する必要があります。もし PannerNode の AudioParam または AudioListener の AudioParam のいずれかが "a-rate" である場合、a-rate での処理を使用する必要があります。

この AudioNode で処理される各サンプルごとに:

azimuth をアジマスとエレベーションセクションで説明されているとおりに計算します。

azimuth の値は、まず以下の式に従って [ -90 , 90 ] の範囲内に変換します :

// First, clamp azimuth to allowed range of [-180, 180].
 azimuth = max(-180, azimuth);
 azimuth = min(180, azimuth);
 
 // Then wrap to range [-90, 90].
 if (azimuth < -90)
   azimuth = -180 - azimuth;
 else if (azimuth > 90)
   azimuth = 180 - azimuth;

モノラル入力に対して、正規化された値 x は、azimuth から次のように計算されます:

x = (azimuth + 90) / 180;

また、ステレオ入力に対しては:

if (azimuth <= 0) { // -90 -> 0
   // Transform the azimuth value from [-90, 0] degrees into the range [-90, 90].
   x = (azimuth + 90) / 90;
 } else { // 0 -> 90
   // Transform the azimuth value from [0, 90] degrees into the range [-90, 90].
   x = azimuth / 90;
 }

左および右のゲイン値は次のように計算されます:

gainL = cos(x * Math.PI / 2);
 gainR = sin(x * Math.PI / 2);

またはモノラル入力の場合のステレオ出力は次のように計算されます:

outputL = input * gainL;
 outputR = input * gainR;

また、ステレオ入力でステレオ出力の場合の計算は:

if (azimuth <= 0) {
   outputL = inputL + inputR * gainL;
   outputR = inputR * gainR;
 } else {
   outputL = inputL * gainL;
   outputR = inputR + inputL * gainR;
 }

距離効果で説明されている距離ゲインとサウンドコーンで説明されている円錐ゲインを適用します：

let distance = distance();
 let distanceGain = distanceModel(distance);
 let totalGain = coneGain() * distanceGain();
 outputL = totalGain * outputL;
 outputR = totalGain * outputR;

6.3.2. PannerNode の "HRTF" パンニング ( ステレオのみ )

この処理には様々なアジマスとエレベーションで記録された HRTF (Head-related Transfer Function : 頭部伝達関数) インパルスレスポンスのセットが必要です。実装には高度に最適化されたコンボリューション機能が必要になります。これは "equalpower" よりもコストが必要ですが、より空間的な音を得る事ができます。

6.3.3. StereoPannerNode のパンニング

StereoPannerNode は、とかのアルゴリズムを実装しなければなりません ( MUST )。

この AudioNode で計算される各サンプルに対して
1. pan をこの StereoPannerNode の pan AudioParam の computedValue とします。
2. pan を [-1, 1] の範囲にクランプします。
```
pan = max(-1, pan);
 pan = min(1, pan);
 
```
3. pan の値を [0, 1] に正規化して x を計算します。モノラル入力の場合 :
```
x = (pan + 1) / 2;
 
```
  ステレオ入力の場合は :
```
if (pan <= 0)
   x = pan + 1;
 else
   x = pan;
 
```
4. 左および右のゲイン値を次のように計算します :
```
gainL = cos(x * Math.PI / 2);
 gainR = sin(x * Math.PI / 2);
 
```
5. モノラル入力でステレオ出力の場合の計算は :
```
outputL = input * gainL;
 outputR = input * gainR;
 
```
  そうでなく、ステレオ入力でステレオ出力の場合の計算は :
```
if (pan <= 0) {
   outputL = inputL + inputR * gainL;
   outputR = inputR * gainR;
 } else {
   outputL = inputL * gainL;
   outputR = inputR + inputL * gainR;
 }
 
```

6.4. 距離効果

近くの音は大きく、遠くの音は小さくなります。正確には、リスナーからの距離に対して どのように 音量が変わるかは distanceModel 属性に依存します。

オーディオレンダリングの際に、distance 値がパンナーとリスナーの位置を基に次のように計算されます :

function distance(panner) {  const pannerPosition = new Vec3(panner.positionX.value, panner.positionY.value,                                  panner.positionZ.value);  const listener = context.listener;  const listenerPosition =      new Vec3(listener.positionX.value, listener.positionY.value,               listener.positionZ.value);  return pannerPosition.diff(listenerPosition).magnitude;}

そして、distance を使って distanceModel 属性に依存した distanceGain が計算されます。それぞれの距離モデルについて、これがどのように計算されるかの詳細は DistanceModelType セクションを参照してください。

この処理の一部として、PannerNode は入力されるオーディオ信号を distanceGain でスケーリング/増幅し、遠くの音は小さく近ければ大きくします。

6.5. サウンドコーン

リスナーとそれぞれの音源はそれがどの方向を向いているかを表す方向ベクトルを持っています。それぞれの音源の音の放射特性は、音源の方向ベクトルに対してソース/リスナー間の角度の関数で音の大きさを表した内部および外部の "コーン" で表現されます。つまり、直接リスナーの方を向いた音源は、違う方向を向いた音源よりも大きく聴こえます。音源はまた、無指向性に設定する事も可能です。

次の図は、リスナーに対するソースのコーンの関係を示しています。この図では、coneInnerAngle = 50 で coneOuterAngle = 120 です。つまり、内側の円錐は、方向ベクトルの両側に 25 度広がります。同様に、外側の円錐は両側とも 60 度です。

cone-diagram — ソースの方向とリスナーの位置と方向に関連するソースのコーン角度

あるソース( PannerNode )とリスナーに対して、コーンの効果によるゲインへの影響を計算するためには、次のアルゴリズムを使用しなくてはなりません ( MUST ):

function coneGain() {  const sourceOrientation =      new Vec3(source.orientationX, source.orientationY, source.orientationZ);  if (sourceOrientation.magnitude == 0 ||      ((source.coneInnerAngle == 360) && (source.coneOuterAngle == 360)))    return 1; // no cone specified - unity gain  // Normalized source-listener vector  const sourcePosition = new Vec3(panner.positionX.value, panner.positionY.value,                                  panner.positionZ.value);  const listenerPosition =      new Vec3(listener.positionX.value, listener.positionY.value,               listener.positionZ.value);  const sourceToListener = sourcePosition.diff(listenerPosition).normalize();  const normalizedSourceOrientation = sourceOrientation.normalize();  // Angle between the source orientation vector and the source-listener vector  const angle = 180 *                Math.acos(sourceToListener.dot(normalizedSourceOrientation)) /                Math.PI;  const absAngle = Math.abs(angle);  // Divide by 2 here since API is entire angle (not half-angle)  const absInnerAngle = Math.abs(source.coneInnerAngle) / 2;  const absOuterAngle = Math.abs(source.coneOuterAngle) / 2;  let gain = 1;  if (absAngle <= absInnerAngle) {    // No attenuation    gain = 1;  } else if (absAngle >= absOuterAngle) {    // Max attenuation    gain = source.coneOuterGain;  } else {    // Between inner and outer cones    // inner -> outer, x goes from 0 -> 1    const x = (absAngle - absInnerAngle) / (absOuterAngle - absInnerAngle);    gain = (1 - x) + source.coneOuterGain * x;  }  return gain;}

7. パフォーマンスに関する考察

7.1. レイテンシー

Web アプリケーションでは、マウスとキーボードのイベント (keydown、mousedown 等) と聴こえる音の間のディレイタイムは重要です。

この時間の遅れはレイテンシーと呼ばれ、いくつかの要因 ( 入力デバイスのレイテンシー、内部バッファーのレイテンシー、DSP 処理のレイテンシー、出力デバイスのレイテンシー、スピーカーとユーザーの耳の距離、など ) によって引き起こされ、累積されてゆきます。レイテンシーが大きいとユーザー体験の満足度は下がります。極端な場合、それは音楽制作やゲームプレイを不可能にする事もあります。ある程度のレベルになるとそれはタイミングに影響し、音が遅れている、あるいはゲームが反応しないなどの印象を与えます。音楽アプリケーションではタイミングの問題はリズムに影響します。ゲームではタイミングの問題はゲームプレイの精度に影響します。インタラクティブなアプリケーションでは、それは一般的にアニメーションのフレームレートがとても低いのと同じようにユーザー体験を非常に安っぽくします。満足できるレイテンシーはアプリケーションによって異なり、3 ～ 6 ミリ秒から 25 ～ 50 ミリ秒程度です。

実装は一般的に全体的なレイテンシーを最小化する事を目指します。

全体的なレイテンシーの最小化とあわせて、実装は一般的に AudioContext の currentTime と AudioProcessingEvent の playbackTime の差を最小化する事を目指します。ScriptProcessorNode が廃止予定となった事でこの考慮はその内問題とならなくなるでしょう。

さらに、AudioNode の中には、オーディオグラフのいくつかのパスに遅延を追加するものがあります。特に:

AudioWorkletNode は内部にバッファを持つスクリプトで信号を遅らせる事ができます。
DelayNode は制御された遅延を加える役割りを持っています。
BiquadFilterNode と IIRFilterNode のフィルタ設計は、因果的フィルター処理の自然な結果として、入力されるサンプルを遅延させます。
ConvolverNode はインパルスによる畳み込み演算の自然な結果として、入力されるサンプルを遅延させます。
DynamicsCompressorNode は先読みアルゴリズムを持っており、それが信号の経路に遅延を発生させます。
MediaStreamAudioSourceNode、MediaStreamTrackAudioSourceNode、および MediaStreamAudioDestinationNodeは、遅延を発生する内部のバッファを実装依存で追加されます。
ScriptProcessorNode は、制御スレッドとレンダリングスレッドの間にバッファを持つことができます。
WaveShaperNode はオーバーサンプリング時に、オーバーサンプリングの手法に応じて信号の経路に遅延を発生させます。

7.2. オーディオバッファのコピー

AudioBuffer に対して内容の取得処理が行われるとき、処理全体は通常、チャンネルデータのコピーをする事なく実装する事ができます。特に、最後のステップは次の getChannelData() の呼び出しまで先延ばしにするべきです ( SHOULD )。それは ( 例えば、複数の AudioBufferSourceNode が同じ AudioBuffer を再生するような ) getChannelData() による間隔をあけない連続した内容の取得処理がアロケーションやコピーをする事なく実装できる事を意味します。

実装はさらに最適化を行う事ができます : AudioBuffer に対して getChannelData() が呼び出される時、新たな ArrayBuffer はまだ割り当てられていませんが、以前 AudioBuffer の内容の取得操作を行った呼び出し側がその AudioBuffer のデータの使用を終えているならば、その生データのバッファを再利用して新しい AudioBuffer で使用する事で、チャネルデータの再割り当てやコピーを回避する事ができます。

7.3. AudioParam の遷移

AudioParam の value 属性に直接値を設定した際、自動的な平滑化が行われない一方で、いくつかのパラメーターは直接的な値の設定に対して滑らかな変化が望まれます。

setTargetAtTime() メソッドを低い timeConstant で使う事で作成者は滑らかな変化を実現する事ができます。

7.4. オーディオグリッジ

オーディオグリッジは正常な連続したオーディオストリームが途切れる事で発生し、大きなクリックノイズやポップノイズを引き起こします。それはマルチメディアシステムでは最悪の失敗と考えられ、絶対に避けなければなりません ( MUST )。それは適切な優先度を持っていなかったり時間的制約から起こるスケジューリングの遅延のような事が原因で、オーディオストリームをハードウェアに供給するスレッドの反応速度の問題によって引き起こされる事があります。また、それはオーディオ DSP が与えられた CPU の速度ではリアルタイムで処理できないような多量の仕事をしようとする事で起こる場合もあります。

8. セキュリティとプライバシーの考察

W3C TAG は、仕様の編集者向けの参考情報として「自己レビューアンケート：セキュリティとプライバシー」を開発中です。

考慮すべき点について

この仕様は個人を特定できる情報を扱いますか？

Web Audio API を使用して聴力検査を行うことができ、個人に対して聞こえる周波数の範囲を明らかにすることができます ( これは年齢とともに減少します )。アクティブな参加を必要とするため、ユーザーの認識と同意なしにこれを行うことは困難です。
この仕様は高価値のデータを処理しますか？

いいえ。クレジットカード情報などは Web Audio では使用されていません。Web Audio を使用して、プライバシーに関する懸案事項であるかもしれない音声データを処理または分析することは可能ですが、ユーザーのマイクへのアクセスは getUserMedia() を介する許可ベースになります。
この仕様では、オリジンのためにブラウズセッションをまたいで保持される新しいステータスが導入されていますか？

いいえ、AudioWorklet はブラウズセッションをまたいで保持されません。
この仕様は、永続的なクロスオリジンなステータスを Web に公開していますか？

はい、サポートされているオーディオサンプルレートと出力デバイスのチャンネル数が公開されています。AudioContext を参照してください。
この仕様は、現在アクセスしていないオリジンに何か他のデータを公開していますか？

はい。利用可能な AudioNode に関するさまざまな情報を提供する場合、Web Audio API は、AudioNode インターフェイスを使用するページにクライアントの特徴的な機能に関する情報 ( オーディオハードウェアのサンプルレートなど ) を公開する可能性があります。さらに、タイミング情報は、AnalyserNode または ScriptProcessorNode インターフェイスを通じて収集することができます。その後、この情報を使用してクライアントのフィンガープリントを作成することができます。

Princeton CITP の研究、 Web Transparency and Accountability Project は DynamicsCompressorNode と OscillatorNode を使用して、クライアントからエントロピーを収集してデバイスのフィンガープリントを行うことができることを示しました。これは、DSP アーキテクチャー、リサンプリング戦略、および異なる実装間のトレードオフの小規模で、通常は聞き取れない違いによるものです。正確なコンパイラーフラグと CPU アーキテクチャ ( Arm vs. x86 ) もこのエントロピーに貢献します。

しかし実際には、これは単に "これは x86 上で実行されている Chrome" のように、簡単な手段 ( ユーザーエージェント文字列 ) で既に読み込み可能な情報の推論だけです。

クロックスキューによるフィンガープリントは、Steven J Murdoch と Sebastian Zander によって記述されています。これは getOutputTimestamp から判断することができます。スキューベースのフィンガープリンティングは、 Nakibly et. al. for HTML でも実証されています。クロック分解能とドリフトの詳細については、 Privacy & Security appendix of High Resolution Time を参照してください。

レイテンシーによるフィンガープリンティングも可能です。これを baseLatency と outputLatency から推論することは可能かもしれません。軽減策としてはジッター ( ディザリング ) と量子化を追加して、正確なスキューについて正しくない報告をする事も含まれます。ただし、ほとんどのオーディオシステムでは、WebAudio によって生成されたオーディオを他のオーディオまたはビデオソース、またはビジュアルキュー ( 例えばゲーム、オーディオ録音、音楽制作環境など ) と同期させるために、低いレイテンシーを目指しています。過度の待ち時間はユーザビリティを低下させ、アクセシビリティの問題になる可能性があります。
この仕様は、新しいスクリプトの実行/読み込みのメカニズムを有効にしますか？

いいえ、[worklets-1] をその仕様で定義されている実行方法で使用します。
この仕様は、オリジンがユーザーのいる場所へのアクセスする事を可能にしますか？

いいえ。

No.
この仕様は、ユーザーのデバイス上のセンサにオリジンがアクセスする事を許可していますか？

直接的にはありません。現在、オーディオ入力はこのドキュメントでは規定されていませんが、クライアントマシンのオーディオ入力またはマイクにアクセスする事を含んでいます。これは、おそらく getUserMedia() API を介して、ユーザーに適切な方法で許可を求める必要があります。
この仕様は、オリジンがユーザーのローカルコンピューティング環境の側面にアクセスすることを可能にしますか？

Does this specification allow an origin access to aspects of a user’s local computing environment?

直接的にはありません。要求されたすべてのサンプルレートがサポートされ、必要に応じてアップサンプリングが行われます。 MediaTrackSupportedConstraints で、Media Capture および Streams を使用して、サポートされているオーディオサンプルレートを調べることができます。これには明示的なユーザー同意が必要です。これは、フィンガープリントの小さな測定を提供します。しかし、実際には、ほとんどの民生機器とプロスペクター機器は、44.1kHz ( 本来は CD で使用 ) と 48kHz ( もともとは DAT で使用 ) の 2 つの標準化されたサンプルレートのいずれかを使用します。高度にリソースが制約されたデバイスは、音声品質の 11kHz のサンプルレートをサポートし、ハイエンドデバイスは、88.2、96、またはオーディオファイル 192kHz のレートをサポートすることがあります。

すべての実装が 48kHz などの単一サポートされたレートにアップサンプリングするように要求する事は、特別なメリットがなく CPU コストが増加し、一方でハイエンドデバイスに低速なレートを使用させるのは、プロフェッショナル向けには不適切です。
この仕様は、オリジンが他の装置へアクセスする事を可能にしますか？

通常、他のネットワーク機器へのアクセスは許可されていません ( ハイエンドの録音スタジオでの例外は、Dante ネットワーク機器である場合がありますが、通常は別個の専用ネットワークを使用します )。これは、必要に応じて、ユーザーのオーディオ出力デバイスまたはコンピューターへの個別のユニットであるデバイスへのアクセスを可能にしています。

音声またはサウンドで作動するデバイスであれば、Web Audio API を使用して他のデバイスを制御することができるかも知れません。さらに、音操作デバイスが超音波周波数に敏感である場合、そのような制御は聞こえないかも知れません。この可能性は、<audio> または <video> 要素を介して HTML にも存在します。一般的なオーディオサンプリングレートでは、( 設計上 ) 多くの超音波情報のためのヘッドルームが不十分です。

人間の聴力の限界は通常 20kHz と言われています。44.1kHz のサンプリングレートの場合、ナイキスト限界は 22.05kHz です。真のブリックウォールフィルターを物理的に実現することができない場合、20kHz 〜 22.05kHz の間の空間は、ナイキストより上のすべての周波数を強く減衰させる高速ロールオフフィルターに使用されます。

48kHz のサンプリングレートでも、20kHz から 24kHz の帯域で急激な減衰があります ( ただし、通過帯域の位相リップルエラーを回避する方が簡単です )。
この仕様は、オリジンがユーザーエージェントのネイティブ UI に対して何らかの制御が可能ですか？

UI に音声アシスタントやスクリーンリーダーなどのオーディオコンポーネントがある場合、Web Audio API を使用して、ネイティブ UI をエミュレートして、攻撃をローカルシステムイベントのように見せることができます。この可能性は、<audio> 要素を介する事で HTML にも存在します。
この仕様では、Web に一時的な ID が公開されていますか？

いいえ。
この仕様では、ファーストパーティのコンテキストとサードパーティのコンテキストの動作を区別していますか？

いいえ。
この仕様は、ユーザーエージェントの "incognito" モードのコンテキストでどのように動作しますか？

違いはありません。
この仕様はユーザーのローカルデバイスにデータを保持しますか？

いいえ。
この仕様はユーザーのローカルデバイスにデータを保持しますか？

はい ( あなたは今それを読んでいます)。
この仕様では、デフォルトのセキュリティ特性をダウングレードできますか？

いいえ。

9. 要件とユースケース

[webaudio-usecases] を参照してください。

10. 仕様のコードのための共通定義

このセクションでは、この仕様で使用される JavaScript コードで使用される一般的な関数とクラスについて説明します。

// Three dimensional vector class.class Vec3 {  // Construct from 3 coordinates.  constructor(x, y, z) {    this.x = x;    this.y = y;    this.z = z;  }  // Dot product with another vector.  dot(v) {    return (this.x * v.x) + (this.y * v.y) + (this.z * v.z);  }  // Cross product with another vector.  cross(v) {    return new Vec3((this.y * v.z) - (this.z * v.y),      (this.z * v.x) - (this.x * v.z),      (this.x * v.y) - (this.y * v.x));  }  // Difference with another vector.  diff(v) {    return new Vec3(this.x - v.x, this.y - v.y, this.z - v.z);  }  // Get the magnitude of this vector.  get magnitude() {    return Math.sqrt(dot(this));  }  // Get a copy of this vector multiplied by a scalar.  scale(s) {    return new Vec3(this.x * s, this.y * s, this.z * s);  }  // Get a normalized copy of this vector.  normalize() {    const m = magnitude;    if (m == 0) {      return new Vec3(0, 0, 0);    }    return scale(1 / m);  }}

11. 変更履歴

11.1. 2018 年 9 月 18 日候補勧告以降

Issue 2193: Incorrect azimuth comparison in spatialization algorithm
Issue 2192: Waveshaper curve interpolation algorithm incorrect
Issue 2171: Allow not having get parameterDescriptors in an AudioWorkletProcessor
Issue 2184: PannerNode refDistance description unclear
Issue 2165: AudioScheduledSourceNode start algorithm incomplete
Issue 2155: Restore changes accidentally reverted in bikeshed conversion
Issue 2154: Exception for changing channelCountMode on ScriptProcessorNode does not match browsers
Issue 2153: Exception for changing channelCount on ScriptProcessorNode does not match browsers
Issue 2152: close() steps don’t make sense
Issue 2150: AudioBufferOptions requires throwing NotFoundError in cases that can’t happen
Issue 2149: MediaStreamAudioSourceNode constructor has weird check for AudioContext
Issue 2148: IIRFilterOptions description makes impossible demands
Issue 2147: PeriodicWave constructor examines lengths of things that might not be there
Issue 2113: BiquadFilter gain lower bound can be lower.
Issue 2096: Lifetime of pending processor construction data and exceptions in instantiation of AudioWorkletProcessor
Issue 2087: Minor issues with BiquadFilter AudioParams
Issue 2083: Missing text in WaveShaperNode?
Issue 2082: WaveShaperNode curve interpolation incomplete
Issue 2074: Should the AudioWorkletNode constructor invoke the algorithm for initializing an object that inherits from AudioNode?
Issue 2073: Inconsistencies in constructor descriptions and factory method initialization
Issue 2072: Clarification on AudioBufferSourceNode looping, and loop points
Issue 2071: cancelScheduledValues with setValueCurveAtTime
Issue 2060: Would it be helpful to restrict use of AudioWorkletProcessor.port().postMessage() in order to facilitate garbage collection?
Issue 2051: Update to constructor operations
Issue 2050: Restore ConvolverNode channel mixing configurability (up to 2 channels)
Issue 2045: Should the check on process() be removed from AudioWorkletGlobalScope.registerProcessor()?
Issue 2044: Remove options parameter from AudioWorkletProcessor constructor WebIDL
Issue 2036: Remove options parameter of AudioWorkletProcessor constructor
Issue 2035: De-duplicate initial value setting on AudioWorkletNode AudioParams
Issue 2027: Revise "processor construction data" algorithm
Issue 2021: AudioWorkletProcessor constructor leads to infinite recursion
Issue 2018: There are still issues with the setup of an AudioWorkletNode’s parameters
Issue 2016: Clarify parameters in AudioWorkletProcessor.process()
Issue 2011: AudioWorkletNodeOptions.processorOptions should not default to null.
Issue 1989: Please update to Web IDL changes to optional dictionary defaulting
Issue 1984: Handling of exceptions in audio worklet is not very clear
Issue 1976: AudioWorkletProcessor’s [[node reference]] seems to be write-only
Issue 1972: parameterDescriptors handling during AudioWorkletNode initialization is probably wrong
Issue 1971: AudioWorkletNode options serialization is underdefined
Issue 1970: "active source" flag handling is a weird monkeypatch
Issue 1969: It would be clearer if the various validation of AudioWorkletNodeOptions were an explicit step or set of steps
Issue 1966: parameterDescriptors is not looked up by the AudioWorkletProcessor constructor
Issue 1963: NewTarget check for AudioWorkletProcessor isn’t actually possible with a Web IDL constructor
Issue 1947: Spec is inconsistent about whether parameterDescriptors is an array or an iterable
Issue 1946: Population of "node name to parameter descriptor map" needs to be defined
Issue 1945: registerProcessor is doing odd things with threads and JS values
Issue 1943: Describe how WaveShaperNode shapes the input with the curve
Issue 1935: length of AudioWorkletProcessor.process() parameter sequences with inactive inputs
Issue 1932: Make AudioWorkletNode output buffer available for reading
Issue 1925: front vs forward
Issue 1902: Mixer Gain Structure section not needed
Issue 1906: Steps in rendering algorithm
Issue 1905: Rendering callbacks are observable
Issue 1904: Strange Note in algorithm for swapping a control message queue
Issue 1903: Funny sentence about priority and latency
Issue 1901: AudioWorkletNode state property?
Issue 1900: AudioWorkletProcessor NewTarget undefined
Issue 1899: Missing synchronous markers
Issue 1897: WaveShaper curve value setter allows multiple sets
Issue 1896: WaveShaperNode constructor says curve set is initialized to false
Issue #1471: AudioNode Lifetime section seems to attempt to make garbage collection observable
Issue #1893: Active processing for Panner/Convolver/ChannelMerger
Issue #1894: Funny text in PannerNode.orientationX
Issue #1866: References to garbage collection
Issue #1851: Parameter values used for BiquadFilterNode::getFrequencyResponse
Issue #1905: Rendering callbacks are observable
Issue #1879: ABSN playback algorithm offset
Issue #1882: Biquad lowpass/highpass Q
Issue #1303: MediaElementAudioSourceNode information in a funny place
Issue #1896: WaveShaperNode constructor says curve set is initialized to false
Issue #1897: WaveShaper curve value setter allows multiple sets.
Issue #1880: setOrientation description has confusing paragraph
Issue #1855: createScriptProcessor parameter requirements
Issue #1857: Fix typos and bad phrasing
Issue #1788: Unclear what value is returned by AudioParam.value
Issue #1852: Fix error condition of AudioNode.disconnect(destinationNode, output, input)
Issue #1841: Recovering from unstable biquad filters?
Issue #1777: Picture of the coordinate system for panner node
Issue #1802: Clarify interaction between user-invoked suspend and autoplay policy
Issue #1822: OfflineAudioContext.suspend can suspend before the given time
Issue #1772: Sorting tracks alphabetically is underspecified
Issue #1797: Specification is incomplete for AudioNode.connect()
Issue #1805: Exception ordering on error
Issue #1790: Automation example chart has an error (reversed function arguments
Fix rendering algorithm iteration and cycle breaking
Issue #1719: channel count changes in filter nodes with tail time
Issue #1563: Make decodeAudioData more precise
Issue #1481: Tighten spec on ABSN output channels?
Issue #1762: Setting convolver buffer more than once?
Issue #1758: Explicitly include time-domain processing code for BiquadFilterNode
Issue #1770: Link to correct algorithm for StereoPannerNode, mention algorithm is equal-power
Issue #1753: Have a single AudioWorkletGlobalScope per BaseAudioContext
Issue #1746: AnalyserNode: Clarify how much time domain data we’re supposed to keep around
Issue #1741: Sample rate of AudioBuffer
Issue #1745: Clarify unit of fftSize
Issue #1743: Missing normative reference to Fetch
Use "get a reference to the bytes" algorithm as needed.
Specify rules for determining output chanel count.
Clarified rendering algorithm for AudioListener.

11.2. 2018 年 6 月 19 日草案以降
Minor editorial clarifications.
Update implementation-report.html.
Widen the valid range of detune values so that any value that doesn’t cause 2^(d/1200) to overflow is valid.
PannerNode constructor throws errors.
Rephrase algorithm for setting buffer and curve.
Refine startRendering algorithm.
Make "queue a task" link to the HTML spec.
Specify more precisely, events overlapping with SetValueCurveAtTime.
Add implementation report to gh-pages.
Honor the given value in outputChannelCount.
Initialize bufferDuration outside of process() in ABSN algorithm.
Rework definition of ABSN output behavior to account for playbackRate’s interaction with the start(…duration) argument.
Add mention of video element in ultrasonic attack surface.

11.3. 2015 年 12 月 8 日草案以降

Add AudioWorklet and related interfaces to support custom nodes. This replaces ScriptProcessorNode, which is now deprecated.
Explicitly say what the channel count, mode, and interpretation values are for all source nodes.
Specify the behavior of Web Audio when a document is unloaded.
Merge the proposed SpatialListener interface into AudioListener.
Rework and clean up algorithms for panning and spatialization and define "magic functions".
Clarify that AudioBufferSourceNode looping is limited by duration argument to start().
Add constructors with options dictionaries for all node types.
Clarify parameter automation method behavior and equations. Handle cases where automation methods may interact with each other.
Support latency hints and arbitrary sample rates in AudioContext constructor.
Clear up ambiguities in definitions of start() and stop() for scheduled sources.
Remove automatic dezippering from AudioParam value setters which now equate to setValueAtTime().
Specify normative behavior of DynamicsCompressorNode.
Specify that AudioParam.value returns the most recent computed value.
Permit AudioBufferSourceNode to specify sub-sample start, duration, loopStart and loopEnd. Respecify algorithms to say exactly how looping works in all scenarios, including dynamic and negative playback rates.
Harmonized behavior of IIRFilterNode with BiquadFilterNode.
Add diagram describing mono-input-to-matrixed-stereo case.
Prevent connecting an AudioNode to an AudioParam of a different AudioContext.
Added Audioparam cancelAndHoldAtTime
Clarify behaviour of AudioParam.cancelScheduledValues().
Add playing reference to MediaElementAudioSourceNodes and MediaStreamAudioSourceNodes.
Refactor BaseAudioContext interface out of AudioContext, OfflineAudioContext.
OfflineAudioContext inherits from BaseAudioContext, not AudioContext.
"StereoPanner" replaced with the correct "StereoPannerNode".
Support chaining on AudioNode.connect() and AudioParam automation methods.
Specify behavior of events following SetTarget events.
Reinstate channelCount declaration for AnalyserNode.
Specify exponential ramp behavior when previous value is 0.
Specify behavior of setValueCurveAtTime parameters.
Add spatialListener attribute to AudioContext.
Remove section titled "Doppler Shift".
Added a list of nodes and reason why they can add latency, in an informative section.
Speced nominal ranges, nyquist, and behavior when outside the range.
Spec the processing model for the Web Audio API.
Merge the SpatialPannerNode into the PannerNode, undeprecating the PannerNode.
Merge the SpatialListener into the AudioListener, undeprecating the AudioListener.
Added latencyHint(s).
Move the constructor from BaseAudioContext to AudioContext where it belongs; BaseAudioContext is not constructible.
Specified the Behavior of automations and nominal ranges.
The playbackRate is widened to +/- infinity.
setValueCurveAtTime is modified so that an implicit call to setValueAtTime is made at the end of the curve duration.
Make setting the value attribute of an AudioParam strictly equivalent of calling setValueAtTime with AudioContext.currentTime.
Add new sections for AudioContextOptions and AudioTimestamp.
Add constructor for all nodes.
Define ConstantSourceNode.
Make the WaveShaperNode have a tail time, depending on the oversampling level.
Allow collecting MediaStreamAudioSourceNode or MediaElementAudioSourceNode when they won’t play ever again.
Add a concept of 'allowed to start' and use it when creating an AudioContext and resuming it from resume() (closes #836).
Add AudioScheduledSourceNode base class for source nodes.
Mark all AudioParams as being k-rate.

12. 謝辞

この仕様は W3C Audio Working Group の集合著作物です。

Members and former members of the Working Group and contributors to the specification are (at the time of writing, and by alphabetical order):
Adenot, Paul (Mozilla Foundation) - Specification Co-editor; Akhgari, Ehsan (Mozilla Foundation); Becker, Steven (Microsoft Corporation); Berkovitz, Joe (Invited Expert, affiliated with Noteflight/Hal Leonard) - WG co-chair from September 2013 to December 2017); Bossart, Pierre (Intel Corporation); Borins, Myles (Google, Inc); Buffa, Michel (NSAU); Caceres, Marcos (Invited Expert); Cardoso, Gabriel (INRIA); Carlson, Eric (Apple, Inc); Chen, Bin (Baidu, Inc); Choi, Hongchan (Google, Inc) - Specification Co-editor; Collichio, Lisa (Qualcomm); Geelnard, Marcus (Opera Software); Gehring, Todd (Dolby Laboratories); Goode, Adam (Google, Inc); Gregan, Matthew (Mozilla Foundation); Hikawa, Kazuo (AMEI); Hofmann, Bill (Dolby Laboratories); Jägenstedt, Philip (Google, Inc); Jeong, Paul Changjin (HTML5 Converged Technology Forum); Kalliokoski, Jussi (Invited Expert); Lee, WonSuk (Electronics and Telecommunications Research Institute); Kakishita, Masahiro (AMEI); Kawai, Ryoya (AMEI); Kostiainen, Anssi (Intel Corporation); Lilley, Chris (W3C Staff); Lowis, Chris (Invited Expert) - WG co-chair from December 2012 to September 2013, affiliated with British Broadcasting Corporation; MacDonald, Alistair (W3C Invited Experts) — WG co-chair from March 2011 to July 2012; Mandyam, Giridhar (Qualcomm Innovation Center, Inc); Michel, Thierry (W3C/ERCIM); Nair, Varun (Facebook); Needham, Chris (British Broadcasting Corporation); Noble, Jer (Apple, Inc); O’Callahan, Robert(Mozilla Foundation); Onumonu, Anthony (British Broadcasting Corporation); Paradis, Matthew (British Broadcasting Corporation) - WG co-chair from September 2013 to present; Pozdnyakov, Mikhail (Intel Corporation); Raman, T.V. (Google, Inc); Rogers, Chris (Google, Inc); Schepers, Doug (W3C/MIT); Schmitz, Alexander (JS Foundation); Shires, Glen (Google, Inc); Smith, Jerry (Microsoft Corporation); Smith, Michael (W3C/Keio); Thereaux, Olivier (British Broadcasting Corporation); Toy, Raymond (Google, Inc.) - WG co-chair from December 2017 - Present; Toyoshima, Takashi (Google, Inc); Troncy, Raphael (Institut Telecom); Verdie, Jean-Charles (MStar Semiconductor, Inc.); Wei, James (Intel Corporation); Weitnauer, Michael (IRT); Wilson, Chris (Google,Inc); Zergaoui, Mohamed (INNOVIMAX)

Web Audio API ( 日本語訳 )

W3C Candidate Recommendation, 11 June 2020

この翻訳は既に新しい版に置き換えられています。

Web Audio API

W3C Candidate Recommendation, 11 June 2020

要約 原文

この文書の位置付け 原文

序文 原文

機能 原文

モジュラールーティング 原文

API の概要 原文

1. オーディオ API 原文

1.1. BaseAudioContext インターフェース 原文

1.1.1. 属性 原文

1.1.2. メソッド 原文

1.1.3. コールバック DecodeSuccessCallback() パラメーター 原文

1.1.4. コールバック DecodeErrorCallback() パラメーター 原文

1.1.5. ライフタイム 原文

1.1.6. 内部検査やシリアライゼーションの基本機能の欠如 原文

1.1.7. BaseAudioContext サブクラスに関連付けられるシステムリソース 原文

1.2. AudioContext インターフェース 原文

1.2.1. コンストラクター 原文

1.2.2. 属性 原文

1.2.3. メソッド 原文

1.2.4. AudioContextOptions 原文

1.2.4.1. ディクショナリー AudioContextOptions メンバー 原文

1.2.5. AudioTimestamp 原文

1.2.5.1. ディクショナリー AudioTimestamp メンバー 原文

1.3. OfflineAudioContext インターフェース 原文

1.3.1. コンストラクター 原文

1.3.2. 属性 原文

1.3.3. メソッド 原文

1.3.4. OfflineAudioContextOptions 原文

1.3.4.1. ディクショナリー OfflineAudioContextOptions メンバー 原文

1.3.5. OfflineAudioCompletionEvent インターフェース 原文

1.3.5.1. 属性 原文

1.3.5.2. OfflineAudioCompletionEventInit 原文

1.3.5.2.1. ディクショナリー OfflineAudioCompletionEventInit メンバー 原文

1.4. AudioBuffer インターフェース 原文

1.4.1. コンストラクター 原文

1.4.2. 属性 原文

1.4.3. メソッド 原文

1.4.4. AudioBufferOptions 原文

1.4.4.1. ディクショナリー AudioBufferOptions メンバー 原文

1.5. AudioNode インターフェース 原文

1.5.1. AudioNode の作成 原文

1.5.2. AudioNode Tail-Time 原文

1.5.3. AudioNode のライフタイム 原文

1.5.4. 属性 原文

1.5.5. メソッド 原文

1.5.6. AudioNodeOptions 原文

1.5.6.1. ディクショナリー AudioNodeOptions メンバー 原文

1.6. AudioParam インターフェース 原文

1.6.1. 属性 原文

1.6.2. メソッド 原文

1.6.3. 値の計算 原文

1.6.4. AudioParam オートメーションの例 原文

1.7. AudioScheduledSourceNode インターフェース 原文

1.7.1. 属性 原文

1.7.2. メソッド 原文

1.8. AnalyserNode インターフェース 原文

1.8.1. コンストラクター 原文

1.8.2. 属性 原文

1.8.3. メソッド 原文

1.8.4. AnalyserOptions 原文

1.8.4.1. ディクショナリー AnalyserOptions メンバー 原文

1.8.5. 時間領域のダウンミックス 原文

1.8.6. FFT 窓関数と時間的スムージング 原文

1.9. AudioBufferSourceNode インターフェース 原文

1.9.1. コンストラクター 原文

1.9.2. 属性 原文

1.9.3. メソッド 原文

1.9.4. AudioBufferSourceOptions 原文

1.9.4.1. ディクショナリー AudioBufferSourceOptions メンバー 原文

1.9.5. ループ再生 原文

1.9.6. AudioBuffer 内容の再生 原文

1.10. AudioDestinationNode インターフェース 原文

1.10.1. 属性 原文

1.11. AudioListener インターフェース 原文

1.11.1. 属性 原文

要約

この文書の位置付け

序文

機能

モジュラールーティング

API の概要

1. オーディオ API

1.1. `BaseAudioContext` インターフェース

1.1.1. 属性

1.1.2. メソッド

1.1.3. コールバック `DecodeSuccessCallback()` パラメーター

1.1.4. コールバック `DecodeErrorCallback()` パラメーター

1.1.5. ライフタイム

1.1.6. 内部検査やシリアライゼーションの基本機能の欠如

1.1.7. `BaseAudioContext` サブクラスに関連付けられるシステムリソース

1.2. `AudioContext` インターフェース

1.2.1. コンストラクター

1.2.2. 属性

1.2.3. メソッド

1.2.4. `AudioContextOptions`

1.2.4.1. ディクショナリー `AudioContextOptions` メンバー

1.2.5. `AudioTimestamp`

1.2.5.1. ディクショナリー `AudioTimestamp` メンバー

1.3. `OfflineAudioContext` インターフェース

1.3.1. コンストラクター

1.3.2. 属性

1.3.3. メソッド

1.3.4. `OfflineAudioContextOptions`

1.3.4.1. ディクショナリー `OfflineAudioContextOptions` メンバー

1.3.5. `OfflineAudioCompletionEvent` インターフェース

1.3.5.1. 属性

1.3.5.2. `OfflineAudioCompletionEventInit`

1.3.5.2.1. ディクショナリー `OfflineAudioCompletionEventInit` メンバー

1.4. `AudioBuffer` インターフェース

1.4.1. コンストラクター

1.4.2. 属性

1.4.3. メソッド

1.4.4. `AudioBufferOptions`

1.4.4.1. ディクショナリー `AudioBufferOptions` メンバー

1.5. `AudioNode` インターフェース

1.5.1. AudioNode の作成

1.5.2. AudioNode Tail-Time

1.5.3. AudioNode のライフタイム

1.5.4. 属性

1.5.5. メソッド

1.5.6. `AudioNodeOptions`

1.5.6.1. ディクショナリー `AudioNodeOptions` メンバー

1.6. `AudioParam` インターフェース

1.6.1. 属性

1.6.2. メソッド

1.6.3. 値の計算

1.6.4. `AudioParam` オートメーションの例

1.7. `AudioScheduledSourceNode` インターフェース

1.7.1. 属性

1.7.2. メソッド

1.8. `AnalyserNode` インターフェース

1.8.1. コンストラクター

1.8.2. 属性

1.8.3. メソッド

1.8.4. `AnalyserOptions`

1.8.4.1. ディクショナリー `AnalyserOptions` メンバー

1.8.5. 時間領域のダウンミックス

1.8.6. FFT 窓関数と時間的スムージング

1.9. `AudioBufferSourceNode` インターフェース

1.9.1. コンストラクター

1.9.2. 属性

1.9.3. メソッド

1.9.4. `AudioBufferSourceOptions`

1.9.4.1. ディクショナリー `AudioBufferSourceOptions` メンバー

1.9.5. ループ再生

1.9.6. AudioBuffer 内容の再生

1.10. `AudioDestinationNode` インターフェース

1.10.1. 属性

1.11. `AudioListener` インターフェース

1.11.1. 属性

1.11.2. メソッド

1.11.3. 処理

1.12. `AudioProcessingEvent` インターフェース - DEPRECATED

1.12.1. 属性

1.12.2. `AudioProcessingEventInit`