Audiomodifizierung des Zeitskala-Wurfs

Zeit sich streckend ist der Prozess, die Geschwindigkeit oder Dauer eines Audiosignals zu ändern, ohne seinen Wurf zu betreffen.

Wurf-Schuppen oder Wurf-Verschiebung sind das Gegenteil: Der Prozess, den Wurf zu ändern, ohne die Geschwindigkeit zu betreffen. Es gibt auch fortgeschrittenere Methoden, die verwendet sind, um Geschwindigkeit, Wurf oder beide sofort als eine Funktion der Zeit zu ändern.

Diese Prozesse werden zum Beispiel verwendet, um die Würfe und Tempos von zwei bespielten Büroklammern zu vergleichen, um sich zu vermischen, wenn die Büroklammern nicht wiederdurchgeführt oder wiederprobiert werden können. (Eine Trommel-Spur, die keine aufgestellten Instrumente enthält, konnte für das Tempo ohne nachteilige Effekten gemäßigt wiederprobiert werden, aber eine aufgestellte Spur hat gekonnt nicht). Sie werden auch verwendet, um Effekten wie Erhöhung der Reihe eines Instrumentes (wie Wurf zu schaffen, der eine Gitarre unten eine Oktave auswechselt).

Wiederstichprobenerhebung

Die einfachste Weise, die Dauer oder den Wurf einer Digitalaudiobüroklammer zu ändern, ist zur Wiederprobe es. Das ist eine mathematische Operation, die effektiv eine dauernde Wellenform von seinen Proben und dann Proben dass Wellenform wieder an einer verschiedenen Rate wieder aufbaut. Wenn die neuen Proben an der ursprünglichen ausfallenden Frequenz gespielt werden, klingt die Audiobüroklammer schneller oder langsamer. Leider werden die Frequenzen in der Probe immer an derselben Rate wie die Geschwindigkeit erklettert, seinen wahrgenommenen Wurf oder unten im Prozess umstellend. Mit anderen Worten senkt das Verlangsamen der Aufnahme den Wurf, das Beschleunigen davon erhebt den Wurf, und die zwei Effekten können nicht getrennt werden. Das ist analog, zu beschleunigen oder eine Entsprechungsaufnahme, wie eine Plattenspieler-Aufzeichnung oder Band zu verlangsamen, die Backenhörnchen-Wirkung schaffend.

Phase-Sprachentschlüsselungsgerät

Eine Weise, die Länge eines Signals zu strecken, ohne den Wurf zu betreffen, soll ein Phase-Sprachentschlüsselungsgerät nach Flanagan, Golden, und Portnoff bauen.

Grundlegende Schritte:

  1. schätzen Sie die sofortige Beziehung der Frequenz/Umfangs des Signals mit dem STFT, der der getrennte Fourier ist, verwandeln sich von einem kurzen, überlappenden und glatt mit Fenster versehenen Block von Proben;
  2. wenden Sie sich etwas Verarbeitung dem Fourier gestalten Umfänge und Phasen (wie Wiederstichprobenerhebung der FFT-Blöcke) um; und
  3. führen Sie einen umgekehrten STFT durch, indem Sie das Gegenteil nehmen, das Fourier auf jedem Klotz und dem Hinzufügen der resultierenden Wellenform-Klötze umgestaltet.

Das Phase-Sprachentschlüsselungsgerät behandelt sinusoid Bestandteile so, aber frühe Durchführungen haben das beträchtliche Schmieren auf vergängliche ("geschlagene") Wellenformen bei der ganzen Kompression/Wachstumsraten der nichtganzen Zahl eingeführt, die die Ergebnisse phasey und weitschweifig macht. Neue Verbesserungen erlauben bessere Qualitätsergebnisse an allen Verhältnissen der Kompression/Vergrößerung, aber ein restlicher Schmiereffekt bleibt noch.

Die Phase-Sprachentschlüsselungsgerät-Technik kann auch verwendet werden, um Wurf-Verschiebung durchzuführen, Timbre-Manipulation, das Harmonisieren, und die anderen ungewöhnlichen Modifizierungen im Chor zu singen, von denen alle als eine Funktion der Zeit geändert werden können.

Zeitabschnitt

SOLA

Rabiner und Schafer 1978 stellen hervor eine abwechselnde Lösung, die im Zeitabschnitt arbeitet: Versuch, die Periode (oder gleichwertig die grundsätzliche Frequenz) einer gegebenen Abteilung der Welle mit einem Wurf-Entdeckungsalgorithmus (allgemein die Spitze der Autokorrelation des Signals, oder manchmal cepstral zu finden, in einer Prozession gehend), und eine Periode in einen anderen zu überblenden.

Das wird Zeitabschnitt genannt harmonisches Schuppen oder das synchronisierte Übergreifen - fügen Methode (SOLA) hinzu, und leistet etwas schneller als das Phase-Sprachentschlüsselungsgerät auf langsameren Maschinen, aber scheitert, wenn die Autokorrelation die Periode eines Signals mit komplizierten Obertönen (wie Orchesterstücke) mis-schätzt.

Adobe Audition (früher Kühl Editieren Pro), scheint, das durch das Schauen für die Periode zu lösen, die an einer Zentrum-Periode am nächsten ist, die der Benutzer angibt, der eine ganze Zahl sein sollte, die des Tempos, und zwischen 30 Hz und der niedrigsten Bassfrequenz vielfach ist.

Das wird im Spielraum viel mehr beschränkt als das gestützte Phase-Sprachentschlüsselungsgerät in einer Prozession gehend, aber kann viel weniger Verarbeiter intensiv für Echtzeitanwendungen gemacht werden. Es stellt die zusammenhängendsten Ergebnisse für den einzeln aufgestellten zur Verfügung ist Stimme oder musikalisch monoakustischen Instrument-Aufnahmen ähnlich.

Hohes Ende kommerzielle in einer Prozession gehende Audiopakete jede Vereinigung die zwei Techniken (zum Beispiel durch das Trennen des Signals in sinusoid und vergängliche Wellenformen), oder Gebrauch andere auf der Elementarwelle gestützte Techniken verwandelt sich, oder künstliche Nervennetzverarbeitung, die Zeit der höchsten Qualität erzeugend, sich streckend.

Das Entwirren der Phase und Zeit

Eine andere Weise, Wurf- und Strecken-Zeit auszuwechseln, soll Phase und Zeit mit einem monoakustischen Ton wie diejenigen von Melodie-Instrumenten trennen.

Indem

Sie nur die Zeitkontrolle verändern, können Sie strecken, zusammenschrumpfen lassen oder Zeit umkehren, oder Schleifen, wie erforderlich, in ausfallenden Synthesizern erzeugen.

Zeitzusammenschrumpfen kann auch zu Kompressionszwecken verwendet werden.

Indem

Sie nur die Phase-Kontrolle verändern, können Sie den Wurf auswechseln oder FM-Synthese-Verzerrungen auf einen vorhandenen Ton anwenden.

Das kann verwendet werden, um Instrumente wechselweise zur wavetable Synthese zu spielen.

Um Phase und Zeit unabhängig zu kontrollieren, würden wir die Versetzung des Tons für jedes Paar der Phase und Zeitposition wissen müssen.

Das entspricht einem Zylinder, wie gezeigt, in der Zahl.

Jedoch ist ein Tonsignal ein eindimensionales Signal.

Sie können dieses Tonsignal als Beobachtung der vollen Funktion auf dem Zylinder betrachten. Das wird als schwarze Linie in der Zahl gezogen.

Der vollen Funktion auf dem Zylinder kann durch das Interpolieren zwischen Punkten auf der Spirale mit (ungefähr) derselben Phase näher gekommen werden.

Von dieser Funktion kann ein verschiedenes Tonsignal abgeleitet werden.

Z.B in der Zahl zeigt die graue Linie den Pfad eines Tons, der denselben Zeitfortschritt, aber eine Frequenz tiefer hat als die ursprüngliche,

oder ein Ton, der dieselbe Frequenz und einen schnelleren Zeitfortschritt oder etwas dazwischen hat.

Schließlich kann der ganze Prozess für getrennte Tonsignale als Interpolation zwischen Werten mit der ähnlichen Phase und ähnliche Zeit durchgeführt werden.

Die beschriebene Technik wird in der monoakustischen Version der Software Melodyne verwendet

Das sinusförmige/geisterhafte Modellieren

Eine andere alternative Methode für die Zeit sich streckend verlässt sich auf ein geisterhaftes Modell des Signals. In dieser Methode werden Spitzen in Rahmen mit dem STFT des Signals identifiziert, und sinusförmige "Spuren" werden durch das Anschließen von Spitzen in angrenzenden Rahmen geschaffen. Die Spuren werden dann an einem neuen zeitlichen Rahmen wiedersynthetisiert. Diese Methode kann gute Ergebnisse sowohl auf dem polyfonen als auch auf Schlagmaterial besonders nachgeben, wenn das Signal in Subbänder getrennt wird. Jedoch ist diese Methode mehr rechenbetont anspruchsvoll als andere Methoden.

Das Geschwindigkeitshören & die Geschwindigkeitsunterhaltung

Für den spezifischen Fall der Rede kann Zeit sich streckend mit PSOLA durchgeführt werden.

Zeit sich streckend kann mit Audiobüchern verwendet werden und hat Vorträge registriert.

Das Verlangsamen kann Verständnis von Fremdsprachen http://www.enounce.com/whatistsm.shtml. verbessern

Während man annehmen könnte, bis dazu zu eilen, reduzieren Verständnis,

Herb Friedman sagt, dass "Experimente gezeigt haben, dass das Gehirn am effizientesten arbeitet, wenn die Informationsrate durch die Ohren - über die Rede - die "durchschnittliche" Lesen-Rate ist, die ungefähr 200-300 wpm ist (Wörter pro Minute), noch ist die durchschnittliche Rate der Rede in der Nachbarschaft 100-150 wpm"

Das Audio-Beschleunigen wird als die Entsprechung von "der Schnelllesemethode" gesehen

.

Zeit sich streckend wird häufig verwendet, um Radiowerbungen anzupassen

http://web.archive.org/web/20080527184101/http://www.tvtechnology.com/features/audio_notes/f_audionotes.shtml und das Audio von Fernsehanzeigen http://www.atarimagazines.com/creative/v9n7/122_Variable_speech.php, um genau in die 30 oder 60 verfügbaren Sekunden zu passen.

Wurf-Schuppen

Diese Techniken können auch verwendet werden, um eine Audioprobe umzustellen, während man Geschwindigkeit oder Dauer unveränderlich hält. Das kann durch die Zeit vollbracht werden, sich streckend und dann zurück zur ursprünglichen Länge wiederausfallend. Wechselweise kann die Frequenz des sinusoids in einem sinusförmigen Modell direkt, und das an der Skala der passenden Zeit wieder aufgebaute Signal verändert werden.

Das Umstellen kann Frequenzschuppen- oder Wurf-Verschiebung abhängig von der Perspektive genannt werden.

Zum Beispiel konnte man den Wurf jedes Zeichens durch einen vollkommenen fünften heranbringen, das Tempo dasselbe haltend.

Man kann diese Umstellung als "Wurf-Verschiebung", "Verschiebung" jedes Zeichens 7 Schlüssel auf einer Klavier-Tastatur oder das Hinzufügen eines gehefteten Betrags auf der Skala von Mel oder des Hinzufügens eines festen Betrags im geradlinigen Wurf-Raum ansehen.

Man kann dieselbe Umstellung wie "Frequenzschuppen" ansehen, (das Multiplizieren) der Frequenz jedes Zeichens durch 3/2 "kletternd".

Musikumstellung bewahrt die Verhältnisse der harmonischen Frequenzen, die das Timbre des Tons verschieden von der Frequenzverschiebung bestimmen, die durch die Umfang-Modulation durchgeführt ist, die einen festen Frequenzausgleich zur Frequenz jedes Zeichens hinzufügt. (In der Theorie konnte man einen wörtlichen Wurf durchführen, der klettert, in dem die Musikwurf-Raumposition [erklettert wird, würde ein höheres Zeichen an einem größeren Zwischenraum im geradlinigen Wurf-Raum ausgewechselt als ein niedrigeres Zeichen], aber das ist hoch ungewöhnlich, und nicht musikalisch).

Zeitabschnitt-Verarbeitung arbeitet viel besser hier, weil das Schmieren weniger bemerkenswert ist, aber Schuppen von stimmlichen Proben verdreht den formants in eine Art Alvin und die Backenhörnchen ähnliche Wirkung, die wünschenswert oder unerwünscht sein kann.

Ein Prozess, der den formants und Charakter einer Stimme bewahrt, ist mit dem Analysieren des Signals mit einem Kanalsprachentschlüsselungsgerät oder LPC Sprachentschlüsselungsgerät plus einige von mehreren Wurf-Entdeckungsalgorithmen und dann dem Wiedersynthetisieren davon an einer verschiedenen grundsätzlichen Frequenz verbunden.

Ein Detaillieren von älteren Analogaufnahme-Techniken für die Wurf-Verschiebung kann innerhalb des Alvins und des Backenhörnchen-Zugangs gefunden werden.

Siehe auch

Außenverbindungen


Angband / Scrollende Parallaxe
Impressum & Datenschutz