このノートブックを使えば、『手を動かしながらやさしく学べるはじめてのAIデータサイエンスリテラシー』 (技術評論社)に掲載しているWolfram言語のプログラムを直接実行することができます。最初に、右上のメニュー [ Make Your Own Copy ] をクリックし、自分のWolfram Cloudにこのノートブックをコピーして利用しましょう。詳しくは、序章 「0-3 Wolfram言語を使うための準備」および「0-4 本書のプログラムを実行する方法」(P11〜16ページ)を参照して下さい。なお、このノートブックでは、本書独自のフォーマットを使ってプログラムの入力部分にオレンジの枠,出力部分にブルーの枠がついたものとなっています。新規でノートブックを開いた時のまっさらのノートブックとは異なりますが、通常のノートブックと同様にプログラムを自分で入力することもできます。
第4章 音・音声データから見える世界
第4章 音・音声データから見える世界
4-1 音・音声データとは
4-1 音・音声データとは
音データの中身をみていこう
音データの中身をみていこう
car=Audio["ExampleData/car.mp3"]
Out[1]=
AudioPlot[car,PlotLabel"car.mp3",FrameLabel"電圧",None,"秒",None]
Out[2]=
cardata=AudioData[car]
Out[3]=
ListLinePlot[cardata[[All,1;;50]],PlotRangeAll,AxesLabel"秒","電圧"]
Out[4]=
2
-11
10
Out[5]=
1
50000000000
Spectrogram[car]
Out[6]=
4-3 音声処理のいろいろ
4-3 音声処理のいろいろ
テキストから音声を出力させる(音声合成)
テキストから音声を出力させる(音声合成)
myspeech=SpeechSynthesize["I have a pen."]
Out[7]=
ap1=AudioPlot[myspeech,PlotLabel->"my speech plot"]
Out[8]=
Spectrogram[myspeech]
Out[9]=
音のキーや長さを変える
音のキーや長さを変える
ps=AudioPitchShift[myspeech,2,Method"Speech"]
Out[10]=
ap2=AudioPlot[ps,PlotLabel->"ピッチ 2up"]
Out[11]=
ts=AudioTimeStretch[myspeech,Scaled[3]]
Out[12]=
ap3=AudioPlot[ts,PlotLabel->"3倍速"]
Out[13]=
GraphicsColumn[{ap1,ap2,ap3}]
音声からテキストを生成させる(音声認識)
音声からテキストを生成させる(音声認識)