このノートブックを使えば、『手を動かしながらやさしく学べるはじめてのAIデータサイエンスリテラシー』 (技術評論社)に掲載しているWolfram言語のプログラムを直接実行することができます。最初に、右上のメニュー [ Make Your Own Copy ] をクリックし、自分のWolfram Cloudにこのノートブックをコピーして利用しましょう。詳しくは、序章 「0-3 Wolfram言語を使うための準備」および「0-4 本書のプログラムを実行する方法」(P11〜16ページ)を参照して下さい。なお、このノートブックでは、本書独自のフォーマットを使ってプログラムの入力部分にオレンジの枠,出力部分にブルーの枠がついたものとなっています。新規でノートブックを開いた時のまっさらのノートブックとは異なりますが、通常のノートブックと同様にプログラムを自分で入力することもできます。

第4章 音・音声データから見える世界

4-1 音・音声データとは

音データの中身をみていこう

car=Audio["ExampleData/car.mp3"]
Out[1]=
00:00
00:07
Data in File[
...car.mp3
]
AudioPlot[car,PlotLabel"car.mp3",FrameLabel"電圧",None,"秒",None]
Out[2]=
cardata=AudioData[car]
Out[3]=
{{0.,1.79305×
-12
10
,-8.86338×
-13
10
,5.4782×
-14
10
,-1.70149×
-13
10
,-4.65504×
-13
10
,3.774×
-13
10
,-4.8931×
-13
10
,-4.41624×
-13
10
,1.39072×
-12
10
,-2.83754×
-13
10
,-1.6724×
-12
10
,1.13669×
-12
10
,-3.94579×
-12
10
,4.93224×
-12
10
,-2.35487×
-12
10
,
⋯328288⋯
,0.,0.,0.,0.,0.,0.,0.,0.,0.,0.,0.,0.,0.,0.,0.,0.}}
Full expression not available
(
original memory size:
2.6 MB)
ListLinePlot[cardata[[All,1;;50]],PlotRangeAll,AxesLabel"秒","電圧"]
Out[4]=
2
-11
10
Out[5]=
1
50000000000
Spectrogram[car]
Out[6]=

4-3 音声処理のいろいろ

テキストから音声を出力させる(音声合成)

myspeech=SpeechSynthesize["I have a pen."]
Out[7]=
00:00
00:01
Data in File[
...-49.wav
]
ap1=AudioPlot[myspeech,PlotLabel->"my speech plot"]
Out[8]=
Spectrogram[myspeech]
Out[9]=

音のキーや長さを変える

ps=AudioPitchShift[myspeech,2,Method"Speech"]
Out[10]=
00:00
00:01
Data in File[
...e9e.wav
]
ap2=AudioPlot[ps,PlotLabel->"ピッチ 2up"]
Out[11]=
ts=AudioTimeStretch[myspeech,Scaled[3]]
Out[12]=
00:00
00:03
Data in File[
...292.wav
]
ap3=AudioPlot[ts,PlotLabel->"3倍速"]
Out[13]=
GraphicsColumn[{ap1,ap2,ap3}]

音声からテキストを生成させる(音声認識)

​