TTWAさんの思考成果物置き場

健やかな26歳男性が考えたことについて、ふんだんに主観と詭弁と出任せを交えて適当になぐり書きします。真に受けないでください。

"AIでよみがえる美空ひばり"を観た感想文

※このブログは日頃文章にロクに触れていない人間が哲学を修めていないのに哲学っぽいことを語ったり心理学を修めていないのに人の行動心理っぽいことを語ったりする詭弁満載ファンタジーブログです。以下の「はじめに」を読んでご理解いただけた方のみ鼻でもほじりながら読んでください。

https://ttwa.hatenablog.com/entry/2019/09/04/210153

 

 

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~

 

どうも、TTWAです。

今回はタイトル通り、先日NHKだかでやっていた"AIでよみがえる美空ひばり"という番組を(途中からですが)観た感想をつらつらと書いていきます。最終的にはAIと人間と芸術とかそんな話っぽいことを語ったふりをします。

あと全部書きあげた段階で疲れたので推敲は一切していません。誤字脱字乱文許して。

今回の記事は約3600文字です。ではどうぞ。

 

(11/9 今更ちょっと追記)

私自身、大学院時代の研究室の同僚に機械学習とかをやっていた人がいたりしているので、少しは技術者的目線でAIは理解しているつもりです。反対に、だからこそわかりにくい技術者的表現も多々あるかと思いますが、そういうことです。許して。

(追記ここまで)

 

 

○"AIでよみがえる美空ひばり"の簡単なあらまし

この番組で行われたことは、「没後30年を迎える美空ひばりの歌声をAIの力で蘇らせる試みに挑むこと」。最新技術のAIを用いて美空ひばりの声や歌い方を徹底的に解析して、最終的には生前の代表曲"川の流れのように"を作詞した秋元康氏作詞の新曲をAIで蘇った美空ひばりに歌わせる。今までにも著名ですでに亡くなっているシンガーの歌い方をAIに学習させて自身の代表作を歌わせるという試みはあったそうだが、AIで再現したシンガーに新曲を歌わせる試みは遥かに難しいことで、相当な技術者の苦難と工夫でもって、最終的にAIが歌う新曲が聴く人を涙させる…。そういう感じでした。

 

○AIが歌を歌う時代へ

さて、ここではそもそも死者をAIで蘇らせるということに対する倫理的問題提起は置いときまして、僕が個人的に一番興味深かった「美空ひばりを学習し尽くした"AIの歌"が聴く人に涙させた」という点。全員が美空ひばりはすでに死没していると知っていて、そこで聴いているのは美空ひばりではなく美空ひばりを再現したものと理解したうえで、お客さんたちは涙しながら"美空ひばりの復活"を喜んでいたのです。

確かにAIの出来は素晴らしく、少なくともボーカロイドを用いて人が一生懸命打ち込んだ「人間っぽいボーカロイドの歌唱」と比べるとAIの学習による歌唱は遥かに自然で、AIであることを知らずに聴けば生身の人間と間違うことも有り得るクオリティでした。

もちろんそれはAIオリジナルの歌唱ではなく、強大なオリジナルである美空ひばりを模したものだからこそ有り得るクオリティだったのでしょうが、この企画を通して確実に、高い歌唱力を持ったAIによる歌手学習モデルが誕生したと言えるでしょう。

言い換えると、コンピューターの力で人工的に人を涙させるまでの歌唱をする"歌声"を作り出すことに成功した一例が生まれたと言えます。

 

○気持ちを込めれば気持ちの込もった演奏になる…はウソなのか?

僕自身吹奏楽部と軽音楽部を経験している人間なのですが、よく楽器演奏や歌において「感情を込めてやるんや!」という指摘を耳にします。確かに平坦で起伏の無い演奏、俗に言う感情の無い無機質な演奏は、それを目的としていない限りは非常につまらないものになってしまいます。しかし、逆を言えば抑揚や起伏がある演奏、感情的で有機的な演奏というのは"気持ちが込められている"と言えるのでしょうか。僕は今回のAIの歌で人間が涙したことによって、"演奏に気持ちを込める"だけを重視することは明示的にNOであることが証明されたと思っています。

例えば「大丈夫」という言葉を考えてみましょう。これを発音するとき、少し高めの声の高さで音量は少し大きめにはきはきと言えば、きっと問題がじきに解決するような前向きな「大丈夫」になるでしょう。一方で声を低くして音量を小さめに籠もらせて言えば、明らかに無理をしているような後ろ向きな「大丈夫」になります。

我々は常日頃、感情を表現したい(前向きとか後ろ向きとか)と思い、そのために声の高さや音量や発音の仕方を工夫して、その感情を伝わる形にしてアウトプットします。増してやアドリブではなく原曲の再現を行うようなジャンルの音楽においては、例えパフォーマーが演奏するその瞬間に何を思おうと表現したい感情が固定されており、できるだけメソッド化された表現手法を用いるのが常です。

ここから言えることは、"気持ちの込もった演奏"というのは決して文字通り気持ちを込めて成り立つのではなく、前向きを表現したいときは声高め音量大きめハキハキと発生するように、"気持ちが込もっているような表現技法を用いて演奏すること"で始めて成り立つということです。そのような表現技法をAIが修得できるということが、この番組ではっきりとわかったのです。

 

○"表現できるAI"による音楽の未来を考えてみる

この番組の成果物である"AI美空ひばり"によって、人を感動させるAI歌手の存在が証明されたこととなります。歌手が生まれたならば、あとは歌詞と曲とバックの演奏。これらがAIによって再現されることとなれば、歌詞から曲から伴奏から歌手まですべてがAIで完結する音楽が誕生することになります。

思うに、この体系が完成する未来はそう遠くないはずです。調べるのも面倒なので裏付けはしてませんが、確か「歌詞を入れたら勝手に曲を作る」みたいなのはすでに存在していたと思いますし、Twitterからツイートを学習して自動で呟きを作ったりするアカウントが存在し、今回の美空ひばりの前例から「音楽的表現をAIで学習再現することは可能」ということが楽器演奏にも当てはまるとすれば、一流の作詞家/作曲家/演奏家/歌手を徹底的に学習すればそれだけで曲ができるということです。また、マスタリング(超ざっくり言えば録った演奏全体を色々と整えてもっと聞こえよくする工程)を自動でするサービスもあります。仕上げまでAIでばっちりです。

SF的な感覚かもしれませんが、近い将来「声が低めの女性が歌う泣ける失恋バラード」とだけ入力すれば、AIが自動で作詞作曲演奏をしてマスタリングまで行って、世界で一つだけの声が低めの女性が歌う泣ける失恋バラードに涙する…みたいな未来がやってくるかもしれません。誰が作ったとか誰が歌ったではなく、そのときの気分に合ったように自動生成された曲を聴くことが当たり前になる。あるいはジャズなどの即興演奏もジャズの巨人たちのパフォーマンスを徹底的に学習したAIによって自動演奏され、その演奏に舌を巻く。「人間が演奏するからこそ~」というのが老人の戯言になる未来がやってくる。そんなことも決してありえなくはないと思いませんか?

 

○人間にしかできない"表現"とは何だろう

作詞も作曲も演奏もAIに表現され尽くす未来において、人間がペンや楽譜や楽器を手に取る意味はどこにあるんでしょう。言い換えると、人間にしかできない"表現"というのは何なんでしょう。

僕はその答えは"オリジナルになること"に他ならないと思っています。

例えば今回観たAI美空ひばりはまさに強大なシンガーである美空ひばりをオリジナルとしたものです。あるいは作詞や作曲や演奏を学習するうえでも、必ず膨大な教師データとして誰かの書いた文や誰かの書いた曲や誰かの演奏した音が必要になります。この"誰か"になることこそが、人間のみができることです。

勿論、AIが学習したことに多少の揺らぎを含ませることで単に学習したもののコピー以外を出力させ、それがオリジナルとなる…ということもあるでしょう。しかしながら、AIというものは常に学習の結果に縛られるものとすれば、常識を打ち壊すほどの強大な変化を与えられるのは人間のみです。この「すれば」が真か偽かはAIが充分に発達した未来にならないとわからないことですが、「学習結果を基にして」ではなく「学習結果を無視して」ものを生み出す力は、少なくとも今の時代においては、人間が遥かに強力なはずです。

society5.0が持ち出され、AIによる業務効率化、ひいては人間の仕事がAIに取って代わられる時代において、「オリジナルになること」こそが我々人間が人間らしくいる唯一の方法なのではないかと、思います。

 

○最後に

AIが充満した世の中では、人間らしさとは何かというのがより明確な問題として浮き上がるように思います。その時のために、「人間とは?」や「自己とは?」というものを少しでも自分の中で明確にしていくべきですね。多くの哲学者が挑んだ問いでもあるのでそう簡単なことではないはずなんですけども。

AI化した未来でも、人間が人間として生きていることを祈りつつ、そういう未来やそういう自分になれるよう、考え生み出し「オリジナルになること」を諦めずに生きていきたいもんです。